خبرنامه هوش‌مصنوعی دومان

در این شماره شاهد معرفی تحقیقات و محصولات متنوعی در زمینه هوش‌مصنوعی مولد (Generative AI) هستیم. همان‌طور که انتظار می‌رود با سرمایه‌گذاری‌های کلان انجام شده ایده‌های مختلف و قابل توجهی در این حوزه در حال شکل‌گیری است. فعلاً تمرکز روی مدل‌های مبتنی بر Diffusion است. در این شماره مدل‌های جدیدی برای تولید تصویر، به حرکت درآوردن تصویر و تولید موسیقی و صوت معرفی شده است. دنیای مدل‌های زبانی نیز خیلی پر و صدا بود! بالاخره بعد از ماه‌ها انتظار رقیب ChatGPT توسط گوگل وارد میدان شد و توجه زیادی را به خود جلب کرد! مدل‌های اپن‌سورس 8X7B (به زودی در یک مقاله جدید این مدل Mistral AI را معرفی می‌کنم) و Phi2 نیز معرفی شده و سایر مدل‌های مشابه را به چالش کشیدند. تلاش‌ها برای نمود فیزیکی هوش‌مصنوعی در قالب ربات‌های انسان‌نما نیز ادامه دارد. برای جزئیات بیشتر ادامه خبرنامه را مطالعه کنید.

۱. رقیب GPT-4 توسط گوگل منتشر شد | معرفی Gemini 🏅

بالاخره بعد از مدت‌ها انتظار گوگل قدرتمندترین مدل هوش‌مصنوعی خود به نام Gemini (با تلفظ جمینای) را منتشر کرد. این مدل توانایی درک دیتا به شکل‌های مختلف متن، کد، تصویر، ویدئو و صوت را دارد. از این رو اصطلاحاً یک multimodal (مولتی مدال) نامیده می‌شود. نسخه 1.0 مدل Gemini در سه سایز مختلف بهینه شده است: نسخه Nano برای گوشی‌های هوشمند، نسخه Pro برای اجرای گستره‌ای از تسک‌های مختلف و نسخه Ultra برای اجرای تسک‌های بسیار پیچیده. بنابر گزارش فنی منتشر شده، نسخه Gemini Ultra در ۳۰ مورد از ۳۲ بنچمارک‌ معتبر از مدل GPT-4 بهتر عمل کرده است. در حال حاضر از نسخه Pro در چت‌بات بارد استفاده شده و قرار است به زودی در مجموعه‌ای از محصولات گوگل نیز مورد بهره‌برداری قرار بگیرد. نسخه Nano نیز در گوشی پرچم‌دار پیکسل ۸ به صورت آفلاین مورد استفاده قرار می‌گیرد و قرار است ابتدای سال بعد نسخه Ultra با معرفی Bard Advanced در اختیار علاقه‌مندان قرار بگیرد.

👈 برای مطالعه جزئیات بیشتر کلیک کنید.

گوگل جمینای

۲. قابلیت‌های جدید پیکسل ۸ با استفاده از Gemini Nano 📱

گوگل با بروزرسانی پیکسل ۸ مجموعه‌ای از قابلیت‌های هوش‌مصنوعی را برای کاربران این گوشی پرچم‌دار معرفی کرد. در این بروزرسانی از مدل Gemini Nano استفاده شده است. این مدل اخیراً توسط گوگل برای فراهم کردن قابلیت‌های هوش‌مصنوعی مولد به صورت آفلاین در گوشی‌های اندرویدی معرفی شد. خلاصه کردن صوت به صورت متن، ارائه پاسخ پیشنهادی در Gboard و بهبود کیفیت عکس و ویدئو از جمله این قابلیت‌ها است (👈 مشاهده ویدئو).

۳. اخبار جدید از xAI

چت بات Grok در دسترس کاربران پریمیوم پلتفرم X قرار گرفت (منبع خبر). این چت بات توسط کمپانی جدید ایلان ماسک به نام xAI توسعه داده شده است. ایلان ماسک پس از خرید توئیتر و تغییر نام این کمپانی به X با تأسیس xAI وارد رقابت هوش مصنوعی شد. xAI اخیراً با ثبت درخواست افزایش سرمایه یک میلیارد دلاری در کمیسیون بورس اوراق بهادار آمریکا توانست ۱۳۴ میلیون دلار سرمایه جدید جذب کند. با این حال ایلان ماسک در پاسخ به یکی از کاربران در پلتفرم X گفت که در حال حاضر قصد افزایش سرمایه ندارد (منبع خبر).

👈 قبلاً xAI را در اینجا معرفی کرده‌ام.

۴. تشکیل اتحاد هوش‌مصنوعی (AI Alliance) توسط IBM و متا

شرکت‌های متا و IBM با همراهی تعدادی از شرکت‌های تکنولوژی، مراکز تحقیقاتی و دانشگاهی اتحاد هوش‌مصنوعی یا AI Alliance را تشکیل دادند. هدف از تشکیل این اتحاد حمایت از توسعه هوش‌مصنوعی اپن‌سورس در برابر انحصار این تکنولوژي است. توسعه هوش‌مصنوعی به صورت اپن‌سورس این تکنولوژی را در اختیار تمامی انسان‌ها قرار داده و امکان مشارکت همه را فراهم می‌سازد. از طرفی به عقیده برخی از افراد صاحب نظر توسعه این تکنولوژی به صورت اپن‌سورس به ایمنی آن نیز کمک می‌کند. اخیراً شرکت‌های مایکروسافت، OpenAI، گوگل و آنتروپیک با راه‌اندازی گروهی به نام Frontier Model Forum برای توسعه هوش‌مصنوعی ایمن مورد انتقاد بابت لابی‌گری و تغییر قوانین به نفع خود شدند. شرکت OpenAI در ابتدا با هدف انتشار دستاوردهای خود برای عموم و به شکل Non-profit وارد عرصه هوش‌مصنوعی شد ولی در گذر زمان با تغییر رویه انحصار و کسب درآمد را اولویت خود قرار داد (منبع خبر).

تشکیل اتحاد هوش‌مصنوعی (AI Alliance) توسط IBM و متا

۵. نقطه عطف رگولاتوری هوش‌مصنوعی در اتحادیه اروپا 🇪🇺

قانون‌گذاران و سیاست‌مداران اتحادیه اروپا در یک نشست ۳۶ ساعته بالاخره به یک توافق موقت حول قوانین رگولاتوری هوش‌مصنوعی موسوم به The AI Act دست یافتند. این توافق یک نقطه عطف در مسیر پر فراز و نشیب رگولاتوری هوش‌مصنوعی در این اتحادیه نامیده شد. اتحادیه اروپا پیش‌رو ترین منطقه اقتصادی در دنیاست که نسبت به وضع قوانین حول موضوع هوش‌مصنوعی اقدام کرده است. البته تلاش‌های دیگری در سایر کشورها در دست اقدام است. براساس این توافق قرار است رای‌گیری نهایی در ابتدایی سال بعد میلادی انجام شده و عملیاتی شدن قانون حداقل تا سال ۲۰۲۵ میلادی به طول خواهد کشید. قابل ذکر است که این قانون با واکنش‌های منفی زیادی همراه بوده است. به عقیده صاحب‌نظران، The AI Act اتحادیه اروپا را در رقابت هوش‌مصنوعی عقب خواهد انداخت (منبع خبر). برای آشنایی بیشتر با این قانون پست‌های زیر را بخوانید:

👈رگولاتوری هوش‌مصنوعی در اتحادیه اروپا

👈 انتقاد کمپانی‌های تک به رگولاتوری هوش‌مصنوعی در اتحادیه اروپا

👈اتحاد اپن‌سورس در برابر رگولاتوری هوش‌مصنوعی در اتحادیه اروپا

۶. گروهی از محققان دانشگاه برکلی با استفاده از یادگیری تقویتی (Reinforcement Learning) روش جدیدی برای تطبیق حرکت ربات‌های انسان‌نما در محیط‌های مختلف ارائه کردند. ربات‌های انسان‌نما می‌توانند برای جبران کمبود نیروی کار در محیط‌های خطرناک، کمک به انسان در خانه و عملیات در سایر سیاره‌ها مورد استفاده قرار بگیرند. برای مطالعه جزئیات فنی این کار تحقیقاتی اینجا را مشاهده کنید (👈 مشاهد ویدئو🤖).

۷. صحبت‌های هلن تونر عضو سابق هیئت مدیره OpenAI درباره اخراج سم آلتمن

اخیراً نیویورک تایمز با خانم هلن تونر (Helen Toner) عضو سابق هیئت مدیره OpenAI و یکی از افراد اصلی که در اخراج سم آلتمن نقش داشت مصاحبه کرد. هلن تونر که در زمینه ایمنی هوش‌مصنوعی نیز فعالیت دارد، چند ماه پیش با همکاران خود در موسسه CSET در این زمینه مقاله‌ای منتشر کرد. در این مقاله OpenAI به خاطر انتشار عمومی ChatGPT مورد انتقاد قرار گرفته است. زیرا با انتشار ChatGPT سایر رقبا نظیر گوگل و آنتروپیک نیز برای رقابت مصمم شده و اقدام به انتشار محصولات و سرویس‌های مشابه کرده‌اند. ظاهراً این انتقاد از سمت هلن تونر به عنوان عضو هیئت مدیره OpenAI موجب بحث و اختلاف نظر او با سم آلتمن در روزهای قبل از اخراج شده است. تونر اخراج سم آلتمن به خاطر نگرانی‌ها حول موضوع ایمنی را رد کرد و تاکید کرد از بین رفتن اعتماد دلیل اخراج سم آلتمن از مدیریت OpenAI بوده است. تونر همچین از وفاداری کارمندان نسبت به آلتمن ابراز تعجب کرد و گفت وظیفه OpenAI نسبت به مدیریتش نیست بلکه نسبت به ماموریتش است (منبع خبر).

👈 ماجرای اخراج سم آلتمن را از اینجا بخوانید.

۸. بعد از آمازون شرکت GXO Logistics نیز اعلام کرد در حال تست ربات‌های انسان‌نمای Digit در انبارهای خود است. ربات انسان‌نمای Digit توسط شرکت Agility Robotics توسعه داده شده است (👈 مشاهده ویدئو🤖).

۹. تسلا از نسخه جدید ربات انسان‌نمای اپتیموس رونمایی کرد. 🤖

نسخه Gen2 ربات انسان‌نمای تسلا معرفی شد. این نسخه ۱۰ کیلوگرم وزن کمتر نسبت به نسخه قبلی دارد. سرعت راه رفتن آن نیز ۳۰درصد افزایش داشته است. همچنین با تغییراتی که اعمال شده، تعادل و کنترل بیشتری روی اجزای مختلف خود دارد (👈 مشاهده ویدئو🤖).

Tesla Optimus Gen 2

۱۰. نسخه ۲ مدل Imagen توسط گوگل DeepMind منتشر شد. 🎨

گوگل DeepMind از نسخه ۲ مدل Imagen رونمایی کرد. این مدل مشابه DALL.E برای تولید عکس از متن استفاده می‌شود. Imagen 2 از تکنیک Diffusion برای تولید تصویر استفاده می‌کند. در حال حاضر این مدل از طریق سرویس Vertex AI در پلتفرم ابری گوگل در دسترس کاربران قرار گرفته است (منبع خبر).

تصاویر تولید شده توسط Imagen گوگل

۱۱. به حرکت درآوردن تصاویر توسط DreaMoving 🕺

گروهی از محققان شرکت چینی علی‌بابا مدلی برای تولید ویدئو رقص از روی تصویر ارائه کردند. این مدل از روش Diffusion برای تولید ویدئو استفاده کرده و DreaMoving نام دارد. برای تولید ویدئو باید تصویر مرجع و دنباله حرکات به همراه یک توضیح متنی به مدل داده شود. اخیراً نمونه مشابهی به نام MagicAnimate نیز معرفی شده بود (منبع خبر و مشاهده نمونه‌ها).

۱۲. استفاده از هوش‌مصنوعی در صنعت فشن و مد 👗

گروهی از محققان شرکت علی‌بابا مدل جدید هوش‌مصنوعی برای به تن کردن انواع لباس در یک تصویر ارائه کردند. این روش نیز از متد Diffusion برای تولید تصویر جدید استفاده کرده و Outfit Anyone نام دارد. این محققان در ادامه از خروجی این مدل در کنار مدل قبلی علی‌بابا به نام Animate Anyone برای به حرکت درآوردن تصویر جدید بهره برده‌اند. قابل ذکر است که علی‌بابا اخیراً مدل دیگری به نام DreaMoving را برای به حرکت درآوردن تصویر انسان معرفی کرد. برای مطالعه جزئیات فنی در مورد پروژه Outfit Anyone اینجا را بخوانید.

۱۳. حذف نویز محیط در گوشی‌های پیکسل گوگل 🦻

قابلیت حذف نویز محیط در گوشی‌های هوشمند پیکسل گوگل با همکاری بخش Google Research توسعه داده شده است. این قابلیت از یک مدل audio-to-audio برای کاهش نویز استفاده می‌کند. در حال حاضر این قابلیت کل بازه فرکانسی صدا را پوشش داده و با کمترین تاخیر صدای بهبود یافته را برای کاربر پخش می‌کند (منبع خبر و شنیدن نمونه).

۱۴. استفاده از هوش‌مصنوعی مولد برای تولید داروی سرطان 💉

دو شرکت آسترازنکا (AstraZeneca) و ابسکی (Absci) در یک همکاری مشترک به ارزش ۲۴۷ میلیون دلار با استفاده از هوش‌مصنوعی برای کشف داروی جدید سرطان اقدام می‌کنند. ابسکی در زمینه کشف دارو (Drug Discovery) فعالیت داشته و در سال‌های اخیر توانسته با استفاده از هوش‌مصنوعی مولد (GenAI) در کشف داروهای جدید به نتایج قابل توجهی دست پیدا کند. تولید داروی جدید بسیار هزینه‌بر بوده و شانس موفقیت پایینی دارد ولی با استفاده از هوش‌مصنوعی درهای جدیدی به روی این صنعت باز شده است. سال جاری ابسکی اعلام کرد با استفاده از تکنیک Zero Shot در یادگیری ماشین توانسته آنتی‌بادی De Novo را به صورت مجازی تولید کند (اینجا را مشاهده کنید). این تکنیک امکان تجزیه و تحلیل دیتایی که در پروسه آموزش مدل وجود نداشته را برای آن فراهم می‌سازد (منبع خبر).

استفاده از هوش‌مصنوعی مولد برای تولید داروی سرطان

۱۵. معرفی مدل AudioBox از متا

مدل Audiobox توسط متا برای تولید و بهبود کیفیت صوت معرفی شده است. این مدل در واقع نسل بعدی مدل Voicebox است که در ابتدای سال جاری معرفی شده بود. قابلیت‌های خارق‌العاده Audiobox را می‌توانید از اینجا تست کنید (منبع خبر).

۱۶. تولید موسیقی با MusicFX 🎵

گوگل مدل جدید خود برای تولید موسیقی را به صورت محدود در دسترس عموم قرار داده است. این مدل MusicFX نام داشته و برای ثبت‌نام در لیست انتظار آن به اینجا مراجعه کنید. این مدل با دریافت Prompt از کاربر موسیقی مورد نظر را تولید می‌کند. ویدئویی که در تصویر مشاهده می‌کنید نمونه‌ای از خروجی MusicFX است (👈 شنیدن نمونه).

۱۷. سه بعدی‌سازی تصاویر با Stable Zero123

شرکت Stability AI نسخه جدید مدل سه‌بعدی ساز خود را با نام Stable Zero123 منتشر کرد. این نسخه نسبت به مدل قبلی یعنی Zero123-XL بهبود قابل توجهی داشته است. این بهبود در تصاویر زیر نمایش داده شده است. Stable Zero123 به صورت اپن‌سورس صرفاً برای اهداف تحقیقاتی منتشر شده است. برای دسترسی به مدل و جزئیات فنی بیشتر به اینجا مراجعه کنید.

مقایسه مدل‌های سه بعدی ساز Stability AI

۱۸. مایکروسافت مدل Phi2 را معرفی کرد.

با داغ شدن مسابقه مدل‌های بزرگ زبانی (LLM) شاهد معرفی مدل‌های کوچک زبانی (SLM) نیز هستیم. در حال حاضر LLMها از چند ده میلیارد، تا چند میلیارد و حتی چند تریلیون پارامتر دارند. هر چقدر تعداد پارامترهای یک مدل بیشتر باشد، پروسه آموزش آن زمان‌بر و هزینه‌بر شده و در نهایت خروجی آن نیز سایز زیادی خواهد داشت. اجرای مدل‌های بزرگ زبانی نیازمند منابع پردازشی زیاد است. از این‌رو، برای فراهم کردن قابلیت‌های مدل‌های زبانی برای پلتفرم‌های مختلف شاهد توسعه و معرفی مدل‌های کوچک زبانی یا SLMها هستیم. کاهش سایز مدل زبانی و در عین حال افزایش کیفیت آن از ترندهای موجود در حوزه هوش‌مصنوعی مولد است. مدل Phi یکی از این SLMها بوده که توسط مایکروسافت منتشر شده است. نسخه Phi2 که به تازگی منتشر شده در مقایسه با نمونه‌های مشابه نتایج درخور توجهی داشته است.

👈 برای جزئیات بیشتر درباره این مدل اینجا را بخوانید.

۱۹. تولید موسیقی با Copilot 🎵

مایکروسافت با همکاری Suno قابلیت تولید موسیقی را به Copilot اضافه کرد. برای استفاده از این قابلیت مراحل زیر را انجام دهید (منبع خبر):

پس از نصب مرورگر Microsoft Edge وارد آدرس copilot.microsoft.com شوید.
وارد حساب کاربری مایکروسافت خود شده و یا حساب جدید بسازید.
در قسمت plugins از فعال بودن Suno مطمئن شوید.
با نوشتن Prompt مورد نظر موسیقی خود را تحویل بگیرید.

ضمناً از اینجا مستقیم می‌توانید با Suno موسیقی موردنظر خود را بسازید.

۲۰. پیش‌بینی بیل گیتس از هوش‌مصنوعی 🔮

بیل‌گیتس بنیان‌گذار مایکروسافت در یک مقاله جدید به مناسبت فرارسیدن سال نو میلادی در مورد آینده هوش‌مصنوعی پیش‌بینی کرد. در ادامه خلاصه‌ای از نکات مهم این مقاله طولانی ارائه شده است:

"هوش‌مصنوعی جهان را متحول کرده و منجر به نوآوری می‌شود. کشورهای ثروتمند نظیر آمریکا طی ۱۸ الی ۲۴ ماه آینده با هوش‌مصنوعی تطبیق پیدا می‌کنند. این تطبیق برای کشورهای فقیرتر با تاخیر و به صورت نسبی رخ می‌دهد. به مرور انسان‌ها هوش‌مصنوعی را در کار خود وارد کرده و یاد می‌گیرند که چه کارهایی را با استفاده از هوش‌مصنوعی انجام داده و چه کارهایی را شخصاً انجام دهند. از هوش‌مصنوعی برای تولید واکسن و داروهای جدید استفاده می‌شود. ابزارهای مبتنی هوش‌مصنوعی طی ۵ الی ۱۰ سال آینده آموزش را متحول می‌کنند. این ابزارها می‌توانند آموزش را براساس هر سلیقه‌ای شخصی‌سازی کرده و تشخیص دهند چه چیزی به دانش‌آموز انگیزه می‌دهد." (لینک مقاله)

پیش‌بینی بیل گیتس از هوش‌مصنوعی

اگر مایل به دریافت خبرنامه هوش‌مصنوعی دومان در پست‌الکترونیک خود هستید از اینجا ثبت‌نام کنید. همچنین می‌توانید با عضویت در کانال تلگرام این خبرنامه در سریع‌ترین زمان در جریان اخبار جدید قرار بگیرید. برای مطالعه شماره‌های قبلی اینجا را نگاه کنید.