اخیراً Demis Hassabis مدیرعامل DeepMind اعلام کرد که این شرکت به زودی مدل LLM جدیدی به نام Gemini را منتشر می‌کند که با ChatGPT رقابت کرده و حتی از آن برتری خواهد داشت۱. طبق این خبر Gemini علاوه‌بر تحلیل متن توانایی حل مساله را نیز دارد. به نظر می‌رسد مدیران گوگل رضایت کافی از انتشار چت‌بات Bard را نداشته‌ و می‌خواهند با ایده جدید وارد میدان رقابت شوند. به گفته Demis Hassabis استفاده از یادگیری تقویتی در Gemini منجر به بهبود این مدل در اجرای دستوراتی شده است که مدل‌های معمولی LLM در اجرای آن به چالش می‌خورند. 

شرکت DeepMind در سال ۲۰۱۰ با هدف ساخت AGI۲ راه‌اندازی و در سال ۲۰۱۴ توسط گوگل خریداری شد. AGI فرمی از هوش‌مصنوعی است که مشابه انسان توانایی انجام تمامی فعالیت‌های شناختی را دارد و محدود به وظایف خاصی نیست. DeepMind تنها شرکت فعال در حوزه AGI نیست. بلکه در این حوزه رقیب قدری به نام OpenAI را به همراه دارد. OpenAI در سال ۲۰۱۵ تاسیس و با سرمایه‌گذاری‌های هنگفت مایکروسافت در سال‌های ۲۰۱۹ و ۲۰۲۳ وارد همکاری نزدیک با این شرکت شد. اگرچه تاکنون هیچ‌کدام از این شرکت‌ها موفق به ساخت AGI نشده‌اند ولی هر کدام دستاوردهای چشم‌گیری منتشر کرده‌اند. انتشار ChatGPT در سال جاری واکنش گوگل و تغییر استراتژی این غول تکنولوژی را برای حفظ بازار به همراه داشت. گوگل که از توسعه‌دهندگان پیشتاز هوش‌مصنوعی است‌ از محافظه‌کاری خود دست برداشته و تلاش می‌کند برتری خود در مقابل مایکروسافت را حفظ کند۳. ماموریت یکسان هر دو شرکت DeepMind و OpenAI و تقابل دو موتور جستجوی گوگل و بینگ نشان دهنده رقابت سنگین این دو در عرصه هوش‌مصنوعی خواهد بود.

یادگیری تقویتی۴ نوعی از یادگیری‌ماشین است که در آن ایجنت (agent) براساس فیدبک پاداش (reward) و تنبیه (punishment) رفتاری که بیشترین پاداش را در پی‌دارد پیدا می‌کند. DeepMind معتقد است روش یادگیری تقویتی کلید دست‌یابی به AGI است۵ و با استفاده از AGI بشر می‌تواند جهان پیرامون خود را کشف کرده و درک کند. یکی از سوابق درخشان DeepMind در حوزه یادگیری تقویتی مدل AlphaGo است. این مدل ایجنتی است که توانایی رقابت در بازی فکری گو را دارد. AlphaGo در سال ۲۰۱۶ توانست ۴ بار قهرمان جهان در گو را از ۵ بازی شکست دهد۶.

رقابت Lee Sedol و AlphaGo


۱. DeepMind claims its next chatbot will rival ChatGPT

۲. Artificial General Intelligence

۳. Google is freaking out about ChatGPT

۴. Reinforcement Learning

۵. DeepMind says reinforcement learning is 'enough' to reach general AI  

۶.AlphaGo in Wikipedia

۷. DeepMind از جمله شرکت‌های پیشتاز هوش‌مصنوعی در لندن است. برای مطالعه بیشتر درباره سیاست‌های لندن در حوزه هوش‌مصنوعی این لینک را مطالعه کنید.


شما می‌توانید با عضو شدن در کانال تلگرام این خبرنامه، در سریع‌ترین زمان در جریان مقالات جدید قرار بگیرید