خبرنامه هوش‌مصنوعی دومان

llm

رقیب GPT-4 توسط گوگل منتشر شد | معرفی Gemini

/%D9%85%D8%AF%D9%84-%D9%82%D8%AF%D8%B1%D9%85%D9%86%D8%AF-%DA%AF%D9%88%DA%AF%D9%84-%D9%85%D9%86%D8%AA%D8%B4%D8%B1-%D8%B4%D8%AF-%D9%85%D8%B9%D8%B1%D9%81%DB%8C-%D9%85%D8%AF%D9%84-gemini

بالاخره بعد از مدت‌ها انتظار گوگل قدرتمندترین مدل هوش‌مصنوعی خود به نام Gemini (با تلفظ جمینای) را منتشر کرد. این مدل توانایی درک دیتا به شکل‌های مختلف متن، کد، تصویر، ویدئو و صوت را دارد. از این رو اصطلاحاً یک multimodal (مولتی مدال) نامیده می‌شود. نسخه 1.0 مدل Gemini در سه سایز مختلف بهینه شده است: نسخه Nano برای گوشی‌های هوشمند، نسخه Pro برای اجرای گستره‌ای از تسک‌های مختلف و نسخه Ultra برای اجرای تسک‌های بسیار پیچیده. بنابر گزارش فنی منتشر شده، نسخه Gemini Ultra در ۳۰ مورد از ۳۲ بنچمارک‌ معتبر از مدل GPT-4 بهتر عمل کرده است. Gemini با استفاده از پلتفرم TPU گوگل از ابتدا به صورت مولتی مدال با توانایی درک انواع دیتا توسعه شده است. در حال حاضر از نسخه Pro در چت‌بات بارد استفاده شده و قرار است به زودی در مجموعه‌ای از محصولات گوگل نیز مورد بهره‌برداری قرار بگیرد. نسخه Nano نیز در گوشی پرچم‌دار پیکسل ۸ به صورت آفلاین مورد استفاده قرار می‌گیرد و قرار است ابتدای سال بعد نسخه Ultra با معرفی Bard Advanced در اختیار علاقه‌مندان قرار بگیرد.


رقابت اپن‌سورس و انحصار: معرفی مدل LLaVA

/%D8%B1%D9%82%D8%A7%D8%A8%D8%AA-%D8%A7%D9%BE%D9%86-%D8%B3%D9%88%D8%B1%D8%B3-%D9%88-%D8%A7%D9%86%D8%AD%D8%B5%D8%A7%D8%B1-%D9%85%D8%B9%D8%B1%D9%81%DB%8C-%D9%85%D8%AF%D9%84-llava

محققان دانشگاه‌های استنفورد، کلمبیا و ویسکانسین مدیسون در یک همکاری مشترک مدل LLaVA را به صورت اپن‌سورس و رایگان منتشر کردند. این مدل توانایی زبانی و درک تصویر را داشته و می‌تواند با مدل GPT-4 شرکت OpenAI رقابت کند. LLaVA در ادامه اقدام متا در توسعه مدل‌های اپن‌سورس معرفی شده است. با این وجود در دسترس عموم قرار گرفتن مدل‌های قدرتمند هوش‌مصنوعی نگرانی‌هایی را نیز در پی داشته است. 


معرفی مدل زبانی Mistral 7B

/%D9%85%D8%B9%D8%B1%D9%81%DB%8C-%D9%85%D8%AF%D9%84-%D8%B2%D8%A8%D8%A7%D9%86%DB%8C-mistral-7b

 استارتاپ فرانسوی Mistral مدل بزرگ زبانی (LLM) خود موسوم به Mistral 7B را تحت لایسنس Apache 2.0 به صورت عمومی منتشر کرد. طبق ادعای این استارتاپ این مدل نسبت به مدل‌های مشابه (از نظر سایز) نظیر Llama 2 13B و Llama 1 34B بهتر عمل می‌کند. برای تسک‌های برنامه‌نویسی نیز عملکرد مشابه مدل CodeLlama 7B دارد. تقریباً هیچ اقدام جدی برای ایمنی این مدل انجام نشده و طبق نمونه‌های منتشر شده در پلتفرم ایکس (توئیتر) می‌توان به راحتی از آن برای تولید محتوای نژاد پرستی و یا راهنمای خودکشی استفاده کرد. البته Mistral اعلام کرده که این نسخه اولیه بوده که در اسرع وقت ریلیز شده و در آینده اقدامات لازم برای افزایش ایمنی این مدل را انجام خواهد داد. بنابر ادعای این استارت مدل Mistral 7B تنها طی ۳ ماه کار فشرده توسعه داده شده است. تمرکز این استارتاپ در حوزه هوش‌مصنوعی مولد بوده و قصد دارد محصولات خود را به صورت اپن‌سورس در اختیار عموم قرار دهد.


گوگل DeepMind را برای رقابت با ChatGPT به میدان می‌فرستد!

/gemini

  اخیراً Demis Hassabis مدیرعامل DeepMind اعلام کرد که این شرکت به زودی مدل LLM جدیدی به نام Gemini را منتشر می‌کند که با ChatGPT رقابت کرده و حتی از آن برتری خواهد داشت. طبق این خبر Gemini علاوه‌بر تحلیل متن توانایی حل مساله را نیز دارد. به نظر می‌رسد مدیران گوگل رضایت کافی از انتشار چت‌بات Bard را نداشته‌ و می‌خواهند با ایده جدید وارد میدان رقابت شوند. به گفته Demis Hassabis استفاده از یادگیری تقویتی در Gemini منجر به بهبود این مدل در اجرای دستوراتی شده است که مدل‌های معمولی LLM در اجرای آن به چالش می‌خورند.