llm
رقیب GPT-4 توسط گوگل منتشر شد | معرفی Gemini
/%D9%85%D8%AF%D9%84-%D9%82%D8%AF%D8%B1%D9%85%D9%86%D8%AF-%DA%AF%D9%88%DA%AF%D9%84-%D9%85%D9%86%D8%AA%D8%B4%D8%B1-%D8%B4%D8%AF-%D9%85%D8%B9%D8%B1%D9%81%DB%8C-%D9%85%D8%AF%D9%84-geminiبالاخره بعد از مدتها انتظار گوگل قدرتمندترین مدل هوشمصنوعی خود به نام Gemini (با تلفظ جمینای) را منتشر کرد. این مدل توانایی درک دیتا به شکلهای مختلف متن، کد، تصویر، ویدئو و صوت را دارد. از این رو اصطلاحاً یک multimodal (مولتی مدال) نامیده میشود. نسخه 1.0 مدل Gemini در سه سایز مختلف بهینه شده است: نسخه Nano برای گوشیهای هوشمند، نسخه Pro برای اجرای گسترهای از تسکهای مختلف و نسخه Ultra برای اجرای تسکهای بسیار پیچیده. بنابر گزارش فنی منتشر شده، نسخه Gemini Ultra در ۳۰ مورد از ۳۲ بنچمارک معتبر از مدل GPT-4 بهتر عمل کرده است. Gemini با استفاده از پلتفرم TPU گوگل از ابتدا به صورت مولتی مدال با توانایی درک انواع دیتا توسعه شده است. در حال حاضر از نسخه Pro در چتبات بارد استفاده شده و قرار است به زودی در مجموعهای از محصولات گوگل نیز مورد بهرهبرداری قرار بگیرد. نسخه Nano نیز در گوشی پرچمدار پیکسل ۸ به صورت آفلاین مورد استفاده قرار میگیرد و قرار است ابتدای سال بعد نسخه Ultra با معرفی Bard Advanced در اختیار علاقهمندان قرار بگیرد.
رقابت اپنسورس و انحصار: معرفی مدل LLaVA
/%D8%B1%D9%82%D8%A7%D8%A8%D8%AA-%D8%A7%D9%BE%D9%86-%D8%B3%D9%88%D8%B1%D8%B3-%D9%88-%D8%A7%D9%86%D8%AD%D8%B5%D8%A7%D8%B1-%D9%85%D8%B9%D8%B1%D9%81%DB%8C-%D9%85%D8%AF%D9%84-llavaمحققان دانشگاههای استنفورد، کلمبیا و ویسکانسین مدیسون در یک همکاری مشترک مدل LLaVA را به صورت اپنسورس و رایگان منتشر کردند. این مدل توانایی زبانی و درک تصویر را داشته و میتواند با مدل GPT-4 شرکت OpenAI رقابت کند. LLaVA در ادامه اقدام متا در توسعه مدلهای اپنسورس معرفی شده است. با این وجود در دسترس عموم قرار گرفتن مدلهای قدرتمند هوشمصنوعی نگرانیهایی را نیز در پی داشته است.
معرفی مدل زبانی Mistral 7B
/%D9%85%D8%B9%D8%B1%D9%81%DB%8C-%D9%85%D8%AF%D9%84-%D8%B2%D8%A8%D8%A7%D9%86%DB%8C-mistral-7bاستارتاپ فرانسوی Mistral مدل بزرگ زبانی (LLM) خود موسوم به Mistral 7B را تحت لایسنس Apache 2.0 به صورت عمومی منتشر کرد. طبق ادعای این استارتاپ این مدل نسبت به مدلهای مشابه (از نظر سایز) نظیر Llama 2 13B و Llama 1 34B بهتر عمل میکند. برای تسکهای برنامهنویسی نیز عملکرد مشابه مدل CodeLlama 7B دارد. تقریباً هیچ اقدام جدی برای ایمنی این مدل انجام نشده و طبق نمونههای منتشر شده در پلتفرم ایکس (توئیتر) میتوان به راحتی از آن برای تولید محتوای نژاد پرستی و یا راهنمای خودکشی استفاده کرد. البته Mistral اعلام کرده که این نسخه اولیه بوده که در اسرع وقت ریلیز شده و در آینده اقدامات لازم برای افزایش ایمنی این مدل را انجام خواهد داد. بنابر ادعای این استارت مدل Mistral 7B تنها طی ۳ ماه کار فشرده توسعه داده شده است. تمرکز این استارتاپ در حوزه هوشمصنوعی مولد بوده و قصد دارد محصولات خود را به صورت اپنسورس در اختیار عموم قرار دهد.
گوگل DeepMind را برای رقابت با ChatGPT به میدان میفرستد!
/geminiاخیراً Demis Hassabis مدیرعامل DeepMind اعلام کرد که این شرکت به زودی مدل LLM جدیدی به نام Gemini را منتشر میکند که با ChatGPT رقابت کرده و حتی از آن برتری خواهد داشت. طبق این خبر Gemini علاوهبر تحلیل متن توانایی حل مساله را نیز دارد. به نظر میرسد مدیران گوگل رضایت کافی از انتشار چتبات Bard را نداشته و میخواهند با ایده جدید وارد میدان رقابت شوند. به گفته Demis Hassabis استفاده از یادگیری تقویتی در Gemini منجر به بهبود این مدل در اجرای دستوراتی شده است که مدلهای معمولی LLM در اجرای آن به چالش میخورند.