مدل بزرگ زبانی

معرفی مدل زبانی Mistral 7B

/%D9%85%D8%B9%D8%B1%D9%81%DB%8C-%D9%85%D8%AF%D9%84-%D8%B2%D8%A8%D8%A7%D9%86%DB%8C-mistral-7b

استارتاپ فرانسوی Mistral مدل بزرگ زبانی (LLM) خود موسوم به Mistral 7B را تحت لایسنس Apache 2.0 به صورت عمومی منتشر کرد. طبق ادعای این استارتاپ این مدل نسبت به مدل‌های مشابه (از نظر سایز) نظیر Llama 2 13B و Llama 1 34B بهتر عمل می‌کند. برای تسک‌های برنامه‌نویسی نیز عملکرد مشابه مدل CodeLlama 7B دارد. تقریباً هیچ اقدام جدی برای ایمنی این مدل انجام نشده و طبق نمونه‌های منتشر شده در پلتفرم ایکس (توئیتر) می‌توان به راحتی از آن برای تولید محتوای نژاد پرستی و یا راهنمای خودکشی استفاده کرد. البته Mistral اعلام کرده که این نسخه اولیه بوده که در اسرع وقت ریلیز شده و در آینده اقدامات لازم برای افزایش ایمنی این مدل را انجام خواهد داد. بنابر ادعای این استارت مدل Mistral 7B تنها طی ۳ ماه کار فشرده توسعه داده شده است. تمرکز این استارتاپ در حوزه هوش‌مصنوعی مولد بوده و قصد دارد محصولات خود را به صورت اپن‌سورس در اختیار عموم قرار دهد.