احتمالاً داستان تب طلا در قرن نوزدهم میلادی در آمریکا را شنیده‌اید. در این زمان که اکثر مردم به دنبال کشف طلا و دستیابی به ثروت کلان بودند‌ مردی با فروش بیل به جویندگان طلا ثروت کلانی اندوخت در حالی‌که چیزی عاید اکثر جویندگان طلا نشد. این مطلب بارها به عنوان یک استراتژی فروش نقل شده است. فارغ از صحت و سقم داستان مرد بیل فروش این مطلب نکته‌ای مهم و ساده را منتقل می‌کند. احتمالاً نمونه‌های مشابه این داستان را در حوزه‌های مختلف مشاهده کرده‌اید. شاید بتوان گفت کمپانی NVIDIA در موج هوش‌مصنوعی جایگاهی مشابه مرد بیل‌فروش پیدا کرده است. NVIDIA از بزرگترین تولیدکننده‌های چیپ در دنیاست. ارزش سهام این شرکت تنها طی ۸ ماه حدود ۳ برابر شد و در ماه May گذشته به کلوپ کمپانی‌های یک تریلیون دلاری پیوست (نمودار زیر را مشاهده کنید). بدون شک هوش‌مصنوعی از مهم‌ترین دستاوردهای تاریخ بشر است که به زودی دگرگونی‌های بزرگی را به همراه خواهد آورد. چشم‌انداز این تکنولوژی و فرصت‌های پیش‌روی آن موجی از سرمایه‌گذاران و محققان را به سمت هوش‌مصنوعی سوق داده است. همانطور که ماهیت تکنولوژی در دهه‌های اخیر نشان داده است انتظار می‌رود بسیاری از شرکت‌هایی که در حال حاضر برای بهره‌برداری از AI راه‌اندازی شده‌اند در سال‌های آینده وجود نداشته باشند. اما وضعیت برای بیزینس‌هایی که زیرساخت این موج را فراهم می‌کنند فرق می‌کند. NVIDIA نیز از جمله چنین بیزنس‌هایی است. 

موقعیت فوق‌العاده NVIDIA مرهون تولید چیپ‌های مخصوص هوش‌مصنوعی است. به صورت کلی تولید چیپ از نظر فنی بسیار پیچیده بوده و کار هر کسی نیست! برای آموزش مدل‌های هوش‌مصنوعی از چیپ‌های مخصوصی به نام GPU یا پردازنده گرافیکی استفاده می‌شود که از پردازنده‌های عادی بسیار سریع‌تر و بهینه‌تر است. GPU با فراهم کردن پردازش موازی تسک‌های ماشین‌لرنینگ را در زمان بسیار کمتری انجام می‌دهد. تمامی مدل‌های قدرتمند هوش‌مصنوعی نظیر Bard و ChatGPT نیز با استفاده از چندین هزار GPU آموزش داده شده‌اند. بخش بزرگی از سرمایه‌گذاری شرکت‌های استارتاپی در حوزه AI نیز صرف خرید و راه‌اندازی کلاسترهای GPU می‌شود. فروش و توزیع چیپ در دنیا پیچیدگی‌های سیاسی نیز دارد. در حال حاضر یکی از بازوهای آمریکا برای حفظ برتری تکنولوژی مقابل چین ممنوعیت صادرات چیپ‌های پیشرفته به این کشور است. موضوعی که تحت عنوان Chip War از آن یاد می‌شود. شرکت NVIDIA سال گذشته میلادی پردازنده‌ گرافیکی H100 را معرفی کرد. چیپ H100 در حال حاضر از قوی‌ترین پردازنده‌های موجود برای الگوریتم‌های یادگیری ماشین است که توسط بسیاری از کمپانی‌های بزرگ هوش‌مصنوعی نظیر متا و Inflection AI خریداری شده است. ارزش هر کدام از این پردازنده‌ها حدود ۴۰ هزار دلار آمریکاست. این پردازنده‌ها به قدری ارزشمند بوده که اخیراً به عنوان وثیقه برای دریافت وام ۲.۳ میلیارد دلاری از پلتفرم ابری CoreWeave مورد قبول قرار گرفت.

NVIDIA GPU cluster

اما اکنون بعد از گذشت یکسال از معرفی H100 پردازنده جدیدی با نام GH200 توسط NVIDIA به بازار معرفی شد! از این چیپ برای هوش‌مصنوعی مولد‌ (Generative AI)، مدل‌های بزرگ زبانی (LLM)، سیستم‌های ریکامندیشن و دیتابیس‌های برداری (Vector Database) استفاده خواهد شد. در این پردازنده برای اولین بار از مموری HBM3e استفاده شده است که نسبت به نسل فعلی مموری‌های پهنای باند بالا (HBM) پنجاه درصد سریع‌تر بوده و امکان اجرای مدل‌های بزرگ‌تر را فراهم می‌سازد. پردازنده GH200 تا فصل دوم سال ۲۰۲۴ در پیکربندی‌های مختلف آماده عرضه به بازار خواهد بود. هر چیپ GH200 دارای ۷۲ هسته با معماری ARM و 141GB مموری است. پیکربندی دوتایی آن ۳ برابر پهنای باند و ۳.۵ برابر ظرفیت مموری بیشتر نسبت به تکنولوژی حال حاضر فراهم می‌کند. بنابر ادعای Jensen Huang مدیرعامل NVIDIA در چیپ جدید GH200 هزینه اجرای مدل‌های بزرگ زبانی به مقدار قابل توجهی کاهش می‌یابد. دلیل این کاهش افزایش مموری در چیپ GH200 و کاهش هزینه استنتاج (Inference) در چیپ است. منظور از استنتاج اجرای مدل بعد از آموزش (Training) است. (تصاویر زیر مربوط به GH200 است).

NVIDIA GH200

NVIDIA GH200


۱. Nvidia briefly joins $1 trillion valuation club

۲.NVIDIA Unveils Next-Generation GH200 Grace Hopper Superchip Platform for Era of Accelerated Computing and Generative AI

۳. Nvidia reveals new A.I. chip, says costs of running LLMs will ‘drop significantly’

۴. Inflection AI کلاستر ۲۲هزارتایی از H100 راه‌اندازی‌ می‌کند.

۵. درباره تب طلا در آمریکا اینجا را بخوانید.


اگر مایل به دریافت این خبرنامه در پست‌الکترونیک خود هستید از اینجا ثبت‌نام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد. همچنین می‌توانید با عضو شدن در کانال تلگرام این خبرنامه، در سریع‌ترین زمان در جریان مقالات جدید قرار بگیرید.