برند Meta مدلهای Llama 4 را معرفی کرد؛ رقابت داغ در صحنه هوش مصنوعی

برند Meta با مدلهای جدید Llama 4، از معماری ترکیب متخصصان برای افزایش بهرهوری پردازشی رونمایی کرده و هوش مصنوعی خود را به رقیبی جدیتر برای سایر شرکتها تبدیل کرده است.
به گزارش توسعه برند، شرکت متا در روز شنبه از سری جدید مدلهای هوش مصنوعی خود تحت عنوان Llama 4 رونمایی کرد؛ مجموعهای که شامل چهار مدل جدید میشود: Llama 4 Scout، Llama 4 Maverick و Llama 4 Behemoth. تمامی این مدلها با حجم بالایی از دادههای متنی، تصویری و ویدیویی آموزش داده شدهاند تا به گفته متا، به درک تصویری گستردهای دست یابند.
گفته میشود توسعه مدلهای Llama 4 تحت فشار رقابت با مدلهای موفق آزمایشگاه چینی DeepSeek شدت گرفته است؛ مدلهای باز این آزمایشگاه، مانند R1 و V3، عملکردی بهتر یا مشابه با مدلهای قبلی متا داشتهاند. این موضوع باعث شد متا اتاقهای فکر خاصی را به تحلیل روش کاهش هزینههای آموزش و استقرار این مدلها اختصاص دهد.
در حال حاضر مدلهای Scout و Maverick به صورت آزاد از طریق وبسایت Llama.com و شرکای متا (از جمله پلتفرم توسعه هوش مصنوعی Hugging Face) در دسترس هستند. اما مدل Behemoth هنوز مراحل آموزشی خود را طی میکند. همچنین متا اعلام کرده است مدلهای Llama 4 در دستیار هوش مصنوعی Meta AI (مورد استفاده در اپلیکیشنهایی مانند واتساپ، مسنجر و اینستاگرام) در ۴۰ کشور بهروزرسانی شدهاند. البته قابلیتهای چندمنظوره فعلاً تنها در آمریکا و به زبان انگلیسی ارائه شده است.
یکی از مسائل بحثبرانگیز مربوط به این مدلها، محدودیتهای اعمالشده توسط متا در مجوز استفاده از آنهاست. کاربران و شرکتهایی که در اتحادیه اروپا مستقر هستند یا دفتر اصلی آنها در این منطقه قرار دارد، مجاز به استفاده یا توزیع این مدلها نیستند. این محدودیتها به احتمال زیاد نتیجه قوانین سختگیرانه در زمینه هوش مصنوعی و حریم خصوصی دادهها در اتحادیه اروپا است. (متا پیشتر این قوانین را بیش از حد دشوار توصیف کرده بود.) علاوه بر این، همانند مدلهای قبلی Llama، شرکتهایی با تعداد کاربران فعال ماهانه بیش از ۷۰۰ میلیون نفر باید برای دریافت مجوز ویژه از متا درخواست دهند که این درخواست ممکن است به صلاحدید متا پذیرفته یا رد شود.
متا در یک پست وبلاگی اعلام کرد: «مدلهای Llama 4 آغازگر عصر جدیدی برای اکوسیستم Llama هستند و این فقط آغاز کار مجموعه Llama 4 است.»
یکی از ویژگیهای جدید Llama 4 استفاده از معماری ترکیب متخصصان (MoE) است که به گفته متا، انقلابی در بهرهوری محاسباتی محسوب میشود و فرآیند آموزش و پاسخگویی مدلها را بهینهتر میکند. این معماری وظایف پردازش داده را به بخشهای کوچکتر تقسیم کرده و هر بخش را به مدلهای “متخصص” اختصاص میدهد.
برای مثال مدل Maverick دارای ۴۰۰ میلیارد پارامتر کل و ۱۷ میلیارد پارامتر فعال در میان ۱۲۸ مدل متخصص است. (پارامترها نشاندهنده مهارتهای حل مسئله در مدلها هستند.) مدل Scout نیز با ۱۷ میلیارد پارامتر فعال، ۱۶ مدل متخصص و ۱۰۹ میلیارد پارامتر کل به انجام وظایفی مانند خلاصهسازی اسناد و تحلیل کد کمک میکند.
Scout میتواند تنها با یک GPU سری Nvidia H100 اجرا شود، اما مدل Maverick نیازمند سیستم Nvidia H100 DGX یا معادل آن است. مدل Behemoth، که هنوز عرضه نشده، به سختافزار قدرتمندتری نیاز دارد. این مدل دارای ۲۸۸ میلیارد پارامتر فعال، ۱۶ متخصص و نزدیک به دو تریلیون پارامتر کل است و عملکرد آن به گفته متا در برخی آزمونها از مدلهایی مانند GPT-4.5 ،Claude 3.7 Sonnet و Gemini 2.0 Pro بهتر بوده است.
با این حال، هیچکدام از مدلهای Llama 4 به عنوان مدلهای «استدلالی» شناخته نمیشوند؛ مدلهایی که مانند OpenAI’s o1 استدلال و صحت پاسخها را بررسی میکنند. مدلهای استدلالی پاسخها را بهصورت قابل اعتمادتر ارائه میدهند اما زمان بیشتری برای این کار نیاز دارند.
نکته جالب اینکه؛ متا مدلهای Llama 4 را طوری تنظیم کرده که کمتر از ارائه پاسخ به موضوعات حساس امتناع کنند. این مدلها قادر به پاسخگویی به مباحث سیاسی و اجتماعی هستند که نسخههای قبلی Llama از آنها اجتناب میکردند. همچنین متا تاکید دارد که این مدلها در تنظیم درخواستها متعادلتر عمل میکنند.
سخنگوی متا در مصاحبهای گفت: «شما میتوانید روی Llama 4 حساب کنید که پاسخهای مفید و واقعی بدون پیشداوری ارائه دهد، و ما در حال بهبود قابلیتهای Llama هستیم تا بتواند به سوالات بیشتری پاسخ دهد و دیدگاههای متفاوتی را فراهم کند.»
به گزارش تککرانچ، این تغییرات در شرایطی رخ داده که برخی متحدان رئیسجمهور سابق آمریکا، دونالد ترامپ، مانند ایلان ماسک، به هوش مصنوعی به دلیل داشتن سوگیری سیاسی انتقاد کردهاند. علیرغم این چالشها، توسعه مدلهای هوش مصنوعی که بتوانند پاسخهای متعادلتری ارائه دهند همچنان ادامه دارد.