برند Meta مدل‌های Llama 4 را معرفی کرد؛ رقابت داغ در صحنه هوش مصنوعی

برند Meta با مدل‌های جدید Llama 4، از معماری ترکیب متخصصان برای افزایش بهره‌وری پردازشی رونمایی کرده و هوش مصنوعی خود را به رقیبی جدی‌تر برای سایر شرکت‌ها تبدیل کرده است.

به گزارش توسعه برند، شرکت متا در روز شنبه از سری جدید مدل‌های هوش مصنوعی خود تحت عنوان Llama 4 رونمایی کرد؛ مجموعه‌ای که شامل چهار مدل جدید می‌شود: Llama 4 Scout، Llama 4 Maverick و Llama 4 Behemoth. تمامی این مدل‌ها با حجم بالایی از داده‌های متنی، تصویری و ویدیویی آموزش داده شده‌اند تا به گفته متا، به درک تصویری گسترده‌ای دست یابند.

گفته می‌شود توسعه مدل‌های Llama 4 تحت فشار رقابت با مدل‌های موفق آزمایشگاه چینی DeepSeek شدت گرفته است؛ مدل‌های باز این آزمایشگاه، مانند R1 و V3، عملکردی بهتر یا مشابه با مدل‌های قبلی متا داشته‌اند. این موضوع باعث شد متا اتاق‌های فکر خاصی را به تحلیل روش کاهش هزینه‌های آموزش و استقرار این مدل‌ها اختصاص دهد.

در حال حاضر مدل‌های Scout و Maverick به صورت آزاد از طریق وب‌سایت Llama.com و شرکای متا (از جمله پلتفرم توسعه هوش مصنوعی Hugging Face) در دسترس هستند. اما مدل Behemoth هنوز مراحل آموزشی خود را طی می‌کند. همچنین متا اعلام کرده است مدل‌های Llama 4 در دستیار هوش مصنوعی Meta AI (مورد استفاده در اپلیکیشن‌هایی مانند واتس‌اپ، مسنجر و اینستاگرام) در ۴۰ کشور به‌روزرسانی شده‌اند. البته قابلیت‌های چند‌منظوره فعلاً تنها در آمریکا و به زبان انگلیسی ارائه شده است.

یکی از مسائل بحث‌برانگیز مربوط به این مدل‌ها، محدودیت‌های اعمال‌شده توسط متا در مجوز استفاده از آن‌هاست. کاربران و شرکت‌هایی که در اتحادیه اروپا مستقر هستند یا دفتر اصلی آن‌ها در این منطقه قرار دارد، مجاز به استفاده یا توزیع این مدل‌ها نیستند. این محدودیت‌ها به احتمال زیاد نتیجه قوانین سخت‌گیرانه در زمینه هوش مصنوعی و حریم خصوصی داده‌ها در اتحادیه اروپا است. (متا پیش‌تر این قوانین را بیش از حد دشوار توصیف کرده بود.) علاوه بر این، همانند مدل‌های قبلی Llama، شرکت‌هایی با تعداد کاربران فعال ماهانه بیش از ۷۰۰ میلیون نفر باید برای دریافت مجوز ویژه از متا درخواست دهند که این درخواست ممکن است به صلاحدید متا پذیرفته یا رد شود.

متا در یک پست وبلاگی اعلام کرد: «مدل‌های Llama 4 آغازگر عصر جدیدی برای اکوسیستم Llama هستند و این فقط آغاز کار مجموعه Llama 4 است.»

یکی از ویژگی‌های جدید Llama 4 استفاده از معماری ترکیب متخصصان (MoE) است که به گفته متا، انقلابی در بهره‌وری محاسباتی محسوب می‌شود و فرآیند آموزش و پاسخ‌گویی مدل‌ها را بهینه‌تر می‌کند. این معماری وظایف پردازش داده را به بخش‌های کوچک‌تر تقسیم کرده و هر بخش را به مدل‌های “متخصص” اختصاص می‌دهد.

برای مثال مدل Maverick دارای ۴۰۰ میلیارد پارامتر کل و ۱۷ میلیارد پارامتر فعال در میان ۱۲۸ مدل متخصص است. (پارامترها نشان‌دهنده مهارت‌های حل مسئله در مدل‌ها هستند.) مدل Scout نیز با ۱۷ میلیارد پارامتر فعال، ۱۶ مدل متخصص و ۱۰۹ میلیارد پارامتر کل به انجام وظایفی مانند خلاصه‌سازی اسناد و تحلیل کد کمک می‌کند.

Scout می‌تواند تنها با یک GPU سری Nvidia H100 اجرا شود، اما مدل Maverick نیازمند سیستم Nvidia H100 DGX یا معادل آن است. مدل Behemoth، که هنوز عرضه نشده، به سخت‌افزار قدرتمندتری نیاز دارد. این مدل دارای ۲۸۸ میلیارد پارامتر فعال، ۱۶ متخصص و نزدیک به دو تریلیون پارامتر کل است و عملکرد آن به گفته متا در برخی آزمون‌ها از مدل‌هایی مانند GPT-4.5 ،Claude 3.7 Sonnet و Gemini 2.0 Pro بهتر بوده است.

با این حال، هیچ‌کدام از مدل‌های Llama 4 به عنوان مدل‌های «استدلالی» شناخته نمی‌شوند؛ مدل‌هایی که مانند OpenAI’s o1 استدلال و صحت پاسخ‌ها را بررسی می‌کنند. مدل‌های استدلالی پاسخ‌ها را به‌صورت قابل اعتماد‌تر ارائه می‌دهند اما زمان بیشتری برای این کار نیاز دارند.

نکته جالب اینکه؛ متا مدل‌های Llama 4 را طوری تنظیم کرده که کمتر از ارائه پاسخ به موضوعات حساس امتناع کنند. این مدل‌ها قادر به پاسخ‌گویی به مباحث سیاسی و اجتماعی هستند که نسخه‌های قبلی Llama از آن‌ها اجتناب می‌کردند. همچنین متا تاکید دارد که این مدل‌ها در تنظیم درخواست‌ها متعادل‌تر عمل می‌کنند.

سخنگوی متا در مصاحبه‌ای گفت: «شما می‌توانید روی Llama 4 حساب کنید که پاسخ‌های مفید و واقعی بدون پیش‌داوری ارائه دهد، و ما در حال بهبود قابلیت‌های Llama هستیم تا بتواند به سوالات بیشتری پاسخ دهد و دیدگاه‌های متفاوتی را فراهم کند.»

به گزارش تک‌کرانچ، این تغییرات در شرایطی رخ داده که برخی متحدان رئیس‌جمهور سابق آمریکا، دونالد ترامپ، مانند ایلان ماسک، به هوش مصنوعی به دلیل داشتن سوگیری سیاسی انتقاد کرده‌اند. علی‌رغم این چالش‌ها، توسعه مدل‌های هوش مصنوعی که بتوانند پاسخ‌های متعادل‌تری ارائه دهند همچنان ادامه دارد.

برچسب ها