غول فناوری متا از مدل هوش مصنوعی Llama 3.3 با کارایی بالاتر و هزینه کمتر رونمایی کرد

شرکت متا از جدیدترین عضو خانواده مدل‌های هوش مصنوعی تولیدکننده متن خود، Llama 3.3 70B، رونمایی کرد. این مدل با عملکردی به خوبی مدل بزرگ‌تر Llama 3.1 405B، از هزینه پایین‌تری برخوردار است. مدل Llama 3.3 در زمینه‌هایی مانند ریاضیات، دانش عمومی، دنبال کردن دستورالعمل‌ها و استفاده از برنامه‌ها بهبود قابل توجهی را ارائه می‌دهد.

به گزارش توسعه برند به نقل از تک کرانچ، احمد الدهله، معاون بخش هوش مصنوعی تولیدکننده متن در متا، در پستی اعلام کرد که مدل جدید Llama 3.3 70B با وجود حجم کمتر (۷۰ میلیارد پارامتر) نسبت به مدل قبلی (۴۰۵ میلیارد پارامتر) عملکرد مشابهی را با هزینه‌ی کمتری ارائه می‌دهد.

دهله با استناد به نموداری، عملکرد برتر Llama 3.3 70B را در مقایسه با مدل‌های Gemini 1.5 Pro از گوگل، GPT-4o از OpenAI و Nova Pro از آمازون، در تعدادی از معیارهای صنعتی مانند MMLU (سنجش توانایی مدل در درک زبان) به نمایش گذاشت. سخنگوی متا از طریق ایمیل اعلام کرد که این مدل باید منجر به بهبود در زمینه‌هایی مانند ریاضیات، دانش عمومی، دنبال کردن دستورالعمل‌ها و استفاده از برنامه‌ها شود.

مدل Llama 3.3 70B برای دانلود از طریق پلتفرم توسعه هوش مصنوعی Hugging Face و منابع دیگر، از جمله وب سایت رسمی Llama، در دسترس قرار گرفته است. این اقدام، آخرین تلاش متا برای تسلط بر حوزه هوش مصنوعی با استفاده از مدل‌های “باز” است که می‌توان از آنها برای طیف وسیعی از برنامه‌ها استفاده و تجاری‌سازی کرد.

با وجود اصطلاح “باز”، محدودیت‌هایی برای استفاده از مدل‌های Llama توسط برخی توسعه‌دهندگان وجود دارد. به عنوان مثال، پلتفرم‌هایی با بیش از ۷۰۰ میلیون کاربر ماهانه باید مجوز ویژه‌ای دریافت کنند. با این حال، به لطف محبوبیت بالای این مدل (با بیش از ۶۵۰ میلیون دانلود)، این موضوع برای بسیاری از توسعه‌دهندگان کم‌اهمیت است.

متا همچنین از Llama در بخش‌های داخلی خود استفاده کرده است. Meta AI، دستیار هوش مصنوعی این شرکت که به طور کامل مبتنی بر مدل‌های Llama است، طبق گفته‌ی مدیرعامل متا، مارک زاکربرگ، اکنون نزدیک به ۶۰۰ میلیون کاربر فعال ماهانه دارد. زاکربرگ ادعا می‌کند که Meta AI در مسیر تبدیل شدن به پراستفاده‌ترین دستیار هوش مصنوعی در جهان قرار دارد.

ماهیت “باز” Llama برای متا هم مزایا و هم معایبی به همراه داشته است. در نوامبر، گزارشی ادعا کرد که محققان نظامی چین از مدل Llama برای توسعه یک چت‌بات دفاعی استفاده کرده‌اند. متا در پاسخ، مدل‌های Llama را برای پیمانکاران دفاعی ایالات متحده در دسترس قرار داد.

با این حال، متا نگرانی‌هایی را در مورد توانایی خود برای انطباق با “قانون هوش مصنوعی” اتحادیه اروپا که چارچوب قانونی برای هوش مصنوعی را تعیین می‌کند، ابراز کرده است. متا اجرای این قانون را برای استراتژی انتشار باز خود “بسیار غیرقابل پیش‌بینی” می‌داند. موضوع مرتبط دیگر برای این شرکت، ضوابط موجود در “GDPR”، قانون حریم خصوصی اتحادیه اروپا است که مربوط به آموزش هوش مصنوعی می‌شود. متا مدل‌های هوش مصنوعی خود را با داده‌های عمومی کاربران اینستاگرام و فیسبوک که انصراف نداده‌اند، آموزش می‌دهد – داده‌هایی که در اروپا تحت ضمانت‌های GDPR قرار دارند.

تنظیم‌کننده‌های اتحادیه اروپا در اوایل سال جاری از متا درخواست کردند تا آموزش مدل‌ها روی داده‌های کاربران اروپایی را متوقف کند تا انطباق این شرکت با GDPR را ارزیابی کنند. متا در عین حال از نامه‌ی سرگشاده‌ای حمایت کرد که خواستار “تفسیر مدرن” از GDPR است که “پیشرفت را رد نمی‌کند.”

متا، نه تنها از چالش‌های فنی مشابه سایر آزمایشگاه‌های هوش مصنوعی در امان نیست، بلکه زیرساخت محاسباتی خود را برای آموزش و راه‌اندازی نسل‌های بعدی Llama ارتقا می‌دهد. این شرکت روز چهارشنبه اعلام کرد که در حال ساخت یک مرکز داده‌ی هوش مصنوعی ۱۰ میلیارد دلاری در لوئیزیانا است – بزرگ‌ترین مرکز داده‌ی هوش مصنوعی متا تاکنون.
زاکربرگ در تماس درآمدی سه ماهه چهارم متا در ماه اوت گفت که برای آموزش مجموعه بعدی مدل‌های بزرگ Llama، یعنی Llama 4، شرکت به ۱۰ برابر قدرت محاسباتی بیشتر از آنچه برای آموزش Llama 3 نیاز داشت، نیاز دارد. متا خوشه‌ای متشکل از بیش از ۱۰۰۰۰۰ پردازنده گرافیکی Nvidia برای توسعه مدل تهیه کرده است که با منابع رقبایی مانند xAI برابری می‌کند.
آموزش مدل‌های مولد هوش مصنوعی یک کسب‌وکار پرهزینه است. هزینه‌های سرمایه‌ای متا تقریباً ۳۳ درصد به ۸.۵ میلیارد دلار در سه ماهه دوم ۲۰۲۴ افزایش یافت که در مقایسه با ۶.۴ میلیارد دلار در سال گذشته، عمدتاً به دلیل سرمایه‌گذاری در سرورها، مراکز داده و زیرساخت‌های شبکه بود.

برچسب ها