غول فناوری متا از مدل هوش مصنوعی Llama 3.3 با کارایی بالاتر و هزینه کمتر رونمایی کرد

شرکت متا از جدیدترین عضو خانواده مدلهای هوش مصنوعی تولیدکننده متن خود، Llama 3.3 70B، رونمایی کرد. این مدل با عملکردی به خوبی مدل بزرگتر Llama 3.1 405B، از هزینه پایینتری برخوردار است. مدل Llama 3.3 در زمینههایی مانند ریاضیات، دانش عمومی، دنبال کردن دستورالعملها و استفاده از برنامهها بهبود قابل توجهی را ارائه میدهد.
به گزارش توسعه برند به نقل از تک کرانچ، احمد الدهله، معاون بخش هوش مصنوعی تولیدکننده متن در متا، در پستی اعلام کرد که مدل جدید Llama 3.3 70B با وجود حجم کمتر (۷۰ میلیارد پارامتر) نسبت به مدل قبلی (۴۰۵ میلیارد پارامتر) عملکرد مشابهی را با هزینهی کمتری ارائه میدهد.
دهله با استناد به نموداری، عملکرد برتر Llama 3.3 70B را در مقایسه با مدلهای Gemini 1.5 Pro از گوگل، GPT-4o از OpenAI و Nova Pro از آمازون، در تعدادی از معیارهای صنعتی مانند MMLU (سنجش توانایی مدل در درک زبان) به نمایش گذاشت. سخنگوی متا از طریق ایمیل اعلام کرد که این مدل باید منجر به بهبود در زمینههایی مانند ریاضیات، دانش عمومی، دنبال کردن دستورالعملها و استفاده از برنامهها شود.
مدل Llama 3.3 70B برای دانلود از طریق پلتفرم توسعه هوش مصنوعی Hugging Face و منابع دیگر، از جمله وب سایت رسمی Llama، در دسترس قرار گرفته است. این اقدام، آخرین تلاش متا برای تسلط بر حوزه هوش مصنوعی با استفاده از مدلهای “باز” است که میتوان از آنها برای طیف وسیعی از برنامهها استفاده و تجاریسازی کرد.
با وجود اصطلاح “باز”، محدودیتهایی برای استفاده از مدلهای Llama توسط برخی توسعهدهندگان وجود دارد. به عنوان مثال، پلتفرمهایی با بیش از ۷۰۰ میلیون کاربر ماهانه باید مجوز ویژهای دریافت کنند. با این حال، به لطف محبوبیت بالای این مدل (با بیش از ۶۵۰ میلیون دانلود)، این موضوع برای بسیاری از توسعهدهندگان کماهمیت است.
متا همچنین از Llama در بخشهای داخلی خود استفاده کرده است. Meta AI، دستیار هوش مصنوعی این شرکت که به طور کامل مبتنی بر مدلهای Llama است، طبق گفتهی مدیرعامل متا، مارک زاکربرگ، اکنون نزدیک به ۶۰۰ میلیون کاربر فعال ماهانه دارد. زاکربرگ ادعا میکند که Meta AI در مسیر تبدیل شدن به پراستفادهترین دستیار هوش مصنوعی در جهان قرار دارد.
ماهیت “باز” Llama برای متا هم مزایا و هم معایبی به همراه داشته است. در نوامبر، گزارشی ادعا کرد که محققان نظامی چین از مدل Llama برای توسعه یک چتبات دفاعی استفاده کردهاند. متا در پاسخ، مدلهای Llama را برای پیمانکاران دفاعی ایالات متحده در دسترس قرار داد.
با این حال، متا نگرانیهایی را در مورد توانایی خود برای انطباق با “قانون هوش مصنوعی” اتحادیه اروپا که چارچوب قانونی برای هوش مصنوعی را تعیین میکند، ابراز کرده است. متا اجرای این قانون را برای استراتژی انتشار باز خود “بسیار غیرقابل پیشبینی” میداند. موضوع مرتبط دیگر برای این شرکت، ضوابط موجود در “GDPR”، قانون حریم خصوصی اتحادیه اروپا است که مربوط به آموزش هوش مصنوعی میشود. متا مدلهای هوش مصنوعی خود را با دادههای عمومی کاربران اینستاگرام و فیسبوک که انصراف ندادهاند، آموزش میدهد – دادههایی که در اروپا تحت ضمانتهای GDPR قرار دارند.
تنظیمکنندههای اتحادیه اروپا در اوایل سال جاری از متا درخواست کردند تا آموزش مدلها روی دادههای کاربران اروپایی را متوقف کند تا انطباق این شرکت با GDPR را ارزیابی کنند. متا در عین حال از نامهی سرگشادهای حمایت کرد که خواستار “تفسیر مدرن” از GDPR است که “پیشرفت را رد نمیکند.”
متا، نه تنها از چالشهای فنی مشابه سایر آزمایشگاههای هوش مصنوعی در امان نیست، بلکه زیرساخت محاسباتی خود را برای آموزش و راهاندازی نسلهای بعدی Llama ارتقا میدهد. این شرکت روز چهارشنبه اعلام کرد که در حال ساخت یک مرکز دادهی هوش مصنوعی ۱۰ میلیارد دلاری در لوئیزیانا است – بزرگترین مرکز دادهی هوش مصنوعی متا تاکنون.
زاکربرگ در تماس درآمدی سه ماهه چهارم متا در ماه اوت گفت که برای آموزش مجموعه بعدی مدلهای بزرگ Llama، یعنی Llama 4، شرکت به ۱۰ برابر قدرت محاسباتی بیشتر از آنچه برای آموزش Llama 3 نیاز داشت، نیاز دارد. متا خوشهای متشکل از بیش از ۱۰۰۰۰۰ پردازنده گرافیکی Nvidia برای توسعه مدل تهیه کرده است که با منابع رقبایی مانند xAI برابری میکند.
آموزش مدلهای مولد هوش مصنوعی یک کسبوکار پرهزینه است. هزینههای سرمایهای متا تقریباً ۳۳ درصد به ۸.۵ میلیارد دلار در سه ماهه دوم ۲۰۲۴ افزایش یافت که در مقایسه با ۶.۴ میلیارد دلار در سال گذشته، عمدتاً به دلیل سرمایهگذاری در سرورها، مراکز داده و زیرساختهای شبکه بود.