برند متا در برابر اتهامات؛ آیا شایعات درباره مدل‌های هوش مصنوعی حقیقت دارند؟

مدیران برند متا شایعات مربوط به دستکاری مدل‌های هوش مصنوعی Llama 4 را نادرست خوانده‌اند اما تفاوت عملکرد این مدل‌ها در پلتفرم‌های مختلف جنجال ایجاد کرده است.

به گزارش توسعه برند، احمد الدحله، معاون بخش هوش مصنوعی مولد در برند متا، در پستی در شبکه اجتماعی X اعلام کرد که این ادعا که مدل‌های Llama 4 Maverick و Llama 4 Scout با استفاده از مجموعه داده‌های مخصوص تست آموزش داده شده‌اند، «کاملاً نادرست» است.

در معیارهای ارزیابی هوش مصنوعی، مجموعه داده‌های تست برای سنجش عملکرد یک مدل پس از مراحل آموزش استفاده می‌شوند. اگر مدلی به‌طور خاص روی این مجموعه‌ها آموزش داده شود، ممکن است امتیازهای معیار به صورت غیرواقعی افزایش پیدا کند و قابلیت‌های مدل بیش از حد واقعی نشان داده شود.

در تعطیلات آخر هفته، این شایعات که متا به‌طور مصنوعی نتایج معیار مدل‌های خود را بهبود داده، در شبکه‌های اجتماعی X و Reddit شروع به انتشار کرد. این شایعه از یک پست در شبکه اجتماعی چینی منابع گرفته است؛ جایی که کاربری ادعا کرده به دلیل نارضایتی از روش‌های ارزیابی برند متا استعفا داده است.

گزارش‌هایی مبنی بر عملکرد ضعیف مدل‌های Maverick و Scout در برخی وظایف، شایعات را تقویت کرد. همچنین، تصمیم متا برای استفاده از نسخه آزمایشی و منتشرنشده Maverick برای کسب امتیازات بهتر در معیار LM Arena به این حواشی افزود. پژوهشگران در شبکه X اختلافات زیادی را بین نسخه قابل دانلود Maverick و نسخه‌ای از آن که در LM Arena میزبانی شده، مشاهده کرده‌اند.

احمد الدحله با تایید اینکه برخی کاربران با «کیفیت‌های متفاوت» از مدل‌های Maverick و Scout در میان ارائه‌دهندگان مختلف خدمات ابری مواجه شده‌اند، گفت:

از آنجا که مدل‌ها را به محض آماده شدن منتشر کردیم، انتظار داریم چند روز طول بکشد تا همه نسخه‌های عمومی به‌طور کامل تنظیم شوند.

وی ادامه داد:

«ما به کار روی اصلاح مشکلات و همکاری با شرکای خود ادامه خواهیم داد.»

برچسب ها