برند متا در برابر اتهامات؛ آیا شایعات درباره مدلهای هوش مصنوعی حقیقت دارند؟

مدیران برند متا شایعات مربوط به دستکاری مدلهای هوش مصنوعی Llama 4 را نادرست خواندهاند اما تفاوت عملکرد این مدلها در پلتفرمهای مختلف جنجال ایجاد کرده است.
به گزارش توسعه برند، احمد الدحله، معاون بخش هوش مصنوعی مولد در برند متا، در پستی در شبکه اجتماعی X اعلام کرد که این ادعا که مدلهای Llama 4 Maverick و Llama 4 Scout با استفاده از مجموعه دادههای مخصوص تست آموزش داده شدهاند، «کاملاً نادرست» است.
در معیارهای ارزیابی هوش مصنوعی، مجموعه دادههای تست برای سنجش عملکرد یک مدل پس از مراحل آموزش استفاده میشوند. اگر مدلی بهطور خاص روی این مجموعهها آموزش داده شود، ممکن است امتیازهای معیار به صورت غیرواقعی افزایش پیدا کند و قابلیتهای مدل بیش از حد واقعی نشان داده شود.
در تعطیلات آخر هفته، این شایعات که متا بهطور مصنوعی نتایج معیار مدلهای خود را بهبود داده، در شبکههای اجتماعی X و Reddit شروع به انتشار کرد. این شایعه از یک پست در شبکه اجتماعی چینی منابع گرفته است؛ جایی که کاربری ادعا کرده به دلیل نارضایتی از روشهای ارزیابی برند متا استعفا داده است.
گزارشهایی مبنی بر عملکرد ضعیف مدلهای Maverick و Scout در برخی وظایف، شایعات را تقویت کرد. همچنین، تصمیم متا برای استفاده از نسخه آزمایشی و منتشرنشده Maverick برای کسب امتیازات بهتر در معیار LM Arena به این حواشی افزود. پژوهشگران در شبکه X اختلافات زیادی را بین نسخه قابل دانلود Maverick و نسخهای از آن که در LM Arena میزبانی شده، مشاهده کردهاند.
احمد الدحله با تایید اینکه برخی کاربران با «کیفیتهای متفاوت» از مدلهای Maverick و Scout در میان ارائهدهندگان مختلف خدمات ابری مواجه شدهاند، گفت:
از آنجا که مدلها را به محض آماده شدن منتشر کردیم، انتظار داریم چند روز طول بکشد تا همه نسخههای عمومی بهطور کامل تنظیم شوند.
وی ادامه داد:
«ما به کار روی اصلاح مشکلات و همکاری با شرکای خود ادامه خواهیم داد.»