چالش جدید برند Bluesky؛ تصمیم‌گیری کاربران درباره استفاده از داده‌ها در هوش مصنوعی

برند Bluesky با ارائه پیشنهادی جدید به کاربران اجازه می‌دهد تصمیم بگیرند که آیا داده‌هایشان برای آموزش هوش مصنوعی و آرشیو عمومی استفاده شود یا نه. این تصمیم اما واکنش‌های متفاوتی را در پی داشته است؛ برخی آن را گامی مثبت در جهت شفافیت می‌دانند و برخی دیگر نگران تغییر سیاست‌های این برند در قبال حریم خصوصی هستند.

به گزارش توسعه برند، شبکه اجتماعی Bluesky اخیراً در GitHub پیشنهادی را منتشر کرده است که گزینه‌های جدیدی را برای کاربران فراهم می‌کند تا مشخص کنند آیا مایل‌اند داده‌ها و پست‌هایشان برای مقاصدی مانند آموزش هوش مصنوعی مولد و آرشیو عمومی استفاده شود یا خیر.

جِی گرِیبر، مدیرعامل Bluesky، اوایل این هفته در رویداد South by Southwest درباره این پیشنهاد صحبت کرد، اما این موضوع زمانی توجه بیشتری جلب کرد که او جمعه‌شب درباره آن در Bluesky پستی منتشر کرد. برخی از کاربران نسبت به این طرح واکنش منفی نشان دادند و آن را برخلاف تعهدات قبلی Bluesky مبنی بر عدم فروش داده‌های کاربران به تبلیغ‌کنندگان و عدم استفاده از محتوای کاربران برای آموزش AI دانستند.

یکی از کاربران به نام Sketchette در واکنش نوشت:

«اوه، نه! جذابیت این پلتفرم در همین عدم اشتراک‌گذاری اطلاعات بود، به‌خصوص با هوش مصنوعی مولد. حالا تسلیم نشو!»

گرِیبر در پاسخ گفت که شرکت‌های هوش مصنوعی در حال حاضر داده‌های عمومی را از سراسر وب جمع‌آوری می‌کنند، از جمله داده‌های Bluesky، زیرا «همه‌چیز در Bluesky عمومی است، درست مانند یک وب‌سایت.» او تأکید کرد که Bluesky در تلاش است تا یک «استاندارد جدید» برای مدیریت این نوع جمع‌آوری داده‌ها ایجاد کند، مشابه robots.txt که وب‌سایت‌ها از آن برای تعیین مجوزهای دسترسی خزنده‌های وب استفاده می‌کنند.

بحث‌های مربوط به آموزش هوش مصنوعی و حقوق کپی‌رایت، robots.txt را به موضوعی پرچالش تبدیل کرده‌اند، چراکه این استاندارد الزام قانونی ندارد. Bluesky چارچوب پیشنهادی خود را به گونه‌ای معرفی کرده که همان مکانیزم و انتظارات را داشته باشد—یک فرمت قابل خواندن توسط ماشین که فعالان خوش‌نیت انتظار می‌رود به آن پایبند باشند، اما از نظر قانونی قابل اجرا نیست.

بر اساس این پیشنهاد، کاربران برنامه Bluesky و سایر اپلیکیشن‌هایی که از ATProtocol استفاده می‌کنند، می‌توانند در تنظیمات خود مشخص کنند که آیا اجازه استفاده از داده‌هایشان را در چهار دسته دارند یا خیر: هوش مصنوعی مولد، ارتباط بین پروتکل‌ها (اتصال اکوسیستم‌های اجتماعی مختلف)، مجموعه داده‌های انبوه و آرشیو وب (مانند Wayback Machine).

در این پیشنهاد آمده است که اگر کاربری انتخاب کند که نمی‌خواهد داده‌هایش برای آموزش AI استفاده شود، شرکت‌ها و تیم‌های تحقیقاتی که مجموعه داده‌های آموزشی را می‌سازند، باید این تمایل را هنگام جمع‌آوری داده از وب‌سایت‌ها یا انجام انتقال‌های انبوه از طریق پروتکل در نظر بگیرند.

به گزارش تک‌کرانچ، مالی وایت، نویسنده خبرنامه Citation Needed و وبلاگ Web3 is Going Just Great، این پیشنهاد را مثبت ارزیابی کرد و گفت عجیب است که برخی کاربران به Bluesky به دلیل این تصمیم حمله کرده‌اند، چراکه این طرح نه به معنای «خوشامدگویی به هوش مصنوعی» بلکه ایجاد یک سیگنال رضایت برای فرآیندی است که هم‌اکنون نیز در حال انجام است.

او در ادامه افزود:

«نقطه‌ضعف این پیشنهاد و پیشنهاد مشابه Creative Commons برای “سیگنال‌های ترجیحی” این است که اجرای آن وابسته به این است که گردآورندگان داده به این استاندارد احترام بگذارند. اما تاکنون شاهد بوده‌ایم که برخی از این شرکت‌ها به راحتی از کنار robots.txt عبور کرده یا حتی محتوای تحت کپی‌رایت را جمع‌آوری کرده‌اند.»

برچسب ها