چالش جدید برند Bluesky؛ تصمیمگیری کاربران درباره استفاده از دادهها در هوش مصنوعی

برند Bluesky با ارائه پیشنهادی جدید به کاربران اجازه میدهد تصمیم بگیرند که آیا دادههایشان برای آموزش هوش مصنوعی و آرشیو عمومی استفاده شود یا نه. این تصمیم اما واکنشهای متفاوتی را در پی داشته است؛ برخی آن را گامی مثبت در جهت شفافیت میدانند و برخی دیگر نگران تغییر سیاستهای این برند در قبال حریم خصوصی هستند.
به گزارش توسعه برند، شبکه اجتماعی Bluesky اخیراً در GitHub پیشنهادی را منتشر کرده است که گزینههای جدیدی را برای کاربران فراهم میکند تا مشخص کنند آیا مایلاند دادهها و پستهایشان برای مقاصدی مانند آموزش هوش مصنوعی مولد و آرشیو عمومی استفاده شود یا خیر.
جِی گرِیبر، مدیرعامل Bluesky، اوایل این هفته در رویداد South by Southwest درباره این پیشنهاد صحبت کرد، اما این موضوع زمانی توجه بیشتری جلب کرد که او جمعهشب درباره آن در Bluesky پستی منتشر کرد. برخی از کاربران نسبت به این طرح واکنش منفی نشان دادند و آن را برخلاف تعهدات قبلی Bluesky مبنی بر عدم فروش دادههای کاربران به تبلیغکنندگان و عدم استفاده از محتوای کاربران برای آموزش AI دانستند.
یکی از کاربران به نام Sketchette در واکنش نوشت:
«اوه، نه! جذابیت این پلتفرم در همین عدم اشتراکگذاری اطلاعات بود، بهخصوص با هوش مصنوعی مولد. حالا تسلیم نشو!»
گرِیبر در پاسخ گفت که شرکتهای هوش مصنوعی در حال حاضر دادههای عمومی را از سراسر وب جمعآوری میکنند، از جمله دادههای Bluesky، زیرا «همهچیز در Bluesky عمومی است، درست مانند یک وبسایت.» او تأکید کرد که Bluesky در تلاش است تا یک «استاندارد جدید» برای مدیریت این نوع جمعآوری دادهها ایجاد کند، مشابه robots.txt که وبسایتها از آن برای تعیین مجوزهای دسترسی خزندههای وب استفاده میکنند.
بحثهای مربوط به آموزش هوش مصنوعی و حقوق کپیرایت، robots.txt را به موضوعی پرچالش تبدیل کردهاند، چراکه این استاندارد الزام قانونی ندارد. Bluesky چارچوب پیشنهادی خود را به گونهای معرفی کرده که همان مکانیزم و انتظارات را داشته باشد—یک فرمت قابل خواندن توسط ماشین که فعالان خوشنیت انتظار میرود به آن پایبند باشند، اما از نظر قانونی قابل اجرا نیست.
بر اساس این پیشنهاد، کاربران برنامه Bluesky و سایر اپلیکیشنهایی که از ATProtocol استفاده میکنند، میتوانند در تنظیمات خود مشخص کنند که آیا اجازه استفاده از دادههایشان را در چهار دسته دارند یا خیر: هوش مصنوعی مولد، ارتباط بین پروتکلها (اتصال اکوسیستمهای اجتماعی مختلف)، مجموعه دادههای انبوه و آرشیو وب (مانند Wayback Machine).
در این پیشنهاد آمده است که اگر کاربری انتخاب کند که نمیخواهد دادههایش برای آموزش AI استفاده شود، شرکتها و تیمهای تحقیقاتی که مجموعه دادههای آموزشی را میسازند، باید این تمایل را هنگام جمعآوری داده از وبسایتها یا انجام انتقالهای انبوه از طریق پروتکل در نظر بگیرند.
به گزارش تککرانچ، مالی وایت، نویسنده خبرنامه Citation Needed و وبلاگ Web3 is Going Just Great، این پیشنهاد را مثبت ارزیابی کرد و گفت عجیب است که برخی کاربران به Bluesky به دلیل این تصمیم حمله کردهاند، چراکه این طرح نه به معنای «خوشامدگویی به هوش مصنوعی» بلکه ایجاد یک سیگنال رضایت برای فرآیندی است که هماکنون نیز در حال انجام است.
او در ادامه افزود:
«نقطهضعف این پیشنهاد و پیشنهاد مشابه Creative Commons برای “سیگنالهای ترجیحی” این است که اجرای آن وابسته به این است که گردآورندگان داده به این استاندارد احترام بگذارند. اما تاکنون شاهد بودهایم که برخی از این شرکتها به راحتی از کنار robots.txt عبور کرده یا حتی محتوای تحت کپیرایت را جمعآوری کردهاند.»