توییتر برخی از کد منبع خود از جمله الگوریتم توصیه خود را فاش می کند

فروردین 12, 1402 4۰49

به گزارش اپ خونه، همانطور که بارها توسط ایلان ماسک، مدیرعامل توییتر وعده داده شده بود، توییتر بخشی از کد منبع خود را برای بازرسی عمومی باز کرده است، از جمله الگوریتمی که برای توصیه توییت ها در جدول زمانی کاربران استفاده می کند.

در GitHub، توییتر دو مخزن حاوی کد برای بسیاری از بخش‌هایی که شبکه اجتماعی را تیک می‌زند منتشر کرد ، از جمله مکانیزمی که توییتر برای کنترل توییت‌هایی که کاربران در جدول زمانی For You می‌بینند، استفاده می‌کند.

توییتر در یک پست وبلاگی این اقدام را به عنوان «اولین گام برای شفاف‌تر شدن» و در عین حال «جلوگیری از خطر» برای خود توییتر و افراد روی پلتفرم توصیف کرد.

ماسک در جلسه توئیتر اسپیس توضیح داد:

انتشار اولیه به اصطلاح الگوریتم ما بسیار شرم آور خواهد بود و مردم اشتباهات زیادی را پیدا خواهند کرد، اما ما آنها را خیلی سریع برطرف خواهیم کرد.

حتی اگر با چیزی موافق نیستید، حداقل می‌دانید که چرا وجود دارد، و اینکه شما مخفیانه دستکاری نمی‌شوید… آنالوگ که ما در آرزوی آن هستیم، نمونه عالی لینوکس به عنوان یک سیستم عامل منبع باز است … از نظر تئوری می توان بسیاری از اکسپلویت ها را برای لینوکس کشف کرد. در واقعیت، آنچه اتفاق می‌افتد این است که جامعه آن سوءاستفاده‌ها را شناسایی و اصلاح می‌کند.

در دومین نکته در پست وبلاگ در مورد جلوگیری از خطر، نسخه‌های منبع باز شامل کدی نمی‌شود که توصیه‌های تبلیغاتی توییتر یا داده‌های مورد استفاده برای آموزش الگوریتم توصیه‌های توییتر را تقویت می‌کند.

علاوه بر این، آنها دستورالعمل‌های کمی در مورد نحوه بازرسی یا استفاده واقعی از کد را شامل می‌شوند – این ایده را تقویت می‌کند که نسخه‌ها کاملاً بر توسعه‌دهنده متمرکز هستند.

تنها چند هفته پس از آنکه توییتر بسیاری از کارکنان هوش مصنوعی اخلاقی و اعتماد و ایمنی خود را که مسئول تعدیل محتوا در میان سایر وظایف مربوط به امنیت کاربر بودند، اخراج کرد، پیام‌های مختلف گرفته است.

اما با این وجود، این شرکت اصرار دارد که با انتشار کد امروز، گام‌هایی برای اطمینان از اینکه امنیت و حریم خصوصی کاربر محافظت می‌شود انجام داده است.

نموداری که نشان می دهد خط لوله توصیه توییتر چگونه کار می کند

توییتر می گوید در حال کار بر روی ابزارهایی برای مدیریت پیشنهادات کد از انجمن و همگام سازی تغییرات در مخزن داخلی خود است.

احتمالاً، این موارد در تاریخ آینده در دسترس قرار خواهند گرفت – در حال حاضر هیچ نشانه ای از آنها وجود ندارد.

ماسک در جلسه Spaces گفت: “ما به دنبال پیشنهادهایی هستیم، نه فقط در مورد اشکالات، بلکه همچنین در مورد نحوه عملکرد الگوریتم. این یک روند در حال تکامل خواهد بود. من انتظار ندارم که یک حرکت صعودی بی وقفه باشد… اما ما نسبت به آنچه که تجربه کاربر را بهبود می بخشد بسیار باز هستیم.”

در نگاه اول، الگوریتم نسبتاً پیچیده است – اما لزوماً از نقطه نظر فنی به هیچ وجه تعجب آور نیست.

این از چندین مدل تشکیل شده است، از جمله مدلی برای تشخیص محتوای توهین‌آمیز یا «ناامن برای کار»، تعیین احتمال تعامل کاربر توییتر با کاربر دیگر و محاسبه «شهرت» کاربر توییتر. (معلوم نیست که “شهرت” دقیقاً به چه چیزی اشاره دارد؛ اسناد سطح بالا در این مورد مشخص نیست.)

چندین شبکه عصبی مسئول رتبه بندی توییت ها و توصیه حساب ها برای دنبال کردن هستند، در حالی که یک جزء فیلتر کننده توییت ها را پنهان می کند .

“پشتیبانی از انطباق قانونی، بهبود کیفیت محصول، افزایش اعتماد کاربران، محافظت از درآمد از طریق استفاده از فیلترینگ سخت، درمان محصول قابل مشاهده .”

جدول زمانی برای شما توییتر که توسط یک الگوریتم توصیه طراحی شده است

توییتر در یک پست وبلاگ مهندسی ، اطلاعات بیشتری در مورد خط لوله توصیه‌ها نشان می‌دهد که ادعا می‌کند تقریباً پنج میلیارد بار در روز اجرا می‌شود:

ما سعی می کنیم بهترین ۱۵۰۰ توییت را از مجموعه ای متشکل از صدها میلیون استخراج کنیم… امروز، جدول زمانی For You به طور متوسط ۵۰٪ [توئیت های افرادی که آنها را دنبال نمی کنید] و ۵۰٪ [توئیت های افرادی که دنبال می کنید] تشکیل می شود.

اگرچه این ممکن است از کاربری به کاربر دیگر متفاوت باشد. رتبه‌بندی [توئیت‌ها] با یک شبکه عصبی ۴۸ میلیون پارامتری به دست می‌آید که به طور مداوم بر روی تعاملات توییت آموزش داده می‌شود تا برای تعامل مثبت (مانند لایک‌ها، ریتوییت‌ها و پاسخ‌ها) بهینه شود.»

البته کاربران توییتر ۱۵۰۰ توییت کامل را نمی بینند. آنها بر اساس محدودیت‌های محتوا و سایر معیارها و عوامل در نظر گرفته شده توسط مدل‌ها فیلتر می‌شوند، مانند اینکه توییت‌ها «بازخورد منفی» داشته باشند یا اینکه عمدتاً از همان کاربر توییتر یا از کاربرانی هستند که مسدود یا بی‌صدا شده‌اند.

Gizmodo خاطرنشان می کند که یکی از مواردی که به نظر می رسد عمومی نشده است، لیست VIP هایی است که توییتر به کاربران ارائه می دهد.

این هفته، پلتفرمر گزارش داد که توییتر لیست چرخشی از کاربران قابل توجه دارد، از جمله YouTuber Mr. Beast و بنیانگذار Daily Wire بن شاپیرو، که از آن برای نظارت بر تغییرات الگوریتم توصیه با افزایش دید این «کاربران قدرتمند» به ظاهر به میل خود استفاده می کند. .

شواهد بیشتری وجود دارد مبنی بر اینکه الگوریتم ممکن است بسته به منبع، توئیت ها را به طور متفاوتی رفتار کند.

محقق جین مانچون وونگ خاطرنشان کرد که الگوریتم توییتر به‌طور خاص مشخص می‌کند که نویسنده توییت، ایلان ماسک است و برچسب‌های دیگری نیز دارد که نشان می‌دهد نویسنده یک «کاربر قدرتمند» و همچنین جمهوری‌خواه یا دموکرات بودن نویسنده است.

در جلسه Spaces ، یک مهندس توییتر گفت که این برچسب‌ها فقط برای معیارها استفاده می‌شوند. اما ماسک – که گفته بود تا قبل از امروز از برچسب ها آگاه نبود – گفت که آنها نباید آنجا باشند.

الگوریتم توییتر مشخص می کند که آیا نویسنده توییت، ایلان ماسک است یا خیر

ماسک گفت: «قطعاً نباید مردم را به جمهوری‌خواهان و دموکرات‌ها تقسیم کرد، این معنایی ندارد.»

انتشار کد منبع پس از چندین بحث و جدل شامل تغییراتی در الگوریتم توصیه توییتر در ماه‌های اخیر صورت گرفت.

به گزارش پلتفرمر ، در ماه فوریه، ماسک از مهندسان توییتر خواست تا الگوریتم را مجدداً پیکربندی کنند تا توییت‌های او بیشتر دیده شوند.

در ماه نوامبر، توییتر شروع به نشان دادن توییت‌های بیشتری به کاربران کرد از افرادی که آنها را دنبال نمی‌کنند – اقدامی که پلتفرم قبل از خرید ماسک انجام داد ، اما بعداً پس از واکنش شدید کاربران معکوس شد.