توییتر برخی از کد منبع خود از جمله الگوریتم توصیه خود را فاش می کند
به گزارش اپ خونه، همانطور که بارها توسط ایلان ماسک، مدیرعامل توییتر وعده داده شده بود، توییتر بخشی از کد منبع خود را برای بازرسی عمومی باز کرده است، از جمله الگوریتمی که برای توصیه توییت ها در جدول زمانی کاربران استفاده می کند.
در GitHub، توییتر دو مخزن حاوی کد برای بسیاری از بخشهایی که شبکه اجتماعی را تیک میزند منتشر کرد ، از جمله مکانیزمی که توییتر برای کنترل توییتهایی که کاربران در جدول زمانی For You میبینند، استفاده میکند.
توییتر در یک پست وبلاگی این اقدام را به عنوان «اولین گام برای شفافتر شدن» و در عین حال «جلوگیری از خطر» برای خود توییتر و افراد روی پلتفرم توصیف کرد.
ماسک در جلسه توئیتر اسپیس توضیح داد:
انتشار اولیه به اصطلاح الگوریتم ما بسیار شرم آور خواهد بود و مردم اشتباهات زیادی را پیدا خواهند کرد، اما ما آنها را خیلی سریع برطرف خواهیم کرد.
حتی اگر با چیزی موافق نیستید، حداقل میدانید که چرا وجود دارد، و اینکه شما مخفیانه دستکاری نمیشوید… آنالوگ که ما در آرزوی آن هستیم، نمونه عالی لینوکس به عنوان یک سیستم عامل منبع باز است … از نظر تئوری می توان بسیاری از اکسپلویت ها را برای لینوکس کشف کرد. در واقعیت، آنچه اتفاق میافتد این است که جامعه آن سوءاستفادهها را شناسایی و اصلاح میکند.
در دومین نکته در پست وبلاگ در مورد جلوگیری از خطر، نسخههای منبع باز شامل کدی نمیشود که توصیههای تبلیغاتی توییتر یا دادههای مورد استفاده برای آموزش الگوریتم توصیههای توییتر را تقویت میکند.
علاوه بر این، آنها دستورالعملهای کمی در مورد نحوه بازرسی یا استفاده واقعی از کد را شامل میشوند – این ایده را تقویت میکند که نسخهها کاملاً بر توسعهدهنده متمرکز هستند.
تنها چند هفته پس از آنکه توییتر بسیاری از کارکنان هوش مصنوعی اخلاقی و اعتماد و ایمنی خود را که مسئول تعدیل محتوا در میان سایر وظایف مربوط به امنیت کاربر بودند، اخراج کرد، پیامهای مختلف گرفته است.
اما با این وجود، این شرکت اصرار دارد که با انتشار کد امروز، گامهایی برای اطمینان از اینکه امنیت و حریم خصوصی کاربر محافظت میشود انجام داده است.
نموداری که نشان می دهد خط لوله توصیه توییتر چگونه کار می کند
توییتر می گوید در حال کار بر روی ابزارهایی برای مدیریت پیشنهادات کد از انجمن و همگام سازی تغییرات در مخزن داخلی خود است.
احتمالاً، این موارد در تاریخ آینده در دسترس قرار خواهند گرفت – در حال حاضر هیچ نشانه ای از آنها وجود ندارد.
ماسک در جلسه Spaces گفت: “ما به دنبال پیشنهادهایی هستیم، نه فقط در مورد اشکالات، بلکه همچنین در مورد نحوه عملکرد الگوریتم. این یک روند در حال تکامل خواهد بود. من انتظار ندارم که یک حرکت صعودی بی وقفه باشد… اما ما نسبت به آنچه که تجربه کاربر را بهبود می بخشد بسیار باز هستیم.”
در نگاه اول، الگوریتم نسبتاً پیچیده است – اما لزوماً از نقطه نظر فنی به هیچ وجه تعجب آور نیست.
این از چندین مدل تشکیل شده است، از جمله مدلی برای تشخیص محتوای توهینآمیز یا «ناامن برای کار»، تعیین احتمال تعامل کاربر توییتر با کاربر دیگر و محاسبه «شهرت» کاربر توییتر. (معلوم نیست که “شهرت” دقیقاً به چه چیزی اشاره دارد؛ اسناد سطح بالا در این مورد مشخص نیست.)
چندین شبکه عصبی مسئول رتبه بندی توییت ها و توصیه حساب ها برای دنبال کردن هستند، در حالی که یک جزء فیلتر کننده توییت ها را پنهان می کند .
“پشتیبانی از انطباق قانونی، بهبود کیفیت محصول، افزایش اعتماد کاربران، محافظت از درآمد از طریق استفاده از فیلترینگ سخت، درمان محصول قابل مشاهده .”
جدول زمانی برای شما توییتر که توسط یک الگوریتم توصیه طراحی شده است
توییتر در یک پست وبلاگ مهندسی ، اطلاعات بیشتری در مورد خط لوله توصیهها نشان میدهد که ادعا میکند تقریباً پنج میلیارد بار در روز اجرا میشود:
ما سعی می کنیم بهترین ۱۵۰۰ توییت را از مجموعه ای متشکل از صدها میلیون استخراج کنیم… امروز، جدول زمانی For You به طور متوسط ۵۰٪ [توئیت های افرادی که آنها را دنبال نمی کنید] و ۵۰٪ [توئیت های افرادی که دنبال می کنید] تشکیل می شود.
اگرچه این ممکن است از کاربری به کاربر دیگر متفاوت باشد. رتبهبندی [توئیتها] با یک شبکه عصبی ۴۸ میلیون پارامتری به دست میآید که به طور مداوم بر روی تعاملات توییت آموزش داده میشود تا برای تعامل مثبت (مانند لایکها، ریتوییتها و پاسخها) بهینه شود.»
البته کاربران توییتر ۱۵۰۰ توییت کامل را نمی بینند. آنها بر اساس محدودیتهای محتوا و سایر معیارها و عوامل در نظر گرفته شده توسط مدلها فیلتر میشوند، مانند اینکه توییتها «بازخورد منفی» داشته باشند یا اینکه عمدتاً از همان کاربر توییتر یا از کاربرانی هستند که مسدود یا بیصدا شدهاند.
Gizmodo خاطرنشان می کند که یکی از مواردی که به نظر می رسد عمومی نشده است، لیست VIP هایی است که توییتر به کاربران ارائه می دهد.
این هفته، پلتفرمر گزارش داد که توییتر لیست چرخشی از کاربران قابل توجه دارد، از جمله YouTuber Mr. Beast و بنیانگذار Daily Wire بن شاپیرو، که از آن برای نظارت بر تغییرات الگوریتم توصیه با افزایش دید این «کاربران قدرتمند» به ظاهر به میل خود استفاده می کند. .
شواهد بیشتری وجود دارد مبنی بر اینکه الگوریتم ممکن است بسته به منبع، توئیت ها را به طور متفاوتی رفتار کند.
محقق جین مانچون وونگ خاطرنشان کرد که الگوریتم توییتر بهطور خاص مشخص میکند که نویسنده توییت، ایلان ماسک است و برچسبهای دیگری نیز دارد که نشان میدهد نویسنده یک «کاربر قدرتمند» و همچنین جمهوریخواه یا دموکرات بودن نویسنده است.
در جلسه Spaces ، یک مهندس توییتر گفت که این برچسبها فقط برای معیارها استفاده میشوند. اما ماسک – که گفته بود تا قبل از امروز از برچسب ها آگاه نبود – گفت که آنها نباید آنجا باشند.
الگوریتم توییتر مشخص می کند که آیا نویسنده توییت، ایلان ماسک است یا خیر
ماسک گفت: «قطعاً نباید مردم را به جمهوریخواهان و دموکراتها تقسیم کرد، این معنایی ندارد.»
انتشار کد منبع پس از چندین بحث و جدل شامل تغییراتی در الگوریتم توصیه توییتر در ماههای اخیر صورت گرفت.
به گزارش پلتفرمر ، در ماه فوریه، ماسک از مهندسان توییتر خواست تا الگوریتم را مجدداً پیکربندی کنند تا توییتهای او بیشتر دیده شوند.
در ماه نوامبر، توییتر شروع به نشان دادن توییتهای بیشتری به کاربران کرد از افرادی که آنها را دنبال نمیکنند – اقدامی که پلتفرم قبل از خرید ماسک انجام داد ، اما بعداً پس از واکنش شدید کاربران معکوس شد.