هوش مصنوعی گوگل بالاخره بازی «Pokémon Blue» را شکست داد!

اردیبهشت 14, 1404 0۰3

به گزارش اپ خونه، به‌نظر می‌رسد قدرتمندترین مدل هوش مصنوعی گوگل، یعنی Gemini 2.5 Pro، به یک نقطه عطف بزرگ دست یافته است: شکست دادن یک بازی ویدیویی ۲۹ ساله!

ساندار پیچای، مدیرعامل گوگل، با هیجان در شبکه اجتماعی X (توییتر سابق) نوشت:
«چه پایانی! Gemini 2.5 Pro بالاخره Pokémon Blue را تمام کرد!»

البته باید روشن کرد که پروژه‌ی Gemini Plays Pokemon توسط یک مهندس نرم‌افزار ۳۰ ساله مستقل به نام Joel Z. راه‌اندازی شده و او هیچ ارتباط رسمی با گوگل ندارد. با این حال، مدیران گوگل با اشتیاق از این پروژه حمایت می‌کنند.

برای مثال، لوگان کیلپاتریک، مدیر محصول Google AI Studio، ماه گذشته نوشته بود که Gemini پیشرفت خوبی در تکمیل بازی پوکمون داشته و پنجمین نشان (badge) خود را کسب کرده؛ در حالی که بهترین مدل دیگر تنها سه نشان کسب کرده بود (البته با ابزار متفاوتی).

پیچای هم در پاسخ شوخی کرد و نوشت:
«ما در حال کار روی API هستیم: هوش مصنوعی پوکمونی :)»

چرا اصلاً «Pokémon»؟

در ماه فوریه، شرکت Anthropic اعلام کرده بود که مدل‌های Claude آن‌ها نیز در حال پیشرفت در بازی Pokémon Red هستند.

آن‌ها نوشته بودند که قابلیت «تفکر گسترده و آموزش مبتنی بر عامل» باعث شده تا Claude در وظایف غیرمنتظره‌ای مانند اجرای بازی کلاسیک عملکرد خوبی داشته باشد. (Pokémon Red و Blue نسخه‌های متفاوتی از بازی معروف GameBoy هستند که نخستین‌بار در سال ۱۹۹۶ منتشر شدند).

حتی کانالی به نام “Claude Plays Pokemon” در توییچ وجود دارد که Joel Z از آن به عنوان منبع الهام خود یاد کرده است.

با وجود پیشرفت‌ها، به نظر می‌رسد Claude هنوز موفق به شکست Pokémon Red نشده. آیا این یعنی Gemini در این بازی عملکرد بهتری دارد؟ Joel Z در صفحه توییچ خود به تماشاگران هشدار داد که:

«لطفاً این پروژه را به‌عنوان معیاری برای مقایسه توانایی مدل‌های زبانی در اجرای بازی Pokémon در نظر نگیرید. نمی‌توان مقایسه مستقیمی انجام داد — زیرا Gemini و Claude از ابزارها و داده‌های متفاوتی استفاده می‌کنند.»

هر دو مدل برای اجرای بازی نیاز به کمک دارند — این کمک از طریق چیزی به نام agent harness (رابط کنترلی مدل) انجام می‌شود. این ابزارها اسکرین‌شات‌هایی از بازی را با اطلاعات اضافی در اختیار مدل‌ها قرار می‌دهند و مدل نیز تصمیم می‌گیرد چه کاری انجام دهد. سپس رابط کنترلی مدل، دکمه‌های لازم در بازی را فشار می‌دهد.

Joel Z تأیید کرد که در طول بازی «مداخلات توسعه‌دهنده» هم وجود داشته، اما تأکید کرد که این تقلب محسوب نمی‌شود.

او گفت:
«مداخلات من به بهبود توانایی تصمیم‌گیری و استدلال Gemini کمک می‌کنند. من راه‌حل خاصی ارائه نمی‌دهم — نه راهنمای مرحله دارم و نه دستور مستقیم برای چالش‌هایی مثل کوه مون (Mt. Moon). تنها موردی که نزدیک به کمک مستقیم بود، این بود که به Gemini اطلاع دادم باید برای دریافت کلید آسانسور، دو بار با یکی از افراد تیم Rocket صحبت کند، که آن هم یک باگ در نسخه اصلی بود و بعدها در Pokémon Yellow برطرف شد.»

او در پایان افزود که پروژه Gemini Plays Pokémon هنوز در حال توسعه فعال است و چارچوب آن نیز دائماً در حال به‌روزرسانی است.