هوش مصنوعی گوگل بالاخره بازی «Pokémon Blue» را شکست داد!
به گزارش اپ خونه، بهنظر میرسد قدرتمندترین مدل هوش مصنوعی گوگل، یعنی Gemini 2.5 Pro، به یک نقطه عطف بزرگ دست یافته است: شکست دادن یک بازی ویدیویی ۲۹ ساله!
ساندار پیچای، مدیرعامل گوگل، با هیجان در شبکه اجتماعی X (توییتر سابق) نوشت:
«چه پایانی! Gemini 2.5 Pro بالاخره Pokémon Blue را تمام کرد!»
البته باید روشن کرد که پروژهی Gemini Plays Pokemon توسط یک مهندس نرمافزار ۳۰ ساله مستقل به نام Joel Z. راهاندازی شده و او هیچ ارتباط رسمی با گوگل ندارد. با این حال، مدیران گوگل با اشتیاق از این پروژه حمایت میکنند.
برای مثال، لوگان کیلپاتریک، مدیر محصول Google AI Studio، ماه گذشته نوشته بود که Gemini پیشرفت خوبی در تکمیل بازی پوکمون داشته و پنجمین نشان (badge) خود را کسب کرده؛ در حالی که بهترین مدل دیگر تنها سه نشان کسب کرده بود (البته با ابزار متفاوتی).
پیچای هم در پاسخ شوخی کرد و نوشت:
«ما در حال کار روی API هستیم: هوش مصنوعی پوکمونی :)»
چرا اصلاً «Pokémon»؟
در ماه فوریه، شرکت Anthropic اعلام کرده بود که مدلهای Claude آنها نیز در حال پیشرفت در بازی Pokémon Red هستند.
آنها نوشته بودند که قابلیت «تفکر گسترده و آموزش مبتنی بر عامل» باعث شده تا Claude در وظایف غیرمنتظرهای مانند اجرای بازی کلاسیک عملکرد خوبی داشته باشد. (Pokémon Red و Blue نسخههای متفاوتی از بازی معروف GameBoy هستند که نخستینبار در سال ۱۹۹۶ منتشر شدند).
حتی کانالی به نام “Claude Plays Pokemon” در توییچ وجود دارد که Joel Z از آن به عنوان منبع الهام خود یاد کرده است.
با وجود پیشرفتها، به نظر میرسد Claude هنوز موفق به شکست Pokémon Red نشده. آیا این یعنی Gemini در این بازی عملکرد بهتری دارد؟ Joel Z در صفحه توییچ خود به تماشاگران هشدار داد که:
«لطفاً این پروژه را بهعنوان معیاری برای مقایسه توانایی مدلهای زبانی در اجرای بازی Pokémon در نظر نگیرید. نمیتوان مقایسه مستقیمی انجام داد — زیرا Gemini و Claude از ابزارها و دادههای متفاوتی استفاده میکنند.»
هر دو مدل برای اجرای بازی نیاز به کمک دارند — این کمک از طریق چیزی به نام agent harness (رابط کنترلی مدل) انجام میشود. این ابزارها اسکرینشاتهایی از بازی را با اطلاعات اضافی در اختیار مدلها قرار میدهند و مدل نیز تصمیم میگیرد چه کاری انجام دهد. سپس رابط کنترلی مدل، دکمههای لازم در بازی را فشار میدهد.
Joel Z تأیید کرد که در طول بازی «مداخلات توسعهدهنده» هم وجود داشته، اما تأکید کرد که این تقلب محسوب نمیشود.
او گفت:
«مداخلات من به بهبود توانایی تصمیمگیری و استدلال Gemini کمک میکنند. من راهحل خاصی ارائه نمیدهم — نه راهنمای مرحله دارم و نه دستور مستقیم برای چالشهایی مثل کوه مون (Mt. Moon). تنها موردی که نزدیک به کمک مستقیم بود، این بود که به Gemini اطلاع دادم باید برای دریافت کلید آسانسور، دو بار با یکی از افراد تیم Rocket صحبت کند، که آن هم یک باگ در نسخه اصلی بود و بعدها در Pokémon Yellow برطرف شد.»
او در پایان افزود که پروژه Gemini Plays Pokémon هنوز در حال توسعه فعال است و چارچوب آن نیز دائماً در حال بهروزرسانی است.