Voyager این هوش مصنوعی از GPT-4 برای تبدیل شدن به یک بازیکن خبره Minecraft استفاده کرد
به گزارش اپ خونه، محققان هوش مصنوعی یک ربات Minecraft ساختهاند که میتواند قابلیتهای خود را در دنیای باز بازی کاوش کرده و گسترش دهد – اما برخلاف سایر رباتها، این ربات اساساً کد خود را از طریق آزمون و خطا و تعداد زیادی جستارهای GP-4 نوشت.
این سیستم آزمایشی که Voyager نامیده میشود، نمونهای از یک «عامل تجسمشده» است، یک هوش مصنوعی که میتواند آزادانه و هدفمند در یک محیط شبیهسازی شده یا واقعی حرکت کند و عمل کند.
هوش مصنوعی و چت رباتهای نوع دستیار شخصی نیازی به انجام کارها ندارند، چه رسد به اینکه برای انجام این کارها در دنیای پیچیده حرکت کنند.
اما این دقیقاً همان کاری است که از یک ربات خانگی انتظار می رود در آینده انجام دهد، بنابراین تحقیقات زیادی در مورد چگونگی انجام این کار وجود دارد.
Minecraft مکان خوبی برای آزمایش چنین چیزهایی است زیرا یک نمایش بسیار تقریبی از دنیای واقعی، با قوانین و فیزیک ساده و سرراست است، اما همچنین به اندازه کافی پیچیده و باز است که کارهای زیادی برای انجام دادن یا امتحان کردن وجود دارد.
شبیه سازهای هدفمند نیز عالی هستند، اما محدودیت های خاص خود را دارند.
MineDojo یک چارچوب شبیهسازی است که حول Minecraft ساخته شده است، زیرا شما نمیتوانید فقط یک هوش مصنوعی تصادفی را در آنجا قرار دهید و انتظار داشته باشید که بفهمد همه این بلوکها و خوکها چه میکنند.
سازندگان آن (همپوشانی های زیادی با تیم Voyager) ویدیوهای YouTube درباره بازی، رونوشت ها، مقالات ویکی و تعداد زیادی از پست های Reddit از r/minecraft را در میان داده های دیگر جمع آوری کرده اند، بنابراین کاربران می توانند یک هوش مصنوعی ایجاد یا تنظیم کنند.
از آنها الگوبرداری کنید همچنین این امکان را فراهم میکند که این مدلها با مشاهده اینکه چقدر خوب کارهایی مانند ساختن حصار دور یک لاما یا پیدا کردن و استخراج الماس را انجام میدهند، کم و بیش عینی ارزیابی شوند.
Voyager در این وظایف عالی عمل می کند و عملکرد بسیار بهتری نسبت به تنها مدل نزدیک به آن یعنی Auto-GPT دارد.
اما آنها رویکرد مشابهی دارند که استفاده از GPT-4 برای نوشتن کد خود در حین حرکت می باشد.
معمولاً شما فقط یک مدل را با تمام دادههای خوب Minecraft آموزش میدهید و امیدواریدکه بفهمید چگونه با غروب خورشید با اسکلتها مبارزه کنید.
با این حال، Voyager نسبتا ساده شروع میکند، و همانطور که در بازی با چیزهایی روبرو میشود، گفتگوی داخلی کمی با GPT-4 در مورد اینکه چه کاری باید انجام دهد و چگونه انجام میدهد، دارد.
هدایت اکشن بعدی و افزودن مهارت ها به مجموعه
به عنوان مثال، شب می آید و آن اسکلت ها بیرون می آیند. نماینده یک ایده کلی از این موضوع دارد، اما از خود می پرسد، یک بازیکن خوب این بازی وقتی هیولاهایی در این نزدیکی وجود دارد، چه کار می کند؟
خوب، GPT-4 میگوید، اگر میخواهید با خیال راحت جهان را کاوش کنید، میخواهید یک شمشیر بسازید و مجهز کنید، سپس اسکلت را با آن بکوبید و از ضربه خوردن اجتناب کنید و این حس کلی از اینکه چه باید کرد به اهداف ملموسی چون جمع آوری سنگ و چوب، ساختن شمشیر روی میز کاردستی، تجهیز آن و مبارزه با اسکلت تبدیل می شود.
پس از انجام آن کارها، آنها وارد یک کتابخانه مهارت عمومی می شوند تا بعداً، زمانی که کار این است که «به اعماق غار بروید تا سنگ آهن پیدا کنید»، لازم نیست دوباره از ابتدا جنگیدن را یاد بگیرد.
هنوز از GPT استفاده میکند، اما از GPT-3.5 ارزانتر و سریعتر استفاده میکند، که به آن مهارتهای مرتبط با یک موقعیت خاص را میگوید – بنابراین تلاشی برای استخراج اسکلت و مبارزه با سنگ معدن نمیکند.
این شبیه به عاملی مانند Auto-GPT است که وقتی با رابطی مواجه میشود که هنوز نمیشناسد، باید به خود یاد دهد که در آن حرکت کند تا به هدفش برسد.
اما Minecraft یک محیط بسیار عمیق تر از آن است که برای حل آن استفاده می شود، بنابراین یک عامل تخصصی مانند Voyager بسیار بهتر عمل می کند.
این ربات ها چیزهای بیشتری پیدا می کند، مهارت های بیشتری را می آموزد و منطقه بسیار بیشتری را نسبت به سایر ربات ها کاوش می کند.
جالب است، اما شاید تعجب آور نباشد، GPT-4 زمانی که نوبت به تولید کد مفید می رسد، زمین را با GPT-3.5 (یعنی ChatGPT) پاک می کند.
آزمایشی که جایگزین اولی با دومی شد، باعث شد که عامل در اوایل، شاید حتی به معنای واقعی کلمه، به دیوار برخورد کند و بهبود نیابد.
ممکن است از صحبت کردن با این دو مدل مشخص نباشد که یکی بسیار باهوشتر است، اما حقیقت این است که برای انجام یک مکالمه ظاهراً هوشمند، لازم نیست بهویژه باهوش باشید .
کدنویسی بسیار دشوارتر است و GPT-4 یک به روز رسانی بزرگ در آنجا بود.
هدف این تحقیق منسوخ شدن بازیکنان Minecraft نیست، بلکه یافتن روشهایی است که مدلهای نسبتاً ساده هوش مصنوعی میتوانند خود را بر اساس «تجربههای» خود بهبود بخشند، زیرا گزینه بهتری ندارند.
اگر میخواهیم روباتهایی داشته باشیم که در خانهها، بیمارستانها و ادارات به ما کمک میکنند، آنها باید این درسها را یاد بگیرند و در اقدامات آینده به کار ببرند.