چتبات Grok حالا با دوربین گوشی شما دنیا را میبیند!
به گزارش اپ خونه، شرکت xAI، متعلق به ایلان ماسک، به تازگی ویژگی جدیدی به نام Grok Vision را برای چتبات هوشمند خود معرفی کرد. این ویژگی حالا به Grok امکان میدهد تا از طریق دوربین گوشی آیفون شما، اشیای واقعی را ببیند و درباره آنها پاسخ بدهد—قابلیتی شبیه به آنچه در ChatGPT و Gemini گوگل دیدهایم.
با استفاده از این قابلیت جدید، کاربران میتوانند دوربین گوشی خود را به سمت اشیایی مثل تابلوها، محصولات فروشگاهی یا حتی اسناد کاغذی بگیرند و از Grok بپرسند: «من دارم به چی نگاه میکنم؟» و Grok با تحلیل تصویر، پاسخ مناسبی ارائه خواهد داد.
این ویژگی در حال حاضر فقط در اپلیکیشن iOS چتبات Grok فعال شده و هنوز برای کاربران اندرویدی در دسترس نیست. با این حال، xAI وعده داده که بهزودی کاربران اندروید هم میتوانند از Grok Vision استفاده کنند.
حالت صوتی Grok نیز حالا به دوربین گوشی دسترسی دارد. یعنی شما میتوانید با صدای خود از چتبات بخواهید تا تصویر دوربین را تحلیل کند. برای مثال کافی است بگویید: «این چیه که دارم نگاهش میکنم؟» و چتبات پاسخ را با تکیه بر آنچه از طریق دوربین میبیند، ارائه میدهد.
این امکان جذاب میتواند کاربردهای زیادی داشته باشد؛ از راهنمایی خرید گرفته تا تشخیص علائم راهنمایی یا ترجمه متون روی تابلوهای خارجی هنگام سفر. بهنوعی میتوان گفت که Grok در حال نزدیکتر شدن به نقش یک دستیار هوش مصنوعی واقعی در دنیای فیزیکی است.
اما ویژگیهای جدید فقط به دوربین محدود نمیشوند. xAI اعلام کرده که Grok اکنون از صدا به چند زبان زنده دنیا هم پشتیبانی میکند. یعنی کاربران میتوانند با این چتبات به زبانهایی مانند اسپانیایی، فرانسوی، ترکی، ژاپنی و هندی صحبت کنند و پاسخ صوتی دریافت کنند.
علاوه بر این، قابلیت جستوجوی زنده در حالت صوتی نیز فعال شده است. این یعنی وقتی با Grok صحبت میکنید، او میتواند بهصورت همزمان در اینترنت جستوجو کند و اطلاعات لحظهای ارائه دهد. این ویژگی برای کاربران اندرویدی هم فعال است، البته به شرطی که اشتراک SuperGrok را تهیه کرده باشند.
اشتراک SuperGrok با هزینه ماهیانه ۳۰ دلار در دسترس است و امکانات پیشرفتهتری از جمله دسترسی به ویژگیهای جدید، پاسخهای سریعتر و ظرفیت استفاده بیشتر از Grok را فراهم میکند.
xAI در ماههای اخیر بهصورت مداوم در حال اضافه کردن امکانات جدید به Grok بوده است. اوایل همین ماه، یک ویژگی به نام “حافظه” به چتبات اضافه شد که به آن اجازه میدهد اطلاعات جلسات گفتوگوی قبلی را به یاد داشته باشد و در مکالمات جدید از آنها استفاده کند.
همچنین قابلیتی مشابه بوم دیجیتال (canvas) برای Grok فراهم شده تا کاربران بتوانند اسناد و حتی اپلیکیشنهای سادهای را از طریق مکالمه با چتبات بسازند—ویژگیای که شباهت زیادی به ابزارهای هوش مصنوعی مایکروسافت و گوگل دارد.
این گسترش سریع قابلیتها نشان میدهد که xAI به دنبال رقابت جدی با بزرگان هوش مصنوعی مثل OpenAI و Google است. هر چه Grok ابزارهای بیشتری برای تعامل با دنیای واقعی پیدا کند، نقش آن در زندگی روزمره کاربران پررنگتر میشود.
استفاده از بینایی ماشینی، حافظه گفتگوها و پاسخگویی چندزبانه، سه گام مهم در راستای تبدیل چتباتهای امروزی به دستیاران هوشمند واقعی محسوب میشود—دستیارانی که نهتنها حرف شما را میفهمند، بلکه دنیا را هم از نگاه شما میبینند.
اگر Grok بتواند این مسیر را بهخوبی ادامه دهد و تجربه کاربریاش را بهبود ببخشد، میتوان انتظار داشت که در آینده نهچندان دور، به رقیبی جدی برای دیگر چتباتهای هوش مصنوعی تبدیل شود.