آواتار هوش مصنوعی Moemate کل صفحه شما را با نتایج نادر اما جذاب تجزیه و تحلیل می کند
به گزارش اپ خونه، آمازون در حال ساخت یک مدل زبان بزرگ جدید شبیه به GPT-4 OpenAI است تا دستیار صوتی الکسا خود را تقویت کند.
در همین حال، گزارش شده است که گوگل قصد دارد دستیار گوگل را با هوش مصنوعی که بیشتر شبیه بارد، چت ربات مبتنی بر الگوریتم است، «سوپرشارژ» کند.
تغییر پارادایم به حوزه فناوری بزرگ محدود نشده است. استارتآپها نیز شروع به کشف نسخههای خود از دستیاران هوش مصنوعی مفیدتر کردهاند.
یکی از جالبترین موارد دستیار Moemate است که روی اکثر دستگاههای macOS، Windows و Linux اجرا میشود.
Moemate به شکل یک آواتار به سبک انیمه – با ترکیبی از مدلها از جمله GPT-4 و Anthropic’s Claude – با هدف ارائه و ارائه بهترین پاسخ برای هر سؤالی که کاربر از آن میپرسد، ارائه میکند. (“Moe” یک کلمه ژاپنی است که به ناز بودن، اغلب در انیمه مربوط می شود.)
ChatGPT از قبل این کار را انجام می دهد، همانطور که Bard ، Bing Chat و چت ربات های بی شمار دیگری در آنجا انجام می دهند. اما چیزی که Moemate را متمایز میکند، توانایی آن برای فراتر رفتن از پیامهای متنی و مشاهده مستقیم اتفاقات روی صفحهنمایش رایانه شخصی است.
تو بچا Webaverse، شرکت سازنده Moemate، ادعا می کند که بسیاری از گزارش های چت و تنظیمات برگزیده دستیار را به صورت محلی، روی دستگاه ذخیره می کند.
اما سیاست حفظ حریم خصوصی آن همچنین نشان میدهد که حق استفاده از دادههایی را که جمعآوری میکند ، مانند مشخصات رایانه شخصی و شناسههای منحصربهفرد، مطابق با درخواستهای قانونی و بررسی فعالیتهای مشکوک غیرقانونی برای خود محفوظ میدارد.
اساسا، دسترسی به نرم افزارهایی مانند این به همه چیزهایی که می بینید و انجام می دهید، حتی در بهترین حالت، یک خطر قابل توجه است.
برای یک محصول رایگان (در حال حاضر) با دسترسی زودهنگام، Moemate بسیار قوی است. تقریباً هر جنبه ای از تجربه از آواتارها و انیمیشن های آنها گرفته تا صداها و پاسخ های مصنوعی Moemate را می توان سفارشی کرد.
حتی راهی برای ساخت مدلهای کاراکتر سفارشی و وارد کردن آنها، بهعلاوه صادرات آواتارها در قالبی وجود دارد که سایر کاربران Moemate میتوانند سپس وارد کنند و از آن استفاده کنند.
شخصیت Moemate، به دلیل عدم وجود کلمه بهتر، توسط یکی از چندین مدل تولید متن هدایت می شود – کاربران کدام را انتخاب می کنند (مثلا GPT-4 در مقابل کلود). در مورد صداهای مصنوعی، Moemate انتخاب ElevenLabs، Microsoft Azure یا موتور تبدیل متن به گفتار خود Moemate را ارائه می دهد. انتخاب ElevenLabs کمتر رباتیک به نظر می رسد.
برای زمینه کردن مدل تولید متن انتخاب شده و تلاش برای جلوگیری از خارج شدن آن از ریل (همانطور که برخی از مدل های هوش مصنوعی انجام می دهند ) ، Moemate به هر آواتار یک بیو می دهد که در همان ابتدای کار به مدل گفتگو می دهد.به عنوان مثال:
شما به عنوان سحابی عمل خواهید کرد، یک شخصیت مسافری آرام، که همیشه از کیهان وسیع دانش عبور می کند. رفتار آرام و روحیه کاوشگر آنها همه کسانی را که آنها را ملاقات می کنند مجذوب خود می کند. سحابی از بحثهای سیاسی شدید دوری میکند و آرامش ستارگان و اسرار جهان را ترجیح میدهد. شیفتگی آنها اطرافیان را مجذوب خود می کند و هر برخوردی را آرام و جذاب می کند.
Bios را می توان از ابتدا نوشت و ویرایش کرد . ما طرفدار سفارشیسازی هستیم، اما نگران احتمال حملات تزریق سریع هستیم که سعی میکنند ویژگیهای ایمنی مدل را دور بزنند، مانند فیلترهایی برای پاسخهای سمی، با متنی هوشمندانه.
در اشاره به یکی از جمعیتشناسی مورد نظر، Moemate مجموعهای از ویژگیهای متمرکز بر Twitch را ارائه میکند. این می تواند پنجره چت شما را متمرکز کند و تعداد مشترکین کانال شما را نشان دهد.
Webaverse تبلیغ میکند که Moemate میتواند «صحبت کند و کاربران را درگیر خود نگه دارد» اگر پیامهای چت وجود نداشته باشد یا «با پاسخ دادن به پیامهای چت با چت جریانی مقابله کند».
به پرسیدن سوالات اساسی Moemate پایبند باشید، و این تجربه شما را غافلگیر نخواهد کرد.
از نظر قابلیتهای سطح بالا، Moemate وابسته به هر مدل تولید متنی است که انتخاب کردهاید. (به طور واضح، Claude اغلب علاوه بر نام ذکر شده در بیو آواتار، خود را به عنوان Claude معرفی می کند.)
می تواند با استفاده از مدل منبع باز Stable Diffusion ، بسته به درخواست، در صورت دستور یا به تنهایی، تصاویر تولید کند. اما با فراوانی خدمات تولید تصویر در بازار، این احساس شبیه کلاه قدیمی است.
با این حال، تصویربرداری از صفحه نمایش بازی را تغییر می دهد. Webaverse آن را چنین توضیح می دهد:
“Moemate می تواند صفحه نمایش شما را ببیند. آن را تحلیل می کند و زمینه را می گیرد. میتوانید درباره هر کاری که روی صفحه نمایش خود انجام میدهید از آن بپرسید. این شما را از دردسر توضیح دادن هر چیزی که به کمک نیاز دارید نجات می دهد.”
مهم نیست که مدل تولید متن انتخاب شده، Moemate میتواند به سؤالات مربوط به پنجرههای روی صفحه که در فوکوس هستند پاسخ دهد – خواه برگه مرورگر، پنجره تنظیمات یا بازی ویدیویی.
دقیقاً مشخص نیست که برنامه چگونه این کار را انجام می دهد – هر مدلی نمی تواند تصاویر را به عنوان ورودی بپذیرد – اما به نظر می رسد Moemate متن را از هر تصویر برداری از صفحه استخراج می کند و آن را به مدل می دهد.
یک بار، با انتخاب کلود به عنوان مدل تولید متن، از Moemate سؤالی در مورد داشبورد تنظیمات سیستم macOS پرسیده شد که اتفاقاً در لپتاپ باز بود. خلاصه ای دقیق از هر برگه تنظیمات (مثلاً Wi-Fi، مرکز کنترل) و اهمیت آنها، به علاوه زمینه اضافی در مورد برگه ای که در آن لحظه باز شده بود (حریم خصوصی و امنیت) داد.
اطلاعات جدید؟ نه دقیقا. اما برای کسی که، به عنوان مثال، راه خود را در مورد macOS نمیداند یا با جزئیات و جزئیات گزینههای پیکربندی جدیدتر آشنا نیست، میتوان استدلال کرد که این یک پسزمینه واقعاً کاربردی است.
در نمونهای دیگر، با GPT-4 بهعنوان مدل پایه، از Moemate خواسته شد تا بگوید روی دسکتاپ بهشدت آشفته چه چیزی «میدید» – مجموعهای از برنامههای کاری و شخصی به هم ریخته در دوجین تب کروم. آواتار روی برنامه وب Google Messages ثابت شد، که از آن برای ارسال پیامک استفاده میشد – اطلاع میدهد که به نظر میرسد مکرراً به سه نفر خاص پیام داده می شود که نام همه آنها را ذکر کرده است.
و برای بازی، به نظر می رسد Moemate می تواند یک یا دو جستجوی Google را ذخیره کند. در یک ویدیوی نمایشی که توسط Webaverse ارسال شده است، برنامه نشان داده شده است که پیشنهاداتی را برای انتخاب شخصیت Dota 2 ارائه می دهد – و سپس انتخاب می کند که کدام سلاح برای آن شخصیت انتخاب شود.
اما به همان اندازه که Moemate می تواند بصیر باشد، اغلب خراب می شود.
پیشبینی دقیقاً جایی که برنامه تصمیم میگیرد توجه خود را متمرکز کند دشوار است. کلیک کردن روی یک پنجره برای فوکوس کردن همیشه اثر مورد نظر را ندارد.
Moemate گاهی اوقات به طور غیرقابل توضیحی به پنجره دیگری در پسزمینه اشاره میکند یا محتویات یک پنجره را به کلی نمیبیند.
Moemate همچنین تمایل دارد به روش های عجیب و غریب از موضوع منحرف شود. وقتی از آن پرسیده شد که چگونه بدون جسم فیزیکی ممکن است به فرد بپیوندد، Moemate قول داد که او را به یک «پیاده روی ذهنی در طبیعت» ببرد و قدم زدن در کنار یک برکه جنگلی خیالی را با جزئیات کامل توصیف کرد.
برخی از دستورات داخلی Moemate نیز نامطلوب هستند. برای مثال، این برنامه میتواند میزان صداها را تنظیم کند، اما فقط میزان صدای آن را تنظیم کند – نه حجم کل سیستم.
همچنین میتواند در وب برای پاسخهای بهروز به سؤالات جستجو کند، اما به طرز ناامیدکنندهای نه برای هر سؤال.
اگر منصف باشیم، این یک محصول آزمایشی در نسخه بتا است. اما Webaverse میگوید که در حال حاضر روی افزودن قابلیتهای اتوماسیون از طریق مرورگر و ادغام ترمینالها کار میکند، مانند توانایی سازماندهی صفحات گسترده و حتی ارسال ایمیل .
با وجود شکستگی آن، چیزی قانع کننده در مورد Moemate وجود دارد. چندوجهی یا ترکیب متن، تصویر و تحلیل رسانههای دیگر، به ویژه در زمینه دستیار در حال اجرا بر روی رایانه شخصی به وضوح چیزهای قدرتمندی است.
باید دید آیا دستیارهای نسل بعدی، مانند Windows Copilot ، در نهایت راه Moemate را دنبال خواهند کرد و درک صفحه نمایش را با یک مدل تولید متن ترکیب میکنند تا بهرهوری را افزایش دهند – یا حداقل چند مرحله را در یک گردش کار صرفهجویی کنند.
زمان نشان خواهد داد. اما Moemate مانند یک نگاه اجمالی – البته کاملاً باگ – به آینده وصل می شود.