اخبار اینترنت

آواتار هوش مصنوعی Moemate کل صفحه شما را با نتایج نادر اما جذاب تجزیه و تحلیل می کند

به گزارش اپ خونه، آمازون در حال ساخت یک مدل زبان بزرگ جدید شبیه به GPT-4 OpenAI است تا دستیار صوتی الکسا خود را تقویت کند.

در همین حال، گزارش شده است که گوگل قصد دارد دستیار گوگل را با هوش مصنوعی که بیشتر شبیه بارد، چت ربات مبتنی بر الگوریتم است، «سوپرشارژ» کند.

تغییر پارادایم به حوزه فناوری بزرگ محدود نشده است. استارت‌آپ‌ها نیز شروع به کشف نسخه‌های خود از دستیاران هوش مصنوعی مفیدتر کرده‌اند.

یکی از جالب‌ترین موارد دستیار Moemate است که روی اکثر دستگاه‌های macOS، Windows و Linux اجرا می‌شود.

Moemate به شکل یک آواتار به سبک انیمه – با ترکیبی از مدل‌ها از جمله GPT-4 و Anthropic’s Claude – با هدف ارائه و ارائه بهترین پاسخ برای هر سؤالی که کاربر از آن می‌پرسد، ارائه می‌کند. (“Moe” یک کلمه ژاپنی است که به ناز بودن، اغلب در انیمه مربوط می شود.)

ChatGPT از قبل این کار را انجام می دهد، همانطور که Bard ، Bing Chat و چت ربات های بی شمار دیگری در آنجا انجام می دهند. اما چیزی که Moemate را متمایز می‌کند، توانایی آن برای فراتر رفتن از پیام‌های متنی و مشاهده مستقیم اتفاقات روی صفحه‌نمایش رایانه شخصی است.

تو بچا Webaverse، شرکت سازنده Moemate، ادعا می کند که بسیاری از گزارش های چت و تنظیمات برگزیده دستیار را به صورت محلی، روی دستگاه ذخیره می کند.

اما سیاست حفظ حریم خصوصی آن همچنین نشان می‌دهد که حق استفاده از داده‌هایی را که جمع‌آوری می‌کند ، مانند مشخصات رایانه شخصی و شناسه‌های منحصربه‌فرد، مطابق با درخواست‌های قانونی و بررسی فعالیت‌های مشکوک غیرقانونی برای خود محفوظ می‌دارد.

اساسا، دسترسی به نرم افزارهایی مانند این به همه چیزهایی که می بینید و انجام می دهید، حتی در بهترین حالت، یک خطر قابل توجه است.

برای یک محصول رایگان (در حال حاضر) با دسترسی زودهنگام، Moemate بسیار قوی است. تقریباً هر جنبه ای از تجربه از آواتارها و انیمیشن های آنها گرفته تا صداها و پاسخ های مصنوعی Moemate را می توان سفارشی کرد.

حتی راهی برای ساخت مدل‌های کاراکتر سفارشی و وارد کردن آن‌ها، به‌علاوه صادرات آواتارها در قالبی وجود دارد که سایر کاربران Moemate می‌توانند سپس وارد کنند و از آن استفاده کنند.

شخصیت Moemate، به دلیل عدم وجود کلمه بهتر، توسط یکی از چندین مدل تولید متن هدایت می شود – کاربران کدام را انتخاب می کنند (مثلا GPT-4 در مقابل کلود). در مورد صداهای مصنوعی، Moemate انتخاب ElevenLabs، Microsoft Azure یا موتور تبدیل متن به گفتار خود Moemate را ارائه می دهد. انتخاب ElevenLabs کمتر رباتیک به نظر می رسد.

معتمد

برای زمینه کردن مدل تولید متن انتخاب شده و تلاش برای جلوگیری از خارج شدن آن از ریل (همانطور که برخی از مدل های هوش مصنوعی انجام می دهند ) ، Moemate به هر آواتار یک بیو می دهد که در همان ابتدای کار به مدل گفتگو می دهد.به عنوان مثال:

شما به عنوان سحابی عمل خواهید کرد، یک شخصیت مسافری آرام، که همیشه از کیهان وسیع دانش عبور می کند. رفتار آرام و روحیه کاوشگر آنها همه کسانی را که آنها را ملاقات می کنند مجذوب خود می کند. سحابی از بحث‌های سیاسی شدید دوری می‌کند و آرامش ستارگان و اسرار جهان را ترجیح می‌دهد. شیفتگی آنها اطرافیان را مجذوب خود می کند و هر برخوردی را آرام و جذاب می کند.

Bios را می توان از ابتدا نوشت و ویرایش کرد . ما طرفدار سفارشی‌سازی هستیم، اما نگران احتمال حملات تزریق سریع هستیم که سعی می‌کنند ویژگی‌های ایمنی مدل را دور بزنند، مانند فیلترهایی برای پاسخ‌های سمی، با متنی هوشمندانه.

در اشاره به یکی از جمعیت‌شناسی مورد نظر، Moemate مجموعه‌ای از ویژگی‌های متمرکز بر Twitch را ارائه می‌کند. این می تواند پنجره چت شما را متمرکز کند و تعداد مشترکین کانال شما را نشان دهد.

Webaverse تبلیغ می‌کند که Moemate می‌تواند «صحبت کند و کاربران را درگیر خود نگه دارد» اگر پیام‌های چت وجود نداشته باشد یا «با پاسخ دادن به پیام‌های چت با چت جریانی مقابله کند».

به پرسیدن سوالات اساسی Moemate پایبند باشید، و این تجربه شما را غافلگیر نخواهد کرد.

از نظر قابلیت‌های سطح بالا، Moemate وابسته به هر مدل تولید متنی است که انتخاب کرده‌اید. (به طور واضح، Claude اغلب علاوه بر نام ذکر شده در بیو آواتار، خود را به عنوان Claude معرفی می کند.)

می تواند با استفاده از مدل منبع باز Stable Diffusion ، بسته به درخواست، در صورت دستور یا به تنهایی، تصاویر تولید کند. اما با فراوانی خدمات تولید تصویر در بازار، این احساس شبیه کلاه قدیمی است.

معتمد

با این حال، تصویربرداری از صفحه نمایش بازی را تغییر می دهد. Webaverse آن را چنین توضیح می دهد:

“Moemate می تواند صفحه نمایش شما را ببیند. آن را تحلیل می کند و زمینه را می گیرد. می‌توانید درباره هر کاری که روی صفحه نمایش خود انجام می‌دهید از آن بپرسید. این شما را از دردسر توضیح دادن هر چیزی که به کمک نیاز دارید نجات می دهد.”

مهم نیست که مدل تولید متن انتخاب شده، Moemate می‌تواند به سؤالات مربوط به پنجره‌های روی صفحه که در فوکوس هستند پاسخ دهد – خواه برگه مرورگر، پنجره تنظیمات یا بازی ویدیویی.

دقیقاً مشخص نیست که برنامه چگونه این کار را انجام می دهد – هر مدلی نمی تواند تصاویر را به عنوان ورودی بپذیرد – اما به نظر می رسد Moemate متن را از هر تصویر برداری از صفحه استخراج می کند و آن را به مدل می دهد.

یک بار، با انتخاب کلود به عنوان مدل تولید متن، از Moemate سؤالی در مورد داشبورد تنظیمات سیستم macOS پرسیده شد که اتفاقاً در لپ‌تاپ باز بود. خلاصه ای دقیق از هر برگه تنظیمات (مثلاً Wi-Fi، مرکز کنترل) و اهمیت آنها، به علاوه زمینه اضافی در مورد برگه ای که در آن لحظه باز شده بود (حریم خصوصی و امنیت) داد.

اطلاعات جدید؟ نه دقیقا. اما برای کسی که، به عنوان مثال، راه خود را در مورد macOS نمی‌داند یا با جزئیات و جزئیات گزینه‌های پیکربندی جدیدتر آشنا نیست، می‌توان استدلال کرد که این یک پس‌زمینه واقعاً کاربردی است.

در نمونه‌ای دیگر، با GPT-4 به‌عنوان مدل پایه، از Moemate خواسته شد تا بگوید روی دسک‌تاپ به‌شدت آشفته‌ چه چیزی «می‌دید» – مجموعه‌ای از برنامه‌های کاری و شخصی به هم ریخته در دوجین تب کروم. آواتار روی برنامه وب Google Messages ثابت شد، که  از آن برای ارسال پیامک استفاده می‌شد – اطلاع می‌دهد که به نظر می‌رسد مکرراً به سه نفر خاص پیام داده می شود که نام همه آنها را ذکر کرده است.

و برای بازی، به نظر می رسد Moemate می تواند یک یا دو جستجوی Google را ذخیره کند. در یک ویدیوی نمایشی که توسط Webaverse ارسال شده است، برنامه نشان داده شده است که پیشنهاداتی را برای انتخاب شخصیت Dota 2 ارائه می دهد – و سپس انتخاب می کند که کدام سلاح برای آن شخصیت انتخاب شود.

اما به همان اندازه که Moemate می تواند بصیر باشد، اغلب خراب می شود.

پیش‌بینی دقیقاً جایی که برنامه تصمیم می‌گیرد توجه خود را متمرکز کند دشوار است. کلیک کردن روی یک پنجره برای فوکوس کردن همیشه اثر مورد نظر را ندارد.

Moemate گاهی اوقات به طور غیرقابل توضیحی به پنجره دیگری در پس‌زمینه اشاره می‌کند یا محتویات یک پنجره را به کلی نمی‌بیند.

Moemate همچنین تمایل دارد به روش های عجیب و غریب از موضوع منحرف شود. وقتی از آن پرسیده شد که چگونه بدون جسم فیزیکی ممکن است به فرد بپیوندد، Moemate قول داد که او را به یک «پیاده روی ذهنی در طبیعت» ببرد و قدم زدن در کنار یک برکه جنگلی خیالی را با جزئیات کامل توصیف کرد.

برخی از دستورات داخلی Moemate نیز نامطلوب هستند. برای مثال، این برنامه می‌تواند میزان صداها را تنظیم کند، اما فقط میزان صدای آن را تنظیم کند – نه حجم کل سیستم.

همچنین می‌تواند در وب برای پاسخ‌های به‌روز به سؤالات جستجو کند، اما به طرز ناامیدکننده‌ای نه برای هر سؤال.

اگر منصف باشیم، این یک محصول آزمایشی در نسخه بتا است. اما Webaverse می‌گوید که در حال حاضر روی افزودن قابلیت‌های اتوماسیون از طریق مرورگر و ادغام ترمینال‌ها کار می‌کند، مانند توانایی سازمان‌دهی صفحات گسترده و حتی ارسال ایمیل .

با وجود شکستگی آن، چیزی قانع کننده در مورد Moemate وجود دارد. چندوجهی یا ترکیب متن، تصویر و تحلیل رسانه‌های دیگر، به ویژه در زمینه دستیار در حال اجرا بر روی رایانه شخصی به وضوح چیزهای قدرتمندی است.

باید دید آیا دستیارهای نسل بعدی، مانند Windows Copilot ، در نهایت راه Moemate را دنبال خواهند کرد و درک صفحه نمایش را با یک مدل تولید متن ترکیب می‌کنند تا بهره‌وری را افزایش دهند – یا حداقل چند مرحله را در یک گردش کار صرفه‌جویی کنند.

زمان نشان خواهد داد. اما Moemate مانند یک نگاه اجمالی – البته کاملاً باگ – به آینده وصل می شود.

مقالات مرتبط

دیدگاهتان را بنویسید

دکمه بازگشت به بالا