متا ما را یک قدم به فیلمهای تولید شده توسط هوش مصنوعی نزدیکتر میکند
به گزارش اپ خونه، مجموعهای از رونماییهای هوش مصنوعی در چند ماه گذشته، بهویژه موتور تبدیل متن به گفتار با صدای فوقالعاده واقعی OpenAI ، نگاهی اجمالی به این مرز شجاع جدید نشان دادهاند.
اما اعلامیه متا، آینده محتوای تولید شده توسط هوش مصنوعی ما را به شدت تسکین داد .
متا Emu Video را معرفی کرد، که یک ابزار تکامل یافته تکنولوژی تولید تصویر است. Emu Video میتواند یک کلیپ متحرک چهار ثانیهای با عنوان (بهعنوان مثال «سگ در حال دویدن بر روی یک گره علفزار»)، تصویر یا عکسی همراه با توضیحات ارائه کند.
کلیپ های Emu Video را می توان با یک مدل هوش مصنوعی مکمل به نام Emu Edit که نیز اعلام شد ویرایش کرد.
کاربران میتوانند تغییراتی را که میخواهند در Emu Edit به زبان طبیعی انجام دهند – به عنوان مثال «همان کلیپ، اما در حرکت آهسته» – و تغییرات منعکسشده در یک ویدیوی جدید را مشاهده کنند.
اکنون، فناوری تولید ویدیو جدید نیست. متا قبلاً با آن آزمایش کرده است ، همانطور که گوگل انجام داده است . در همین حال، استارت آپ هایی مانند Runway در حال ایجاد کسب و کار بر روی آن هستند.
اما کلیپهای ۵۱۲×۵۱۲ و ۱۶ فریم در ثانیه Emu Video از نظر وفاداری به راحتی جزو بهترینهایی هستند که موجود اند.
به نظر میرسد Emu Video موفقترین انیمیشنسازی صحنههای ساده و عمدتاً ثابت (مانند آبشارها و تایم لپسهای خطوط آسمان شهر) است که از فوتورئالیسم دور میشوند – یعنی در سبکهایی مانند کوبیسم، انیمه، «کاردستی برش کاغذ» و استیم پانک.
برج ایفل با طرح نقاشی و انعکاس آن در رود
با این حال، حتی در بهترین آثار Emu Video، عجیب و غریبهای تولید شده توسط هوش مصنوعی میتوانند وارد شوند – مانند فیزیک عجیب و غریب (مثلاً اسکیتبردهایی که به موازات زمین حرکت میکنند) و زائدههای عجیب و غریب (انگشتهای پا که پشت پا خم میشوند و پاهایی که با یکدیگر ترکیب میشوند).
اجسام اغلب بدون منطق زیادی ظاهر می شوند و محو می شوند، مانند پرندگان بالای سر در کلیپ برج ایفل که در بالا ذکر شد.
پس از زمان بسیار زیادی که صرف مرور خلاقیت های Emu Video (یا حداقل نمونه هایی که متا انتخاب کرده بود)، می شود متوجه یک نکته واضح دیگر شد: سوژه های موجود در کلیپ ها کار زیادی انجام نمی دهند .
به نظر نمی رسد Emu Video درک قوی از افعال اکشن داشته باشد، شاید محدودیتی در معماری زیربنایی مدل باشد.
برای مثال، یک راکون زیبای انسانسازی شده در یک کلیپ ویدئویی Emu، گیتار را نگه میدارد، اما گیتار را نمیزند. یا دو تک شاخ شطرنج «بازی» خواهند کرد، اما فقط به این معنا که با کنجکاوی در مقابل صفحه شطرنج بدون حرکت دادن مهره ها بنشینند.
بنابراین واضح است که این ابزار هنوز جای کار دارد.
جدا از خطر دیپ فیک، باید از انیماتورها و هنرمندانی ترسید که معیشت آنها به ساخت انواع صحنه هایی بستگی دارد که هوش مصنوعی مانند Emu Video اکنون می تواند تقریبی داشته باشد.
متا و رقبای هوش مصنوعی مولد آن احتمالاً استدلال میکنند که Emu Video، که مارک زاکربرگ، مدیر عامل متا میگوید در فیسبوک و اینستاگرام ادغام شده است،تا به جای جایگزینی هنرمندان انسانی، تقویت شود .
در اوایل سال جاری، نتفلیکس از تصاویر پس زمینه تولید شده توسط هوش مصنوعی در یک انیمیشن کوتاه سه دقیقه ای استفاده کرد.
این شرکت ادعا کرد که این فناوری می تواند به کمبود نیروی کار فرضی انیمه کمک کند – اما به راحتی متوجه شد که چگونه دستمزد کم و اغلب شرایط سخت کاری هنرمندان را از کار دور می کند.
در یک بحث مشابه، استودیوی پشت سکانس اعتباری «تهاجم مخفی» مارول اعتراف کرد که از هوش مصنوعی، عمدتاً ابزار تبدیل متن به تصویر Midjourney ، برای تولید بسیاری از آثار هنری سکانس استفاده کرده است.
علی سلیم، کارگردان سریال، این موضوع را مطرح کرد که استفاده از هوش مصنوعی با مضامین پارانوئیدی نمایش مطابقت دارد، اما اکثریت جامعه هنرمندان و طرفداران به شدت مخالف بودند .
یکی از مهمترین نکات مهم در حمله اخیر SAG-AFTRA، استفاده از هوش مصنوعی برای ایجاد شباهتهای دیجیتالی بود. استودیوها در نهایت موافقت کردند که به بازیگران برای شباهت های تولید شده توسط هوش مصنوعی پول پرداخت کنند. اما آیا ممکن است با پیشرفت فناوری تجدید نظر کنند؟ به نظر احتمالش است.
با اضافه کردن توهین و آسیب، هوش مصنوعی مانند Emu Video معمولاً بر روی تصاویر و ویدیوهای تولید شده توسط هنرمندان، عکاسان و فیلمسازان آموزش داده می شود که بدون اطلاع یا جبران خسارت به سازندگان است.
متا همراه با انتشار Emu Video فقط میگوید که این مدل بر روی مجموعه دادهای متشکل از ۳۴ میلیون «جفت متن ویدیویی» با طول بین ۵ تا ۶۰ ثانیه آموزش دیده است – آن ویدیوها از کجا آمدهاند، وضعیت حق نسخهبرداری آنها یا آیا متا به آنها مجوز داده است..مشخص نیست.
استانداردهای گسترده ای در صنعت به وجود آمده است تا هنرمندان بتوانند با دریافت پول برای آثار تولید شده توسط هوش مصنوعی که در آن مشارکت داشته اند، همکاری کنند.
اما اگر Emu Video نشانهای باشد، این فناوری – همانطور که اغلب اتفاق میافتد – به زودی بسیار جلوتر از اصول اخلاقی خواهد بود.