هوش مصنوعی

متا ما را یک قدم به فیلم‌های تولید شده توسط هوش مصنوعی نزدیک‌تر می‌کند

به گزارش اپ خونه، مجموعه‌ای از رونمایی‌های هوش مصنوعی در چند ماه گذشته، به‌ویژه موتور تبدیل متن به گفتار با صدای فوق‌العاده واقعی OpenAI ، نگاهی اجمالی به این مرز شجاع جدید نشان داده‌اند.

اما اعلامیه متا، آینده محتوای تولید شده توسط هوش مصنوعی ما را به شدت تسکین داد .

متا Emu Video را معرفی کرد، که یک ابزار تکامل یافته تکنولوژی تولید تصویر است. Emu Video می‌تواند یک کلیپ متحرک چهار ثانیه‌ای با عنوان (به‌عنوان مثال «سگ در حال دویدن بر روی یک گره علف‌زار»)، تصویر یا عکسی همراه با توضیحات ارائه کند.

کلیپ های Emu Video را می توان با یک مدل هوش مصنوعی مکمل به نام Emu Edit که نیز اعلام شد ویرایش کرد.

کاربران می‌توانند تغییراتی را که می‌خواهند در Emu Edit به زبان طبیعی انجام دهند – به عنوان مثال «همان کلیپ، اما در حرکت آهسته» – و تغییرات منعکس‌شده در یک ویدیوی جدید را مشاهده کنند.

اکنون، فناوری تولید ویدیو جدید نیست. متا قبلاً با آن آزمایش کرده است ، همانطور که گوگل انجام داده است . در همین حال، استارت آپ هایی مانند Runway در حال ایجاد کسب و کار بر روی آن هستند.

اما کلیپ‌های ۵۱۲×۵۱۲ و ۱۶ فریم در ثانیه Emu Video از نظر وفاداری به راحتی جزو بهترین‌هایی هستند که موجود اند.

ویدئو Emu

به نظر می‌رسد Emu Video موفق‌ترین انیمیشن‌سازی صحنه‌های ساده و عمدتاً ثابت (مانند آبشارها و تایم لپس‌های خطوط آسمان شهر) است که از فوتورئالیسم دور می‌شوند – یعنی در سبک‌هایی مانند کوبیسم، انیمه، «کاردستی برش کاغذ» و استیم پانک.

ویدئو Emu

برج ایفل با طرح نقاشی و انعکاس آن در رود

با این حال، حتی در بهترین آثار Emu Video، عجیب و غریب‌های تولید شده توسط هوش مصنوعی می‌توانند وارد شوند – مانند فیزیک عجیب و غریب (مثلاً اسکیت‌بردهایی که به موازات زمین حرکت می‌کنند) و زائده‌های عجیب و غریب (انگشت‌های پا که پشت پا خم می‌شوند و پاهایی که با یکدیگر ترکیب می‌شوند).

اجسام اغلب بدون منطق زیادی ظاهر می شوند و محو می شوند، مانند پرندگان بالای سر در کلیپ برج ایفل که در بالا ذکر شد.

پس از زمان بسیار زیادی که صرف مرور خلاقیت های Emu Video (یا حداقل نمونه هایی که متا انتخاب کرده بود)، می شود متوجه یک نکته واضح دیگر شد: سوژه های موجود در کلیپ ها کار زیادی انجام نمی دهند .

به نظر نمی رسد Emu Video درک قوی از افعال اکشن داشته باشد، شاید محدودیتی در معماری زیربنایی مدل باشد.

ویدئو Emu

برای مثال، یک راکون زیبای انسان‌سازی شده در یک کلیپ ویدئویی Emu، گیتار را نگه می‌دارد، اما گیتار را نمی‌زند. یا دو تک شاخ شطرنج «بازی» خواهند کرد، اما فقط به این معنا که با کنجکاوی در مقابل صفحه شطرنج بدون حرکت دادن مهره ها بنشینند.

ویدئو Emu

بنابراین واضح است که این ابزار هنوز جای کار دارد.

ویدئو Emu

جدا از خطر دیپ فیک، باید از انیماتورها و هنرمندانی ترسید که معیشت آنها به ساخت انواع صحنه هایی بستگی دارد که هوش مصنوعی مانند Emu Video اکنون می تواند تقریبی داشته باشد.

متا و رقبای هوش مصنوعی مولد آن احتمالاً استدلال می‌کنند که Emu Video، که مارک زاکربرگ، مدیر عامل متا می‌گوید در فیس‌بوک و اینستاگرام ادغام شده است،تا به جای جایگزینی هنرمندان انسانی، تقویت شود .

در اوایل سال جاری، نتفلیکس از تصاویر پس زمینه تولید شده توسط هوش مصنوعی در یک انیمیشن کوتاه سه دقیقه ای استفاده کرد.

این شرکت ادعا کرد که این فناوری می تواند به کمبود نیروی کار فرضی انیمه کمک کند – اما به راحتی متوجه شد که چگونه دستمزد کم و اغلب شرایط سخت کاری هنرمندان را از کار دور می کند.

در یک بحث مشابه، استودیوی پشت سکانس اعتباری «تهاجم مخفی» مارول اعتراف کرد که از هوش مصنوعی، عمدتاً ابزار تبدیل متن به تصویر Midjourney ، برای تولید بسیاری از آثار هنری سکانس استفاده کرده است.

علی سلیم، کارگردان سریال، این موضوع را مطرح کرد که استفاده از هوش مصنوعی با مضامین پارانوئیدی نمایش مطابقت دارد، اما اکثریت جامعه هنرمندان و طرفداران به شدت مخالف بودند .

ویدئو Emu

یکی از مهم‌ترین نکات مهم در حمله اخیر SAG-AFTRA، استفاده از هوش مصنوعی برای ایجاد شباهت‌های دیجیتالی بود. استودیوها در نهایت موافقت کردند که به بازیگران برای شباهت های تولید شده توسط هوش مصنوعی پول پرداخت کنند. اما آیا ممکن است با پیشرفت فناوری تجدید نظر کنند؟ به نظر احتمالش است.

با اضافه کردن توهین و آسیب، هوش مصنوعی مانند Emu Video معمولاً بر روی تصاویر و ویدیوهای تولید شده توسط هنرمندان، عکاسان و فیلمسازان آموزش داده می شود که بدون اطلاع یا جبران خسارت به سازندگان است.

متا همراه با انتشار Emu Video فقط می‌گوید که این مدل بر روی مجموعه داده‌ای متشکل از ۳۴ میلیون «جفت متن ویدیویی» با طول بین ۵ تا ۶۰ ثانیه آموزش دیده است – آن ویدیوها از کجا آمده‌اند، وضعیت حق نسخه‌برداری آن‌ها یا آیا متا به آنها مجوز داده است..مشخص نیست.

ویدئو Emu

استانداردهای گسترده ای در صنعت به وجود آمده است تا هنرمندان بتوانند با دریافت پول برای آثار تولید شده توسط هوش مصنوعی که در آن مشارکت داشته اند، همکاری کنند.

اما اگر Emu Video نشانه‌ای باشد، این فناوری – همانطور که اغلب اتفاق می‌افتد – به زودی بسیار جلوتر از اصول اخلاقی خواهد بود.

نوشته های مشابه

دیدگاهتان را بنویسید

دکمه بازگشت به بالا