چرا “هوش مصنوعی مولد” ناگهان بر زبان ها افتاده است: این یک “میدان باز” است

آبان 8, 1401 7۰52

به گزارش اپ خونه، اگر پیشرفت هوش مصنوعی Open AI را از نزدیک دنبال کرده اید، شرکتی که توسط سام آلتمن اداره می شود و شبکه های عصبی آن اکنون می توانند متن اصلی را بنویسند و تصاویر اصلی را با سهولت و سرعت شگفت انگیز ایجاد کنند، ممکن است این قطعه را نادیده بگیرید.

از سوی دیگر، اگر به طور مبهم به پیشرفت شرکت و کشش فزاینده ای که سایر شرکت های به اصطلاح “مولد” هوش مصنوعی به طور ناگهانی به دست می آورند توجه کرده اید و می خواهید بهتر بفهمید که چرا، بهتر است از مصاحبه با جیمز کوریر، پنج‌بار بنیان‌گذار و اکنون سرمایه‌گذار مخاطره‌آمیز که پنج سال پیش به همراه چند تن از دوستان موسس سریال‌اش، شرکت NFX را تأسیس کرد،بهره مند شوید.

کریر در زمره افرادی قرار می گیرد که پیشرفت را از نزدیک دنبال می کنند – آنقدر از نزدیک که NFX همانطور که او آن را توصیف می کند، سرمایه گذاری های مرتبط متعددی را در “تکنولوژی مولد” انجام داده است و هر ماه توجه تیم را بیشتر به خود جلب می کند. در واقع، کریر فکر می‌کند که نیازی به هیاهویی نیست زیرا همیشه دنیای استارت‌آپ‌های گسترده‌ برای اولین بار پس از مدت‌ها ناگهان با یک فرصت بسیار بزرگ روبرو می‌شوند.

کوریر می گوید: «هر ۱۴ سال یک بار یکی از این انفجارهای کامبرین را دریافت می کنیم. ما در سال ۹۴ در اینترنت یکی داشتیم. ما در سال ۲۰۰۸ یک گوشی تلفن همراه داشتیم. اکنون در سال ۲۰۲۲ یک گوشی دیگر داریم.”

در ادامه سوال و جواب هایی که در مصاحبه TechCrunchبا James Currier ردوبدل شد را میخوانیم:

TC: ابهامات زیادی در مورد هوش مصنوعی مولد وجود دارد، از جمله اینکه دقیقاً چقدر جدید است یا اینکه آیا به تازگی به آخرین کلمه کلیدی تبدیل شده است.

جی سی(جیمز کوریر): فکر می‌کنم اتفاقی که برای دنیای هوش مصنوعی رخ داد این است که ما این حس را داشتیم که می‌توانیم هوش مصنوعی قطعی داشته باشیم، که به ما کمک می‌کند حقیقت چیزی را شناسایی کنیم. به عنوان مثال، آیا آن یک قطعه شکسته در خط تولید است؟ آیا این جلسه مناسبی است؟ اینجا جایی است که شما با استفاده از هوش مصنوعی چیزی را به همان روشی که انسان چیزی را تعیین می کند، تعیین می کنید. این تا حد زیادی همان چیزی است که هوش مصنوعی در ۱۰ تا ۱۵ سال گذشته بوده است.

مجموعه‌های دیگر الگوریتم‌ها در هوش مصنوعی بیشتر این الگوریتم‌های انتشار بودند، که قصد داشتند به مجموعه‌های عظیمی از محتوا نگاه کنند و سپس چیزی جدید از آنها تولید کنند، و می‌گفتند: «در اینجا ۱۰۰۰۰ مثال آورده شده است. آیا می‌توانیم ۱۰۰۰۱ نمونه مشابه را ایجاد کنیم؟
آنها تا حدود یک سال و نیم پیش بسیار شکننده، بسیار شکننده بودند. [اکنون] الگوریتم ها بهتر شده اند. اما مهمتر از آن، مجموعه محتوایی که ما به آن نگاه کرده‌ایم بزرگ‌تر شده‌اند، زیرا فقط قدرت پردازش بیشتری داریم. بنابراین اتفاقی که افتاده این است که این الگوریتم‌ها بر قانون مور سوار می‌شوند – [با بهبود بسیار] فضای ذخیره‌سازی، پهنای باند، سرعت محاسبات – و ناگهان قادر به تولید چیزی شده‌اند که بسیار شبیه آنچه یک انسان تولید می‌کند. این بدان معناست که ارزش اسمی متنی که می نویسد، و ارزش اسمی نقاشی که می کشد، بسیار شبیه به کاری است که یک انسان انجام می دهد. و همه اینها در دو سال گذشته اتفاق افتاده است. بنابراین ایده جدیدی نیست، اما به تازگی در آن آستانه قرار دارد. به همین دلیل است که همه به این نگاه می کنند و می گویند: “وای، این جادو است.”

بنابراین این قدرت محاسباتی بود که به طور ناگهانی بازی را تغییر داد، نه برخی از زیرساخت‌های فناوری که قبلاً گم شده بود؟

ناگهان تغییر نکرد، فقط به تدریج تغییر کرد تا اینکه کیفیت نسلش به جایی رسید که برای ما معنادار بود. بنابراین پاسخ به طور کلی منفی است، الگوریتم ها بسیار شبیه به هم بوده اند. در این الگوریتم‌های انتشار، تا حدودی بهتر شده‌اند. اما در واقع، این در مورد قدرت پردازش است. سپس، حدود دو سال پیش، [مدل زبان قدرتمند] GPT منتشر شد، که یک نوع محاسبات در فرض بود، سپس GPT3 آمد جایی که [شرکت هوش مصنوعی Open AI] [محاسبات] را برای شما در فضای ابری انجام می‌داد. ; از آنجایی که مدل‌های داده بسیار بزرگ‌تر بودند، لازم بود این کار را روی سرورهای خود انجام دهند. شما فقط نمی توانید آن را [به تنهایی] انجام دهید. و در آن نقطه، همه چیز واقعاً بالا رفت.

ما می‌دانیم زیرا در شرکتی سرمایه‌گذاری کرده‌ایم که بازی‌های مولد مبتنی بر هوش مصنوعی، از جمله «AI Dungeon» را انجام می‌دهد، و فکر می‌کنم اکثریت قریب به اتفاق محاسبات GPT-3 از طریق «AI Dungeon» در یک نقطه انجام می‌شد.

آیا «AI Dungeon» به تیم کوچک‌تری نسبت به بازی‌ساز دیگری نیاز دارد؟

این یکی از مزایای بزرگ است، قطعا. آن‌ها مجبور نیستند این همه پول را برای نگهداری این داده‌ها خرج کنند، و می‌توانند با گروه کوچکی از مردم، ده‌ها تجربه بازی ایجاد کنند که همه از آن بهره‌مند شوند. [در واقع] ایده این است که شما می‌خواهید هوش مصنوعی مولد را به بازی‌های قدیمی اضافه کنید، بنابراین شخصیت‌های غیربازیکن شما واقعاً می‌توانند چیز جالب‌تری نسبت به امروز بگویند، هرچند که تجربه‌های اساسی بازی متفاوتی را خواهید داشت. هوش مصنوعی در بازی، در مقابل افزودن هوش مصنوعی به بازی‌های موجود.

بنابراین یک تغییر بزرگ در کیفیت است؟ آیا این فناوری در نقطه‌ای رو به افزایش است؟

نه، همیشه به صورت تدریجی بهتر خواهد شد. فقط این است که تفاوت افزایش ها در طول زمان کمتر خواهد شد زیرا آنها در حال حاضر بسیار خوب شده اند،اما تغییر بزرگ دیگر این است که Open AI واقعاً باز نبود. آنها این چیز شگفت انگیز را تولید کردند، اما پس از آن باز نبود و بسیار گران بود. بنابراین گروه‌ها مانند Stability AI و سایر افراد دور هم جمع شدند و گفتند: «بیایید فقط نسخه‌های منبع باز این را بسازیم.» و در آن نقطه، هزینه ۱۰۰ برابر، فقط در دو یا سه ماه گذشته کاهش یافت.

اینها شاخه های Open AI نیستند.

قرار نیست تمام این فناوری مولد فقط بر روی مدل Open AI GPT-3 ساخته شود. که فقط اولی بود جامعه منبع باز اکنون بسیاری از کارهای خود را تکرار کرده است، و آنها احتمالاً هشت ماه عقب هستند، شش ماه از نظر کیفیت. اما قرار است به آنجا برسد. و از آنجایی که نسخه های متن باز یک سوم یا یک پنجم یا یک بیستم هزینه های Open AI است، رقابت قیمت زیادی را شاهد خواهید بود و شاهد افزایش تعداد این مدل ها خواهید بود که با هوش مصنوعی باز رقابت می کنند. . و احتمالاً در نهایت با پنج، یا شش، یا هشت، یا شاید، شاید ۱۰۰ تا از آنها خواهید رسید.

سپس در بالای آن ها مدل های هوش مصنوعی منحصر به فردی ساخته می شود. بنابراین ممکن است یک مدل هوش مصنوعی داشته باشید که واقعاً به ساختن شعر می‌پردازد، یا مدل‌های هوش مصنوعی که واقعاً به نحوه ساخت تصاویر بصری از سگ‌ها و موهای سگ نگاه می‌کند، یا مدلی دارید که واقعاً در نوشتن ایمیل‌های فروش تخصص دارد. شما یک لایه کامل از این مدل های تخصصی هوش مصنوعی خواهید داشت که سپس به صورت هدفمند ساخته می شوند. سپس علاوه بر آن‌ها، تمام فناوری‌های مولد را خواهید داشت، که عبارتند از: چگونه می‌توانید مردم را وادار کنید از محصول استفاده کنند؟ چگونه مردم را وادار به پرداخت برای محصول می کنید؟ چگونه افراد را وادار به ورود به سیستم می کنید؟ چگونه مردم را وادار به اشتراک گذاری آن می کنید؟ چگونه افکت های شبکه ایجاد می کنید؟

چه کسی اینجا پول در می آورد؟

لایه برنامه ای که افراد قرار است پس از توزیع و اثرات شبکه بروند جایی است که شما می خواهید درآمد کسب کنید.

در مورد شرکت های بزرگی که می توانند این فناوری را در شبکه های خود بگنجانند چه می شود. آیا برای شرکتی که این مزیت را ندارد، خیلی سخت نخواهد بود که از ناکجاآباد بیاید و پول دربیاورد؟

فکر می‌کنم چیزی که شما به دنبال آن هستید چیزی شبیه یک Twitch است که YouTube می‌توانست آن را در مدل خود ادغام کند، اما آنها این کار را نکردند. و توییچ یک پلتفرم جدید و یک بخش جدید ارزشمند از فرهنگ و ارزش را برای سرمایه گذاران و بنیانگذاران ایجاد کرد، هرچند سخت بود. بنابراین شما بنیانگذاران بزرگی خواهید داشت که از این فناوری برای ایجاد مزیت استفاده خواهند کرد. و این یک درز در بازار ایجاد می کند. و در حالی که افراد بزرگ در حال انجام کارهای دیگری هستند، می توانند شرکت های میلیارد دلاری بسازند.

نیویورک تایمز اخیراً مقاله‌ای را منتشر کرده است که در آن تعداد انگشت شماری از خلاقان نشان داده شده است که می‌گویند برنامه‌های هوش مصنوعی مولد که در زمینه‌های مربوطه خود استفاده می‌کنند، ابزارهایی در جعبه ابزار وسیع‌تری هستند. آیا مردم اینجا ساده لوح هستند؟ آیا آنها در خطر جایگزینی با این فناوری هستند؟ همانطور که اشاره کردید، تیم کار بر روی “AI Dungeon” کوچکتر است. این برای شرکت خوب است اما برای توسعه دهندگانی که ممکن است در غیر این صورت روی بازی کار کرده باشند، به طور بالقوه بد است.

من فکر می‌کنم در مورد بیشتر فناوری‌ها، یک نوع ناراحتی برای مردم وجود دارد که [به عنوان مثال] روبات‌ها جایگزین شغلی در یک کارخانه خودروسازی می‌شوند. وقتی اینترنت آمد، بسیاری از افرادی که پست مستقیم می‌دادند، احساس خطر کردند که شرکت‌ها می‌توانند مستقیماً بفروشند و از خدمات تبلیغات کاغذی خود استفاده نکنند. اما [بعد از] آن‌ها بازاریابی دیجیتال یا ارتباطات دیجیتالی از طریق ایمیل را پذیرفتند، احتمالاً دست‌اندازهای فوق‌العاده‌ای در حرفه‌شان داشتند، بهره‌وری آنها بالا رفت، سرعت و کارایی آنها بالا رفت. در مورد کارت های اعتباری آنلاین نیز همین اتفاق افتاد. شاید تا سال ۲۰۰۲ احساس راحتی نداشتیم که کارت های اعتباری را آنلاین کنیم. اما کسانی که [این موج در] ۲۰۰۰ تا ۲۰۰۳ را پذیرفتند، بهتر عمل کردند.

من فکر می کنم آنچه در حال حاضر اتفاق می افتد. نویسندگان، طراحان و معمارانی که به آینده فکر می‌کنند و از این ابزارها استفاده می‌کنند تا بهره‌وری ۲ برابر یا ۳ برابر یا ۵ برابر را به خود اختصاص دهند، عملکرد فوق‌العاده خوبی خواهند داشت. من فکر می کنم که کل جهان طی ۱۰ سال آینده شاهد افزایش بهره وری خواهد بود. این یک فرصت بزرگ برای ۹۰٪ از مردم است که فقط کارهای بیشتری انجام دهند، بیشتر باشند، بیشتر بسازند، بیشتر ارتباط برقرار کنند.

آیا فکر می‌کنید با توجه به آنچه که در اطراف آن به وجود آمده، این یک گام اشتباه از سوی Open AI بود که [منبع باز] چیزی را که در حال ساخت بود، نکرد؟

رهبر در نهایت رفتار متفاوتی نسبت به پیروان دارد. نمی دانم، من داخل شرکت نیستم، واقعاً نمی توانم بگویم. چیزی که من می دانم این است که اکوسیستم بزرگی از مدل های هوش مصنوعی وجود خواهد داشت، و برای من روشن نیست که چگونه یک مدل هوش مصنوعی متمایز می شود زیرا همه آنها به یک کیفیت مجانب می شوند و فقط به یک بازی قیمت تبدیل می شود. به نظر من افرادی که برنده می شوند Google Cloud و AWS هستند زیرا همه ما دیوانه وار چیزهایی تولید می کنیم.

ممکن است هوش مصنوعی باز به سمت بالا یا پایین حرکت کند. شاید خودشان شبیه یک AWS شوند، یا شاید شروع به ساخت AI های تخصصی کنند که به عمودی خاصی می فروشند. من فکر می‌کنم همه افراد در این فضا اگر به درستی حرکت کنند، فرصتی برای انجام کارهای خوب خواهند داشت. آنها فقط باید در مورد آن باهوش باشند.