چرا “هوش مصنوعی مولد” ناگهان بر زبان ها افتاده است: این یک “میدان باز” است
به گزارش اپ خونه، اگر پیشرفت هوش مصنوعی Open AI را از نزدیک دنبال کرده اید، شرکتی که توسط سام آلتمن اداره می شود و شبکه های عصبی آن اکنون می توانند متن اصلی را بنویسند و تصاویر اصلی را با سهولت و سرعت شگفت انگیز ایجاد کنند، ممکن است این قطعه را نادیده بگیرید.
از سوی دیگر، اگر به طور مبهم به پیشرفت شرکت و کشش فزاینده ای که سایر شرکت های به اصطلاح “مولد” هوش مصنوعی به طور ناگهانی به دست می آورند توجه کرده اید و می خواهید بهتر بفهمید که چرا، بهتر است از مصاحبه با جیمز کوریر، پنجبار بنیانگذار و اکنون سرمایهگذار مخاطرهآمیز که پنج سال پیش به همراه چند تن از دوستان موسس سریالاش، شرکت NFX را تأسیس کرد،بهره مند شوید.
کریر در زمره افرادی قرار می گیرد که پیشرفت را از نزدیک دنبال می کنند – آنقدر از نزدیک که NFX همانطور که او آن را توصیف می کند، سرمایه گذاری های مرتبط متعددی را در “تکنولوژی مولد” انجام داده است و هر ماه توجه تیم را بیشتر به خود جلب می کند. در واقع، کریر فکر میکند که نیازی به هیاهویی نیست زیرا همیشه دنیای استارتآپهای گسترده برای اولین بار پس از مدتها ناگهان با یک فرصت بسیار بزرگ روبرو میشوند.
کوریر می گوید: «هر ۱۴ سال یک بار یکی از این انفجارهای کامبرین را دریافت می کنیم. ما در سال ۹۴ در اینترنت یکی داشتیم. ما در سال ۲۰۰۸ یک گوشی تلفن همراه داشتیم. اکنون در سال ۲۰۲۲ یک گوشی دیگر داریم.”
در ادامه سوال و جواب هایی که در مصاحبه TechCrunchبا James Currier ردوبدل شد را میخوانیم:
TC: ابهامات زیادی در مورد هوش مصنوعی مولد وجود دارد، از جمله اینکه دقیقاً چقدر جدید است یا اینکه آیا به تازگی به آخرین کلمه کلیدی تبدیل شده است.
جی سی(جیمز کوریر): فکر میکنم اتفاقی که برای دنیای هوش مصنوعی رخ داد این است که ما این حس را داشتیم که میتوانیم هوش مصنوعی قطعی داشته باشیم، که به ما کمک میکند حقیقت چیزی را شناسایی کنیم. به عنوان مثال، آیا آن یک قطعه شکسته در خط تولید است؟ آیا این جلسه مناسبی است؟ اینجا جایی است که شما با استفاده از هوش مصنوعی چیزی را به همان روشی که انسان چیزی را تعیین می کند، تعیین می کنید. این تا حد زیادی همان چیزی است که هوش مصنوعی در ۱۰ تا ۱۵ سال گذشته بوده است.
مجموعههای دیگر الگوریتمها در هوش مصنوعی بیشتر این الگوریتمهای انتشار بودند، که قصد داشتند به مجموعههای عظیمی از محتوا نگاه کنند و سپس چیزی جدید از آنها تولید کنند، و میگفتند: «در اینجا ۱۰۰۰۰ مثال آورده شده است. آیا میتوانیم ۱۰۰۰۱ نمونه مشابه را ایجاد کنیم؟
آنها تا حدود یک سال و نیم پیش بسیار شکننده، بسیار شکننده بودند. [اکنون] الگوریتم ها بهتر شده اند. اما مهمتر از آن، مجموعه محتوایی که ما به آن نگاه کردهایم بزرگتر شدهاند، زیرا فقط قدرت پردازش بیشتری داریم. بنابراین اتفاقی که افتاده این است که این الگوریتمها بر قانون مور سوار میشوند – [با بهبود بسیار] فضای ذخیرهسازی، پهنای باند، سرعت محاسبات – و ناگهان قادر به تولید چیزی شدهاند که بسیار شبیه آنچه یک انسان تولید میکند. این بدان معناست که ارزش اسمی متنی که می نویسد، و ارزش اسمی نقاشی که می کشد، بسیار شبیه به کاری است که یک انسان انجام می دهد. و همه اینها در دو سال گذشته اتفاق افتاده است. بنابراین ایده جدیدی نیست، اما به تازگی در آن آستانه قرار دارد. به همین دلیل است که همه به این نگاه می کنند و می گویند: “وای، این جادو است.”
بنابراین این قدرت محاسباتی بود که به طور ناگهانی بازی را تغییر داد، نه برخی از زیرساختهای فناوری که قبلاً گم شده بود؟
ناگهان تغییر نکرد، فقط به تدریج تغییر کرد تا اینکه کیفیت نسلش به جایی رسید که برای ما معنادار بود. بنابراین پاسخ به طور کلی منفی است، الگوریتم ها بسیار شبیه به هم بوده اند. در این الگوریتمهای انتشار، تا حدودی بهتر شدهاند. اما در واقع، این در مورد قدرت پردازش است. سپس، حدود دو سال پیش، [مدل زبان قدرتمند] GPT منتشر شد، که یک نوع محاسبات در فرض بود، سپس GPT3 آمد جایی که [شرکت هوش مصنوعی Open AI] [محاسبات] را برای شما در فضای ابری انجام میداد. ; از آنجایی که مدلهای داده بسیار بزرگتر بودند، لازم بود این کار را روی سرورهای خود انجام دهند. شما فقط نمی توانید آن را [به تنهایی] انجام دهید. و در آن نقطه، همه چیز واقعاً بالا رفت.
ما میدانیم زیرا در شرکتی سرمایهگذاری کردهایم که بازیهای مولد مبتنی بر هوش مصنوعی، از جمله «AI Dungeon» را انجام میدهد، و فکر میکنم اکثریت قریب به اتفاق محاسبات GPT-3 از طریق «AI Dungeon» در یک نقطه انجام میشد.
آیا «AI Dungeon» به تیم کوچکتری نسبت به بازیساز دیگری نیاز دارد؟
این یکی از مزایای بزرگ است، قطعا. آنها مجبور نیستند این همه پول را برای نگهداری این دادهها خرج کنند، و میتوانند با گروه کوچکی از مردم، دهها تجربه بازی ایجاد کنند که همه از آن بهرهمند شوند. [در واقع] ایده این است که شما میخواهید هوش مصنوعی مولد را به بازیهای قدیمی اضافه کنید، بنابراین شخصیتهای غیربازیکن شما واقعاً میتوانند چیز جالبتری نسبت به امروز بگویند، هرچند که تجربههای اساسی بازی متفاوتی را خواهید داشت. هوش مصنوعی در بازی، در مقابل افزودن هوش مصنوعی به بازیهای موجود.
بنابراین یک تغییر بزرگ در کیفیت است؟ آیا این فناوری در نقطهای رو به افزایش است؟
نه، همیشه به صورت تدریجی بهتر خواهد شد. فقط این است که تفاوت افزایش ها در طول زمان کمتر خواهد شد زیرا آنها در حال حاضر بسیار خوب شده اند،اما تغییر بزرگ دیگر این است که Open AI واقعاً باز نبود. آنها این چیز شگفت انگیز را تولید کردند، اما پس از آن باز نبود و بسیار گران بود. بنابراین گروهها مانند Stability AI و سایر افراد دور هم جمع شدند و گفتند: «بیایید فقط نسخههای منبع باز این را بسازیم.» و در آن نقطه، هزینه ۱۰۰ برابر، فقط در دو یا سه ماه گذشته کاهش یافت.
اینها شاخه های Open AI نیستند.
قرار نیست تمام این فناوری مولد فقط بر روی مدل Open AI GPT-3 ساخته شود. که فقط اولی بود جامعه منبع باز اکنون بسیاری از کارهای خود را تکرار کرده است، و آنها احتمالاً هشت ماه عقب هستند، شش ماه از نظر کیفیت. اما قرار است به آنجا برسد. و از آنجایی که نسخه های متن باز یک سوم یا یک پنجم یا یک بیستم هزینه های Open AI است، رقابت قیمت زیادی را شاهد خواهید بود و شاهد افزایش تعداد این مدل ها خواهید بود که با هوش مصنوعی باز رقابت می کنند. . و احتمالاً در نهایت با پنج، یا شش، یا هشت، یا شاید، شاید ۱۰۰ تا از آنها خواهید رسید.
سپس در بالای آن ها مدل های هوش مصنوعی منحصر به فردی ساخته می شود. بنابراین ممکن است یک مدل هوش مصنوعی داشته باشید که واقعاً به ساختن شعر میپردازد، یا مدلهای هوش مصنوعی که واقعاً به نحوه ساخت تصاویر بصری از سگها و موهای سگ نگاه میکند، یا مدلی دارید که واقعاً در نوشتن ایمیلهای فروش تخصص دارد. شما یک لایه کامل از این مدل های تخصصی هوش مصنوعی خواهید داشت که سپس به صورت هدفمند ساخته می شوند. سپس علاوه بر آنها، تمام فناوریهای مولد را خواهید داشت، که عبارتند از: چگونه میتوانید مردم را وادار کنید از محصول استفاده کنند؟ چگونه مردم را وادار به پرداخت برای محصول می کنید؟ چگونه افراد را وادار به ورود به سیستم می کنید؟ چگونه مردم را وادار به اشتراک گذاری آن می کنید؟ چگونه افکت های شبکه ایجاد می کنید؟
چه کسی اینجا پول در می آورد؟
لایه برنامه ای که افراد قرار است پس از توزیع و اثرات شبکه بروند جایی است که شما می خواهید درآمد کسب کنید.
در مورد شرکت های بزرگی که می توانند این فناوری را در شبکه های خود بگنجانند چه می شود. آیا برای شرکتی که این مزیت را ندارد، خیلی سخت نخواهد بود که از ناکجاآباد بیاید و پول دربیاورد؟
فکر میکنم چیزی که شما به دنبال آن هستید چیزی شبیه یک Twitch است که YouTube میتوانست آن را در مدل خود ادغام کند، اما آنها این کار را نکردند. و توییچ یک پلتفرم جدید و یک بخش جدید ارزشمند از فرهنگ و ارزش را برای سرمایه گذاران و بنیانگذاران ایجاد کرد، هرچند سخت بود. بنابراین شما بنیانگذاران بزرگی خواهید داشت که از این فناوری برای ایجاد مزیت استفاده خواهند کرد. و این یک درز در بازار ایجاد می کند. و در حالی که افراد بزرگ در حال انجام کارهای دیگری هستند، می توانند شرکت های میلیارد دلاری بسازند.
نیویورک تایمز اخیراً مقالهای را منتشر کرده است که در آن تعداد انگشت شماری از خلاقان نشان داده شده است که میگویند برنامههای هوش مصنوعی مولد که در زمینههای مربوطه خود استفاده میکنند، ابزارهایی در جعبه ابزار وسیعتری هستند. آیا مردم اینجا ساده لوح هستند؟ آیا آنها در خطر جایگزینی با این فناوری هستند؟ همانطور که اشاره کردید، تیم کار بر روی “AI Dungeon” کوچکتر است. این برای شرکت خوب است اما برای توسعه دهندگانی که ممکن است در غیر این صورت روی بازی کار کرده باشند، به طور بالقوه بد است.
من فکر میکنم در مورد بیشتر فناوریها، یک نوع ناراحتی برای مردم وجود دارد که [به عنوان مثال] روباتها جایگزین شغلی در یک کارخانه خودروسازی میشوند. وقتی اینترنت آمد، بسیاری از افرادی که پست مستقیم میدادند، احساس خطر کردند که شرکتها میتوانند مستقیماً بفروشند و از خدمات تبلیغات کاغذی خود استفاده نکنند. اما [بعد از] آنها بازاریابی دیجیتال یا ارتباطات دیجیتالی از طریق ایمیل را پذیرفتند، احتمالاً دستاندازهای فوقالعادهای در حرفهشان داشتند، بهرهوری آنها بالا رفت، سرعت و کارایی آنها بالا رفت. در مورد کارت های اعتباری آنلاین نیز همین اتفاق افتاد. شاید تا سال ۲۰۰۲ احساس راحتی نداشتیم که کارت های اعتباری را آنلاین کنیم. اما کسانی که [این موج در] ۲۰۰۰ تا ۲۰۰۳ را پذیرفتند، بهتر عمل کردند.
من فکر می کنم آنچه در حال حاضر اتفاق می افتد. نویسندگان، طراحان و معمارانی که به آینده فکر میکنند و از این ابزارها استفاده میکنند تا بهرهوری ۲ برابر یا ۳ برابر یا ۵ برابر را به خود اختصاص دهند، عملکرد فوقالعاده خوبی خواهند داشت. من فکر می کنم که کل جهان طی ۱۰ سال آینده شاهد افزایش بهره وری خواهد بود. این یک فرصت بزرگ برای ۹۰٪ از مردم است که فقط کارهای بیشتری انجام دهند، بیشتر باشند، بیشتر بسازند، بیشتر ارتباط برقرار کنند.
آیا فکر میکنید با توجه به آنچه که در اطراف آن به وجود آمده، این یک گام اشتباه از سوی Open AI بود که [منبع باز] چیزی را که در حال ساخت بود، نکرد؟
رهبر در نهایت رفتار متفاوتی نسبت به پیروان دارد. نمی دانم، من داخل شرکت نیستم، واقعاً نمی توانم بگویم. چیزی که من می دانم این است که اکوسیستم بزرگی از مدل های هوش مصنوعی وجود خواهد داشت، و برای من روشن نیست که چگونه یک مدل هوش مصنوعی متمایز می شود زیرا همه آنها به یک کیفیت مجانب می شوند و فقط به یک بازی قیمت تبدیل می شود. به نظر من افرادی که برنده می شوند Google Cloud و AWS هستند زیرا همه ما دیوانه وار چیزهایی تولید می کنیم.
ممکن است هوش مصنوعی باز به سمت بالا یا پایین حرکت کند. شاید خودشان شبیه یک AWS شوند، یا شاید شروع به ساخت AI های تخصصی کنند که به عمودی خاصی می فروشند. من فکر میکنم همه افراد در این فضا اگر به درستی حرکت کنند، فرصتی برای انجام کارهای خوب خواهند داشت. آنها فقط باید در مورد آن باهوش باشند.