فکر کردن رباتیکها به هوش مصنوعی مولد
موضوع هوش مصنوعی مولد اغلب در خبرنامه من، Actuator مطرح می شود. اعتراف می کنم که چند ماه پیش برای صرف زمان بیشتر روی این موضوع کمی مردد بودم. هرکسی که به اندازه من در مورد فناوری گزارش میدهد، چرخههای تبلیغات بیشماری را پشت سر گذاشته و قبلاً سوزانده شده است. گزارش در مورد فناوری نیاز به دوز سالمی از شک و تردید دارد که امیدواریم با کمی هیجان در مورد آنچه که می توان انجام داد تعدیل شود.
این بار، به نظر میرسید هوش مصنوعی مولد در بالها منتظر بود و زمان خود را در انتظار فروپاشی اجتنابناپذیر ارزهای دیجیتال بود. همانطور که خون از آن دسته خارج شد، پروژههایی مانند ChatGPT و DALL-E آماده بودند تا کانون گزارشهای بینفس، امیدواری، انتقاد، نابودی و تمام مراحل مختلف Kübler-Rossian حباب تبلیغاتی فناوری باشند.
کسانی که مطالب من را دنبال میکنند میدانند که من هرگز نسبت به کریپتو خوشبین نبودم. با این حال، همه چیز با هوش مصنوعی مولد متفاوت است. برای شروع، یک توافق تقریباً جهانی وجود دارد که هوش مصنوعی/ یادگیری ماشینی به طور گسترده نقش متمرکزتری در زندگی ما در آینده ایفا خواهد کرد.
گوشی های هوشمند در اینجا بینش عالی ارائه می دهند. عکاسی محاسباتی چیزی است که من به طور منظم در مورد آن می نویسم. در سالهای اخیر پیشرفتهای بزرگی در این زمینه صورت گرفته است، و من فکر میکنم که بسیاری از تولیدکنندگان در نهایت تعادل خوبی بین سختافزار و نرمافزار ایجاد کردهاند که هم در مورد بهبود محصول نهایی و هم پایین آوردن نوار ورود به میان میآید. به عنوان مثال، گوگل با ویژگیهای ویرایشی مانند Best Take و Magic Eraser، ترفندهای واقعاً چشمگیر را انجام میدهد.
مطمئناً، آنها ترفندهای منظمی هستند، اما به جای اینکه ویژگی هایی برای ویژگی ها باشند، مفید نیز هستند. با این حال، حرکت رو به جلو، ترفند واقعی ادغام یکپارچه آنها در تجربه خواهد بود. با گردشهای کاری ایدهآل در آینده، اکثر کاربران هیچ تصوری از آنچه در پشت صحنه اتفاق میافتد ندارند. آنها فقط از اینکه کار می کند خوشحال خواهند شد. این کتاب بازی کلاسیک اپل است.
هوش مصنوعی مولد یک اثر “واو” مشابه را از گیت ارائه می دهد، که روش دیگری است که با سلف چرخه هایپ خود متفاوت است. زمانی که نزدیکترین اقوام شما در زمینه فناوری میتواند پشت کامپیوتر بنشیند، چند کلمه را در یک فیلد گفتگو تایپ کند و سپس تماشا کند که جعبه سیاه نقاشیها و داستانهای کوتاه را بیرون میریزد، نیازی به مفهومسازی زیادی نیست. این بخش بزرگی از دلیلی است که همه اینها به همان سرعتی که انجام شد رخ داد – بیشتر مواقعی که مردم روزمره از فناوریهای پیشرفته استفاده میکنند، لازم است آنها را تجسم کنند که چگونه ممکن است در پنج یا 10 سال آینده به نظر برسد.
با ChatGPT، DALL-E و غیره، می توانید همین الان آن را به طور مستقیم تجربه کنید. البته طرف دیگر این است که کاهش انتظارات چقدر دشوار می شود. همانطور که مردم تمایل دارند رباتها را با هوش انسانی یا حیوانی آغشته کنند، بدون اینکه درک اساسی از هوش مصنوعی داشته باشند، به راحتی میتوان هدفمندی را در اینجا نشان داد. اما اکنون همه چیز به همین شکل است. ما با تیتر جذاب پیشرو هستیم و امیدواریم مردم به اندازه کافی در اطراف خود بمانند تا در مورد دسیسه های پشت آن بخوانند.
هشدار اسپویلر: از هر 10 9 بار این کار را نمیکنند و ناگهان ماهها و سالها تلاش میکنیم تا همه چیز را به واقعیت برگردانیم.
یکی از مزیت های خوب شغل من این است که می توانم این چیزها را با افراد بسیار باهوش تر از من بشکنم. آنها وقت می گذارند تا چیزها را توضیح دهند و امیدوارم کار خوبی برای ترجمه آن برای خوانندگان انجام دهم (برخی از تلاش ها موفق تر از بقیه هستند).
وقتی مشخص شد که هوش مصنوعی مولد نقش مهمی در آینده رباتیک دارد، من در حال یافتن راههایی برای جابجایی سوالات در مکالمات هستم. من متوجه شدم که اکثر افراد در این زمینه با بیانیه جمله قبلی موافق هستند، و دیدن وسعت تأثیری که آنها معتقدند این جمله خواهد داشت، جذاب است.
به عنوان مثال، در گفتگوی اخیرم با مارک رایبرت و گیل پرت، دومی نقش هوش مصنوعی مولد در رویکرد یادگیری ربات را توضیح داد:
ما متوجه شدهایم که چگونه میتوان کاری انجام داد، یعنی استفاده از تکنیکهای هوش مصنوعی مولد مدرن که انسان را قادر میسازد هم موقعیت و هم نیرو را نشان دهد تا اساساً فقط از چند نمونه به ربات آموزش دهد. کد به هیچ وجه تغییر نکرده است. آنچه این بر اساس آن است چیزی به نام سیاست انتشار است. این کاری است که ما با همکاری کلمبیا و MIT انجام دادیم. ما تاکنون 60 مهارت مختلف را آموزش داده ایم.
هفته گذشته، وقتی از معاون و مدیر ارشد محاسبات جاسازی شده و لبهای انویدیا، دیپو تالا، پرسیدم که چرا این شرکت معتقد است هوش مصنوعی مولد چیزی بیش از یک مد است، او به من گفت:
من فکر می کنم در نتایج صحبت می کند. شما در حال حاضر می توانید بهبود بهره وری را مشاهده کنید. می تواند برای من ایمیل بسازد. دقیقاً درست نیست، اما من مجبور نیستم از صفر شروع کنم. به من 70 درصد می دهد. چیزهای واضحی وجود دارد که میتوانید مشاهده کنید که قطعاً عملکرد یک مرحلهای بهتر از وضعیت قبلی دارند. خلاصه کردن چیزی کامل نیست من نمی گذارم آن را برای من بخواند و خلاصه کند. بنابراین، میتوانید نشانههایی از بهبود بهرهوری را مشاهده کنید.
در همین حال، در آخرین گفتگوی من با دانیلا روس، رئیس MIT CSAIL توضیح داد که چگونه محققان از هوش مصنوعی مولد برای طراحی واقعی ربات ها استفاده می کنند:
به نظر می رسد که هوش مصنوعی مولد می تواند برای حل مشکلات حتی برنامه ریزی حرکت بسیار قدرتمند باشد. شما میتوانید راهحلهای بسیار سریعتر و راهحلهای روانتر و انسانمانندتری را برای کنترل نسبت به راهحلهای پیشبینی مدل دریافت کنید. من فکر می کنم این بسیار قدرتمند است، زیرا روبات های آینده بسیار کمتر رباتیک خواهند شد. آنها در حرکاتشان بسیار روانتر و شبیه انسان خواهند بود.
ما همچنین از هوش مصنوعی مولد برای طراحی استفاده کردهایم. این بسیار قدرتمند است. همچنین بسیار جالب است، زیرا فقط تولید الگو برای روبات ها نیست. شما باید کار دیگری انجام دهید. نمی تواند فقط یک الگوی مبتنی بر داده تولید کند. ماشین ها باید در زمینه فیزیک و دنیای فیزیکی معنا پیدا کنند. به همین دلیل، ما آنها را به یک موتور شبیهسازی مبتنی بر فیزیک متصل میکنیم تا مطمئن شویم که طرحها محدودیتهای مورد نیاز خود را برآورده میکنند.
این هفته، تیمی در دانشگاه نورث وسترن از تحقیقات خود در مورد طراحی ربات تولید شده توسط هوش مصنوعی رونمایی کرد. محققان نشان دادند که چگونه “روباتی که با موفقیت راه می رود در عرض چند ثانیه” طراحی کردند. نگاه کردن به این موارد زیاد نیست، اما به اندازه کافی آسان است که ببینیم چگونه با تحقیقات بیشتر، می توان از این رویکرد برای ایجاد سیستم های پیچیده تر استفاده کرد.
سام کریگمن، سرپرست تحقیقات، گفت: «ما یک الگوریتم طراحی بسیار سریع مبتنی بر هوش مصنوعی را کشف کردیم که ترافیک تکامل را دور میزند، بدون اینکه از تعصبات طراحان انسانی عقب نشینی کنیم. ما به هوش مصنوعی گفتیم که رباتی می خواهیم که بتواند در خشکی راه برود. سپس ما به سادگی یک دکمه را فشار دادیم و از قبل آماده کردیم! طرحی برای روباتی در یک چشم به هم زدن ایجاد کرد که هیچ شباهتی به هیچ حیوانی که تا به حال روی زمین راه رفته است ندارد. من این فرآیند را «تکامل آنی» مینامم.»
این انتخاب برنامه هوش مصنوعی برای گذاشتن پاها بر روی ربات کوچک و متلاطم بود. کریگمن افزود: «این جالب است زیرا ما به هوش مصنوعی نگفتیم که یک ربات باید پا داشته باشد. او دوباره کشف کرد که پاها راه خوبی برای حرکت در خشکی هستند. حرکت پاها در واقع کارآمدترین شکل حرکت زمینی است.
جف لینل، بنیانگذار و مدیر عامل Formant این هفته به من گفت: «از دیدگاه من، هوش مصنوعی مولد و اتوماسیون فیزیکی/رباتیک چیزی است که همه چیزهایی را که در مورد حیات روی زمین می دانیم تغییر خواهد داد. «من فکر میکنم همه ما به این واقعیت اعتقاد داریم که هوش مصنوعی یک چیز است و انتظار داریم شغل، هر شرکت و دانشآموزی تحت تأثیر قرار گیرد. فکر میکنم با روباتیک همزیستی دارد. شما مجبور نیستید یک ربات را برنامه ریزی کنید. شما می خواهید با ربات به زبان انگلیسی صحبت کنید، درخواست یک عمل کنید و سپس مشخص خواهد شد. برای آن یک دقیقه وقت میگذرد.»
قبل از Formant، لینل به عنوان مدیر عامل Bot & Dolly تاسیس و خدمت کرد. این شرکت مستقر در سانفرانسیسکو که بیشتر به خاطر کارش بر روی Gravity شناخته می شود، در سال 2013 توسط گوگل به پایان رسید زیرا غول نرم افزاری هدف خود را برای شتاب بخشیدن به صنعت (بهترین برنامه ها و غیره) هدف قرار داد. مدیر اجرایی به من می گوید که نکته کلیدی او از این تجربه این است که همه چیز در مورد نرم افزار است (با توجه به ورود ربات های داخلی و روزمره به DeepMind، من تمایل دارم بگویم که گوگل موافق است).