Korak bliže TERMINATORU! Kompanija „Figure“ predstavila do sada najnaprednijeg humanoidnog robota
Kompanija za proizvodnju robota pod nazivom Figure prikazala je humanoidnog robota koji integriše OpenAI-ovu naprednu jezičku tehnologiju, omogućavajući mu da se uključi u razgovore u realnom vremenu i istovremeno obavlja zadatke.
Decript izveštava da je Figure, kompanija za robotiku, predstavila svoju najnoviju kreaciju – razgovornog humanoidnog robota prožetog najsavremenijom OpenAI tehnologijom veštačke inteligencije. Robot ima sposobnost da trenutno razume i reaguje na ljudske interakcije, zahvaljujući integraciji moćnih modela jezika OpenAI.
Nedavno partnerstvo kompanije sa OpenAI-om donelo je svojim robotima vizuelnu i jezičku inteligenciju visokog nivoa, omogućavajući „brze, spretne radnje robota na niskom nivou“. Ova sinergija između napredne veštačke inteligencije i robotike rezultirala je robotom koji ne samo da može da razgovara sa ljudima, već i da nesmetano obavlja zadatke i obavlja više zadataka.
Mediji su ranije izvestili da je Figure prikupio podršku visokog profila, uključujući ulaganja Jeffa Bezosa i Nvidia.
U video demonstraciji koju je objavio Figure, robot Figure 01 se može videti u interakciji sa starijim AI inženjerom svog kreatora, Corei Linch-om, koji vodi robota kroz niz zadataka i pitanja u simuliranom kuhinjskom okruženju. Robot bez napora identifikuje objekte kao što su jabuka, posuđe i šolje, a kada se od njega zatraži nešto za jelo, odmah nudi jabuku, pokazujući njenu sposobnost da razume komande i deluje po njima.
We are now having full conversations with Figure 01, thanks to our partnership with OpenAI.
Our robot can:
– describe its visual experience
– plan future actions
– reflect on its memory
– explain its reasoning verbally
Technical deep-dive 🧵:pic.twitter.com/6QRzfkbxZY— Corey Lynch (@coreylynch) March 13, 2024
Štaviše, ovaj robot može da skuplja smeće u korpu dok se istovremeno upušta u razgovor, ističući svoje mogućnosti multitaskinga. Prema Linchu, robot može opisati svoja vizuelna iskustva, planirati buduće akcije, razmišljati o svom pamćenju i verbalno objasniti svoja razmišljanja – podvig koji bi bio nezamisliv prije samo nekoliko godina.
Ključ konverzacijske sposobnosti Figure 01 leži u integraciji OpenAI multimodalnih AI modela. Ovi modeli mogu da razumeju i generišu različite tipove podataka, kao što su tekst i slike, omogućavajući robotu da obrađuje vizuelne i slušne unose i reaguje u skladu sa tim. Linč je objasnio da model obrađuje čitavu istoriju razgovora, uključujući slike iz prošlosti, da bi generisao jezičke odgovore, koji se zatim vraćaju čoveku putem teksta u govor.
Debi ovog robota izazvao je veliki odziv na društvenim medijima, pri čemu su mnogi bili impresionirani sposobnostima robota, a neki čak i povlače poređenja sa scenarijima naučne fantastike. Međutim, za programere i istraživače veštačke inteligencije, Linč je pružio vredne tehničke uvide, navodeći da su sva ponašanja vođena politikama vizuomotornog transformatora neuronske mreže, mapirajući piksele direktno u radnje.