Dan nakon što je OpenAI lansirao svoj najnoviji AI sustav GPT-4o, Google je na svojoj godišnjoj Google I/O prezentaciji odlučio predstaviti svoj vlastiti sustav, koji bi trebao biti direktan konkurent. Googleov novi sustav umjetne inteligencije ima mogućnost interpretirati informacije iz slika, videozapisa i zvukova uz pomoć kamere i mikrofona na telefonu.
Google-ova prezentacija u natjecateljskom stilu predstavila je AI pomoćnik Gemini Nano, koji bi se trebao nalaziti na Pixel uređajima, ali i u aplikaciji Gemini, koja je u nekim zemljama lansirana krajem prošle godine. Na prezentaciji su uživo demonstrirali i mogućnost upozorenja na prijevaru, još jednu od novih značajki pomoćnika Gemini Nano, koji može preslušavati telefonski razgovor i upozoriti korisnika da se radi o prijevari bez ikakvih dodatnih informacija.
Sir Demis Hassabis, čelnik odjela Google DeepMind, naglasio je kako je dugogodišnji interes tvrtke multimodalna umjetna inteligencija, koja je u stanju rukovati slikama, videozapisima i zvukovima te ih povezivati. "Da bi bio istinski koristan, pomoćnik mora razumjeti i odgovoriti na složeni i dinamični svijet baš kao i ljudi - te koristiti i zapamtiti ono što vidi i čuje, kako bi razumio kontekst i poduzeo traženu akciju", rekao je Hassabis.
VEZANI ČLANCI:
Na prezentaciji je predstavljen i Astra projekt, koji bi trebao istraživati budućnost AI pomoćnika. U demo videu je prikazano kako pomoćnik odgovara na govorna pitanja o tome što vidi kroz kameru telefona. Na kraju demonstracije jedan zaposlenik je pitao AI gdje je ostavio svoje naočale, na što mu je pomoćnik odgovorio da ih je upravo vidio na obližnjem stolu. Google najavljuje kako će Gemini moći pomagati i u popravku dijelova na opremi, pa tako recimo može imenovati dijelove zvučnika i detektirati mogući kvar.
U budućnosti najavljuju i uvrštavanje AI pomoćnika u aplikacije kao što su Google Photos i Gmail, gdje će AI moći pomoći u pretragama fotografija ili starijih mailova, ali će isto moći i sažimati sve mailove na istu temu. Također se očekuje poboljšanje u generiranju novih slika, videa i glazbe.
Odgovor je to na OpenAI prezentaciju, gdje su pokazali kako GPT-4o isto može prepoznavati stvari dok se krećete prostorijom te da može rješavati matematičke probleme držanjem kamere ispred komada papira i odgonetnuti nečije raspoloženje jednostavno gledajući njihovo lice.
GALERIJA Pogledajte koja su sve poznata lica došla na spektakularnu slavljeničku reviju eNVy rooma