Kako AI asistenti dobivaju glasove?

Filmska zvijezda Scarlett Johansson upozorila na mogućnosti kršenja prava zbog AI-a

Joaquin Phoenix, Scarlett Johansson
Foto: Maria La Torre/KIKA/PIXSELL/KIKA/PIXSELL
1/3
27.05.2024.
u 13:15

Boju, intonaciju i intenzitet tih glasova virtualnih asistenata generira umjetna inteligencija koja pokušava oponašati osobu koja je prethodno izgovarala slične tekstove

Scarlett Johansson je s ljutnjom i nevjericom popratila vijest da će OpenAI za ChatGPT 4.0. koristiti sintetički glas koji je "jezivo sličan" njezinu glasu iz filma "Ona" u kojem je glumila s Joaquinom Phoenixom. Kad je OpenAI objavio umjetni glas pod imenom Sky, nekim se korisnicima učinio poznatim, a mnogi su ga i ismijavali zbog koketnog tona. Johansson je za CNN rekla da joj je šef OpenAI-ja Sam Altman prošlog rujna ponudio angažman u projektu novog ChatGPT 4.0 sustava. Ponudu da posudi svoj glas odbila je iz osobnih razloga.

"Dva dana prije nego što je demo ChatGPT 4.0 objavljen, Altman je kontaktirao mog agenta tražeći od mene da još jednom razmislim. Prije nego što smo se uspjeli povezati, sustav je bio vani", požalila se Johansson koja je angažirala pravnog savjetnika i rekla da je OpenAI nakon toga "nevoljko pristao" povući Sky.

"U vremenu kada se svi borimo s deepfakeovima i zaštitom vlastitog lika, rada i identiteta, vjerujem da su to pitanja koja zaslužuju da se razjasne. Radujem se rješenju u obliku transparentnosti i donošenju odgovarajućeg zakonodavstva kako bi se osigurala zaštita individualnih prava", napisala je Johansson koja je rekla da je bila šokirana kad je čula kako zvuči Sky.

OpenAI tvrdi da sporni glas nije onaj koji je Johansson dala umjetnoj inteligenciji u filmu "Ona", nego drugoj profesionalnoj glumici koja koristi svoj prirodni glas. "Vjerujemo da glasovi umjetne inteligencije ne bi trebali namjerno oponašati karakterističan glas neke slavne osobe. Skyin glas nije imitacija Scarlett Johansson, već pripada drugoj profesionalnoj glumici koja koristi svoj prirodni glas. Kako bismo zaštitili njihovu privatnost, ne možemo dijeliti imena naših glasovnih talenata", objavila je tvrtka. I Altman je to ponovio tvrdeći da je Sky iznijela druga glumica.

VEZANI ČLANCI:

"Glas Skya nije glas Scarlett Johansson i nikada nije trebao sličiti njezinu", rekao je Altman i dodao da su iz poštovanja prema Johansson odgodili korištenje Skyjevog glasa u proizvodima tvrtke, odnosno za glasovni način rada ChatGPT-a. Ta funkcija glasovnog načina rada pokrenuta prošle godine omogućuje korisnicima interakciju s ChatGPT-om, a djeluje i alat za pretvaranje teksta u govor u jednoj od pet različitih glasovnih opcija.  U filmu “Ona” iz 2013. lik kojeg glumi Joaquin Phoenix zaljubi se u glasovnu asistenticu.

Kako je objavio CNN, bivši zaposlenik OpenAI-ja Jan Leike, koji je vodio tim usmjeren na dugoročnu sigurnost umjetne inteligencije, otišao je iz kompanije zajedno sa suosnivačem i glavnim znanstvenikom Ilyom Sutskeverom, izrazivši zabrinutost time što tvrtka ne posvećuje dovoljno resursa pripremi za moguću buduću "umjetnu opću inteligenciju" (AGI) koja bi mogla biti pametnija od ljudi.

Kako tvrtke odabiru glas za AI asistente?

OpenAI tvrdi da je surađivao s profesionalnim glumcima i od 400 varijanti odabrali pet. Glumci su plaćeni sve dok se njihovi glasovi koriste u proizvodima ChatGPT-a, istaknula je tvrtka. Jedan od najpoznatijih asistenata je Amazonova Alexa, kojoj je glas, prema pisanju brojnih medija dala Nina Rolle, pjevačica iz Colorada. Tvrdi to i pisac Brad Stone u svojoj knjizi i ističe da je Rolle odabrana nakon što je Amazon mjesecima procjenjivao različite kandidate, a konačni izbor potpisao je Jeff Bezos, osnivač tvrtke. Apple je lansirao Siri, kojoj je glas jedno vrijeme davala Susan Alice Bennett, bivša prateća pjevačica Roya Orbisona i Burta Bacharacha. No, najpoznatija je kao ženski američki glas Appleove osobne asistentice Siri, otkako je usluga predstavljena na iPhoneu 4S u listopadu 2011., pa do ažuriranja iOS 7 u rujnu 2013.

Fernando Cerezal, inženjer inovacija iz tehničkog laboratorija u BBVA Next Technologies, specijaliziranoj za softversko inženjerstvo, objasnio je kako se daju glasovi virtualnim asistentima koje naručuju kompanije za interakciju s korisnicima. Ističe da se prvo snimi glas osobe koja čita određeni tekst i snimka se dostavlja alatu umjetne inteligencije od kojeg se traži da oponaša snimljeni glas. Kroz tu vrstu "treninga" umjetna inteligencija uspijeva "razgovarati" baš kao i osoba, a na sličan način može naučiti čitati tekstove, čak i kada se oni razlikuju od onih korištenih za treniranje sustava.

Boju, intonaciju i intenzitet tih glasova virtualnih asistenata generira umjetna inteligencija koja pokušava oponašati osobu koja je prethodno izgovarala slične tekstove, tvrdi Cerezal. Amazon je rekao da su tisuće programera doprinijele da Alexa postane funkcionalna, od softverskih inženjera, sistemskih analitičara do lingvista i pisaca. Glasovi virtualnih asistenata evoluiraju, ali usput se, eto, događaju i neželjene epizode poput ove sa S. Johansson.

GALERIJA Pogledajte na što je nalik Trg nakon proslave. Po podu su hrpe boca i ostalog smeća
Joaquin Phoenix, Scarlett Johansson
1/11

Još nema komentara

Nema komentara. Prijavite se i budite prvi koji će dati svoje mišljenje.
Važna obavijest
Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na web portalu i mobilnim aplikacijama Vecernji.hr dopušteno je samo registriranim korisnicima. Svaki korisnik koji želi komentirati članke obvezan je prethodno se upoznati s Pravilima komentiranja na web portalu i mobilnim aplikacijama Vecernji.hr te sa zabranama propisanim stavkom 2. članka 94. Zakona.

Za komentiranje je potrebna prijava/registracija. Ako nemate korisnički račun, izaberite jedan od dva ponuđena načina i registrirajte se u par brzih koraka.

Želite prijaviti greške?

Još iz kategorije