Vedetele din epoca de aur a Hollywood-ului renasc prin acordurile de clonare a vocii cu inteligență artificială ale celebrităților, ceea ce sugerează că unele Preocupări privind „Vestul Sălbatic”. Noile modele de afaceri rezolvă problema imitației neautorizate de AI.
ElevenLabs, o startup de tehnologie audio susținută de firme de capital de risc, inclusiv Andreessen Horowitz și Sequoia Capital, a încheiat mai multe acorduri cu patrimoniul legendarului actor pentru a oferi sunet iconic Instrumentul permite utilizatorilor să le citească voci generate de AI prin intermediul aplicațiilor de cărți audio. Printre vedete se numără Burt Reynolds, Judy Garland, James Dean și Sir Laurence Olivier.
Lansat în 2023, ElevenLabs creează știri pentru cărți și articole de știri, personaje de jocuri video, pre-producție de film, precum și pentru rețelele sociale și publicitate. Compania lucrează deja cu editori precum The New York Times și The Washington Post, iar la începutul acestui an a fost selectată de Disney să se alăture programului său de accelerare.
„Aveți nevoie de aproximativ 30 de minute de sunet de înaltă calitate pentru a crea o clonă de voce profesională”, a spus Sam Sklar, membru al echipei de dezvoltare ElevenLabs. Vocile sunt generate din cataloagele celebrităților. Odată creat, acesta poate fi apelat pentru a citi text (articole, PDF-uri, ePub, buletine informative sau alt conținut text). Cu toate acestea, vorbirea și conținutul nu pot fi exportate, toată ascultarea se află în aplicația de citire.
De exemplu, un utilizator poate citi un articol de James Dean povestit în aplicație, dar utilizatorul nu poate accesa vocea a ceea ce nu este deja în aplicație.
Astfel de oferte ar putea ajuta la stabilirea limitelor unui viitor în care conținutul de vorbire generat de AI devine mai puțin controversat și mai mult un tărâm controlat și îngrijit. Google Play și Apple Books Sunete generat folosind inteligența artificială Într-o oarecare măsură acest lucru s-a realizat, deși rămân obstacole semnificative în reconstruirea ritmului, intonației și emoției vocii umane.
Industria inteligenței artificiale a fost încântată de îngrijorări cu privire la utilizarea vocilor celebrităților, după ce actrița Scarlett Johansson a acuzat compania că ia vocea ei după ce ea a respins oferta de permis.
„Suntem foarte conștienți de riscurile asociate cu mediile sintetice și luăm foarte în serios utilizarea în siguranță a instrumentelor noastre”, a spus Sklar. Măsurile de siguranță includ revizuirea proactivă a conținutului, impunerea răspunderii prin ordonanțe și reguli speciale pentru a proteja impactul conținutului AI oferă o voce pentru alegerile din 2024.
Există încă multă anxietate în rândul generației actuale de actori cu privire la utilizarea inteligenței artificiale pentru a genera conținut vocal. actor de voce jocuri video a exprimat îngrijorarea că anul trecut grevă de film și televiziune Anxietatea cu privire la utilizarea inteligenței artificiale are rădăcini adânci. Folosirea sunetului caracteristic al proprietăților de vânzare este o nișă de piață care poate evită aceste capcane și reprezintă un nou flux de venituri din inteligența artificială, mai degrabă decât unul care se pierde din cauza inteligenței artificiale.
Utilizarea vocilor celebrităților care sună similar este o problemă care a existat înainte de apariția inteligenței artificiale, cum ar fi acest caz din 1988. Frito Lay folosind Tom Waits seamănă foarte mult în publicitatea lor și Un alt caz Waits în 2007după ce Waits însuși a respins de mult ofertele de publicitate. Inteligența artificială oferă o modalitate mai ușoară de a crea sunete, proces intentat recent împotriva startup-ului AI Lovo Pretinsa utilizare necorespunzătoare și gratuită Prezența actorilor vocali care produc voci AI este un memento că lumea generării vorbirii AI poate fi încă una complexă și controversată într-o oarecare măsură. (Lovo neagă acuzațiile din proces și indică modelul său de împărțire a veniturilor pentru a oferi actorilor voci clonate.)
Steve Cohen, partener la Pollock & Cohen, a spus că ar fi dificil să evaluăm protecțiile locale fără a revizui limbajul specific al contractului IconicVoices. litigii Acuzat de clonarea sunetelor fără permisiune.
ElevenLabs subliniază modul în care instrumentul său IconicVoices obține permisiuni și gestionează utilizarea sunetului.
„Permiterea folosirii vocii cuiva este unul dintre principiile fundamentale”, a spus Cohen. „Cred că elementele cheie sunt permisiunea, compensarea și controlul”.
Cohen a spus că noi legi mai clare ar putea, de asemenea, să împiedice oamenii care încearcă să-și folosească vocea în mod necorespunzător, „nu pentru băieții răi, ci pentru cazuri extreme”. Dar el a citat-o pe Bette Davis în „All About Eve”, spunând: „„Încărcați-vă; va fi o călătorie accidentată”.
Cât de realiste vor fi sunetele clonate este, de asemenea, o întrebare în evoluție. Mulți experți spun că calitatea performanței este limitată, deoarece inteligența artificială nu „știe” despre ce vorbește. Sklar a spus că cele mai recente niveluri de calitate a vocii ale ElevenLabs nu se pot distinge de vorbirea umană reală. „Instrumentul text-to-speech al ElevenLabs înțelege contextul cuvintelor individuale”, a spus el.
Inteligența artificială este la fel de bună ca modelul care o antrenează, iar datele vocale ale actorului sunt integrate ca parte a acestui proces.
„Puterea modelelor neuronale vine din imitarea/memorizarea nuanțelor și tiparelor prezente în materialul de instruire”, a spus Nauman Dawalatabad, un post-doctorat la Laboratorul de Informatică și Inteligență Artificială al MIT, care a efectuat cercetări ample privind generarea de vorbire a inteligenței artificiale. „Calitatea și diversitatea datelor de antrenament afectează semnificativ performanța modelului.”
Vocile vedetelor de film pot îmbunătăți imitarea și învățarea AI, oferind „un set de date de vorbire de înaltă calitate pentru antrenament și reglare fină a modelelor mari”, despre care Dhavaratabad a spus că este esențial pentru proces. Dar are rezerve cu privire la „să sună ca un om” ca test corect în domeniul vorbirii inteligenței artificiale, deoarece poate exacerba relația antagonistă dintre vocile umane și cele sintetice.
Actorii vocali rămân împărțiți în privința tehnologiei, unii refuzând să ia în considerare orice înțelegere, dar alții spunând că oportunitatea de a-și clona vocile pentru a face o formă de carte audio mai rapidă și mai ieftină nu poate fi ignorată. Michele Cobb, director executiv al Audio Publishers Association, a declarat: „Tehnologia inteligenței artificiale poate ajuta la fluxul de lucru, nu este un instrument nou pentru talentul de voce off, producători și editori. Mulți oameni o folosesc pentru a îmbunătăți controlul calității în post-producție.
Davaratabad spune că modelele generative recente au arătat îmbunătățiri uriașe în comparație cu iterațiile anterioare, ceea ce face din ce în ce mai dificilă distingerea falsetului de sunetele reale numai după ureche. El a adăugat că licențele vocale AI ar putea ușura volumul de muncă al actorilor vocali, dar nu i-ar înlocui, deoarece aceștia „mediază concentrându-se pe corectarea sau îmbunătățirea aspectelor inefabile precum intonația, căldura și accentul, care există încă provocări.