Google a anunțat lansarea Gemini 3.5 Live Translate, o nouă tehnologie de traducere vocală care transformă conversațiile în timp real, păstrând tonul, ritmul și intonația vorbitorului.
Spre deosebire de soluțiile clasice de traducere, care procesează mesajul după ce interlocutorul termină de vorbit, Gemini 3.5 Live Translate oferă traducerea în mod continuu, reducând întârzierile la doar câteva secunde și menținând cursivitatea dialogului.
Noua tehnologie poate detecta automat limba utilizată și este compatibilă cu peste 70 de limbi. În cadrul întâlnirilor online, aceasta permite comunicarea prin mai mult de 2.000 de combinații lingvistice diferite.
Potrivit Google, sistemul este conceput să funcționeze eficient și în medii zgomotoase, fiind destinat apelurilor telefonice, ședințelor, cursurilor online, transmisiunilor live și altor situații în care participanții vorbesc limbi diferite.
Gemini 3.5 Live Translate începe să fie integrat în mai multe servicii Google. În această lună, funcția intră în faza de testare pentru anumite companii care utilizează Google Meet, urmând să fie disponibilă treptat pentru un număr mai mare de utilizatori.
În paralel, utilizatorii aplicației Google Translate de pe Android și iPhone vor putea beneficia de traducerea vocală live folosind orice pereche de căști compatibile.
Pentru dispozitivele Android, Google introduce și un nou mod de utilizare: telefonul poate fi ținut la ureche ca într-un apel obișnuit, iar traducerea va fi redată direct prin difuzorul intern al aparatului.
Tehnologia este deja testată de compania Grab pentru comunicarea dintre șoferi și pasageri. Conform Google, prin platformă sunt realizate lunar peste 10 milioane de apeluri vocale, iar traducerea aproape instantanee ar putea elimina numeroase bariere lingvistice.
De asemenea, dezvoltatorii vor avea acces la model prin platformele dedicate inteligenței artificiale, pentru a crea aplicații de traducere vocală în timp real.
Pentru a limita riscurile de dezinformare și utilizare abuzivă, Google a anunțat că toate fișierele audio generate cu Gemini 3.5 Live Translate vor fi marcate cu SynthID, un filigran digital invizibil care permite identificarea conținutului creat sau modificat cu ajutorul inteligenței artificiale. Compania susține că această măsură va contribui la detectarea mai ușoară a materialelor generate de AI și la prevenirea utilizării frauduloase a vocilor sintetice.

