Sztuczna inteligencja została nauczona, aby naśladować ludzki głos

Sztuczna inteligencja została nauczona, aby naśladować ludzki głos

Naukowcy z Chin ogłosili technologię Deep Voice, która działa w oparciu o uczenie maszynowe i przy pomocy krótkich próbek może oszukać system rozpoznawania głosu. Szkoliła się w oparciu o nagranie dźwiękowe trwające ponad 800 godzin i obejmujące około 2400 różnych głosów. Jak powiedzieli deweloperzy, do skutecznego działania sieci neuronowej potrzeba około pięćdziesięciu pięciu sekund sygnałów dźwiękowych

Głębokie brzmienie jest w stanie symulować barwę, intonację głosu i odróżniać je od rzeczywistych. Według twórców, może być używany jako asystenci cyfrowi, nagrywanie głosu w grach wideo, muzyka i tłumaczenie symultaniczne. Ponadto może służyć tym, którzy stracili okazję do mówienia. Naukowcy zauważyli również, że Głos Głosu może zmienić głos, czyniąc go mężczyzną zamiast kobietą lub dodając obcy akcent.

"To prawdziwy przełom z technicznego punktu widzenia", powiedział jeden z autorów opracowywania Leo Zu. "Udało nam się rozwiązać najbardziej złożony problem generatywny, a mianowicie, że udało nam się zsyntetyzować mowę żywą ze wszystkimi jej cechami."

To nie jest pierwsza innowacja w tym kierunku – kanadyjscy programiści wcześniej przedstawili usługę głosową o nazwie Lyrebird. Kompresuje wszystkie indywidualne cechy mowy na bardzo krótki zapis, odtwarzając 1000 zdań w zaledwie pół sekundy. Jest również zdolny do kopiowania dźwięków domowych – na przykład, prowadzenie piły łańcuchowej lub śpiewanie określonego rodzaju ptaka, może przedstawiać gniewny, pogodny lub sympatyczny ton. Kanadyjski rozwój, a także Deep Voice, jest wykorzystywany do działania asystentów głosowych, dźwięku produktów multimedialnych i syntezy mowy osób niepełnosprawnych.

Jednak deweloperzy kanadyjscy i chińscy zauważają, że technologia ma wspólny problem: oszuści mogą z niej korzystać, Wprowadzać w błąd ludzi lub wykorzystywać możliwości programów działających w oparciu o rozpoznawanie mowy. Prawnicy zauważają również, że w związku z tym obawiają się, że nagrania audio wkrótce staną się mniej znaczącymi dowodami w sądach.

Powiązane wiadomości