Technologia Tekst na mowę w spontanicznym stylu, opracowanym przez Laboratorium AI Xiaomi w Chinach jest to jedna z ostatnich granic, jeśli chodzi o rozpoznawanie głosu i korzystanie z urządzeń za pośrednictwem głosu. Projekt, który Rodzi wewnątrz laboratorium przyjmuje nazwę „Własny mój głos”. Pozwala odbiorcom, którzy niestety cierpią z powodu zaburzenia mowy mieć unikalne i spersonalizowane głosy do komunikowania się z innymi ludźmi. Zobaczmy szczegółowo, co to jest i od kiedy chińska firma nad tym pracuje.
Xiaomi zaprezentowało najnowszą aplikację zaawansowanych algorytmów i opracowanej przez siebie technologii mowy, która pomaga osobom z zaburzeniami mowy
Xiaomi troszczy się o ludzi i dąży do zaspokojenia ich różnych potrzeb poprzez innowacje technologiczne. W ciągu ostatnich kilku lat chińska marka odkryła pragnienie wielu użytkowników z zaburzeniami językowymi posiadać własny głos, nawet unikalny, do wykorzystania w codziennej komunikacji. Z tego powodu Xiaomi utworzyło zespół projektowy ”Własny mój głos”. Zhu Xi, koordynator Komitetu Technologicznego ds. Tech for Good Xiaomi, powiedział:
Jesteśmy podekscytowani odkrywaniem wielu wartości, które oferują nam innowacje technologiczne, takich jak odpowiadanie na prośby użytkowników o tożsamość osobistą i budowanie tożsamości
Aby wygenerować najbardziej odpowiedni i spersonalizowany głos dla użytkownika z zaburzeniami mowy, zespół projektowy Xiaomi ma zrekrutował ponad 200 wolontariuszy wewnątrz, aby oddać swój głos. Algorytm dopasowywania odbitek głosowych został wykorzystany do dopasowania cech głosów przekazanych przez wolontariuszy do cech głosu odbiorcy. Dzięki takiemu podejściu było znalazł najbardziej odpowiedni głos jako dźwięk referencyjny podstawowy głos dla odbiorcy.
Zobacz także: Mi Band 7 wychodzi z dużą ilością daty i ceny | Zdjęcie
Później naukowcy wykorzystali technologię spontanicznej syntezy mowy do: trenuj model sztucznej inteligencji. W ten sposób do nowego głosu można stopniowo dodawać naturalny rytm i intonację szczerze wyrażaj emocje i ton człowieka.
Zhu Xi dodał:
Jeżeli na wczesnym etapie zauważymy i zaadresujemy potrzeby grup mniejszościowych, proces rozpowszechniania technologii może zostać znacznie skrócony. Dzięki temu korzyści płynące z nowych technologii stają się natychmiast dostępne dla użytkowników o specjalnych potrzebach
Kręgosłupem tego projektu jest grupa eksperci w dziedzinie technologii głosowych autorstwa Xiaomi AI Lab 2017 opublikowali 37 artykułów na ten temat i byli obecni w ważnych kręgach, takich jakMiędzynarodowa konferencja nt. akustyki, mowy i przetwarzania sygnałów (ICASSP). Sukces „Własny mój głos„Głównie zależy od spontanicznego stylu opracowanej przez nich technologii przetwarzania tekstu na mowę. Spontaniczny styl technologii Text-To-Speech zasadniczo sprawia, że zsyntetyzowany głos wygląda jak prawdziwy człowiek w jego intonacji, pauzie, szybkości i innych cechach. Zastępuje to monotonne, nienaturalne odczucie elektronicznego głosu bardziej naturalnym.