Controllable Expressive Speech Synthesis

KU Leuven
2021
Tobias
Cornille
De afgelopen jaren hebben neurale netwerken realistische spraaksynthese mogelijk gemaakt. Toch is de gegenereerde spraak vaak niet expressief en niet makkelijk te bewerken. ConEx, het model dat ik ontwikkelde, laat gebruikers toe om spraak in een bepaalde stijl te genereren, en achteraf de prosodie aan te passen.
Meer lezen

Grafeem-naar-foneemconversie door middel van neurale netwerken

Universiteit Gent
2019
Robrecht
Meersman
G2P is een belangrijke module in text-to-speech en spraakherkenning. Het doel is om de uitspraak van een zin in fonetisch schrift te vinden, gegeven de geschreven tekst. De huidige implementatie gebruikt een ketting van linguïstische regels die manueel door taalexperts ingegeven moeten worden. Dankzij de opmars van recentste technologiën, kan de volledige G2P stap in zijn geheel vervangen worden door een artificieel neuraal netwerk. Hiermee wordt de implementatietijd drastisch ingekort, in cominatie met een hogere nauwkeurigheid.
Meer lezen