Profivox magyar beszédszintetizátor bemutatása hangdemonstrációkkal


A bemutatott szövegfelolvasó technológiát (szoftvereket) a Budapesti Műszaki és Gazdaságtudományi Egyetem,  Távközlési és Médiainformatikai Tanszékén (BME-TMIT) fejlesztették ki 1995-2003 között.
© BME-TTT 1995-2010 . 
Projektvezető és felvilágosítás: dr. Németh Géza docens, tel.: 06-1-463-38-83, nemeth@tmit.bme.hu

PROFIVOX-szövegfelolvasó technológia
Ez a szövegfelolvasási technológia egyrészről több évtizedes nyelvészeti-fonetikai kutatások eredménye, valamint professzionális műszaki teljesítmény. Ezt a szövegfelolvasási technológiát egyrészről a Prof. Dr. Gordos Géza (gordos@tmit.bme.hu) által 1968-ban a BME-n alapított és azóta is elvi iránymutatásával folyó célzott beszédkutatás teszi megalapozottá. A gép a beszélt nyelv változatos kifejezésformáit valósítja meg, ezzel közel olyan hangzást ad, mintha ember beszélne. A technológiát folyamatosan fejlesztjük. A rendszer nyelvészeti-fonetikai szakértője Prof. dr. Olaszy Gábor, (olaszy@tmit.bme.hu). A rendszer több elemből és modellből áll. A felhasználás témaköre, célközönsége határozza meg, hogy milyen modulok kellenek a gépi szövegfelolvasás magas szintű megvalósításához. Ez a technológia teljeskörű prozódiai modellekkel van ellátva (tud kérdezni és különböző beszédprofilokat is tud alkalmazni, mint például mese felolvasása, novella, hírek, cégadatok stb.). A jelen fájlokban  bemutatott szövegfelolvasó technológiát (szoftvereket)  a BME Távközlési és Médiainformatikai Tanszékén fejlesztették ki 1995-2010 között.

A bemutatott szövegfelolvasó szoftverek egyebek között a következő alkalmazásokban működnek:

  • telefonról elérhető e-levél felolvasó (T-Mobile Magyarország, Mailmondó, szolgáltatása 1999-től );
  • szépirodalmi internetes könyvfelolvasó (2001, http://vilaghallo.hu);
  • meghangosított internetes SMS szolgáltatás (2002) (Digitania Rt., pl. Origo Hangember);
  • mobiltelefonba épített SMS felolvasó (az SMSmondó a világon az első ilyen megoldás! 2003- tól) a T-Mobile Magyarország készülékeiben;
  • automatikus számszerinti tudakozó (T-Mobile Magyarország, 2004);
  • a Jaws for Windows (USA) képernyőolvasó magyar beszédmodulja vakok számára (2002- től ),
  • Volksbank Hungary beszélő bankjegykiadó automata (1146 Bp. Hungária krt. 140-144), amelyet látássérültek segítésére fejlesztettek ki 2004-ben;
  • Generáli Biztosító beszéddel vezérelt automatikus telefonközpontja (2004-től);
  • WINCOR_NIXDORF bankautomaták ellátása beszélő szoftverrel. (2006);
  • Paksi Atomerőmű beléptető rendszerének beszédmodulja (2006) ;
  • Gyógyszervonal, automatikus telefonos információs rendszer (Tel: 06-1-886-94-90). 2007-től nyilvános;
  • Vonatállomási, utastájékoztató automata (kísérleti rendszer 2007);
  • automatikus számszerinti tudakozó (Vodafone Magyarország 2008);
  • automatikus, mobiltelefonos, helyfüggő kereső szolgáltatás (T-Mobile, kísérleti rendszer, 2008)
  • automatikus árú és árlista felolvasó (T-Mobile, kísérleti rendszer, 2008)
  • NCR bankautomatákhoz beszédkimenet vakok segítésére (2010)

A magyar és más nyelvű szövegfelolvasó szoftvert adaptálni kell minden külön alkalmazáshoz, a felolvasási stílusok és egyéb esetleges behatároló követelmények különbözősége miatt. Csak így lehet elérni, hogy az alkalmazásban a beszédtechnológiai komponens optimális teljesítményt nyújtson.

 Projektvezető és felvilágosítás: dr. Németh Géza docens, tel.: 06-1-463-38-83, nemeth@tmit.bme.hu