Feldolgozási szintek:

  1. szöveg (.txt),
  2. fonetikus átirat hang szinten (.gph),
  3. hangnyomás-idő függvény (.wav),
  4. zöngés/zöngétlen határjelzések és zöngeszinkron jelek (.pit),
  5. hanghatárok (.TextGrid),
  6. szóhatárok (.ssw),
  7. F1, F2, F3 formáns frekvencia minden magánhangzóban 5 mérési ponton (txt) (külön adatbázisként megtekinthető ezen a honlapon),
  8. Hangsúly címkék a mondat minden szavára szöveges jelöléssel a kijelentő mondatokban (külön adatbázisként megtalálható ezen a honlapon).

A felsorolt 8 szolgáltatás adatai szoros szinkronban vannak egymással. Ez biztosítja azt, hogy akár kereszt vizsgálatok is végezhetők.

Felhasználás: az adatbázis precíziós feldolgozottsága biztos alapot nyújthat a jövő kutatóinak.

Hozzáférés: az adatbázis (vagy része) kutatáshoz előzetes egyeztetés után térítés mentesen hozzáférhető, egyéb célra a CESAR projekten keresztül megvásárolható. Kapcsolat: dr. Németh Géza; nemeth@tmit.bme.hu

A beszédadatbázis felépítése
Az adatbázis  mind a 12 beszélőre ugyanazt a könyvtár struktúrát követi, így ugyanazon mondat könnyen megtalálható egy másik beszélő hangjával is. A struktúra egy beszélőre a következő: 56 könyvtár, azon belül minden könyvtárban 36 mondat adatai találhatók sorszámozva (txt, wav, TextGridek a hangokkal és határaikkal, formánsértékek, szóhatárok stb.). Az ugyanazon mondathoz tartozó fájlok sorszámozási neve ugyanaz, csak a kiterjesztése változik. Egy ilyen 56 könyvtáros adathalmaz összességében 2 GB. Minden beszélőre egy-egy ilyen adathalmaz vonatkozik.

Szöveges rész
Az adatbázis közel 12x2000=24000 mondatot tartalmaz szépirodalmi művekből. Ezeket a mondatokat olvasták fel a beszélők (kontextus információjuk nem volt). Minden mondat txt formátumban szerepel.

Hangzó formák
Az adatbázis mondatait 6 női és 6 férfi beszélő olvasta fel professzionális hangstúdióban (44 kHz, 16 bit feldolgozási beállításokkal).