A beszédadatbázis felépítése

Az adatbázis  mind a 10 beszélőre ugyanabban az adatformátumban tartalmazza a Hz adatokat a mondat minden beszédhangjára (hangonként 5 mérési ponton: 10%, 25%, 50%, 75%, 90%). Minden hangra, minden mérési ponton 3 db rezonancia frekvencia (rf1, rf2, rf3) adatot adunk meg. A Hz adatokat az 5 pontra tabulátorral tagolt szöveges állományba szerveztük, amelyre példa alább látható (a hangsor: júli.....).

  file label num time pos rf1 rf2 rf3
1 f_bm_1701 j 2 0.1067 10 263 2014 2566
2 f_bm_1701 j 2 0.1142 25 289 1998 2529
3 f_bm_1701 j 2 0.1266 50 332 1917 2492
4 f_bm_1701 j 2 0.1391 75 357 1831 2399
5 f_bm_1701 j 2 0.1466 90 366 1536 2323
6 f_bm_1701 u: 3 0.1642 10 360 1230 2241
7 f_bm_1701 u: 3 0.1831 25 328 938 2303
8 f_bm_1701 u: 3 0.2146 50 304 899 2362
9 f_bm_1701 u: 3 0.2461 75 327 1018 2404
10 f_bm_1701 u: 3 0.2650 90 361 1234 2371
11 f_bm_1701 l 4 0.2821 10 343 1425 2377
12 f_bm_1701 l 4 0.2888 25 300 1418 2368
13 f_bm_1701 l 4 0.3000 50 311 1475 2439
14 f_bm_1701 l 4 0.3112 75 301 1485 2498
15 f_bm_1701 l 4 0.3179 90 302 1479 2550
16 f_bm_1701 i 5 0.3292 10 396 1655 2548
17 f_bm_1701 i 5 0.3393 25 399 1774 2550
18 f_bm_1701 i 5 0.3562 50 388 1965 2541
19 f_bm_1701 i 5 0.3730 75 382 2107 2594
20 f_bm_1701 i 5 0.3832 90 383 2121 2617

Minden hangra 5 mérési sor vonatkozik a 10%, 25%, 50%, 75% és a 90%-os pontra vonatkoztatva.

RF adatok

Az adatbázis mindösszesen 11 693 100 db RF adatot tartalmaz. A magánhangzókra, valamint a v, j,l,m,n,ny hangokra valóságos, mért adatok szerepelnek, a többi hangra (b.p,d,t,g,k,gy,ty,h,f,z,sz,c,dz,zs,s,cs,dzs,r) csak közelítőek, olyanok amelyek jellemzőek a hang artikulációjából adódó rezonancia frekvenciákra. Ezek számítás alapján kerültek meghatározásra a hangkörnyezetükből.  Ez utóbbi hangokra azért választottuk ezt a megoldást, mert ezek a hangok vagy kis intenzitásúak, vagy zöngétlenek. A kis intenzitású zöngés hangokban gyakorlatilag nincsenek formánsok, a zöngétlen hangoknál pedig az adatok nem a hang spektrális tartalmát mutatják, hanem a hang artikulációs képzési helyére jellemző rezonancia adatokat, vagyis azt az adatot, amivel az őket követő zöngés hang indulni fog, illetve az őket megelőző hang befejeződik. Tehát az artikulációs folyamatosság adatsorát mutatják. A honlapon csak egyedi példákat mutatunk be.