Beszedfelismeres algoritmus

Andras Tantos andras_tantos at yahoo.com
Fri Jul 9 02:08:31 CEST 2004


Hali!

>>van nálam egy diplomamunka, az a címe, hogy beszélőfelismerés. nem
>>tudom, hogy hogy lehetne belőle információt kivenni, ugyanis a baj
>>az, hogy titkosított. talán az irodalom jegyzék, vagy a fejezet
>>címek? nem tudom, hogy mi lenne segítség, ugyanakkor még megthető
>>is. csak nem scannelhetem be az egészet...
>
>Hmmm... :) Ez izgalmasan hangzik, illetve biztató, hogy foglalkoznak
>vele itthon is. A készítője gondolom, üzletet akar csinálni belőle.
>Nagyon meg tudom érteni. Nem akarom én sem elvenni más munkáját, az nem
>volna tisztességes.

Tudtommal a diploma munka publikacionak szamit, es, mint ilyen, publikus.
Tarolni kell az adott egyetem irattaraban, es keres eseten kiadni. Ha
valamibol penzt akarsz csinalni, szabadalmaztasd, vagy tartsd titokban. De
persze lehet, hogy amiota en diplomaztam valtozott a jog otthon...

>Ha az eredeti levélben megadott paraméterek, vagyis
>kötött szótár+háttérzaj esetére van benne valami használható, akkor
>néhány mondatban esetleg a címszavakról mondhatnál valamit. Idézni se
>kell, elég a lényeg tömören, hogy Ő hogyan képzelte ezt. Így szerintem
>még korrekt, hiszen nagy titkokat sem árulsz el, csak statisztikai
>jellegű adatokat. Ha valaki megcsinálta és OK, akkor talán arrafele
>lehetne kezdeni evickélni.
>A zaj, a változó hangerő rettenet megnehezíti sajnos. Vsz. alapvetően
>változni fog a megoldás elve is miatta.

A beszelo felismeres es a beszedfelismeres alapvetoen mas problema. Az elso
esetben pont azokat a jellemzoket akarod kiemelni, amiket a masikban el
akarsz nyomni, es forditva. Ugyan a hasznalt jelfeldolgozasi modszerek
kozott van hasnlosag, de nem hiszem, hogy kulonosebben sokra mennel ezzel...

>AZ LPC-s felismerés elég vad nekem elsőre, ezt próbálom ippeg
>hámozgatni.

Nem is mondtam, hogy egyszeru :-).

>A Microsoft MSDN-ben is kaptunk egy SPEECH-feliratú CD-t, de
>gondolom, ez csak beszédgenerálás lesz, az kevésbé érdekes számomra. Az
>már -bár kötött szótárral-, nekem megvan, szuperál is szépen, s
>tetszőleges platformra tudom adaptálni. (Nem kell oprendszertől, PC-től
>függeni) De a fejlesztésemhez kellene nagyon a biztonságos felismerés...

Az MS-nek van (egesz jo, sot allitolag vilagszinvonalu) speech-to-text, azaz
kotetlen szotaras beszedfelismero rendszere. Az office-szal szoktak adni,
csak fel kell telepiteni, es mukodik is (angolul). En tettem vele kb. egy
eve egy probat, de nagyon gyaszos lett az eredmeny. Jo, nekem akcentusom is
van. Amit lattam:
- Nem beszelofuggetlen, azaz be kell tanitani
- Nagyon erzekeny a zajokra.
- Nagyon kifinomult nyelvi adatbazist hasznal: nem csak szavakat, hanem
szo-sorokat, mondatokat probal felismerni. Azaz a felismeres soran annak a
pontossagat, hogy melyik hangsor melyik szora, vagy szavakra illik ra, a
szovegkornyezet nyelvtani(!) elemzesevel probalja javitani. Ebbol az lesz
(nagyon jopofa, csak tok hasznalhatatlan), hogy a bemondott szovegbol egy
tobbe-kevesbe ertelmetlen al-angol mondat lesz, ami nyelvtanilag helyes. Es
termeszetesen semmi koze a bemondott szoveghez.

Erdemes meg szetnezni a http://research.microsoft.com/-on is. Tobb
beszedfelismeressel foglalkozo project is fut itt, talan talalsz hasznalhato
informaciot. Pl. van beszelofelismeres is.

Egyebkent nem nagyon ertem, miert nem talasz irodalmat. Az internet szazaval
kell, hogy tartalmazzon ezzel foglalkozo cikkeket, irasokat. Csak egy-ket
link, amit 3 perc alatt talaltam:
http://cm.bell-labs.com/cm/ms/departments/sia/dxsun/speech/
http://murray.newcastle.edu.au/users/staff/speech/home_pages/tutorial_sr.html
http://ieeexplore.ieee.org/iel1/53/1964/00054527.pdf?isNumber=1964&prod=JNL&arnumber=54527&arSt=26&ared=41&arAuthor=Picone%2C+J.
http://www.melnikoff.plus.com/fpt%202002.pdf
http://ieeexplore.ieee.org/xpl/tocresult.jsp?isNumber=1964&puNumber=53
http://ieeexplore.ieee.org/search/basicsearch.jsp - Csak ez az egy kereso
6684 cikket talalt (az IEEE anyagai kozott) ami a beszed-felismeressel
kapcsolatos.

--
Udv,
Tantos Andras
<http://andrast.tantos.homedns.org>




More information about the Elektro mailing list