Biometrikus beszélőazonosító rendszerek performanciája összehasonlításának elmélete és gyakorlataés gyakorlata
Absztrakt :
A biometrikus (automatikus) beszélőazonosítás széleskörűen alkalmazott mind a hazai, mind a nemzetközi kriminalisztikai gyakorlatban. A módszertan nagy sebességgel, kiválóan automatizálható adatfeldolgozási lehetőségekkel rendelkezik, pontos és valid eredményeket szolgáltat. A biometrikus azonosító rendszerek az összevetett hangfelvételeken beszélők azonosságának valószínűségét adják meg. Egy rendszer performanciájának meghatározásához azonosítási mátrixot kell előállítani, amely a valószínűségi értékeket tartalmazza. Tanulmányomban ismertetem a mátrixok előállításának folyamatát és szempontjait, az adatstruktúra felépítését. 136 beszélő személy hangmintáját használtam fel, amelyeket különböző időpontokban és eszközökkel rögzítettem. Az Oxford Wave Research Ltd. Vocalise és Phonexia biometrikus azonosító rendszerekkel létrehoztam a mátrixokat, illetve a match és non-match adatokat, amelyeket a Bio-Metrics performanciamérő szoftverrel értékeltem ki. Az eredmények értékelése megmutatta, hogy a teljesítőképesség meghatározásához több típusú kimenetet is fel kell használni, nem elegendő a leggyakrabban publikált Egyenlő Hibaarány (EER) közlése. A közel 40 ezer vizsgált valószínűségi érték elemzése alapján a megadott rendszerek megbízhatóan, megfelelő diszkriminatív erővel képesek azonosítani az egyező, és megkülönböztetni az eltérő személyeket.
The biometric (automatic) speaker recognition method has been widely used in both domestic
and international forensic practice. The methodology has high-speed, excellently automated
data processing capabilities and it provides accurate and valid results. Biometric speaker
recognition systems give the probability of the identity of those speaking on the compared
audio recordings. To determine the performance of a system, an identification matrix should
be generated, which contains the probability scores. In my study I describe the process
and aspects of the production of matrixes and the data structure. I used audio samples of
136
speakers recorded at various times and with various devices. I created the matrix and the
match and non-match scores using the Vocalise biometric identification system of Oxford
Wave Research Ltd. and the Phonexia software. I evaluated the results with the Bio-Metrics
performance measurement software. The evaluation of the results shows that to determine the performance, several types of output should be used; it is not sufficient to report the most
frequently published Equal Error Rate (EER). Based on the analysis of the approximately forty
thousand probability results examined, the given system is able to identify the same speakers
reliably and with adequate discriminative power and differentiate among different speakers.