Az emberek jelentős része csak passzív ingerfelfogóknak gondolja az érzékszerveket. Ez azonban tévedés. A jelfeldolgozás az ingerület agyba jutása előtt, már az érzékszervekben megkezdődik. Ez igaz a fülre is, és ez az egyik oka például annak, hogy miért nem sikerült tökéletes hallókészüléket kifejleszteni a mai napig.
A különféle ingerek érzékelésének kutatása a biológia és a pszichológia egyik legizgalmasabb területe. A kutatók sokáig csak az agy jelfeldolgozó szerepére koncentráltak, és viszonylag kevés figyelmet fordítottak arra, hogy az agy és az érzékszervek egy közös összetett rendszert alkotnak, amelyben az agy mintegy hangolja, beállítja az érzékszerveket az azokból érkező jelek és az organizmus aktuális céljai alapján. Ennek megfelelően, az idegimpulzusok nemcsak az agy felé áramlanak, hanem onnan visszafelé is, fontos utasításokat adva az érzékszerveknek.
Másrészt, az érzékszervek nemcsak idegi jelekké alakítják a beérkező ingereket, hanem egyben megkezdik feldolgozásukat, jelentősen tömörítve a beérkező információkat. A szem hátsó részén elhelyezkedő fényfelfogó szerv, a retina, például olyan bonyolult felépítésű, hogy az agy meghosszabbításának, egyfajta miniatűr agynak is tekinthető. Ha nem történne meg itt a látási ingerek előszűrése, a lényeg kiemelése, akkor valamennyi inger agyba továbbításához karvastagságú látóideg kellene.
A hangingerek feldolgozása
A látási ingerekhez hasonlóan a hangingerek feldolgozása is elkezdődik már a fülben. A hallás kutatásával foglalkozik az MTA doktora, az MTA TTK Kognitív Idegtudományi és Pszichológiai Intézetében dolgozó Winkler István, aki nemrég elnyerte a Lendület program támogatását is.
Fülvizsgálat egy müncheni klinikán
A villamosmérnöki kar elvégzése után pályáját az MTA akkori Pszichológiai Intézetében kezdő Winkler István elmondta, hogy az észlelés elsődleges célja nem az, hogy az ember esztétikai értékítéletet alkosson a világról, hanem hogy a túlélést segítse. Az észlelés segítségével fel tudjuk mérni a veszélyforrásokat és el tudjunk menekülni a fenyegető veszély elől, illetve megszerezhessük a számunkra szükséges erőforrásokat. Mi tehát nem az érzékszervekbe jutó ingerekre, hanem a tárgyakra vagyunk kíváncsiak, amikről ezek az ingerek információt hoznak. Azonkívül nem elég számunkra, hogy információkat szerzünk a külvilágról, az észlelés, így a hallás feladata az, hogy segítségével megjósolhassuk a jövőt. Hiszen a túlélés szempontjából például nem az a fontos, hogy hol volt az autó, amikor meghallottuk a közeledését, hanem az, hogy hol lesz, amikor át akarunk kelni az úton.
A hallási érzékelés speciális problémája, hogy a hangok összekeveredve jutnak a fülünkbe - mondta Winkler. Amikor az emberek valamit vagy valakit hallgatnak, akkor triviálisnak érzik, hogy ezt meg tudják különböztetni a környezet többi hangjától. Ha megkérdezik, hogy miként tudják ezt megtenni, akkor például olyasmit szoktak mondani, hogy magasabb vagy mélyebb a hangja a beszélőnek. Ez azonban a hangok fizika természete alapján nem ilyen egyszerű.
A környezetünkben található szinte minden hangforrás olyan hangokat bocsát ki, amely majdnem minden frekvenciát tartalmaz a hallható tartományban - persze különböző arányokban - folytatta Winkler. Mielőtt ezek a hangok a fülünkbe jutnának, már összekeverednek, és hullámtermészetük miatt különféle interferenciákat hoznak létre.
Ezeket az interferenciamintázatokat nem lehet egyszerűen szétszedni; pontosabban nincs egyértelmű megoldás erre a problémára, matematikai értelemben. Elméletben a források végtelen számú konfigurációja létre tudná hozni ugyanazokat a fülünkbe jutó mintázatokat, miközben nekünk az adott helyzetre érvényes forrás-konfigurációt kell megtalálnunk. Az evolúció és az életünk során tanultak viszont ellátnak bennünket olyan ismeretekkel, amelyeket peremfeltételként felhasználva mindennapi körülmények között szinte mindig helyesen meg tudjuk határozni, mit is hallunk.
A belső fül szőrsejtjei, ezek alakítják át a rezgő levegőrészecskék mechanikai energiáját elektromos energiává, mely idegi impulzus formájában a hallóidegen keresztül az agyba jut
A hangforrások szétválasztása
A hallási észlelés jelenleg legnagyobb hatású elméletében Albert Bergman az egyszerre aktív hangforrások szétválasztásának lehetséges elveit vázolta fel. Eszerint a beérkező, több forrás által keltett hullámok egyvelegét tartalmazó akusztikus jeleket párhuzamosan, nagyszámú algoritmus szerint dolgozzuk fel. Ezek az algoritmusok az evolúció során bevált szabályszerűségek alapján készítik el a beérkező jelből a források egy-egy lehetséges szétválasztását. Ilyen elvek például, hogy a hasonló hangokat általában azonos forrás kelti (hasonlóság), hogy egy-egy forrás nem változtatja meg nagyon hirtelen az általa kibocsátott jelek alaptulajdonságait (jó folytatás), vagy hogy az azonos forrásból származó jel a különböző frekvenciákon egyszerre hangosodik vagy halkul (közös sors). Magukat az elveket az észlelés Gestalt iskolájának kutatói már a múlt század első harmadában leírták, de információ-feldolgozás szemléletű felhasználásuk, érthető okokból, a század végéig váratott magára.
Ép hallású ember számára nem jelent gondot a lépészaj kiszűrése
Amennyiben ezeken a feltételezéseken alapuló algoritmusok nagy többsége azonos vagy hasonló forrásokat állapít meg, akkor ez az elrendezés jelenik meg az észlelésben. Ilyen esetben az észlelés magasabb feldolgozási szintű információkkal, például akaratlagosan, nem befolyásolható. Tehát nem tudunk egy egyértelmű hangelrendezést többféleképpen hallani. Ha azonban több alternatíva kap nagyjából azonos mértékű támogatást a kiértékelő algoritmusoktól, akkor az észlelés billeghet a lehetséges alternatívák között, illetve akaratlagosan befolyásolható. Kétértelmű vizuális ingerelrendezésekkel - amilyen például a kacsa-nyúl illúzió - már mindenki találkozott. A hallásnál is előfordul ilyen illúzió. Például, ha szaggatott hangjeleket fehérzajjal kötünk össze, akkor folyamatos dallamot hallunk. Ez az úgynevezett folytonossági illúzió.
Hallgassa meg a folytonossági illúziót!
Mivel a kiértékelő algoritmusok jelentős része az egyes források jelének közvetlen előzményei alapján jelöli ki, hogy az éppen beérkező hangjel mely részét kelthette az adott forrás (illetve hogy a jel mely része nem magyarázható a már ismert források működésével), az agyban az akusztikus szabályosságokat forrásonként kell ábrázolnunk és tárolnunk.
Algoritmusok beszédhangok szétválasztására
Winkler elmondta, hogy egyik kutatási témája jelenleg hangforrások - azon belül is az emberi beszédhangok - szétválasztására alkalmas algoritmusok és modellek kidolgozása. Egyelőre lehetetlen lenne olyan modellt alkotni, ami tetszőleges hangforrásokat képes azonosítani. Kihasználva az emberi beszéd speciális tulajdonságait egy olyan modell megalkotására törekszenek, amely hasznos lehet mindennapi körülmények között. A beszédértést szimuláló tökéletes prediktív modell megalkotása természetesen lehetetlen a jelenlegi tudásunk mellett, hiszen ez már feltételezné a mesterséges intelligencia létét, de bizonyos korlátozott, de már használható algoritmusok megalkotása - például a hangszín alapján - most is lehetséges.
Ha ilyen algoritmusokat sikerülne beépíteni egy hallókészülékbe egy interfésszel, amely például visszajelezne a hallókészüléknek, hogy a kire néz a készülék viselője (ezt mondjuk egy szemüvegbe lehetne beépíteni), akkor a hallókészülék képes lenne egyszerűbb prediktív modellek felépítésére, ami jelentősen javítana a használhatóságán. Így ki tudná választani, mely hangokat erősítse fel a sok közül. A jelenlegi hallókészülékek buták ilyen értelemben, mert minden hangot felerősítenek, ami sokszor zavaróbb a hallgatónak, mint ha egyáltalán nem viselne hallókészüléket.
Ennek oka, hogy a fül nem egyszerű hangerősítő, hanem - mint korábban említettük - hangfeldolgozó egység is. A fülbe több szabályozó rost megy az agyból, mint fordított irányba. Az agy tehát nem passzívan várja az ingereket, hanem aktívan szabályozza az érzékszervek működését. Az igazán fejlett hallókészülék tehát az volna, ha ezeket az idegrostokat be tudnánk kötni az eszközbe, és így tudnánk megvalósítani ennek szabályozását - mondta Winkler. Ez azonban jelenleg még a tudományos-fantasztikus regények kategóriájába tartozik.
Másrészt, az érzékszervek nemcsak idegi jelekké alakítják a beérkező ingereket, hanem egyben megkezdik feldolgozásukat, jelentősen tömörítve a beérkező információkat. A szem hátsó részén elhelyezkedő fényfelfogó szerv, a retina, például olyan bonyolult felépítésű, hogy az agy meghosszabbításának, egyfajta miniatűr agynak is tekinthető. Ha nem történne meg itt a látási ingerek előszűrése, a lényeg kiemelése, akkor valamennyi inger agyba továbbításához karvastagságú látóideg kellene.
A hangingerek feldolgozása
A látási ingerekhez hasonlóan a hangingerek feldolgozása is elkezdődik már a fülben. A hallás kutatásával foglalkozik az MTA doktora, az MTA TTK Kognitív Idegtudományi és Pszichológiai Intézetében dolgozó Winkler István, aki nemrég elnyerte a Lendület program támogatását is.
Fülvizsgálat egy müncheni klinikán
A villamosmérnöki kar elvégzése után pályáját az MTA akkori Pszichológiai Intézetében kezdő Winkler István elmondta, hogy az észlelés elsődleges célja nem az, hogy az ember esztétikai értékítéletet alkosson a világról, hanem hogy a túlélést segítse. Az észlelés segítségével fel tudjuk mérni a veszélyforrásokat és el tudjunk menekülni a fenyegető veszély elől, illetve megszerezhessük a számunkra szükséges erőforrásokat. Mi tehát nem az érzékszervekbe jutó ingerekre, hanem a tárgyakra vagyunk kíváncsiak, amikről ezek az ingerek információt hoznak. Azonkívül nem elég számunkra, hogy információkat szerzünk a külvilágról, az észlelés, így a hallás feladata az, hogy segítségével megjósolhassuk a jövőt. Hiszen a túlélés szempontjából például nem az a fontos, hogy hol volt az autó, amikor meghallottuk a közeledését, hanem az, hogy hol lesz, amikor át akarunk kelni az úton.
A hallási érzékelés speciális problémája, hogy a hangok összekeveredve jutnak a fülünkbe - mondta Winkler. Amikor az emberek valamit vagy valakit hallgatnak, akkor triviálisnak érzik, hogy ezt meg tudják különböztetni a környezet többi hangjától. Ha megkérdezik, hogy miként tudják ezt megtenni, akkor például olyasmit szoktak mondani, hogy magasabb vagy mélyebb a hangja a beszélőnek. Ez azonban a hangok fizika természete alapján nem ilyen egyszerű.
A környezetünkben található szinte minden hangforrás olyan hangokat bocsát ki, amely majdnem minden frekvenciát tartalmaz a hallható tartományban - persze különböző arányokban - folytatta Winkler. Mielőtt ezek a hangok a fülünkbe jutnának, már összekeverednek, és hullámtermészetük miatt különféle interferenciákat hoznak létre.
Ezeket az interferenciamintázatokat nem lehet egyszerűen szétszedni; pontosabban nincs egyértelmű megoldás erre a problémára, matematikai értelemben. Elméletben a források végtelen számú konfigurációja létre tudná hozni ugyanazokat a fülünkbe jutó mintázatokat, miközben nekünk az adott helyzetre érvényes forrás-konfigurációt kell megtalálnunk. Az evolúció és az életünk során tanultak viszont ellátnak bennünket olyan ismeretekkel, amelyeket peremfeltételként felhasználva mindennapi körülmények között szinte mindig helyesen meg tudjuk határozni, mit is hallunk.
A belső fül szőrsejtjei, ezek alakítják át a rezgő levegőrészecskék mechanikai energiáját elektromos energiává, mely idegi impulzus formájában a hallóidegen keresztül az agyba jut
A hangforrások szétválasztása
A hallási észlelés jelenleg legnagyobb hatású elméletében Albert Bergman az egyszerre aktív hangforrások szétválasztásának lehetséges elveit vázolta fel. Eszerint a beérkező, több forrás által keltett hullámok egyvelegét tartalmazó akusztikus jeleket párhuzamosan, nagyszámú algoritmus szerint dolgozzuk fel. Ezek az algoritmusok az evolúció során bevált szabályszerűségek alapján készítik el a beérkező jelből a források egy-egy lehetséges szétválasztását. Ilyen elvek például, hogy a hasonló hangokat általában azonos forrás kelti (hasonlóság), hogy egy-egy forrás nem változtatja meg nagyon hirtelen az általa kibocsátott jelek alaptulajdonságait (jó folytatás), vagy hogy az azonos forrásból származó jel a különböző frekvenciákon egyszerre hangosodik vagy halkul (közös sors). Magukat az elveket az észlelés Gestalt iskolájának kutatói már a múlt század első harmadában leírták, de információ-feldolgozás szemléletű felhasználásuk, érthető okokból, a század végéig váratott magára.
Ép hallású ember számára nem jelent gondot a lépészaj kiszűrése
Amennyiben ezeken a feltételezéseken alapuló algoritmusok nagy többsége azonos vagy hasonló forrásokat állapít meg, akkor ez az elrendezés jelenik meg az észlelésben. Ilyen esetben az észlelés magasabb feldolgozási szintű információkkal, például akaratlagosan, nem befolyásolható. Tehát nem tudunk egy egyértelmű hangelrendezést többféleképpen hallani. Ha azonban több alternatíva kap nagyjából azonos mértékű támogatást a kiértékelő algoritmusoktól, akkor az észlelés billeghet a lehetséges alternatívák között, illetve akaratlagosan befolyásolható. Kétértelmű vizuális ingerelrendezésekkel - amilyen például a kacsa-nyúl illúzió - már mindenki találkozott. A hallásnál is előfordul ilyen illúzió. Például, ha szaggatott hangjeleket fehérzajjal kötünk össze, akkor folyamatos dallamot hallunk. Ez az úgynevezett folytonossági illúzió.
Hallgassa meg a folytonossági illúziót!
Mivel a kiértékelő algoritmusok jelentős része az egyes források jelének közvetlen előzményei alapján jelöli ki, hogy az éppen beérkező hangjel mely részét kelthette az adott forrás (illetve hogy a jel mely része nem magyarázható a már ismert források működésével), az agyban az akusztikus szabályosságokat forrásonként kell ábrázolnunk és tárolnunk.
Algoritmusok beszédhangok szétválasztására
Winkler elmondta, hogy egyik kutatási témája jelenleg hangforrások - azon belül is az emberi beszédhangok - szétválasztására alkalmas algoritmusok és modellek kidolgozása. Egyelőre lehetetlen lenne olyan modellt alkotni, ami tetszőleges hangforrásokat képes azonosítani. Kihasználva az emberi beszéd speciális tulajdonságait egy olyan modell megalkotására törekszenek, amely hasznos lehet mindennapi körülmények között. A beszédértést szimuláló tökéletes prediktív modell megalkotása természetesen lehetetlen a jelenlegi tudásunk mellett, hiszen ez már feltételezné a mesterséges intelligencia létét, de bizonyos korlátozott, de már használható algoritmusok megalkotása - például a hangszín alapján - most is lehetséges.
Ha ilyen algoritmusokat sikerülne beépíteni egy hallókészülékbe egy interfésszel, amely például visszajelezne a hallókészüléknek, hogy a kire néz a készülék viselője (ezt mondjuk egy szemüvegbe lehetne beépíteni), akkor a hallókészülék képes lenne egyszerűbb prediktív modellek felépítésére, ami jelentősen javítana a használhatóságán. Így ki tudná választani, mely hangokat erősítse fel a sok közül. A jelenlegi hallókészülékek buták ilyen értelemben, mert minden hangot felerősítenek, ami sokszor zavaróbb a hallgatónak, mint ha egyáltalán nem viselne hallókészüléket.
Ennek oka, hogy a fül nem egyszerű hangerősítő, hanem - mint korábban említettük - hangfeldolgozó egység is. A fülbe több szabályozó rost megy az agyból, mint fordított irányba. Az agy tehát nem passzívan várja az ingereket, hanem aktívan szabályozza az érzékszervek működését. Az igazán fejlett hallókészülék tehát az volna, ha ezeket az idegrostokat be tudnánk kötni az eszközbe, és így tudnánk megvalósítani ennek szabályozását - mondta Winkler. Ez azonban jelenleg még a tudományos-fantasztikus regények kategóriájába tartozik.
0 Megjegyzések