Mesterséges Intelligencia Kutatólaboratórium

 
 
 

Társadalmunk számára már nincs visszalépés: az életünk minden területét átszövik az infokommunikációs technológiák. Szenzorok sokaságával felszerelt mobil eszközök felhasználók százmillióit kötik össze és adatok Petabyte-jait termelik naponta. A fizikai és digitális világ közötti választóvonal áttöréséhez azonban radikálisan új, skálázható algoritmikus technikák és az egyének és a társadalom működésének ismerete szükséges.

Az ízlésünket jó ismerő ajánló rendszerek, a Google gépi fordítás, önvezető autók, a világ legjobb Go játékosait legyőző számítógépek hátterében nem a gép „intelligenciáját”, hanem ügyes algoritmusokat, nagy számítási kapacitást, és a gépet „tanító” óriási adatmennyiséget találunk. Az áttöréseket a nagy adatmennyiségek feldolgozásával, elsősorban az algoritmuselmélet eredményeire alapozva érték el. A gépi tanulási eljárások mögött statisztika, valószínűségszámítás, és lineáris modellezés található.

A mesterséges intelligencia alapjainak kutatása során egyik célunk olyan újszerű hatékony algoritmusok tervezése, amelyek vizsgálata nem lehetséges a bonyolultségelmélet hagyományos keretei között, ezen belül kutatjuk az algebrai, aritmetikai számításokat, kvantum algoritmusokat, kombinatorikus problémák előfeldolgozását (kernelizáció), gráfalgoritmusokat, kombinatorikus optimalizálási és korlátkielégítési problémákat, az adatbázisok elméletét.

A mesterséges intelligencia alkalmazásai között kiemelten foglalkozunk a gépi látás, az autonóm közlekedés, az ipari szenzorhálózatok, hiba-előrejelzés, kommunikációs hálózatok, ajánló rendszerek vizsgálatával.

A természetes nyelvfeldolgozás minden területével foglalkozunk a kezdeti felismeréstől (automatikus beszédfelismerés, optikai karakterfelismerés) a késői szintézist igénylő feladatokig, különös hangsúlyt fektetve a közbeeső fázisokra, amelyek megértést is igényelnek (szemantikai modellezés). Folytatjuk a magyarországi nyílt és szabad nyelvtechnológiai szoftverek létrehozásának hagyományát, amelyet a Hun* programcsalád tagjai testesítenek meg, mint a HunMorph morfológiai elemző, a HunNER névelem felismerő, a HunPars szintaktikai elemző, a HunAlign mondat-összepárosító, és talán a legjobban ismert HunSpell helyesírás-ellenőrző könyvtár, amely ma már elterjedten használt az Open Office-ban, a Firefoxban és a Thunderbirdben.


A laboratórium célja, hogy zárt láncban teljes humán és hagyományos innovációs folyamatot valósítson meg a képzéstől (ELTE, BME), doktori munka vezetésétől a publikációs tevékenységen keresztül az eredmények ipari hasznosításáig. Talán országosan is egyedülálló a matematikusi és mérnöki munka együttélése: a kutatás alapvetően kísérleti jellegű, a módszerek létjogosultságát az igazolja, ha valós adatokon és alkalmazásokban hasznosítható eredményt, információt, új tudást hoznak létre. Ugyanakkor az adatok extrém mérete miatt minden lehetséges eljárás mély algoritmuselméleti és valószínűségszámítási ismereteken, matematikailag bizonyítható alapokon kell, hogy álljon.

Legfontosabb kutatási területeink

  • Mesterséges Intelligencia, gépi tanulás, adattudomány, big data
  • Számítástudomány, algoritmusok elmélete és bonyolultsága
  • Természetes nyelvfeldolgozás, gépi megértés, tudásalapú ember-gép interakció, keresőtechnológiák

 

Kiemelkedő eredményeink

A laboratórium tagja az MTA Elnöke által adományozott Lendület csoportvezető és a Mesterséges Intelligencia Nemzeti Kiválósági Programot a SZTAKI-ban vezető Benczúr András, az ERC Consolidator Grant nyertes Marx Dániel és és a Szemantikai alapú nyelvtechnológia projektet elnyerő Kornai András. A labor K+F legfontosabb eredményei:

  • A mesterséges intelligencia alkalmazásai öregedés-kutatásban, fehérjetranszlokáció jelenségének vizsgálatában, hálózatok dinamikájának előrejelzésében és modellezésében, gyártási folyamatok elemzésében.
  • Természetes nyelv feldolgozó eszközök a Hun* programcsaládban, demók (párbeszédeket folytató, utasításokat végrehajtó SHRDLU 2.0 rendszer; MÁV-pénztáros és ELVIRA)
  • Ajánlórendszereket kutató közösség elismert tagjaként versenyek szervezése és oktatás a téma legfontosabb rendezvényén (ACM RecSys).

 

Termékeink/szolgáltatásaink

  • Hun* programcsalád: HunMorph morfológiai elemző, HunNER névelem felismerő, HunPars szintaktikai elemző, HunAlign mondat-összepárosító, HunSpell helyesírás-ellenőrző. http://hlt.sztaki.hu
  • Big Data eszközrendszer és hatékony algoritmusok szaktanácsadás, Ericsson, OTP Bank
  • Apache Flink machine learning library, https://github.com/FlinkML/flink-parameter-server
  • Alpenglow ajánló keretrendszer, https://github.com/rpalovics/Alpenglow
  • Keresőrendszer, Magyar Telekom csoport belső hálózat (2004-), portálok (2008-), AEGON
  • Ügyfélismeret, csalás, nemfizetés, lemorzsolódás előrejelzés, OTP Bank, Magyar Telekom, AEGON
  • Webszerver és IT napló elemző rendszer, T-Online, AEGON

 

Laborismertető
Bemutatkozó videó

Vezető

Ph.D.
kutatólabor vezető