Adatrosta

    kedd, 2005, február 1

    2003.-2005. között, a magyar kormány pénzügyi támogatásával, nagyléptékű szerver log-ok használat-elemző eszközei fejlesztése céljából készült.

    A projekt kulcseredménye, hogy létrejött az Adatbányászati Pipeline, egy saját adatfolyamkezelő keretrendszer.

    Tevékenység

    A digitális gazdaság nagy ígérete, hogy az ügyfeleket jellemző fogyasztói magatartásokról információk gazdag tárháza áll rendelkezésre, amely alapjául szolgál a korábbi lehetőségekhez képest jóval alaposabb, pontosabb és hatékonyabb tervezésnek, ill. fejlesztésnek. A weben megjelenő cégek és szervezetek számára az ügyfélismeret lehetőségét az üzemeltetés során keletkező forgalmi naplóállományok elemzése adja meg.

    Az Internet szolgáltatók látogatottsági statisztikáiban például napszaki, heti, vagy évszakos sajátságokat fedezhetünk fel, illetve észlelhetjük a szokatlan eseményeket, a hirtelen forgalombővülést vagy -kiesést. Ennél azonban az elemzés jóval tovább is léphet: a személyiségi jogok védelmét, az anonimitását biztosító azonosítók használatával megismerhető az egyes felhasználó, számára így személyre szabott szolgáltatás biztosítható. Nem kell tehát fölösleges információdzsungelen áthaladnia, egy portál vagy e-kereskedő egyéni érdeklődési köre szerint automatikusan hozhat létre számára weboldalakat.

    A projekt számára a legnagyobb kihívást az jelentette, hogy egy országos méretet elérő Internet szolgáltatónál akkora napi elemzendő adatmennyiség keletkezik, amelyet a meglevő elemző szoftverek már képtelenek feldolgozni. Az elemzést olyan eljárásokra kell alapozni, amelyek az adatbázis mindössze egy-kétszeri végigolvasásával igen összetett kérdésekre tudnak válaszolni. Ezen módszereket a milliárdos adatmennyiségekre szakosodott adatbányászat fejlődő tudományága biztosítja.

    Résztvevők

    ELTE, BME, MTA SZTAKI, T-Online (Axelero), econet.hu

    Típus: 
    Kutatási projekt
    Ipari projekt
    Állapot: 
    Befejezett