Gyakori elemhalmazok tömör reprezentaciója

    Előadó: 
    Göbölös-Szabó Julianna

    A gyakori elemhalmazok kinyerésekor sokszor szembesülünk azzal a problémával, hogy a felhasznaló számára feldolgozhatatlan mennyisegű elemhalmazt kapunk válaszként. Célunk, hogy ezeket tömörítve könnyen áttekinthető halmazgyűjteményt kapjunk, ami ugyanakkor megőrzi az eredeti válasz jellemzőit is. Erre a feladatra nézunk három különböző modellt:
    1, Pusztán kombinatorikus megközelítéssel átfedő klasztereket képezhetünk a gyakori termékhalmazokból.
    2, Naiv valószínűségi modellt alkalmazva fix számú klaszterre oszthatjuk a gyakori elemhalmazok terét.
    3, A termékek együttes eloszlását próbáljuk modellezni olyan eloszlással, ami a gyakori temékhalmazok támogatottságának visszaadása mellett maximalizálja az entrópiát. Belátjuk, hogy ez a modell egy Gibbs-eloszlásra vezet, ami ekvivalens egy Markov Random Field-del. Megvizsgáljuk, milyen módszerekkel számíthatóak hatékonyan az eloszlást jellemző paraméterek.

    Típus: 
    adatbányászat szeminárium
    Időpont: 
    csütörtök, 2011, április 7 - 10:15
    Tavaszi félév

    Nyelvek