NoSQL alternatívák "big data" feladatok megoldásához - Adattárház Fórum 2012

    Előadó: 
    Sidló Csaba

    Big Data feladatoknál a fő problémát az adat mérete maga jelenti. Az előadásban két ilyen feladatot ismertetünk, ahol osztott architektúrákkal, jól skálázódó NoSQL eszközökkel és gondosan tervezett algoritmusokkal sikerült jól működő alkalmazásokhoz jutni. Átnézzük egyrészt nagyméretű ügyfél-adattörzsek különböző osztott feldolgozási paradigmák szerinti adattisztításának, duplikátummentesítésének tapasztalatait, másrészt pedig egy webes archívum építésének és jól skálázódó spam-mentesítésének tanulságait.

    Típus: 
    külsős
    Időpont: 
    kedd, 2012, június 12 - 16:30
    Tavaszi félév

    Nyelvek