S piškotki izboljšujemo vašo uporabniško izkušnjo. Z uporabo naših storitev se strinjate z uporabo piškotkov. V redu Piškotki, ki jih uporabljamo Kaj so piškotki?
Domov » Sklopi » Dokumenti » D2.3.1: Specifikacija bogatenja nestrukturiranih podatkov

D2.3.1: Specifikacija bogatenja nestrukturiranih podatkov

Projekt in mejnik izročka: P2, M18

Povzetek

V okviru naloge T2.3, ki teče v P2 projektu kompetenčnega centra KC CLASS bomo izvedli tri različne naloge iz tematike bogatenja nestrukturiranih podatkov (1): naloga razvoja komponente za vizualizacijo podatkov; (2) razvoj rešitve za analizo specifičnih bolnišničnih podatkov, ki so na voljo iz projekta P7 ter (3) razvoj prediktivnih modelov za podatke maloprodajnega podjetja, ki sodeluje na projektu P4. Prva naloga je generičnega tipa, medtem ko sta ostali dve specializirani na konkretne primere, ki izhajajo iz potreb na projektih P4 in P7. Zasnova rešitev in predvidenih nalog oziroma funkcionalnosti so opisane v poglavjih 2 (prva naloga), poglavju 3(druga naloga) in poglavju 4 (tretja naloga). Zaključki in končne ugotovitve so zbrane v Zaključku.

Ker sta prva in druga naloga močno odvisni od vsebine podatkov smo v dokumentu temu psvetili posebno težo. Prva podatkovna zbirka so podatki iz skupin primerljivih primerov, ki se v zdravstvenem sistemu uporabljajo za spremljanje in financiranje akutnih bolnišničnih obravnav. Podatki so zaupne narave, a jih je za raziskovalne potrebe mogoče pridobiti v anonimizirani obliki. Druga podatkovna zbirka predstavlja podatke maloprodajnega podjetja, bo posegala na področje velikih podatkov in bo vključevala podatke o uporabnikih in nakupih  izdelkov in bo preko formiranja profilov uporabnikov ter izgradnje analitičnih modelov obogatila in nadgradila obstoječo podatkovno zbirko z ciljem boljšega ciljnega oglaševanja in uspešnejših prodajnih kampanj..

Podprojekt T2.3 združuje metode in pristope za bogatitev podatkov, ki imajo poseben poudaren na analitičnem delu. Zato so v dokumentu opisani različni pristopi in koncepti, ki združujejo uporabo na eni strani obstoječih analitičnih orodij in na drugi strani orodij, ki se bodo tokom te naloge razvila v skladu s planom. Opisana orodja omogočajo analitične obdelave podatkov na različnih nivojih: od najosnovnejših (OLAP tehnologije) do trenutno najbolj naprednih Data Mining pristopov.