Mida suuremaks ja keerukamaks kasvab ettevõte, seda rohkem koguneb ka erinevatest allikatest andmeid. Masskoguja mentaliteediga ei tasu igat andmekildu alles hoida – ühelt poolt võib nõnda põrkuda regulatsioonide vastu, teisalt muudab liigne hulk prügiandmeid pea võimatuks päriselt asjalike andmepõhiste otsuste langetamise.
Prügiandmed raskendavad andmepõhiste otsuste tegemist
Tänapäeval võib andmeid tekitada iga väikseimgi liigutus – keegi ostab e-poest midagi ning kohe on kuskil kirjas, millal, kuidas, mis seadmega, mis asukohast ja mis keelde seatud operatsioonisüsteemiga ost sooritati. Kui tegemist on veelgi keerukama teenuse või tootega, jookseb ilmselt kuskile sisse ka info seadme enda omapärade kohta ning võimalik, et kuskile pannakse ka kirja, mis oli X tegevuse ajal selle telefoni piirkonna õhutemperatuur.
Mingi maani on need andmed ka vajalikud, et oma pakutut parandada või mõista, milliste probleemide otsa kliendid koperdavad. Ühel hetkel tuleb endalt aga küsida, kas andmeid hoitakse alles reaalse eesmärgi pärast – milleks võib olla ka eeldatav vajadus nähtavas tulevikus – või takistab ebavajalikust andmekogumisest loobumist hirm ilma jääda ning suutmatus eristada olulist mitteolulisest.
Kust jookseb piir?
Viimastel aastatel on küll olukord paremaks muutunud, kuna regulatsioonid on pannud päitsed pähe liigtühjale andmekorjele ning ettevõtted peavad kasutaja nõusolekul alles hoidma vaid andmeid, mida päriselt vaja läheb. Kuid ka siin ei ole tegu täielikult mustvalge olukorraga.
Ka pealtnäha kasulike andmete seas on meeletus koguses träni, mis ei loo tegelikult ärilisest vaatepunktist mingit reaalset väärtust.
Ka pealtnäha kasulike andmete seas on meeletus koguses träni, mis ei loo tegelikult ärilisest vaatepunktist mingit reaalset väärtust. Kuigi keegi võib endale sisendada, et tulevikus turule toodava teenus jaoks on vaja kõvakettatäit andmeid klientide kasutatud seadmetest või temperatuurist, siis reaalsuses on nende andmekildude praktiline väärtus väike. Mitte alati, aga enamasti.
Mittekasulike andmete otsas istumine hakkab aga ühel hetkel probleeme tekitama. Kuigi võib tunduda, et mida rohkem andmeid, seda paremad otsused, siis see vaade on petlik. Head otsused saavad sündida heade andmete pealt ning mida rohkem peidab end päriselt kasulikke andmepunktide vahel sisutut müra, seda keerulisemaks ja ajakulukamaks muutub oluliste trendide ja suundumuste tuvastamine.
Ära ei saa ka unustada, et andmetel on oma hind. Paar Exceli tabelit ostuajalugudega on üks asi, aga kui erinevad süsteemid sülitavad iga päev välja meeletus koguses erinevaid numbreid, protsente ja logisid, muutub ühel hetkel nende pilves või oma serveriruumis hoidmine väga selgelt mõõdetavaks kuluks. Eriti kalliks muutuvad asjad siis, kui sihitu andmekrahmamine hakkab põrkuma vastu seaduste piire, seda nii potentsiaalse mainekahju kui ka otseste trahvide näol.
Andmetesse tuleks suhtuda kui kvaliteetveini – mõõdukalt on hea, nauditav ja kasulik, liiale minek rikub aga elamuse ja ajab pea valutama.
See tähendab, et andmetesse tuleks suhtuda kui kvaliteetveini – mõõdukalt on hea, nauditav ja kasulik, liiale minek rikub aga elamuse ja ajab pea valutama. Täpselt parajas koguses andmeid on see, mis aitab ettevõtetel tuvastada trende ja teha kasulikke otsuseid, üle võlli minnes pannakse end aga olukorda, kus andmerahnudest on end võimatu läbi uuristada ning vead ja valejäreldused on kiired tekkima.
Kuskilt jookseb mõistlikkuse piir ning iga organisatsioon peab selle enda jaoks ise ära tundma. On oluline mõista, mis andmeid läheb vaja täna, kas kuu aja pärast võib vaja minna ajaloolist infot ning mille näol on tegu millegagi, millele enam reaalsuses kunagi uuesti peale ei vaadata. Tühja digiprügi ei tasu tekitada ning huupi servereid logide, ostuajalugude ning kasutusinfodega täita ei tasu. Andmed on ettevõtete jaoks üks nende kõige olulisemaid varaklasse, kuid kui nendega ei osata nutikalt ümber käita, võiks need samahästi olemata olla.