Elame sümbolite maailmas: tähestikud, sõnad, tähendused, meemid, numbrid ... Käimasolev on ristitud digisajandiks ehk neljandaks tööstusrevolutsiooniks, mille keskmes on meie digivõimekus ja ka andmete kasutamise oskus. Pythagoras väitis juba 500 aastat e.m.a, et maailma saab mõtestada arvude kaudu. Tänapäeval öeldakse, et andmed on uus nafta. Heites pilgu uutele loodavatele töökohtadele, leiame ametid, mille sisu on läbi põimunud andmete kõikvõimaliku kasutamisega.
Näiteks andmeajakirjanik (data journalist), andmevisualiseerija (data visualizer), andmekaevur (data miner), andmekraapija (data scrapper), andmeanalüütik (data analyst), andmeteadlane (data scientist). Kuidas valmistada praegune põlvkond ette andmemaailmaga paremaks toimetulekuks? Ühiskond vajab andmekirjaoskusega (data literacy) inimesi, sest andmeanalüüs ja -süntees on organisatsioonides digitaliseerimise ja protsesside täiustamise otsustav osa.
Aju ei vaja andmeid, vaid lugusid
Andmekirjaoskus on interdistsiplinaarne ja seda ei tohiks segi ajada selliste konkreetsete distsipliinidega nagu matemaatika või statistika. Tõsi, andmekirjaoskusel on nendega seoseid, aga see sisaldab ka teisi valdkondi, nagu kunst, geomeetria, argumenteerimine, loovkirjutamine, süsteemne (kriitiline) mõtlemine ja otsustamine. Andmekirjaoskuse eesmärk pole mitte niivõrd pakkuda konkreetseid valemeid, vaid pigem anda oskus mõista maailma andmete kaudu, rikastades nõnda igapäevast suhtlemist ja aidates langetada otsuseid.
Analüüsi eesmärk on mõista, mis peitub andmete taga.
Meedia püüab küll lugusid rääkida, kuid tihti on need laetud emotsioonidega ega tugine faktidele. Tänapäeva maailmas ei saa me enam tegutseda teadmisega, et on olemas väike, suur ja statistiline vale. Niikaua, kuni me ei oska rääkida andmete keeles, võibki tunduda, et arvudega saab teha ükskõik mida. Maailm on täis andmeid, mida meil on vaja mõtestada ja kasutada.
Aju töötleb sümboleid aeglasemalt kui pilte. Statistikaameti üks suund on pakkuda teabe kiirema ja parema leidmise ning mõtestamise lahendusi. Seda tehakse juhtimislaudade abil, koondades ja visualiseerides statistika kindlal teemalehel. Pakume võimalust panna kokku just kasutajale huvipakkuvate statistiliste näitajate sobiv mosaiik. Visualiseeritud lugude rääkimise tõttu oleme Eestis sotsiaalmeedias jälgijate arvu kõige kiirema kasvuga asutus.
Andmekirjaoskus ei tohi jääda üksnes väljavalitutele ehk statistikutele ja teadlastele. Teadlased on aastasadu lähtunud loogikast, et millegi väitmiseks on vaja seda tõestada. Nii nagu paljudes valdkondades, on tänapäeval võimalik ise andmekirjaoskusest osa saada ja anda oma panus. Kui meil on vaja fotot, ei tähenda see, et peaksime alati fotograafi abi kasutama. Inglise keele rääkimiseks ei pea me olema inglise filoloogid.
Tänapäeva maailmas ei saa me enam tegutseda teadmisega, et on olemas väike, suur ja statistiline vale.
Sama kehtib andmete kohta: me saame andmeid mõtestada, olemata andmeteadlased. See ei tähenda, et arvude maailma ekspertidelt, statistikutelt ja andmeteadlastelt võetakse nende leib. Vastupidi – kui ühiskonnaliikmed suudavad esmatasandi andmeid mõista ja kaasa rääkida, on nende jaoks sisukamad ka valdkonnaekspertide analüüsid ning uuringud, mis ei jää siis üksnes failidesse või riiulitele tolmu koguma.
Andmekirjaoskuse viis sammast
Leidmisoskus. Kui vajame mõne valdkonna või nähtuse kohta andmeid, pöördume esmalt Google’i poole. Otsing aitab, kuid selle andmestikud on enamasti peidetud. Vähesed teavad, et kui otsingumootorisse lisada märksõna "filetype:csv", saame vastuseks viited teksti kujul andmestikule. Veel vähesemad teavad, kuidas andmed Wikipedia tabelist ühe käsuga lugeda Google’i dokumenti. Eesti andmete korral julgustan kõiki pöörduma statistikaameti andmebaaside ja rakenduste poole, kus on näitajad enam kui 2000 nähtuse kohta.
Lugemisoskus. Tähtis on aru saada, mida tähendab üks või teine mõiste ja millele tähelepanu pöörata, kui on esitatud mõni graafik või arv. Mida otsida pealkirjast, kuidas lugeda legendi ja hinnata graafiku arvskaalasid ning kust andmed pärinevad. Võime küll teada, et Eesti keskmine brutopalk on 1400 eurot, aga kas hoomame, kuidas on see jaotunud palgavahemike alusel? Mõiste "keskmine" on juba iseenesest eksitav, sest seda saab mõõta vähemalt kolme moodi. Mõningane andmekirjaoskus on meile sündides kaasa antud: uuringud tõestavad, et imikud oskavad enne kõnelemist arvutada. Kui keegi väidab, et tal seisab ees kohtumine kolme ja poole inimesega, taipame intuitiivselt, et see lause on väär.
Töötlemisoskus. Mõnikord on endal vaja andmeid töödelda. Olemas on tööriist – Excel. Aga see, kuidas oskame andmete õigsust kontrollida, neid puhastada või nähtavaks teha, on omaette küsimus. Aju töötleb andmeid oluliselt kiiremini piltidena, aga valdavalt kasutame ikkagi loendeid või rist-tabeleid. Statistikaamet esitabki juba arvestatava osa riiklikust statistikast visuaalselt (tamm.stat.ee, data.stat.ee).
Analüüsioskus. Vaja on aru saada, millised seaduspärasused andmetes peituvad. Sõna "analüüs" tähendab tervikpildi lahtimõtestamist osade kaupa. Sõna "aruanne" tähistabki selles kontekstis, et võiksime selgitusest õppida, saada juurde arukust ja läbi selle olla targemad. Kas aga kättesaadavad aruanded seda eesmärki ka täidavad?
Argumenteerimisoskus. Argumenteerimine hõlmab peale andmete ka subjektiivsust ehk seda, kuidas aju andmeid tõlgendab ja kuidas me otsuseid langetame. Seda iseloomustavad ka kriitiline või süsteemne mõtlemine ja analüüsi vastand ehk süntees. Andmete kasutamise oskus argumenteerimisel tähendab ka oskust teada, millal võib või ei või otsuste langetamisega oodata. Aju on kord nii ehitatud, et me ei mõtle andmetest otse, vaid narratiivide ehk lugude abil. Lugude loomise ehk otsustamise kellavärk aga erineb igaühel.
Andmete kasutamise oskus argumenteerimisel tähendab ka oskust teada, millal võib või ei või otsuste langetamisega oodata.
Näidates inimrühmale üht numbrit, tekib selle mõtestamisel väga erinevaid lugusid. Prooviks võite mõelda, kuidas otsustate, kas minna sööma uude restorani, kui hinnang sellele on sotsiaalmeedias viiepallisüsteemis neli. Kas teie kolleeg arvab sama?
Andmekirjaoskust on vaja õppida
Koolis õpime lugema, kirjutama ja arvutama. Andmekirjaoskus on kõigi nende oskustega läbi põimunud. Just nimelt oskustega, mitte faktide meeldejätmisega. Albert Einstein on öelnud, et haridus on see, mis jääb järele, kui kogu õpitu on ununenud. See mõte sobib hästi andmekirjaoskuse kohta, sest faktide meeldejätmist on selles vähe. Rõhk on argumenteerimisel ja kaalutud otsuste langetamisel.
Paradoksaalselt aga tuleb esmalt omandada küsimisoskus. Niisugune mõtteviis tundub olevat vastuolus sellega, et koolis on tähtis eksamil teada õiget vastust. Õppejõuna olen kogenud, et tudengid satuvad esmalt kimbatusse, kui ei alustata etteantud küsimusest. Arvan, et küsimisoskust peaks hakkama õpetama juba põhikoolis.
Tulemas
Koolitus: Ärianalüütika – andmetöötlus ja mõõdikud
Koolitaja: Andres Kukke
Lisainfo ja registreerimine: siin
Täiendaksin üha populaarsemat STEAM-õppemetoodikat (teadus, tehnoloogia, inseneeria, kunstid, matemaatika ehk science, technology, engineering, arts, mathematics) D-tähega (andmed ehk data) ehk saaksime STEADM-õppe. Töötavatel inimestel peaks elukestva õppe käigus olema võimalik asjaomane kursus läbida. Maailmas pakutakse andmekirjaoskuse õpet juba mõnda aega ja see on kindlasti tulnud, et jääda.
Kirjakeelega samale tasemele
Andmete lugemise oskus võiks 80% juhtudel olla igaühel ja 20% juhtudel võiksime toetuda spetsialistidele, kes kasutavad eriala täpsemaid tööriistu, nagu statistika ja masinõpe. Maailmas on üldine kirjaoskuse tase 90%. Võiksime seada eesmärgi saavutada andmekirjaoskuses sama tase. Kiidan tänapäevaste õppematerjalide koostajaid, sest näiteks matemaatika ühe haru, statistika õpetamisel kasutatakse väga praktilisi ja elulisi näiteid. Seda kinnitab ka tõsiasi, et Euroopa statistikavõistlusest võtab Eesti riiklikus voorus sel aastal osa peaaegu 150 tiimi.
Eesti saab olla andmekirjaoskuse arendamisel maailmas eeskujuks. Meil tõesti on, millele toetuda: PISA-testi põhjal on Eesti õpilased nii lugemise, matemaatika kui ka loodusteaduste tundmisel maalima tipus. Rahvusvaheliselt on meil selle võimekuse tutvustamisel ka üks suur eelis: andmete ehk arvude keel on universaalne, seda ei ole vaja tõlkida.
Miks on vaja andmekirjaoskust?
* Andmekirjaoskus on interdistsiplinaarne valdkond, mis on tulnud, et jääda.
* Maailm on täis andmeid, mida on vaja arvestada aruteludes ja otsustamisel.
* Inimestel on erinev otsustamisprotsess, mistõttu andmed on vaja tõlkida lugudeks.
* Andmeanalüüs on inspireeriv ehk juhib meie mõtteid.
* Andmekirjaoskus peab kuuluma kooli õppekavasse ja seda tuleb rakendada organisatsioonides, sest otsuseid ei langeta tehnoloogia, vaid ikkagi inimesed.