24. oktoober 2018

Tähelepanu! Artikkel on enam kui 5 aastat vana ning kuulub väljaande digitaalsesse arhiivi. Väljaanne ei uuenda ega kaasajasta arhiveeritud sisu, mistõttu võib olla vajalik kaasaegsete allikatega tutvumine.

Algoritmidest on saanud otsekui matemaatilised massihävitusrelvad

Foto: pixabay.com

Enamikul meist, kui me pole just kindlustusmatemaatikud või kvantitatiivsed analüütikud Wall Streeti firmades, on ainult ebamäärane arusaam algoritmidest ja sellest, kuidas nad töötavad. Samal ajal mõjutavad algoritmid meie igapäevaelu juba märkimisväärselt. Algoritmid on juhised, mille järgi arvutid probleeme lahendavad. Suurandmetel põhinevad varjatud algoritmid võivad teile anda hea muusikasoovituse, tööpakkumise või viia kokku elu armastusega.

Need matemaatilised mudelid peaksid olema neutraalsed. Aga nad ei ole, kinnitab Wall Streetil viis aastat kvantitatiivse analüütikuna töötanud matemaatikadoktor Cathy O’Neil, kes kirjutas sellest raamatu „Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy” ja peab blogi aadressil mathbabe.org. O'Neil ütleb, et algoritmide levik on nagu viitsütikuga pomm, mille taga on head kavatsused, aga mis võimendab kahjulikke stereotüüpe eriti vaeste ja vähemuste kohta.

Algoritmid ei ole raamatu ainufookus. Ta kirjutab laiemalt matemaatilistest mudelitest meie maailmas – miks mõned on kasulikud, aga mõned toovad õnnetust.

Asi on selles, et iga mudel peidab endas mingit pinnaalust loogikat. Iga mudeli ehitamine algab intuitsiooni põhjal tehtud järeldustest meid ümbritseva maailma kohta. Selle kaudu pääsevad mudelitesse meie eelarvamused ja valetõlgendused. Intuitsiooni kasutamine ei ole mudelite loomisel halb, vastupidi, aga ainult siis, kui on olemas mehhanism, mille abil mudelit testida ja parandada.

Kvaliteetse mudeli eeldused

O'Neil toob oma raamatus näiteks moodsa pesapallimeetrika, millest kirjutas raamatus „Moneyball” ka Michael Lewis ja jutustas selle raamatu põhjal tehtud film. Ameerika spordihuvilised armastavad selle plusside-miinuste üle endiselt vaielda, aga igatahes on see mängijate hindamise viis saanud pesapallis kindla koha ja levinud ka teistele spordialadele.

Moneyball'i mudel töötab, sest ta vastab kolmele olulisele tingimusele. Esiteks, see mudel on küllaltki läbipaistev: igal põhiliste matemaatikaoskustega inimesel on võimalik hoomata, kuidas see mudel töötab. Teiseks, mudeli eesmärk ehk saavutada rohkem võite on selge ja hõlpsasti mõõdetav. Kolmandaks: sellel on isekorrigeeruv tagasisidemehhanism.

Seal, kus mudelid ebaõnnestuvad, on need kolm tingimust tihti puudulikult täidetud. Arvutused on läbipaistmatud; mudeli eesmärgiks on seatud mingi tulemus, mida eriti ei saa kvantifitseerida, ja tagasiside ei avalda mudelile korrigeerivat mõju, vaid aitab hoopis tugevdada vigaseid eeldusi.

Pärast seda, kui O’Neil sai Harvardist doktorikraadi matemaatikas, töötas ta veidi aega õppejõuna, aga suundus siis tööle riskifondi D. E. Shaw. Alguses talle see töö meeldis ja ta pidas riskifonde „moraalselt neutraalseteks” või halvimal juhul finantssüsteemi raipesööjateks. Riskifondid ei loonud uusi turgusid nagu kurikuulsaks saanud hüpoteeklaenudega tagatud võlakirjade turg, nad ainult mängisid neil turgudel. Aga sedamööda, kuidas hüpoteeklaenude kriis süvenes, muutus ettevõtte sisekliima närviliseks. Tekkis mure, et toimumas on midagi pretsedenditut – midagi, mida nende matemaatilised mudelid ei arvesta. O’Neil mõistis, et matemaatika on probleemi juur.

Hüpoteekvõlakirjade riski hindamise algoritmidest oli saanud kõigest suitsukate, mis maskeeris nende väärtpaberite tõelist riskitaset. Need mudelid olid läbipaistmatud ja neil puudus toimiv tagasisidemehhanism. Mis veelgi hullem, riskihinnangute tõepärasust kontrollisid reitinguagentuurid, kes elasid teenustasudest, mida maksid neid võlakirju müüvad finantsasutused.

Riskifondi analüütiku töös pettunud O’Neil suundus 2009. aastal tööle RiskMetrics Groupi, mis tegeleb pankade ja teiste finantsasutuste riskianalüüsiga. Uues kohas tajus ta, et temasuguseid inimesi, kes hoiatavad riskide eest, peetakse finantsasutustes tüütusteks, kes segavad kasumi teenimist.

Seepärast liikus ta juba paari aasta pärast tööle uude kohta – andmeteadlaseks idufirmas Intent Media, mis analüüsis veebiliiklust ja ehitas algoritme, mis aitaksid ettevõtetel e-kaubandusest maksimaalset tulu saada. Siin märkas O’Neil algoritmide kasutamisel ehmatavaid sarnasusi finantsasutustega.

Puudusid tagasisidemehhanismid

Mõlemas maailmas, mis kasutasid keerulisi matemaatilisi mudeleid, puudusid tõeliselt isekorrigeerivad tagasisidemehhanismid. Tagasiside tuli ainult turult – kui mudel suurendas kasumit, peeti mudelit õigeks, sest miks muidu ta kasumit suurendab. Wall Streetil oli samasugune loogika viinud 2008. aastal katastroofiliste tagajärgedeni. O’Neil lahkus idufirmast, et pühenduda matemaatika väärkasutamise teemale.

Ärivälistest halbadest algoritmidest rääkides toob O’Neil muuhulgas näiteks USAs 2002. aastal kehtestatud seaduse No Child Left Behind Act, mis nägi ette standarditud testide laiaulatusliku kasutamise.

Mudeli ehitamine algab intuitsiooni põhjal tehtud järeldustest maailma kohta. Selle kaudu pääsevad mudelitesse eelarvamused ja valetõlgendused.

See tekitas nõudluse analüütiliste süsteemide järele, millega testidest kogutud andmete põhjal mingeid järeldusi teha. Sageli on nende testide tulemusi püütud kasutada selleks, et tuvastada õpetajad, kes ei õpeta hästi. O’Neili hinnangul on see andnud halbu tulemusi, sest tuvastamismeetodid ei ole tegelikult teadusliku täpsusega, toovad ohvriks häid õpetajaid ja stimuleerivad käitumist, mis ei paranda haridust.

Halvad mudelid

Näiteks 2009. aastal Washingtonis juurutatud süsteem Impact püüdis keeruka algoritmi abil määratleda, millise osa õpilaste tulemuse paranemisest või halvenemisest võib kanda konkreetse õpetaja arvele. Kõige halvema tulemuse saanud õpetajad lasti lahti – isegi siis, kui lapsevanemad ja koolidirektor neid kiitsid. Samalaadset algoritmi katsetati New Yorgis ja O’Neil kirjutab kogenud õpetajast, kelle efektiivsuse hindas algoritm ühel aastal kuuele pallile sajast, aga järgmisel 96 pallile. Rohkem kui veerandil õpetajatel täheldati järjestikustel aastatel üle 40punktilist erinevust.

O’Neil märgib, et sellised hindamismudelid on läbipaistmatud, meelevaldsed, ebaõiglased ja kaebuste vastu kurdid. Sellised firmad nagu Google saavad oma algoritmide puhul tugineda väga suurele valimile ja pidevale statistilisele tagasisidele, mis võimaldab identifitseerida vead ja mudelit parandada, aga õpetajate hindamise süsteemid põhinevad mõnekümne õpilase kord aastas tehtavatel eksamitel.

Tagasiside tuli ainult turult – kui mudel suurendas kasumit, peeti mudelit õigeks, sest miks muidu ta kasumit suurendab. Wall Streetil oli samasugune loogika viinud 2008. aastal katastroofiliste tagajärgedeni.

Pealegi ei saa need süsteemid tagasisidet veast, kui õpetaja valesti vallandati, läks teise kooli ja näitas seal suurepäraseid tulemusi.

Õpetajad ei ole kaugeltki ainus inimvara, millest sääraste süsteemidega võimalikult palju püütakse välja pigistada. „Tööjõu juhtimisest” on saanud suur äri – sealhulgas arvutiprogrammidest, mis lubavad lõpetada „mõistatamise” ja parimate töötajate leidmise lihtsaks teha. Deloitte'i hinnangul kasutab selliseid programme 60–70% USA firmadest, kaks korda rohkem kui viie aasta eest. Need programmid loovad illusiooni teaduslikust täpsusest personalivalikul, kuid tegelikult on väga suurte puudustega.

Uued krediidiriski mudelid

O’Neil kritiseerib teravalt ka moodsaid krediidikõlblikkuse hindamise algoritme, mis kasutavad suurandmeid. Vanal mudelil, 1980ndate lõpus kasutusele võetud FICO-skooril on omad vead, aga suuremas osas on ta ikkagi näide heast matemaatilisest mudelist. Ta on küllaltki läbipaistev, reguleeritud ja toimiva tagasisidemehhanismiga. Kui halbade laenude määr ei vasta sellele, mida FICO ennustab, saavad reitinguagentuurid mudelit kohendada.

O’Neili sõnul on uued, pseudoteaduslikud hindamismeetodid metsikult vohama hakanud. „Meie kohta käivaid andmeid pannakse kokku igasugusel mõeldaval viisil – postiindeksid, internetis surfamise kombed, ostud jne. Aga erinevalt FICO-skoorist on need krediidihinded suvalised, seletamatud ja tihti ebaõiglased, ütleb O’Neil.

Google saab oma algoritmide puhul tugineda suurele valimile ja pidevale statistilisele tagasisidele, mis võimaldab identifitseerida vead ja mudelit parandada.

Seepärast soovitab ta alustada „matemaatiliste massihävitusrelvade” desarmeerimist, mille esimene samm oleks algoritmide auditeerimine – nende matemaatiliste mudelite mustade kastide avamine (tihti on need mudelid registreeritud intellektuaalomandina).

O’Neil rõhutab, et me peame mõistma, et matemaatilised mudelid, mis on tunginud kõikjale meie ellu, ei koosne mitte lihtsalt andmetest, vaid ka valikutest selle kohta, mis andmetele tähelepanu pöörata. Need valikud ei puuduta ainult logistikat, kasumit ja efektiivsust, vaid tähendavad ka moraalialaseid valikuid.

Artikkel on ilmunud veebiajakirjas Knowledge@Wharton ja Finantsjuhtimise Infolehes.

O’Neil rõhutab, et matemaatilised mudelid ei koosne mitte lihtsalt andmetest, vaid ka valikutest selle kohta, millistele andmetele tähelepanu pöörata.

Autor: Villu Zirnask, Finantsjuhtimise Infoleht

Hetkel kuum

Kas nad teavad, mida kasumi maksustamine täpselt tähendab? Eriti silmiavav lugemine alla 50-aastatele

Professor: levinud korruptsiooniindeksid valetavad, minu indeks paljastab rikaste riikide tegeliku korruptsioonitaseme

Merit Tarkvara finantsjuht: raamatupidajad kardavad tülitada ettevõtte juhte automatiseerimissoovidega

Eksperdid me tulumaksusüsteemist: see on riigipoolne tähtajatu ja tagatiseta intressivaba laen kasumit teenivatele ettevõtetele

Tööjõuvajaduse baromeeter: finantsjuhte on parajalt, lihtraamatupidajaid üle

Liitu Finantsuudiste uudiskirjaga!

Loe lisaks

Visualiseerimine aitab avastada tootmises vajalikke seoseid

E-müügiarved loovad ettevõttest nutikama kuvandi

Paavo Siimann: efektiivsuse hindamiseks tasub kasutada efektiivsusmaatriksit