We use cookies and other tracking technologies to improve your browsing experience on our site, show personalized content and targeted ads, analyze site traffic, and understand where our audience is coming from. To find out more or to opt-out, please read our privacy policy.

Store spørsmål – smålig retorikk

Haakon Gjerløw og Tore Wig polemiserer i et innlegg 26.09 mot stordata og konsulentselskapers bruk av ny teknologi. Faglig debatt om analysemetoder ønsker vi velkommen, men retorikken Gjerløw og Wig benytter seg av gjør lite for å fremme utviklingen i faget.

Bakteppet er dette: Stordata- og maskinlæring åpner uante muligheter for samfunnsanalyse. Derfor investerer de fleste av verdens fremste teknologiselskaper, analysemiljøer og forskningsinstitusjoner i nye verktøy som kan hente og analysere data fra internett. Målet er å bedre forstå hvordan verden henger sammen, og i hvilken retning samfunnsutviklingen er på vei. Ny teknologi har alltid utfordret gjeldene praksis og ikke minst etablerte miljøer. Det skaper motstand.

Internasjonalt er det allerede en pågående debatt mellom forsvarere av tradisjonelle statistiske metoder, som Gjerløw og Wig, og tilhengere av ny maskinlæringsteknologi. Som i faglige debatter flest, har begge sider gode poenger. Statistikken, slik den undervises på universitetene, har sin fremste styrke i teori. Statistikere og andre forskere har i evigheter diskutert hvilke metoder som er best egnet for å tolke og forstå data. Maskinlæringsteknikker er av nyere dato. Styrken i maskinlæring ligger i at den kombinerer matematikkens presisjon med kraften fra moderne prosessorer. Vi har kommet til et punkt hvor maskinlæringsalgoritmer i stadig større grad klarer å lære seg selv hvordan data bør tolkes og problemer løses. Men fordi metodene er nye, løper på mange måter teorien etter den teknologiske utviklingen.

Vårt utgangspunkt er at de beste analysene kombinerer innsikt fra ulike metoder. Frem til nå har vi analysert store samfunnstrender ved å bruke tradisjonelle virkemidler, som meningsmålinger, eller kvalitative metoder som kan supplere tallenes tale med menneskelig intuisjon. Nå kombinerer vi denne innsikten med stordata og maskinlæringsmodeller. Vår vurdering er at analysemiljøer som ønsker å forstå de viktigste trendene i Norge og verden, må hente data fra flest mulig kilder og benytte et størst mulig mangfold av metoder. Ikke minst må vi være villige til å tenke nytt og ta i bruk ny teknologi.

Når to forskere benytter sine akademiske titler i et innlegg bør man kunne forvente større vilje til presisjon, nyanse og seriøsitet enn det Gjerløw og Wig demonstrerer.

Vi skulle ønske Gjerløw og Wigs innlegg reflekterte litt mer av den nysgjerrigheten og læreviljen som preger fremragende forskningsmiljøer på sitt beste. I stedet velger Wig og Gjerløw å hoppe i skyttergravene. Det står de to fritt til å gjøre. Men stilen de legger for dagen i innlegget sitt er det vanskeligere å gå god for. Når to forskere benytter sine akademiske titler i et innlegg bør man kunne forvente større vilje til presisjon, nyanse og seriøsitet enn det Gjerløw og Wig demonstrerer. De gjør ikke noe forsøk på å opplyse leserne om den faglige debatten mellom tradisjonell statistisk metode og maskinlæring, de gjengir oss på en upresis og tendensiøs måte, og de ser med åpne øyne bort fra hva vi selv skriver om våre analyser. Det er synd, for vi er sikre på at både Zynk og Gjerløw og Wig kunne hatt utbytte av seriøs faglig dialog. Det er også grunnen til at vi tidligere har invitert Wig til å møte oss.

Wig og Gjerløw ser særlig ut til å irritere seg over at Zynk i 2017 leverte en stordata-analyse av trendene ved stortingsvalget, og dermed tråkket rett inn i beddet til statsvitenskapen. Zynk er ikke et meningsmålingsbyrå og vi holder armlengdes avstand til partipolitikken. Men kort tid etter at vi investerte i stordataverktøyet Q-ball, valgte vi å teste om våre modeller klarte å fange opp de viktigste utviklingstrekkene i stortingsvalget. Vårt formål i 2017 var ikke å bygge en omfattenede valgmodell ala det prediksjons-guruen Nate Silver gjør i USA, eller for den saks skyld Norsk Regnesentral i Norge – men å vise oss selv og andre at stordata fanger opp vesentlige samfunnstrender. Det gjorde den. Da Zynk i fjor forutså hovedtendensene i Stortingsvalget publiserte vi åpent og transparent analysene på www.zynk.no henholdsvis åtte og tre dager før valget. Ingen av analysene har påstått eller antydet at vi kan predikere partienes prosentvise oppslutning eller at de er statistisk sammenlignbare med valgresultatet eller tradisjonelle meningsmålinger, slik Wig og Gjerløw kritiserer oss for. Tvert imot, var vi helt eksplisitte på det motsatte og skrev i 2017: «Analysen kan predikere hvilke partier som trender og om de har en positiv eller negativ utvikling, men kan ikke fastslå partienes oppslutning på en så presis måte at man kan forutse hvilke partier som f.eks. havner over eller under sperregrensen». Gjerløw og Wig hopper over dette i sin polemikk. Det er lite tillitsvekkende.

Vårt stordata-verktøy Q-ball er utviklet av det svenske analysebyrået Quattroporte og tidligere analysesjef Peter Majanen i Gallup. Majanen har en lang akademisk karriere og er en anerkjent trendanalytiker. Q-ball baserer seg på språkanalyser i en database på flere enn 50 millioner nnorske nettsider og flere titalls millioner sosiale medie poster. Algoritmen bak Q-ball er utprøvd og testet mot internasjonale valg og Stockholmsbørsen siden 2012. Det er med andre ord få stordata-algoritmer som har en lengre historikk enn Q-ball. Prediksjonsmodellen har vist seg å treffe godt når den testes mot aksjekursutvikling. Resultatene er verifisert og attestert av CFO i Wallenbergs investeringsselskap, Investor.

I 2016 leverte Quattroporte en valganalyse som predikerte Donald Trumps overraskende valgseier ved hjelp av Q-ball. Igjen viste stordata-modellene seg bedre egnet enn selv de mest avanserte tradisjonelle statistiske metodene, som systematisk undervurderte sannsynligheten for et valgsjokk. At to statsvitere ikke reflekterer mer kritisk over egen fagdisiplin i etterkant av jordskjelvene i 2016 er forbausende. Når de i stedet gyver løs på stordata-modellene som faktisk fanget opp Trumps seier, følger det for så vidt den gamle hypotesen om at angrep er det beste forsvar. Om strategien er egnet til å fremme faglig utvikling i statsvitenskap og statistikk er derimot noe uklart.

At Quattroporte, som har utviklet og har rettighetene til Q-ball, ikke ønsker å offentliggjøre koden til algoritmen de har investert mye ressurser og mange års testing og utvikling på, kan man vanskelig kritisere en kommersiell aktør for. Bortsett fra å være kommersiell, da selvfølgelig. Og kanskje avslører Wig og Gjerløws siste setning – «…kommersielle aktører som vil flotte seg med vanskelige begreper som «prediktiv algoritme» og «store data», og «like store fakturaer» den egentlige kjernen i deres kritikk. Akademikerne misliker at nye aktører og analysemetoder utfordrer deres tradisjonelle metoder, og attpåtil tar seg betalt for det.

<script> (function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){ (i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o), m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m) })(window,document,'script','//www.google-analytics.com/analytics.js','ga'); ga('create', 'UA-62724418-1', 'auto'); ga('send', 'pageview'); </script> <!-- Tracking code for www.zynk.no --> <script type='text/javascript'> var psSite = '75806460c0'; (function() { var AL = document.createElement('script'); AL.type = 'text/javascript'; AL.async = true; AL.src = ('https:' == document.location.protocol ? 'https://' : 'http://') + 'tr.apsislead.com/al_v2.js'; var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(AL, s) })(); </script> <noscript><img src='http://tr.apsislead.com/?id=75806460c0' style='border:0;display:none;'></noscript> <!-- End Tracking code -->