Big Data

Publisert: 23. november 2012 kl 10.59
Oppdatert: 6. juni 2013 kl 12.58

Valgkampmaskineriet til Barack Obama samlet inn store mengde data og brukte avanserte analyse- og statistikkverktøy for å finne fram til hvordan de kunne jobbe så målrettet som mulig opp mot velgerne. 

De gikk så detaljert til verks at de eksempelvis visste at kvinner i alderen 40 til 49 år på vestkysten hadde en hang til å være sterke beundrerinner av skuespilleren George Clooney. Ifølge Time hadde demokratene her funnet den gruppen som var mest villige til å donere penger for en middag med Obama og Clooney.  Middagen ble da også avholdt, og ifølge amerikanske medier dro Clooney inn hele 15 millioner dollar til Obamas kampanje. 

En annen som håvet inn en dataseier i presidentvalget, var tallknuseren Nate Silvers. Han predikerte rett valgresultat i 50 av 50 stater, og tok med dette innersvingen på hele det amerikanske kommentariatet. For-klaring: -Silvers baserte seg ikke på enkeltmålinger og egne meninger. Han gikk i stedet løs på store datamengder og tok i bruk avanserte statistiske modellverktøy.

Trenden Big Data

Mengden digitale data som er tilgjengelig for analyse vokser raskt. Dette har igjen gitt oss den teknologi- og ledelsestrenden som omtales som Big Data.

Kort fortalt handler trenden om at en rekke aktører i økende grad analyserer seg fram til mønstre i de digitale dataene vi har til rådighet. Funnene de gjør kan åpne for mer målrettede valgkamper, men også for nye forretningsmuligheter.

– Ideen er enkel. Det handler om at når veldig mange uttaler seg, har det gjennomsnittlige svaret en tendens til å ligge nærmere virkeligheten enn om noen få eksperter uttaler seg. Videre handler det om å koble sammen og finne mønstre i data, sier Arne Krokan, professor ved Institutt for sosiologi og statsvitenskap ved NTNU, som i 2013 kommer ut med boken Digital økonomi 2.0.

Saken fortsetter under annonsen

– En ledelsesrevolusjon

Andrew McAfee og Erik -Brynjolfsson fra MIT Center for Digital Business argumenterer i en artikkel hos Harvard Business Review at Big Data innebærer en ledelsesrevolusjon.  

De viser til at alle de mulighetene som nå foreligger for gode dataanalyser, vil gi bedre prediksjoner, noe som igjen vil føre til at ledere tar bedre, databaserte beslutninger.

For å få til dette kreves det imidlertid en ny kultur for beslutnings-taking i næringslivet, mener McAfee og Brynjolfsson. Skal endringene skje, krever det at ledere stoler mindre på intuisjon og mer på databaserte analyser. 

Nye måter å ta beslutninger på 

NTNU-professor Arne Krokan er enig med McAfee og Brynjolfsson i at analyser av store data gir mer nøyaktige prediksjoner og vil forandre måten ledere tar beslutninger på. 

– Filmbransjen bruker allerede analyser av privatpersoners Twitter-meldinger om nye filmer til å beregne hvor lenge filmer kommer til å gå på kino. Analyser av aktivitet i sosiale medier kan brukes til å estimere hva børsene vil stå i om tre dager, sier Krokan, som viser til at moderne analyseverktøy kan gå igjennom millioner av poster og legge sammen informasjon på måter som gjør at resultatet kan bli en temmelig nøyaktig forståelse av den faktiske situasjonen.

Saken fortsetter under annonsen

I dag snakkes det mye om Big Data, men innenfor informatikk har man lenge vært opptatt av data mining. Dette er ifølge Krokan to sider av samme sak. Poenget er å lete etter struktur og mening i store mengder ustrukturerte data. Sentrale teknikker vil være mønstergjenkjenning og statistisk modellering. 

– Ingen ledelsesrevolusjon

William Brochs-Haukedal, professor i ledelse ved Norges Handelshøyskole, kjøper ikke McAfee og Brynjolfssons påstander om at trenden Big Data skal innebære en ledelsesrevolusjon. 

– Dette er ikke noen nytt. Dette er en fortsettelse av en utvikling som begynte da datakraft begynte å bli rimeligere og mer tilgjengelig for 20-30 år siden. Hvis man fjerner seg fra motefenomenet Big Data, og ser på hva som faktisk har skjedd, handler det om at analyser nå kan gjøres i større utstrekning og billigere enn før. Vi kan bruke algoritmer på stadig større datamengder og vi er blitt flinkere til å analysere. 

(Algoritme er en presis beskrivelse av en endelig serie operasjoner som skal utføres for å løse et problem. Uttrykk fra matematikk og informatikk. Red.anm) 

– Endrer ikke lederrollen

– Hvordan påvirker analyser av store datamengder lederrollen?

Saken fortsetter under annonsen

– I Norge er det rundt 200 000 personer som har et lederansvar. De fleste av disse er mellomledere og linjeledere som forholder seg mest til produksjon og interne forhold i organisasjonen. For dem betyr ikke denne utviklingen i retning av flere analyser av store datamengder så mye. Toppledelsen, styrer og eiere som sitter med ansvar for strategi kan på sin side ha stor nytte av analyser av omgivelser, kunder og trender, sier NHH-professoren.

Irrasjonelle tendenser

– Tror du vi vil få en utvikling der toppledere tar flere databaserte beslutninger enn før?

– Nei, jeg tror ikke det. Dette gjøres allerede i ganske stor utstrekning. Forskjellen ligger i at vi blir stadig flinkere, sier Brochs-Haukedal, som minner om at beslutningstagere har en tendens til å stole mer på informasjon fra venner og kolleger enn på statistiske data. Nobelprisvinner Daniel Kahneman, og flere med ham, har gjort funn som peker i retning av at vi mennesker i stor grad tar såkalt irrasjonelle beslutninger. 

– Vi er mennesker med følelser og emosjoner, ikke datamaskiner, og det kommer ikke til å forandre seg. Alle som har jobbet med kompliserte problemstillinger og statistikk vet dessuten at statstiske analyser kan rigges til på måter som gjør at man får de svarene man ønsker å få. 

Målrettet arbeid

Demokratene i USA hadde fra før av store databaser. Problemet var at basene ikke snakket sammen. I forkant av dette valget ble det ifølge Time derfor laget et massivt system som kunne koble informasjon fra meningsmålinger, folk som donerte penger til kampanjen, valgkamparbeidere, forbrukerdatabaser, velgerdatabaser, data fra sosiale medier og mobilkontakter. Dette gjorde det i sin tur mulig å målrette valgkampinnsatsen på en helt annen måte enn tidligere. 

Saken fortsetter under annonsen

Et annet eksempel på analyser av store data finner vi i netthandelen. Tradisjonelle bokhandlere kunne registrere hvilke bøker som ble solgt, og koblet kanskje salg opp til forbrukegrupper gjennom et lojalitetsprogram. Den nettbaserte bokhandelen Amazon bruker langt mer avanserte verktøy. De registrerer hva folk kjøper, men har også data for hvordan kunder navigerer rundt på nettsiden. De kan måle i hvilken grad brukerne lar seg påvirke av annonser, bokomtaler og den grafiske layouten på siden, og de har lenge brukt algoritmer som kan predikere hva kunden vil foretrekke å lese neste gang. 

Googles influensastatistikk

Søkemotoren Google klarer ved hjelp av analyser av store mengder søkeord som er relatert til influensa å predikere forekomsten av influensa. 

– Det viser seg at Googles prediksjoner er nesten overlappende med faktisk rapportert influensa. Forskjellen er at de vet dette -to-tre uker før helsemyndighetene, sier Arne Krokan, som mener at tilsvarende kartlegging av andre søkeord kan brukes til å kartlegge andre situasjoner, for eksempel produkters popularitet. 

Landingstider og julehandel 

Eksemplene på bruken av analyser av store data er mange, og Andrew McAfee og Erik Brynjolfsson viser i sin artikkel til at analyser av store data kan skape endringer i helt ulike bransjer. 

På en flyplass er det viktig å vite når flyene lander. Hvis et fly lander før tiden, må mannskap og passasjerer vente på at bakkemannskapet er klart. Lander et fly etter estimert tid, er det bakkemannskapet som må vente. Istedenfor meldinger om estimert landingstid fra pilotene, begynte et stort amerikansk flyselskap å bruke analyser hvor tilgjengelige data om vær, flyruter og målinger fra radarstasjoner etc. ble koblet sammen. Estimatene på landingstider ble langt mer nøyaktige enn før. Hvilket igjen innebar mange penger spart.

Saken fortsetter under annonsen

Et annet, mer kuriøst eksempel, stammer fra et forsøk gjort av Alex Pentman fra MIT Media Lab. Signaler fra mobiltelefoner ble her brukt til å predikere hvor mange biler det var på parkeringsplassen utenfor et kjøpesenter den dagen julehandelen startet. Disse dataene, i kombinasjon med andre data, gjorde det mulig å predikere salget for denne dagen. Før kjøpesenteret selv hadde registrert hvor stort salget faktisk ble.

Motebaserte bransjer

Matematikk og IT vil i større grad enn før danne grunnlag for beslutninger i næringslivet, tror NTNU-professor Arne Krokan, men også han minner om Daniel Kahnemans funn som viser at vi mennesker ikke er så rasjonelle som vi liker å tro. 

– Det vil aldri bli slik at analyser av store data styrer alle situasjoner. Mange faktorer vil dessuten ikke bli fanget opp i dataanalysene, samme hvor avanserte de er. Det vil alltid oppstå noen uventede hendelser. Alt i alt vil imidlertid bedre data-analyser føre til bedre beslutninger, mener Krokan.

Professoren tror utviklingen med flere databaserte beslutninger vil vinne terreng hos aktører som skal lansere nye produkter eller selge motepregede produkter som klær og biler. 

– Denne typen analyser kan være betydningsfulle hvis du skal analysere markeder som stadig er i endring. Analysene er av mindre betydning hvis du selger fornuftsbaserte produkter som Leca og grus.

Etikk og dataoverflod

Hva så med etikken rundt Big Data-trenden? Ønsker vi en utvikling der digitale spor kan analyseres og utnyttes i forretningsmessig øyemed?

Arne Krokan viser til at det vanligste er å bruke åpne data til å analysere større trender og utviklingstrekk. Herunder sykdomsutvikling. 

– Dette mener jeg det er greit å gjøre. Det er langt mer tvilsomt hvis mobilapplikasjoner i det skjulte henter ut data fra telefonen din for å formidle dem videre til en tredjepart. 

Skal du kaste deg ut i det store datahavet, skal du også huske at risikoen for å drukne i irrelevante data så absolutt er til stede. Her som ellers gjelder det å stille de gode spørsmålene. Det er først da man får gode svar. 

--------------------------------------------------------------------------------------------------

Utforsker forretnings-mulighetene

Jan Gusland og kol-legene i konsulent-selskapet eMind ser nye forretnings-muligheter i analyser av store data. 

Tekniske verktøy som muliggjør analyser av stadig større datamengder, har skapt et nytt marked for konsulentselskaper. Det finnes flere store aktører som tilbyr tjenester med merkelappen Big Data, men også mindre selskaper øyner forretningsmuligheter. Jan Gusland, gründer og en av tre konsulenter i eMind, forteller at de er i ferd med å videreutvikle analyseverktøy for data i sosiale medier og nyhetsmedier. 

– Bedrifter har lenge jobbet med å forbedre og effektivisere prosesser, og her er det fremdeles mye å hente. Et nytt forbedringsfelt er databasert analyse av store og gjerne ustrukturerte data. Det hjelper ledere til å ta riktigere beslutninger. 

Forbrukere og politikk

Noe av det eMind allerede har gjort, er å analysere ordene som brukes i diskusjonsfora hvor temaet er forbrukerelektronikk. De kan analysere seg fram til hvilke produkter som oftest diskuteres når aktøren Elkjøp er involvert. De kan også se hvilke produkter som oftest nevnes i tilknytning til andre aktører, og derigjennom si noe om markedsposisjon. 

– Vi har også funnet at den nye aktøren Dustin Home oftest ble nevnt i sammenheng med aktøren Komplett. Det peker i retning av at forbrukere vurderer nykommeren først og fremst som en konkurrent til Komplett, sier Gusland, som forteller at de planlegger å gjøre noe av det samme med politiske partier. Dataanalyser vil kunne avdekke hvilke politiske partier som i størst grad eier ulike temaer i diskusjoner på nettet og i nyhetene. Hvilket parti forbinder vi egentlig med helsepolitikk? Hvilket parti viser vi oftest til når vi diskuterer skatt? Er det forskjell på sakseierskapet i folkets diskusjoner og nyhetsdekningen?

Personvern

– Hvordan hånderer dere personvernet?

– Det er svært viktig å ivareta personvernet. Vi forholder oss til offentlig tilgjengelig informasjon, som vi systematiserer og aggregrerer. Vi er ute etter å oppdage trender, sammenhenger og utviklingstrekk. Vi er ikke ute etter individdata og det er ikke mulig å spore individdata i analysene vi utarbeider. 

Mye upløyd mark

– Er norske ledere opptatt av å ta i bruk analyser av Big Data?

– Det er ikke så mange ledere som er opptatt av det, men når de forstår nyttet av det, tror jeg de vil bli det. Det vil imidlertid ta tid. Dette er ikke noe vi er veldig flinke til i Norge, og det er ikke en måte å jobbe på som er på plass over natten, mener Gusland.

Han tror imidlertid ikke at databaserte beslutninger vil utkonkurrere ledererfaring og intuisjon.

– Vi trenger databaserte analyser som avdekker trender på et tidlig tidspunkt, men vi trenger fremdeles dyktige kremmere som har en forståelse av situasjonen som utover det dataanalysene kan fortelle. 

--------------------------------------------------------------------------------------------------

Husk personvernet

Utnyttelse av person-data er underlagt reguleringer. 

Det er det europeiske personverndirektivet som danner grunnlaget for personvernlovgivningen i Norge. Reglene er annerledes i Europa enn i USA, hvor en del av eksemplene i artikkelen ovenfor er hentet fra, men de ikke nødvendigvis strengere på alle områder. 

– Amerikanerne har mindre regelverk på noen områder, mens de på andre områder er langt strengere, sier Atle Årnes, fagdirektør i Datatilsynet. 

Statistikk kontra person

Hvis man er i tvil om hvilke digitale opplysninger man har lov til å samle inn og bruke, kan man kontakte Datatilsynet for å få råd. En god huskeregel er imidlertid at det er forskjell på statistikk og personopplysninger. 

– Statistikk, det vil si aggregerte data som ikke kan føres tilbake til enkeltpersoner, er det greit å bruke. I en del tilfeller skal man imidlertid ha et trenet øye for å se hva som er hva, sier Årnes. 

Innhenting av samtykke

Det er for eksempel forskjell på å registrere aktivitet på en nettside og på å identifisere aktiviteten til identifiserte enkeltpersoner dag etter dag. 

– Hvis du vil følge med på hva enkeltpersoner foretar seg, er hovedregelen at du må innhente samtykke fra de det gjelder. Det er det imidlertid mange forbrukere som sier ja til. Problemet oppstår hvis man bygger opp personprofiler uten å ha innhentet samtykke. 

Facebook og Twitter

– Hva med å bruke data fra sosiale medier som Facebook, Twitter og blogger?

– Her er det generelle rådet å sjekke hvilke retningslinjer og vilkår som gjelder for de ulike nettstedene. I tillegg kommer vårt regelverk, og her vil det som tidligere nevnt være forskjell på om man lager statistikk eller henter ut personopplysninger.