Sølvpilen Big Data

gaussiandistproblemEt tegn på at Big Data er Big kan findes i politikkens Økonomi sektion som i går brugte hele 6 sider på artikler om Big Data [blandt andet 1].

Her kan man læse at hungry.dk sammenkører deres restauratør liste med de offentlige smiley data til at sikre at ingen restauratører har en sur smiley[2]. Det beskrives som et af de få eksempler på at danske firmaer udnytter Big Data, som vi ellers i Danmark både taber arbejdspladser og konkurrenceevene på ikke at udnytte [ 3 ].

Personligt syntes jeg, at det er genialt at hungry.dk holder sig opdateret med om et takeout-sted overholder smileyreglerne, og at det selvfølgelig handler om at bruge de offentlige data, som Dansk Statistik[ 4 ] har givet adgang til. Men for mig handler Big Data om analyse af store mængder data, så jeg ved ikke om jeg hellere vil kalde det datasamkørsel, men det lyder ikke så godt.

Under alle omstændigheder er Big Data noget der snakkes om, og som alle virksomheder burde være flove over ikke at udnytte. Det offentliges tilgængelige data er jo der for at blive brugt, hvem der så end betaler for alle de servere som skal servicere det blomsterende erhvervsliv.

Hvor starter man så? De fleste bøger og websites får det til at lyde som om det blot er at spørge efter en nøgle hos Big Data-lederen, og så flyder det ud med viden, som gør lige netop dit firma helt specielt. Men det er ikke helt så lige til, eller er det?

Først punkt på listen må være at finde de data som du skal BigDataficere (bigdatae). En god start er at gemme dine backups, og sikre at al den kundeinformation du har, bliver gemt på en måde som kan forespørges/undersøges. Indsamlingen af data kan også være at finde et offentligt API, som man kan hente data fra, bruge Twitter til at finde trends på forskellige ting, eller lave en Facebook app så folk frivilligt fortæller dig alt fra, at deres vaskemaskine er gået i stykker, til hvor de gerne vil hen på ferie næste år (her ligger det jo lige til højrebenet for et hvidevarebutik at sende et tilbud om en ny vaskemaskine, og for EasyJet at opfinde en ny kampagne rettet mod brugere som drømmer om lige netop den destination).

Når data er der, og der er nok til at lave et statistisk grundlag [se f.eks. 5 ] kan man sætte sin statistiker og sin maskine til at prøve at lære noget fra de data, faktisk skal man nok snakke med sin lokale statistiker om indsamlingen af data også.

Med succes kan man optimere sit salg, sine kampagner, eller hvordan man bygger broer bedst. Der er nærmest ingen grænser for hvad man kan lære en maskine, hvis bare man ved hvad man skal lære den. F.eks. er der mange som laver anbefalinger og påstår at de får salget til at gå op med hele 10% bare ved at bruge de data man har til at tilbyde kunderne det de vil have[Klassisk eksempel netflix.com og Amazon.co.uk].

Det lyder nemt, men ligesom med de fleste undersøgelser skal der ikke meget slinger i valsen til, før man får forkerte konklusioner ud af det, og maskinen lærer noget helt forkert.

“The way to turn data into insight is to squash the notion that big data is a silver bullet. We preach that data and analytics is important but then we empower people to be curious and ask questions and get involved in big data analytics.” [ 6 ]

Share Button
The following two tabs change content below.
Profile photo of kimfalk

kimfalk

Lead Data scientist hos Karnov om dagen, Forfatter til Practical Recommender Systems om aftenen
Profile photo of kimfalk

Nyeste indlæg af kimfalk (se alle)

1 kommentar for “Sølvpilen Big Data

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *