Forfatter Arkiv for kimfalk

Lead Data scientist hos Karnov om dagen, Forfatter til Practical Recommender Systems om aftenen

Beware of the dark patterns.

ekstra gebyrer eksluderet

Dark patterns er ikke noget som folk ”on the dark side” bruger til at sejre over flere jedi-riddere, men noget som dukker op flere og flere steder på nettet. Pioneren inden for dark patterns er et flyselskab som alle kender og hader. Skal man ud og flyve, starter man ud på deres hjemmeside med en pris på en flybillet, der er så billig, at man…

Ligheden af ting

mirror dragons

En spørgsmål som man ofte møder i forbindelse med Machine learning og data mining er at bestemme hvor meget to ting ligner hinanden, altså hvordan måler man ligheden af ting, det kan være personer, dokumenter, film eller frugter i et supermarkedet. Og det er der selvfølgelig mange måder at gøre det på, men en god en, at have i tasken, er opfundet af en…

Stor skala maskinelærings til forudsigelses opgaver

Ting lyder bedre når man siger dem på engelsk, der er ikke noget at gøre, men vi skriver jo på dansk. I sidste uge var der RecSys 2014 i Californien som er en af de største recommender systems konferencer, og er værd at kigge lidt på, hvis man laver systemer som skal lave forudsigelser (predictive analysis). I det følgende vil jeg fortælle lidt om…

Side-rankering

pagerank

Google-søgemaskinen er, som de fleste ved, ret berømt, du har måske oven i købet brugt den til at ankomme her – forhåbentlig lå denne post højt på resultatlisten. Alt det startede med en algoritme ved navnet PageRank, som gjorde det muligt for computere at lave rankeringer af internet-sider og ved et slag lavede internet-søgemaskiner til relevans-maskiner i stedet for store leksikale opslagsværker. Ideen bag…

Microsoft i skyen

En ting som der bliver snakket næsten endnu mere om end Big Data er skyen, og i dag er jeg taget på Azure DevCamp for at lære hvordan det hænger sammen i en Microsoft verden. Hos Microsoft ved siden af den store Tuborg flaske, blev vi fortalt om den imponerende arkitektur som ligger bag det mange hovedet monster. Jeg ved ikke nok om skyer…

Adrian Cockcroft om hurtig aflevering (Fast Delivery)

Hej, skriver live GOTO cph, sidder og lytter til Adrian Cockcroft som fortæller om fast delivery, om hvordan de hos Netflix kom ud så hurtigt på cloud. Han beretter om en kultur som blandt andet indeholder: Om man koncentere sig om at hastighed vinder i markedet Man skal fjerne friktion i udviklings cyklusen Managere og udviklere skal have høj tillid, udvilking skal ikke styres…

Hvorfor egentlig bruge automatiseret test?

resize

Hvordan kan man være sikker på at et en feature virker. Nemt tænker man jeg prøver bare at køre mit software, og tjekker om den omtalte feature virker som forventet. Når man har to features så gør man det samme og per induktion kan man sige at hvis det virker med de eksisterende features og det virker hvis man tilføjer en feature mere, så…

SPA – website wellness part 1.

2014-09-04 07.44.33

Når jeg tænker på Single Page Architecture (SPA) er der en række problemer som popper op, som f.eks: Back button virker ikke, da browseren ikke oplever det som side skift når man navigere rundt på siden, eller at UX delen er en suppe af div-tags of javascript, som hurtig bliver svær at overskue og umulig at debugge. Derfor er jeg lidt skeptisk når jeg…

Uregerlig data

Diamonds

Big data er over det hele, og man skal gemme så meget data som man kan, og hele tiden prøve at indsamle mere. Men hvad gør man så når man har alt det data, som er så stort at ens database spørger efter mere kaffe, hver gang man prøver at køre en forespørgsel på data, hvis din maskine ikke bare dør, og skal genstartes.…

Mere Azure Machine Learning

azure-machinelearning

Jeg fik adgang til Azure Machine Learning, og har leget lidt med det! Det er sjovt og virker rigtigt nemt at gå til. Azure ML studio Jeg har fundet ud af hvordan man læser en CSV fil ind i systemet, hvordan man konvertere de indlæste data til et dataset, hvordan man fortæller systemet hvilke kolonner som er input og hvilke er output. Mine data…