Database

Vi skal stole mere på maskinerne – en konklusion fra GOTO

Halvt igennem den anden dag af GOTO, og jeg sidder og lytter til hvordan mennesker reagerer i semi-selvkørende biler (link). Et af deres forsøg viser at folk meget hurtigt taber interesse i at følge trafikken, når en bil kører selv – næsten. En næsten selvkørende bil lyder jo fantastisk, men køreren af næsten selvkørende biler som sidder og kigger på Netflix-film, lyder faktisk ikke…

Bliv klogere ved at løbe gennem grafer

Læste I dr.dk’s artikel om panama-papirene? Deri kan man læse at panamapapirene angiveligt indeholder informationer om 5-600 danskeres skattely-aktiviteter. De papirer der omtales er en del af de 11,5 millioner dokumenter, som er blevet lækket fra virksomheden Mossack Fonseca i Panama. 11,5 millioner dokumenter er det det samme som 2000 kopier af hele Game of Thrones bog-serien (altså 14000 bøger, hvis altså man antager…

En snak om RavenDb

Ayende Rahien aka Oren Eini er kommet for at fortælle om RavenDb her på Goto Konference. Han fortæller at grunden til at de gik igang med at udvikle RavenDb var fordi de var trætte løse de samme trivielle problemer hver gang de tog en ny kunde. Som database optimerings eksperter havde de en lille liste af ting som de gennemgik hver gang de startede,…

Hvorfor vil jeg bruge tid på at Lære Spark

Alle der er interesseret i data analytics, machine learning eller big data, har på et tidspunkt prøvet at kigge på et dataset som er så stort, at det bliver svært at arbejde med i R eller med SQL. En løsning er at bruge Spark. Spark er et af de hurtigst voksende big data Apache projekter, der har en memory-orienterede procceserings model, og er et…

Bag om Elasticsearch: Søgning og aggregering

featured

Med Lucene som fundament har man med ElasticSearch naturligvis en førsteklasses søgemaskine. Lucenes modenhed er en stor fordel når vi kigger på featuresættet, men med i prisen er der også en del legacy-baggage. Elasticsearch abstraherer ikke Lucene væk – dens JSON-baserede REST-interface giver adgang til alle Lucenes funktioner. Men Elasticsearch er ikke bare en indpakning af Lucene – derudover indeholder den et lag der…

CQRS med ElasticSearch

_DSC0365Elasticsearch

Når data gemmes i ElasticSearch, sker det ved hjælp af en struktur kaldet et dokument. Hvert dokument består af de felter man som bruger kommer med, samt et antal faste felter. Ét af disse felter er et id der unikt identificerer dokumentet og kan, fra grænsefladens side, bruges til at lave opdateringer og overskrivninger af dokumentet. Under overfladen foregår tingene lidt anderledes. Lucene, der…

Uregerlig data

Diamonds

Big data er over det hele, og man skal gemme så meget data som man kan, og hele tiden prøve at indsamle mere. Men hvad gør man så når man har alt det data, som er så stort at ens database spørger efter mere kaffe, hver gang man prøver at køre en forespørgsel på data, hvis din maskine ikke bare dør, og skal genstartes.…

Microservices: Det er ikke (kun) størrelsen der er vigtigt, det er (også) hvordan du bruger dem – Del 4

Del 1 – Microservices: Det er ikke (kun) størrelsen der er vigtigt, det er (også) hvordan du bruger dem Del 2 – Microservices: Det er ikke (kun) størrelsen der er vigtigt, det er (også) hvordan du bruger dem Del 3 – Microservices: Det er ikke (kun) størrelsen der er vigtigt, det er (også) hvordan du bruger dem I del 3 så vi at for…

Go To Big Analytics with H2O

Når der er nogen som siger at de har løst alle de store udfordringer i et komplekst problemområde, så bliver jeg normalt lidt skeptisk, men alligevel nysgerrig (om ikke andet bare for at finde huller i det). Så da jeg læste om en ny machine learning open source platform, begyndte jeg straks at downloade. Den bliver præsenteret som skruetrækkeren der passer på alle bigdata-skruer,…

Migrering af Elasticsearch indexes med C#

Thomas Ardal

Dette skulle være så nemt: NoSQL databaserne og deres skemaløse tilgang til verden. Pist væk med tabeller, primærnøgler, fremmednøgler og vigtigst af alt – Migrering! Billedet er desværre ikke helt så sort og hvidt. Jeg har arbejdet med NoSQL databaser som Elasticsearch, RavenDB, MongoDB og CouchDB mere eller mindre konstant de sidste fem år. Det sidste års tid mere intenst under udviklingen af mit…