Søgeteknologi

Bag om Elasticsearch: Søgning og aggregering

featured

Med Lucene som fundament har man med ElasticSearch naturligvis en førsteklasses søgemaskine. Lucenes modenhed er en stor fordel når vi kigger på featuresættet, men med i prisen er der også en del legacy-baggage. Elasticsearch abstraherer ikke Lucene væk – dens JSON-baserede REST-interface giver adgang til alle Lucenes funktioner. Men Elasticsearch er ikke bare en indpakning af Lucene – derudover indeholder den et lag der…

Side-rankering

pagerank

Google-søgemaskinen er, som de fleste ved, ret berømt, du har måske oven i købet brugt den til at ankomme her – forhåbentlig lå denne post højt på resultatlisten. Alt det startede med en algoritme ved navnet PageRank, som gjorde det muligt for computere at lave rankeringer af internet-sider og ved et slag lavede internet-søgemaskiner til relevans-maskiner i stedet for store leksikale opslagsværker. Ideen bag…

Migrering af Elasticsearch indexes med C#

Thomas Ardal

Dette skulle være så nemt: NoSQL databaserne og deres skemaløse tilgang til verden. Pist væk med tabeller, primærnøgler, fremmednøgler og vigtigst af alt – Migrering! Billedet er desværre ikke helt så sort og hvidt. Jeg har arbejdet med NoSQL databaser som Elasticsearch, RavenDB, MongoDB og CouchDB mere eller mindre konstant de sidste fem år. Det sidste års tid mere intenst under udviklingen af mit…

Bag om Elasticsearch: Skalering

featured

Noget der virkelig har givet NoSQL medvind er behovet for skalering; data mængder har det med at vokse. Uanset om der er tale om en lille opstartsvirksomhed med ambitioner om international succes eller blot almindelig tilvækst af data, så er der behov for at kunne skalere. Ydermere kan behovet opstå pludselig. Elasticsarch er fra starten forberedt på skalering med henholdsvis sharding og replikering; selv…

Bag om Elasticsearch: Indeksering med Lucene

es

Med Elasticsearch har man en hel palette af måder at strukturere sine fritekstsøgninger på, lige fra simple termer til advancerede geografiske søgninger. Den grundlæggende teknologi der muliggør dette finder man nederst i teknologistakken. Her ligger et, i IT sammenhæng, nærmest antikt produkt Lucene fra 1999, skrevet i Java men oversat til mange andre sprog. Lucene er en ren søgemaskine, dens primære rolle er at…