Archive for the ‘Søketeknologi’ Category

Cominvent utvider Solr kursing

mandag, mars 21st, 2011

Cominvent har levert profesjonell trening i virksomhets-søk i over 7 år. Først på FAST-plattformen, og deretter på Lucene/Solr. Vi var de første til å introdusere Solr kursing i Europa.

Det er med glede at vi nå ekspanderer vårt brede kurstilbud, som vist i kurs-forløp-illustrasjonen til høyre. Vi dekker alt fra korte halv-dags intro-kurs til fullt sertifiserings-spor for utviklere.

Besøk vår kursside www.solrkurs.com og meld deg på det kurset som passer best for deg.

Visualisering av Lucene segment-merging

torsdag, februar 24th, 2011

Lucene guru Mike McCandless har lansert et imponerende stykke arbeid på bloggen sin som visualiserer hvordan Lucene’s MergePolicy fungerer i praksis gjennom en rekke YouTube videoer. Han mater Solr først med en 10Gb Wikipedia dump og så med mer random add/delete data feed, og så logger hvert eneste segment som skrives eller merges gjennom hele prosessen.

Mike forklarer også hvordan en ny kul merge-policy, TieredMergePolicy (LUCENE-854) fungerer. Denne er mye smartere og noe mer effektiv enn det som er standard i Lucene/Solr nå. Håper dette kan bli den nye standarden i Solr på sikt!

Solr sammendrag november 2010

mandag, desember 13th, 2010

Vi oversetter nok en gang Sematext’s Solr Digest, denne gangen for November 2010.

Dette var ikke en måned med masse interessant utvikling, så her fokuserer vi på de mest interessante tingene:

Ferdig funksjonalitet

  • Alle som jobber med polsk språk vil være glad for at en Polsk stemmer nå er i 3_x branch og i trunk.

Interessant funksjonalitet under utvikling

Diverse

  • Sortering etter funksjoner har vært tilgjengelig siden før i år, og nå er en fiks for “Enable sorting by Function Query” snart ferdig. Denne er stor! Det var noen problemer med vektig av funksjoner, parsing av funksjonene, bruk av deprekert kode etc. Du kan teste patchen allerede.
  • Mange bruker allerede GEO-søk mulighetene vi har fått i Solr. Hvis du også tenker på det så vær klar over at det kun er støtte for ett punkt per dokument. Så selv om det er mulig å lage multiValued geo-felter så vil de ikke fungere med sortering etc. Det er ikke umulik å løse teknisk, Elastic Search er en motor som klarer det, så kryss fingrene for å se det i Solr en dag også. Du kan sjekke progressen i SOLR-2154.
  • Det er en alvorlig bug i DataImportHandler - den slipper ikke opp brukte JDBC forbindelser. Det er ikke relatert til noen bestemt database så dette er ganske sikkert en DIH bug. Sjekk ut SOLR-2045 for oppdateringer.
  • Hvis du foretrekker GIT over SVN så er nå Apache’s GIT repository oppe. Sjekk denne Mailingsliste-tråden for å lære mer.

Solr-distroene kommer

fredag, november 12th, 2010

Åpen Kildekode-basert søk får et stadig økt momentum. Først hadde du Lucene (2001), som ga kraftig søk for programmerere. Så fikk vi Solr (2006) som gjorde søk tilgjengelig for ikke-programmerere, men fortsatt behov for et visst nivå med ekspertise. Og så kom Constellio, en åpen kildekode / fri programvare (GPL) bedrifts-søkemotor distribusjon (distro) bygget på Solr, men med et pent GUI, innholds-connectorer, web-crawling støtte og mer.

Hva sa du sa du? En Solr distro?

Jeg kaller det “distro” fordi jeg liker å sammenligne evolusjonen med hva vi har sett innenfor GNU/Linux. Først hadde vi Linux-kjernen. Så fikk vi GNU-verktøyene som gjorde Linux brukbar til noe, men fortsatt kun for ingeniører som er komfortable med kommando-linjen. Og så begynte firmaer som RedHat, Suse o.l. å bygge komplette distoer inkludert moderne GUI, ut-av-boksen verktøy som OpenOffice, Thunderbird og mer. Uten disse disroene ville Linux bare vært en kjerne, og overlatt til brukeren å legge til alle verktøyene og sukkeret rundt.

(mer…)

Den første ekte boka om FAST Søk

fredag, november 12th, 2010

Book cover © Amazon & Wrox

Veeeldig på overtid har Wrox nettopp publisert en bok om Microsoft Enterprise Søk, inkludert de forskjellige FAST-variantene. Bravo!

Man kan spørre seg hvordan FAST brukere har kunnet klare seg i så mange år uten bøker eller eksterne kilder for å lære produktene. Frem til nå har FAST/MS og deres partnere vært så og si eneste kilden til å lære FAST søk [1]. Vel så er jo vi også del av det økosystemet og har kanskje profittert på mangelen på tilgjengelig materiell, men det er en annen historie. (mer…)