Archive for the ‘Søketeknologi’ Category

Solr 3.5 er sluppet

søndag, november 27th, 2011

I dag ble en ny versjon av Apache Solr sluppet, nemlig versjon 3.5.0. Her er kunngjøringen fra Lucene PMC:

The Lucene PMC is pleased to announce the release of Apache Solr 3.5.0!

See the CHANGES.txt file included with the release for a full list of details.

Solr 3.5.0 Release Highlights:

  • Bug fixes and improvements from Apache Lucene 3.5.0, including a very substantial (3-5X) RAM reduction required to hold the terms index on opening an IndexReader. (LUCENE-2205)
  • Added support for distributed result grouping. (SOLR-2066SOLR-2776)
  • Added support for Hunspell stemmer TokenFilter supporting stemming for 99 languages. (SOLR-2769)
  • A new contrib module “langid” adds language identification capabilities as an Update Processor, using Tika’s LanguageIdentifier or Cybozu language-detection library (SOLR-1979)
  • Numeric types including Trie and date types now support sortMissingFirst/Last. (SOLR-2881)
  • Added hl.q parameter. It is optional and if it is specified, it overrides q parameter in Highlighter. (SOLR-1926)
  • Several minor bugfixes like date parsing for years from 0001-1000, ignored configurations when using QueryAnalyzer with SpellCheckComponent and many more. See CHANGES.txt entries for full details.

Noen av bidragene fra Contributions er Språkdeteksjon, gjøre Hunspell stemmeren klar for Solrog SOLR-2742 som gjøre commitWithin lettere tilgjengelig gjennom SolrJ APIet. I tillegg er Tika oppgradert til versjon 0.10, med flere feilrettinger for parsing av PDF dokumenter og Office dokumenter.

Å bli en committer

torsdag, juni 16th, 2011

Apache’s måte å utvikle programvare på er avhengig av et aktivt miljø av brukere, bidragsytere og utviklere. Alle kan bidra på en eller annen måte. Å være en committer betyr at du deltar aktivt i utviklingen av programvaren og har skrivetilgang til kildekoden. Hvert prosjekt hos Apache ledes av en PMC (Project Management Committee) som består av utvalgte committere som tar ekstra ansvar for å stake ut kursen for prosjektet. (mer…)

Apache Solr 3.1 er lansert

fredag, april 1st, 2011

Vi har ventet lenge, og nå er endelig versjon 3.1 av Solr sluppet. Versjon 1.4.1 kom i juni 2010 og av ulike årsaker ble det aldri noen 1.4.2 eller 1.5 versjon. Dels på grunn av at utviklingsmiljøet og kodebasen til Lucene og Solr ble slått sammen, noe som også forklarer hoppet i versjon til 3.1, for å tilpasse seg Lucene’s versjonsnummer.

Så hva er nytt? For meg er de viktigste to funksjonene Extended Dismax parser (SOLR-1553) og GEO-søk. En komplett liste over forbedringer finnes i CHANGES.TXT, men her er mine favoritter:

(mer…)

Apache Solr 3.1 Produktark

fredag, april 1st, 2011

Den flunkende nye versjon 3.1 av Apache Solr ble sluppet i går.

Vi har laget et 2-siders Apache Solr produkt-ark som veldig konsist (og vakkert) beskriver høynivå egenskapene til denne populære søkemotoren, inkludert linker til nedlasting og hvordan man kommer igang.

Bruk det for å forklare for business-personer og beslutningstakere hva fri programvare søk er istand til. Dette er den manglende “glansede” brikken i markedsføringen av Solr om du vil.

Du er fri til å gjenbruke dette produktarket i din kommersielle business, da det er lisensiert under Creative Commons BY-SA, som betyr at du til og med kan gjøre endringer så lenge du lar linken og krediten til Cominvent forbli som den er og du også deler dine endringer under samme lisens og på ODF kildeformat.

Last ned Solr 3.1 produktark (PDF).

Og her er Solr 3.1 product sheet master (ODT).

Vårt GoOpen foredrag om DN.no migrering til Solr

onsdag, mars 23rd, 2011

Vi holdt et foredrag på Fri Programvare/Åpen Kildekode-konferansen GoOpen 2011 i Oslo idag, sammen med vår kunde NHST representert ved Hans Jørgen Hoel. Foredraget var om prosessen de har gått gjennom med å bytte ut FAST søkemotoren de brukte før med Apache Solr for alle NHST’s publikasjoner og datakilder.

(mer…)