Archief

Solr: uitstekend alternatief voor Google Site Search

22 februari 2011 door Frank Schipper

Google Site Search is een populaire tool voor het aanbieden van een zoekfunctie op uw website, maar heeft ook enkele nadelen – waaronder de prijsstelling bij grote aantallen zoekopdrachten. Het Apache open source project Solr biedt voor veel situaties een aantrekkelijk alternatief.

Google Site Search

Google biedt met Google Site Search alle van Google bekende functionaliteiten voor het doorzoeken van de eigen website. Voor de site wordt een eigen zoekindex opgebouwd, die los staat van de algemene Google index.

Implementatie van Google Site Search op een site is zeer eenvoudig. Er kan al worden volstaan met het plaatsen van wat Javascript op de eigen site. Als meer controle op de presentatie van zoekresultaten is gewenst kan worden gewerkt met een zakelijk account: elke zoekvraag resulteert dan in zoekresultaten in XML formaat, die geheel zelf kunnen worden opgemaakt.

Solr

Solr: krachtig alternatief voor Google Site SearchSolr is een razendsnel open source zoekplatform dat voortkomt uit het Apache Lucene project. Solr biedt o.a. krachtige full-text search, highlight van zoektermen binnen zoekresultaten, en indexering van rich-tekst documenten als Word en PDF. Solr is geschreven in Java.

Solr integratie in een website is relatief complex. De te indexeren documenten dienen zelf te worden aangeboden aan het zoekmachine platform, en er dient veel meer ingeregeld te worden dan bij Google Site Search.

Voor- en nadelen van Google Site Search

  1. Google Site Search is snel en eenvoudig te implementeren. Verder is deze Google service relatief goedkoop bij kleine hoeveelheden zoekvragen. Bij hogere aantallen lopen de kosten echter zeer snel op.
  2. Nadeel van de Google oplossing is dat indexatie van documenten geschiedt op het moment dat Google daar aan toe komt. Met on-demand indexing (indexering door Google in opdracht van de gebruiker) en sitemaps  kan daar wel een mouw aan worden gepast, maar het aantal pagina’s dat in opdracht kan worden geindexeerd is relatief beperkt.
  3. Google indexeert volledige pagina’s, inclusief minder relevante content in secundaire contentvlakken. Een zoekactie kan daardoor resulteren in weinig relevante zoekresultaten.
  4. Verwijderen van geindexeerde documenten uit de Google zoekindex is een handmatige en tijdrovende klus.
  5. Google heeft tenslotte als belangrijk nadeel dat er niet kan worden ingegrepen op de zoekresultaten. Het is bijvoorbeeld onmogelijk om de meest actuele zoekresultaten als eerste te plaatsen in de zoekresultatenlijst. Vaak pakt dat goed uit, maar er zijn zeker situaties waarin dat erg ongewenst is. Denk hierbij bijvoorbeeld aan nieuwssites.

Voor- en nadelen van Solr

  1. Solr is open source en kan gratis worden gedownload en gebruikt. “Out of the box” is de zoekmachine echter niet direct te gebruiken; er dient heel wat configuratie- en koppelings-werk te worden gedaan voordat een website wordt geindexeerd en zoekresultaten kunnen worden gepresenteerd. Ziet u daar tegen op, kijk dan eens naar Solr-as-a-Service: een hosted variant van Solr, die veel van dit inrichtingswerk wegneemt.
  2. Groot voordeel van Solr ten opzichte van Google Site Search is echter dat er veel meer mogelijkheden zijn om te bepalen welke zoekresultaten relevant zijn voor de zoekvraag. Tegenover het strikt geheime Google zoekalgoritme staat het volledig transparante Solr mechanisme. Bij Solr bestaat daardoor een veel grotere controle over de resultaten van een zoekactie, en kan ook beter worden onderbouwd waarom een bepaald resultaat hoog of beter scoort. Verder kan bijvoorbeeld eenvoudig worden besloten om jongere zoekresultaten altijd boven oudere resultaten te laten zien.
  3. Solr biedt niet alleen meer vrijheid op het gebied van zoekresultaten, ook aan de inputzijde heeft de website-beheerder veel meer controle. Solr indexeert uitsluitend de documenten die worden aangeboden, en niet meer. Verwijderen van onjuiste of verouderde informatie gaat eenvoudig en snel. De Solr zoekresultaten kunnen daardoor veel meer “to the point” zijn dan die van Google.
  4. Nadeel van Solr is dat dit standaard geen “hosted solution”is, zoals Google die met Site Search wel biedt. Sites die Solr willen inzetten zullen dus zelf kosten moeten maken voor hosting/beheer van deze zoekmachine.

Dus: Solr of Google Site Search?

Is het zoekvolume beperkt, en kunt u leven met het feit dat zelf weinig invloed heeft op de resultaten van een zoekvraag? Kies dan voor Google Site Search. Simpel, eenvoudig te implementeren, en bij kleine volumes aantrekkelijk geprijsd.

Handelt uw site zeer hoge zoekvolumes af, en wilt u een grote controle over zoekresultaten? Dan is Solr (en zeker Solr-as-a-Service) een uitstekend alternatief voor Google Site Search, en in veel gevallen aanzienlijk goedkoper. 



< Terug naar blogarchief

Vragen?

Wilt u dat wij u bellen? Dat kan!

Abonnementen

Blijf op de hoogte van onze producten en ontwikkelingen.

Neem contact met ons op

Science Park Eindhoven 5644
5692 EN Son

(040) 213 66 66