SlideShare une entreprise Scribd logo
1  sur  31
Télécharger pour lire hors ligne
cominvent as
Enterprise Search Experts




   Open Source & Apache Lucene/Solr
                  Frokostseminar Oslo 5. mai 2010


                                               © FINDWISE, COMINVENT 2010
Cominvent AS: Jan Høydahl

                          ●   IT architect, 15 years with
                              search, telecom, mobile
                          ●   Helped build FAST's Global
                              Services as first engineer
                          ●   Founder of Cominvent AS
                          ●   Search consultant 10 years
                          ●   Certified Solr instructor




cominvent as
Cominvent AS: Consulting

    – Cominvent delivers independent search consulting
    – Focus on Apache Lucene/Solr & Microsoft FAST ESP

    – Idea – architecture – implementation




cominvent as
Cominvent AS: Commercial Support

    – When community & mailing list support is not enough..
    – Paid support agreement for Apache Solr/Lucene
    – In cooperation with Lucid Imagination

    – Read more: http://www.cominvent.com/support/




cominvent as
Cominvent AS: Training

    – Cominvent AS delivers training public and on-site
    – Certified Solr Training Partner for Lucid Imagination
    – Certified FAST ESP Training Partner

    – Read more: http://www.cominvent.com/training/




cominvent as
                                                       Photo: fluidpowerzone.com
Solr kurs




cominvent as
Hva er Open Source?
«Åpen Kildekode betyr at kildekoden tl et dataprogram er gjort tlgjengelig
(ofe på Internet) for alle.» (Wikipedia)


Fri programvare er programvare som gir mer frihet, eierskap og feksibilitet.
Det er ingen som dikterer hva man kan gjøre eller hvilken leverandør som må
benytes. Man kan gjøre endringer i programvaren eter eget ønske, og man
kan dele programvaren med andre, om ønskelig.
Fri programvare er ikke nødvendigvis grats for bedrifer og organisasjoner.
Selv om lisensen ikke koster penger, kommer allikevel levetdskostnader.
(friprog.no)
De mest kjente...
Funker det for «seriøse» bedrifter?
Årsaker tl at noen er motvillige tl åpen kildekode:


Hvordan kan vi vite at kvaliteten er god?
Hvem ringer vi ved problemer?
Hva med sikkerheten?
Usikkerhet rundt fremtd og oppdateringer
Forstår ikke modellen
Policy
FUD
Hvorfor Fri Programvare?
Open Source tar markedsandeler
Open Source Sofware vinner markedsandeler hvert år.
Fra 13% i 2007 tl 27% i 2010




                                   2010

                                                      Kilde: Gartner
Hvorfor går folk over til Open Source
Hvor viktg var reduksjonen i kostnader når du valgte Open Source?




                                                          Kilde: The 451 Group
Hvorfor forblir folk ved Open Source?
Eter å ha gjort overgangen tl åpen kildekode, hva var den største gevinsten?




                                                                                         Kilde: The 451 Group



        Fra Forrester/Unisys:
        • 62% view open source sof ware as capable of delivering signif cant business payback
                                 t                                    i
        • 80% viewed factors other than cost such as open standards support, use of code, and avoiding lock-in
        • 58% of IT execs reported that they now use Open Source for mission-crit cal applicat ons
                                                                                i            i
Hvordan utvikles Open Source?
Kildekoden er tlgjengelig for alle fra SCM
Brukere og utviklere danner et fellesskap
Alle kan bidra med kodeforbedringer, feilrapporter, dokumentasjon etc
En kjerne av utviklere, ofe betalt av bedrifer som bruker produktet
Virtuell utviklerorganisasjon


Eksempel:
En bruker fnner en feil og reter den samme dag. Feilfksen sendes tlbake tl
fellesskapet og blir umiddelbart tlgjengelig for andre.
Med lukket programvare tar det ofe uker eller måneder før en feil retes.
Om Apache Software Foundation
•Startet i Juni 1999, ut fra Apache Web Server
•Ideell organisasjon/stfelse
•Ca 60 toppnivå-prosjekter med fere underprosjekter
•Tekniske eksperter leder hvert prosjekt
•Apache-lisensen er meget liberal og business-vennlig
 - I praksis kan du gjøre hva du vil med programvaren
Apache Lucene
•Programvarebibliotek for søk, skrevet i Java
•Ble et Apache-prosjekt i September 2001
•Den mest utbredte indeks-motoren på markedet
•Finnes innebygget i mange andre tjenester og programmer
•Powered by Lucene:
Apache Lucene
Apache Nutch
•Også fra Apache Foundaton
•Web-søkemotor
•Bygger på Lucene
•Spesialisert på å crawle og prosessere HTML + andre formater
•Bygget for å skalere tl milliarder av dokumenter
•Kan kombineres med Solr
Apache Tika
•Bibliotek for å ekstrahere tekst fra rike dokumentormater
•Støte for mange formater:
PDF, Word, Excel, PowerPoint, Open Document – ODT, ODS, ODP, RTF
•Kan også ekstrahere data fra rik media
GIF, JPG, MP3, MOV...
•Utvides stadig med støte for nye formater
•Savner du et format? Enkelt rammeverk for å plugge inn egne parsere.


•Tika er integrert i bl.a. Nutch og Solr
Apache Mahout
•Avansert samling skalerbare maskinlærings-biblioteker
•Bruker Hadoop Map/Reduce
•Apache-prosjekt siden 2008
•Eksempel på bruk
    •Recommendatons
    •Clustering
    •Automatsk klassifsering
    •++
•Antas å integreres i Lucene/Solr i fremtden
OpenPipeline

• Generisk prosesseringsmodul for søkemotorer
• Laget av Dieselpoint Inc.
• Ble gjort Open Source i 2008
• Skrevet som en Java web-applikasjon
• Tilbyr crawling- og avansert dokument-prosessering
• Let å integrere med mange ulike søkemotorer
Apache Solr
●
    Søke-server basert på Lucene
●
    Gjør det enkelt å legge tl søk på sin tjeneste/applikasjon
●
    Krever ingen programmering – alt er XML/HTTP og åpne APIer
●
    Utviklet av CNET Networks i 2004
●
    Kildekoden donert tl Apache i 2006
●
    Versjon 1.4 ble utgit november 2009
●
    Brukes av store bedrifer verden over
Funksjonalitet
• Rikt spørrespråk med bl.a.
    • Boolske operatorer AND, OR, NOT
    • Fuzzy søk og fonetsk søk
    • Sortering i fere nivåer
• Nær sanntds indeksering av
 strukturerte og ustrukturerte data
• Faset-navigering
• Avansert kontroll over relevans
• Did you mean stavekontroll
• GEO-søk
• Clustering
• Sikkerhet
Bruksområder
Snakker med alle plattformer




                             XML/HTTP




5
Data inn i søkemotoren
Eksempel med XML input
Data ut (spørring)

http://localhost:8080/solr/select?q=car&fl=id,title
Eller med en litt penere presentasion...
Eksempel på en installasjon m/feiltoleranse
Arkitektur




0
Thank You




               www.cominvent.com




               jh@cominvent.com




               www.twitter.com/cominvent

cominvent as

Contenu connexe

En vedette

20090403 移動体ライブトラッキングのすすめ
20090403 移動体ライブトラッキングのすすめ20090403 移動体ライブトラッキングのすすめ
20090403 移動体ライブトラッキングのすすめshinagaki
 
Badanie procesu zakupowego w sklepach internetowych
Badanie procesu zakupowego w sklepach internetowychBadanie procesu zakupowego w sklepach internetowych
Badanie procesu zakupowego w sklepach internetowychSławomir Stańczuk
 
Portfolio
PortfolioPortfolio
Portfoliopakulek
 
#Mrec September 24 2013 Keynote
#Mrec September 24 2013 Keynote #Mrec September 24 2013 Keynote
#Mrec September 24 2013 Keynote Rob Humphrey
 
2009 First Time Homebuyer Tax Credit
2009 First Time Homebuyer Tax Credit2009 First Time Homebuyer Tax Credit
2009 First Time Homebuyer Tax Creditwrtoff
 
EL CIRUJANO-DENTISTA PERUANO Y SU FALTA DE FORMACIÓN GREMIAL
EL CIRUJANO-DENTISTA PERUANO Y SU FALTA DE FORMACIÓN GREMIALEL CIRUJANO-DENTISTA PERUANO Y SU FALTA DE FORMACIÓN GREMIAL
EL CIRUJANO-DENTISTA PERUANO Y SU FALTA DE FORMACIÓN GREMIALRicardo Benza
 
Rob Humphrey North Carolina State University [Student Talk]
Rob Humphrey North Carolina State University [Student Talk]Rob Humphrey North Carolina State University [Student Talk]
Rob Humphrey North Carolina State University [Student Talk]Rob Humphrey
 
WSCSS Fall In-Service Keynote Ellen Siminoff
WSCSS Fall In-Service Keynote Ellen SiminoffWSCSS Fall In-Service Keynote Ellen Siminoff
WSCSS Fall In-Service Keynote Ellen SiminoffShmoop
 
Fun Things About Tundra Hofmeyer
Fun Things About Tundra HofmeyerFun Things About Tundra Hofmeyer
Fun Things About Tundra HofmeyerMichelle McGinnis
 
APSU Drupal Training Personal
APSU Drupal Training PersonalAPSU Drupal Training Personal
APSU Drupal Training PersonalMark Jarrell
 

En vedette (15)

20090403 移動体ライブトラッキングのすすめ
20090403 移動体ライブトラッキングのすすめ20090403 移動体ライブトラッキングのすすめ
20090403 移動体ライブトラッキングのすすめ
 
Ckv[1]
Ckv[1]Ckv[1]
Ckv[1]
 
Badanie procesu zakupowego w sklepach internetowych
Badanie procesu zakupowego w sklepach internetowychBadanie procesu zakupowego w sklepach internetowych
Badanie procesu zakupowego w sklepach internetowych
 
Portfolio
PortfolioPortfolio
Portfolio
 
Etruscan Art
Etruscan ArtEtruscan Art
Etruscan Art
 
#Mrec September 24 2013 Keynote
#Mrec September 24 2013 Keynote #Mrec September 24 2013 Keynote
#Mrec September 24 2013 Keynote
 
2009 First Time Homebuyer Tax Credit
2009 First Time Homebuyer Tax Credit2009 First Time Homebuyer Tax Credit
2009 First Time Homebuyer Tax Credit
 
EL CIRUJANO-DENTISTA PERUANO Y SU FALTA DE FORMACIÓN GREMIAL
EL CIRUJANO-DENTISTA PERUANO Y SU FALTA DE FORMACIÓN GREMIALEL CIRUJANO-DENTISTA PERUANO Y SU FALTA DE FORMACIÓN GREMIAL
EL CIRUJANO-DENTISTA PERUANO Y SU FALTA DE FORMACIÓN GREMIAL
 
Rob Humphrey North Carolina State University [Student Talk]
Rob Humphrey North Carolina State University [Student Talk]Rob Humphrey North Carolina State University [Student Talk]
Rob Humphrey North Carolina State University [Student Talk]
 
WSCSS Fall In-Service Keynote Ellen Siminoff
WSCSS Fall In-Service Keynote Ellen SiminoffWSCSS Fall In-Service Keynote Ellen Siminoff
WSCSS Fall In-Service Keynote Ellen Siminoff
 
The Tundra Projectperry
The Tundra ProjectperryThe Tundra Projectperry
The Tundra Projectperry
 
Fun Things About Tundra Hofmeyer
Fun Things About Tundra HofmeyerFun Things About Tundra Hofmeyer
Fun Things About Tundra Hofmeyer
 
Drama
DramaDrama
Drama
 
APSU Drupal Training Personal
APSU Drupal Training PersonalAPSU Drupal Training Personal
APSU Drupal Training Personal
 
Cartilla u1
Cartilla u1Cartilla u1
Cartilla u1
 

Similaire à Frokostseminar mai 2010 solr open source cominvent as

Hva er fri programvare
Hva er fri programvareHva er fri programvare
Hva er fri programvareLibriotech
 
GoOpen 2010: Espen Dalløkken
GoOpen 2010: Espen DalløkkenGoOpen 2010: Espen Dalløkken
GoOpen 2010: Espen DalløkkenFriprogsenteret
 
En guide igjennom tåkeheimen
En guide igjennom tåkeheimenEn guide igjennom tåkeheimen
En guide igjennom tåkeheimenmudnaes
 
Hva er fri programvare? (2011)
Hva er fri programvare? (2011)Hva er fri programvare? (2011)
Hva er fri programvare? (2011)Libriotech
 
GoOpen 2010: Jan Christensen
GoOpen 2010: Jan ChristensenGoOpen 2010: Jan Christensen
GoOpen 2010: Jan ChristensenFriprogsenteret
 
Progressive web applications i praksis
Progressive web applications i praksisProgressive web applications i praksis
Progressive web applications i praksisHåvard Wigtil
 
GoOpen 2010: Paul Skrede
GoOpen 2010: Paul SkredeGoOpen 2010: Paul Skrede
GoOpen 2010: Paul SkredeFriprogsenteret
 
Aud Marie Hauge, Epinova: Innledning til universell utforming på web
Aud Marie Hauge, Epinova: Innledning til universell utforming på webAud Marie Hauge, Epinova: Innledning til universell utforming på web
Aud Marie Hauge, Epinova: Innledning til universell utforming på webDag Tjemsland
 
GoOpen 2010: Jorgen Wahlberg
GoOpen 2010: Jorgen WahlbergGoOpen 2010: Jorgen Wahlberg
GoOpen 2010: Jorgen WahlbergFriprogsenteret
 
Fri Programvare Og Morgendagens LøSninger Software11feb
Fri Programvare Og Morgendagens LøSninger Software11febFri Programvare Og Morgendagens LøSninger Software11feb
Fri Programvare Og Morgendagens LøSninger Software11febEspen Sjøvoll
 
Webdagene2007 Christian Johansen Webutvikling
Webdagene2007 Christian Johansen WebutviklingWebdagene2007 Christian Johansen Webutvikling
Webdagene2007 Christian Johansen WebutviklingAnette Urhamar
 
Core trek 2015
Core trek 2015Core trek 2015
Core trek 2015CoreTrek
 
Universell utforming av digitale løsninger
Universell utforming av digitale løsningerUniversell utforming av digitale løsninger
Universell utforming av digitale løsningerMetronet
 
Rules engine vs. domain logic - JavaZone 2009
Rules engine vs. domain logic - JavaZone 2009Rules engine vs. domain logic - JavaZone 2009
Rules engine vs. domain logic - JavaZone 2009Anders Sveen
 
Tips og triks for bedre brukeropplevelser
Tips og triks for bedre brukeropplevelserTips og triks for bedre brukeropplevelser
Tips og triks for bedre brukeropplevelserVegard Johansen
 
Gode brukeropplevelser for web redaktør og sluttbruker
Gode brukeropplevelser for web redaktør og sluttbrukerGode brukeropplevelser for web redaktør og sluttbruker
Gode brukeropplevelser for web redaktør og sluttbrukerNina Taraldsen
 

Similaire à Frokostseminar mai 2010 solr open source cominvent as (20)

Hva er fri programvare
Hva er fri programvareHva er fri programvare
Hva er fri programvare
 
GoOpen 2010: Espen Dalløkken
GoOpen 2010: Espen DalløkkenGoOpen 2010: Espen Dalløkken
GoOpen 2010: Espen Dalløkken
 
En guide igjennom tåkeheimen
En guide igjennom tåkeheimenEn guide igjennom tåkeheimen
En guide igjennom tåkeheimen
 
Hva er fri programvare? (2011)
Hva er fri programvare? (2011)Hva er fri programvare? (2011)
Hva er fri programvare? (2011)
 
GoOpen 2010: Jan Christensen
GoOpen 2010: Jan ChristensenGoOpen 2010: Jan Christensen
GoOpen 2010: Jan Christensen
 
Progressive web applications i praksis
Progressive web applications i praksisProgressive web applications i praksis
Progressive web applications i praksis
 
Aws på kartet - 2
Aws på kartet - 2Aws på kartet - 2
Aws på kartet - 2
 
GoOpen 2010: Paul Skrede
GoOpen 2010: Paul SkredeGoOpen 2010: Paul Skrede
GoOpen 2010: Paul Skrede
 
Aud Marie Hauge, Epinova: Innledning til universell utforming på web
Aud Marie Hauge, Epinova: Innledning til universell utforming på webAud Marie Hauge, Epinova: Innledning til universell utforming på web
Aud Marie Hauge, Epinova: Innledning til universell utforming på web
 
GoOpen 2010: Jorgen Wahlberg
GoOpen 2010: Jorgen WahlbergGoOpen 2010: Jorgen Wahlberg
GoOpen 2010: Jorgen Wahlberg
 
Fri Programvare Og Morgendagens LøSninger Software11feb
Fri Programvare Og Morgendagens LøSninger Software11febFri Programvare Og Morgendagens LøSninger Software11feb
Fri Programvare Og Morgendagens LøSninger Software11feb
 
Fri Programvare for web
Fri Programvare for webFri Programvare for web
Fri Programvare for web
 
Webdagene2007 Christian Johansen Webutvikling
Webdagene2007 Christian Johansen WebutviklingWebdagene2007 Christian Johansen Webutvikling
Webdagene2007 Christian Johansen Webutvikling
 
Apps
AppsApps
Apps
 
Core trek 2015
Core trek 2015Core trek 2015
Core trek 2015
 
Devops eller dø!
Devops eller dø!Devops eller dø!
Devops eller dø!
 
Universell utforming av digitale løsninger
Universell utforming av digitale løsningerUniversell utforming av digitale løsninger
Universell utforming av digitale løsninger
 
Rules engine vs. domain logic - JavaZone 2009
Rules engine vs. domain logic - JavaZone 2009Rules engine vs. domain logic - JavaZone 2009
Rules engine vs. domain logic - JavaZone 2009
 
Tips og triks for bedre brukeropplevelser
Tips og triks for bedre brukeropplevelserTips og triks for bedre brukeropplevelser
Tips og triks for bedre brukeropplevelser
 
Gode brukeropplevelser for web redaktør og sluttbruker
Gode brukeropplevelser for web redaktør og sluttbrukerGode brukeropplevelser for web redaktør og sluttbruker
Gode brukeropplevelser for web redaktør og sluttbruker
 

Plus de Cominvent AS

Solr's missing plugin ecosystem
Solr's missing plugin ecosystemSolr's missing plugin ecosystem
Solr's missing plugin ecosystemCominvent AS
 
Scaling search with Solr Cloud
Scaling search with Solr CloudScaling search with Solr Cloud
Scaling search with Solr CloudCominvent AS
 
Oslo Solr MeetUp March 2012 - Solr4 alpha
Oslo Solr MeetUp March 2012 - Solr4 alphaOslo Solr MeetUp March 2012 - Solr4 alpha
Oslo Solr MeetUp March 2012 - Solr4 alphaCominvent AS
 
Improving the Solr Update Chain
Improving the Solr Update ChainImproving the Solr Update Chain
Improving the Solr Update ChainCominvent AS
 
First oslo solr community meetup lightning talk janhoy
First oslo solr community meetup lightning talk janhoyFirst oslo solr community meetup lightning talk janhoy
First oslo solr community meetup lightning talk janhoyCominvent AS
 
Dagens Næringslivs overgang til Lucene/Solr søk
Dagens Næringslivs overgang til Lucene/Solr søkDagens Næringslivs overgang til Lucene/Solr søk
Dagens Næringslivs overgang til Lucene/Solr søkCominvent AS
 
Key topics when migrating from FAST to Solr, EuroCon 2010
Key topics when migrating from FAST to Solr, EuroCon 2010Key topics when migrating from FAST to Solr, EuroCon 2010
Key topics when migrating from FAST to Solr, EuroCon 2010Cominvent AS
 
Oslo Enterprise MeetUp May 12th 2010 - Jan Høydahl
Oslo Enterprise MeetUp May 12th 2010 - Jan HøydahlOslo Enterprise MeetUp May 12th 2010 - Jan Høydahl
Oslo Enterprise MeetUp May 12th 2010 - Jan HøydahlCominvent AS
 
Open source breakfast norge findwise
Open source breakfast norge findwiseOpen source breakfast norge findwise
Open source breakfast norge findwiseCominvent AS
 
Migrating Fast to Solr
Migrating Fast to SolrMigrating Fast to Solr
Migrating Fast to SolrCominvent AS
 
Cominvent AS company Presentation
Cominvent AS company PresentationCominvent AS company Presentation
Cominvent AS company PresentationCominvent AS
 

Plus de Cominvent AS (11)

Solr's missing plugin ecosystem
Solr's missing plugin ecosystemSolr's missing plugin ecosystem
Solr's missing plugin ecosystem
 
Scaling search with Solr Cloud
Scaling search with Solr CloudScaling search with Solr Cloud
Scaling search with Solr Cloud
 
Oslo Solr MeetUp March 2012 - Solr4 alpha
Oslo Solr MeetUp March 2012 - Solr4 alphaOslo Solr MeetUp March 2012 - Solr4 alpha
Oslo Solr MeetUp March 2012 - Solr4 alpha
 
Improving the Solr Update Chain
Improving the Solr Update ChainImproving the Solr Update Chain
Improving the Solr Update Chain
 
First oslo solr community meetup lightning talk janhoy
First oslo solr community meetup lightning talk janhoyFirst oslo solr community meetup lightning talk janhoy
First oslo solr community meetup lightning talk janhoy
 
Dagens Næringslivs overgang til Lucene/Solr søk
Dagens Næringslivs overgang til Lucene/Solr søkDagens Næringslivs overgang til Lucene/Solr søk
Dagens Næringslivs overgang til Lucene/Solr søk
 
Key topics when migrating from FAST to Solr, EuroCon 2010
Key topics when migrating from FAST to Solr, EuroCon 2010Key topics when migrating from FAST to Solr, EuroCon 2010
Key topics when migrating from FAST to Solr, EuroCon 2010
 
Oslo Enterprise MeetUp May 12th 2010 - Jan Høydahl
Oslo Enterprise MeetUp May 12th 2010 - Jan HøydahlOslo Enterprise MeetUp May 12th 2010 - Jan Høydahl
Oslo Enterprise MeetUp May 12th 2010 - Jan Høydahl
 
Open source breakfast norge findwise
Open source breakfast norge findwiseOpen source breakfast norge findwise
Open source breakfast norge findwise
 
Migrating Fast to Solr
Migrating Fast to SolrMigrating Fast to Solr
Migrating Fast to Solr
 
Cominvent AS company Presentation
Cominvent AS company PresentationCominvent AS company Presentation
Cominvent AS company Presentation
 

Frokostseminar mai 2010 solr open source cominvent as

  • 1. cominvent as Enterprise Search Experts Open Source & Apache Lucene/Solr Frokostseminar Oslo 5. mai 2010 © FINDWISE, COMINVENT 2010
  • 2. Cominvent AS: Jan Høydahl ● IT architect, 15 years with search, telecom, mobile ● Helped build FAST's Global Services as first engineer ● Founder of Cominvent AS ● Search consultant 10 years ● Certified Solr instructor cominvent as
  • 3. Cominvent AS: Consulting – Cominvent delivers independent search consulting – Focus on Apache Lucene/Solr & Microsoft FAST ESP – Idea – architecture – implementation cominvent as
  • 4. Cominvent AS: Commercial Support – When community & mailing list support is not enough.. – Paid support agreement for Apache Solr/Lucene – In cooperation with Lucid Imagination – Read more: http://www.cominvent.com/support/ cominvent as
  • 5. Cominvent AS: Training – Cominvent AS delivers training public and on-site – Certified Solr Training Partner for Lucid Imagination – Certified FAST ESP Training Partner – Read more: http://www.cominvent.com/training/ cominvent as Photo: fluidpowerzone.com
  • 7. Hva er Open Source? «Åpen Kildekode betyr at kildekoden tl et dataprogram er gjort tlgjengelig (ofe på Internet) for alle.» (Wikipedia) Fri programvare er programvare som gir mer frihet, eierskap og feksibilitet. Det er ingen som dikterer hva man kan gjøre eller hvilken leverandør som må benytes. Man kan gjøre endringer i programvaren eter eget ønske, og man kan dele programvaren med andre, om ønskelig. Fri programvare er ikke nødvendigvis grats for bedrifer og organisasjoner. Selv om lisensen ikke koster penger, kommer allikevel levetdskostnader. (friprog.no)
  • 9. Funker det for «seriøse» bedrifter? Årsaker tl at noen er motvillige tl åpen kildekode: Hvordan kan vi vite at kvaliteten er god? Hvem ringer vi ved problemer? Hva med sikkerheten? Usikkerhet rundt fremtd og oppdateringer Forstår ikke modellen Policy FUD
  • 11. Open Source tar markedsandeler Open Source Sofware vinner markedsandeler hvert år. Fra 13% i 2007 tl 27% i 2010 2010 Kilde: Gartner
  • 12. Hvorfor går folk over til Open Source Hvor viktg var reduksjonen i kostnader når du valgte Open Source? Kilde: The 451 Group
  • 13. Hvorfor forblir folk ved Open Source? Eter å ha gjort overgangen tl åpen kildekode, hva var den største gevinsten? Kilde: The 451 Group Fra Forrester/Unisys: • 62% view open source sof ware as capable of delivering signif cant business payback t i • 80% viewed factors other than cost such as open standards support, use of code, and avoiding lock-in • 58% of IT execs reported that they now use Open Source for mission-crit cal applicat ons i i
  • 14. Hvordan utvikles Open Source? Kildekoden er tlgjengelig for alle fra SCM Brukere og utviklere danner et fellesskap Alle kan bidra med kodeforbedringer, feilrapporter, dokumentasjon etc En kjerne av utviklere, ofe betalt av bedrifer som bruker produktet Virtuell utviklerorganisasjon Eksempel: En bruker fnner en feil og reter den samme dag. Feilfksen sendes tlbake tl fellesskapet og blir umiddelbart tlgjengelig for andre. Med lukket programvare tar det ofe uker eller måneder før en feil retes.
  • 15. Om Apache Software Foundation •Startet i Juni 1999, ut fra Apache Web Server •Ideell organisasjon/stfelse •Ca 60 toppnivå-prosjekter med fere underprosjekter •Tekniske eksperter leder hvert prosjekt •Apache-lisensen er meget liberal og business-vennlig - I praksis kan du gjøre hva du vil med programvaren
  • 16. Apache Lucene •Programvarebibliotek for søk, skrevet i Java •Ble et Apache-prosjekt i September 2001 •Den mest utbredte indeks-motoren på markedet •Finnes innebygget i mange andre tjenester og programmer •Powered by Lucene:
  • 18. Apache Nutch •Også fra Apache Foundaton •Web-søkemotor •Bygger på Lucene •Spesialisert på å crawle og prosessere HTML + andre formater •Bygget for å skalere tl milliarder av dokumenter •Kan kombineres med Solr
  • 19. Apache Tika •Bibliotek for å ekstrahere tekst fra rike dokumentormater •Støte for mange formater: PDF, Word, Excel, PowerPoint, Open Document – ODT, ODS, ODP, RTF •Kan også ekstrahere data fra rik media GIF, JPG, MP3, MOV... •Utvides stadig med støte for nye formater •Savner du et format? Enkelt rammeverk for å plugge inn egne parsere. •Tika er integrert i bl.a. Nutch og Solr
  • 20. Apache Mahout •Avansert samling skalerbare maskinlærings-biblioteker •Bruker Hadoop Map/Reduce •Apache-prosjekt siden 2008 •Eksempel på bruk •Recommendatons •Clustering •Automatsk klassifsering •++ •Antas å integreres i Lucene/Solr i fremtden
  • 21. OpenPipeline • Generisk prosesseringsmodul for søkemotorer • Laget av Dieselpoint Inc. • Ble gjort Open Source i 2008 • Skrevet som en Java web-applikasjon • Tilbyr crawling- og avansert dokument-prosessering • Let å integrere med mange ulike søkemotorer
  • 22. Apache Solr ● Søke-server basert på Lucene ● Gjør det enkelt å legge tl søk på sin tjeneste/applikasjon ● Krever ingen programmering – alt er XML/HTTP og åpne APIer ● Utviklet av CNET Networks i 2004 ● Kildekoden donert tl Apache i 2006 ● Versjon 1.4 ble utgit november 2009 ● Brukes av store bedrifer verden over
  • 23. Funksjonalitet • Rikt spørrespråk med bl.a. • Boolske operatorer AND, OR, NOT • Fuzzy søk og fonetsk søk • Sortering i fere nivåer • Nær sanntds indeksering av strukturerte og ustrukturerte data • Faset-navigering • Avansert kontroll over relevans • Did you mean stavekontroll • GEO-søk • Clustering • Sikkerhet
  • 25. Snakker med alle plattformer XML/HTTP 5
  • 26. Data inn i søkemotoren Eksempel med XML input
  • 28. Eller med en litt penere presentasion...
  • 29. Eksempel på en installasjon m/feiltoleranse
  • 31. Thank You www.cominvent.com jh@cominvent.com www.twitter.com/cominvent cominvent as