2. Agenda
Der Real Time Hype
Zugriff auf Real-Time-Informationen
Recherche
Fazit
1 | Dirk Lewandowski
3. Agenda
Der Real Time Hype
Zugriff auf Real-Time-Informationen
Recherche
Fazit
2 | Dirk Lewandowski
4. Der Real-Time-Hype
• Proteste im Iran 2009
• 19 Mrd. Suchanfragen/Monat in Twitter?
• Google: 88 Mrd.
• Yahoo: 9,4 Mrd.
• Bing: 4,1 Mrd.
• Herausforderungen für Suchmaschinen
• Zugriff auf die Inhalte der Real-Time-Dienste
• Nutzer auf den eigenen Suchseiten halten
• Aktueller Anlass
• Alle großen SM (GYM) haben in den letzten Monaten Real-Time-Lösungen
vorgestellt.
3 | Dirk Lewandowski
5. „Revolutionen der Geschwindigkeit“
Web News Blogs Real Time
• Jeweils eigene Indices, die im Ranking in der Universal Search
zusammengefasst werden.
• Jeder Index hat seine eigenen Aktualitätsprobleme.
4 | Dirk Lewandowski
8. Definition Real-Time-Informationen
Real Time Informationen sind Informationen, die über laufende Kannäle
verbreitet werden, im Moment ihrer Aktualisierung für Nutzer relevant werden
und deren Informationswert zeitkritisch ist.
1. Informationen sind schon kurz nach ihrer Erstellung über laufend aktualisierte Ticker
verfügbar.
2. Für Nutzer ist es bedeutend, diese Informationen sofort zur Kenntnis zu nehmen.
3. Die Informationen veralten (in der Regel) sehr schnell.
7 | Dirk Lewandowski
9. Agenda
Der Real Time Hype
Zugriff auf Real-Time-Informationen
Recherche
Fazit
8 | Dirk Lewandowski
10. Zugriff auf Real-Time-Informationen
• Direkter Abruf eines Feeds
• Vollständiger Feed eines Angebots wird angezeigt
• Suche beschränkt sich auf das Auffinden des geeigneten Feeds
• Abruf eines gefiltertenFeeds
• Gebündelt aufgrund von Nutzerpräferenzen (explizit oder implizit)
• Suche in Real-Time-Informationen mit Hilfe einer Suchmaschine
• Ad-Hoc-Recherche
• Ranking
• nach allgemeinen, für alle Nutzer gültigen Kriterien
• aufgrund des Nutzerprofils (bspw. Abgeleitet aus dem Kontaktnetzwerk)
9 | Dirk Lewandowski
11. Inhalte der Real-Time-Suche
• Statusmeldungen
• Explizite Statusmeldungen: Nutzer gibt etwas bekannt / schreibt eigenen Text
• Implizite Statusmeldungen: Meldung wird vom System aufgrund Aktivität generiert
10 | Dirk Lewandowski
12. Formen der Kommunikation in Real-Time-Diensten
• One-to-one
• Sender möchte einen Empfänger erreichen.
• Private Nachricht in Sozialen Netzwerken
• One-to-many
• Sender möchte viele Nutzer erreichen.
• Beschränkung des Adressatenkreises höchstens durch das System (alle Mitglieder
des gleichen Netzwerks können die Nachricht lesen)
• One-to-some
• Sender möchte eine bestimmte Zielgruppe erreichen.
• Beschränkt auf die Kontakte innerhalb eines Sozialen Netzwerks, i.d.R. Kontakte
ersten Grads
11 | Dirk Lewandowski
13. Rankingfaktoren für Real-Time-Inhalte
• Textstatistik
• Abgleich Suchanfrage – Dokument
• Gewichtung nach „Volltext“, Hashtag
• Aufgrund der Kürze von Statusmeldungen weitergehende Analyse kaum möglich.
• Popularität
• Popularität des Autors messen: Anzahl Kontakte/Follower
• Links auf die in der Vergangenheit von diesem Autor verfassten Nachrichten
• Für „Archivrecherchen“ auch Verlinkung
• Aktualität
• Lokalität
12 | Dirk Lewandowski
14. Agenda
Der Real Time Hype
Zugriff auf Real-Time-Informationen
Recherche
Fazit
13 | Dirk Lewandowski
15. Recherche nach Real-Time-Informationen
Arten von Real-Time-Suchmaschinen (Sullivan 2009)
1. Suchmaschinen für einen einzelnen Datenbestand
• Mehrwert liegt in der Verbesserung der Suchergebnisse
2. Suchmaschinen, die einen Datenbestand auf Basis der in RT-Diensten
geposteten Links aufbauen
• Alternativer Datenbestand zu den konventionellen Web-Suchmaschinen
3. Websites, die selbst einen Großteil der Inhalte des RT-Web erstellen
• Bsp. Facebook, Twitter
• Bieten eigene Suche an
Ergänzung
4. Allgemeine Web-Suchmaschinen, die Meldungen aus dem RT-Web in ihre
Ergebnisse integrieren.
14 | Dirk Lewandowski
16. Recherche direkt in den einzelnen Angeboten
1. Sinnvoll, wenn Inhalte nicht (oder nicht vollständig) an die Aggregatoren
weitergegeben werden.
2. Sinnvoll, wenn es um Vollständigkeit und „absolute Aktualität“ geht.
15 | Dirk Lewandowski
18. Recherche in Suchmaschinen, die ihren Bestand auf Basis von
Links in Statusmeldungen aufbauen
• Sinnvoll, wenn man eine alternative Sicht (auf das „aktuelle Web“) bekommen
möchte.
• Beispiel www.oneriot.com
17 | Dirk Lewandowski
20. Recherche in allgemeinen Web-Suchmaschinen
1. Sinnvoll, wenn primär Web-Inhalte gefunden werden sollen, eine Ergänzung um
Meldungen aus dem Real Time Web aber erwünscht ist.
2. Sinnvoll, wenn (auch) alte Meldungen gefunden werden sollen (echte
Archivsuche).
19 | Dirk Lewandowski
23. Agenda
Der Real Time Hype
Zugriff auf Real-Time-Informationen
Recherche
Fazit
22 | Dirk Lewandowski
24. Fazit
• Real-Time-Informationen sind eine gute Ergänzung
• vor allem bei gerade (sehr) aktuellen Themen
• zum Nachverfolgen von Diskussionen
• zur Trendbeobachtung
• Real-Time-Suchmaschinen stehen noch ganz am Anfang
• RT-Suche wird sich in den kommenden Monaten wesentlich verändern.
• Real-Time-Suchmaschinen decken nur einen Teil des RT-Web ab
• Lösung liegt eher in der Integration der Inhalte in der Universal Search als im
Aufbau möglichst vollständiger RT-Suchmaschinen.
23 | Dirk Lewandowski
25. Vielen Dank für Ihre
Aufmerksamkeit.
www.bui.haw-hamburg.de/lewandowski.html
Aktuelles Buch:
Handbuch Internet-Suchmaschinen
E-Mail:
dirk.lewandowski@haw-hamburg.de