Zugang zum Dokument

Stein, Benno ; Potthast, Martin:

Hashing-basierte Indizierung: Anwendungsszenarien, Theorie und Methoden

Datei(en):

Download PDF 449kB  




Zitierfähiger Link: Bitte nutzen Sie diese URL, um auf das Dokument zu verlinken oder es zu zitieren:
http://nbn-resolving.de/urn:nbn:de:gbv:hil2-opus-672
URL: http://opus.bsz-bw.de/ubhi/volltexte/2011/67/
Originalveröffentlichung: Workshop Information Retrieval 2006 of the Special Interest Group Information Retrieval
Weitere beteiligte Personen (Hrsg. etc.): Althoff, Klaus-Dieter
Sonstige beteiligte Körperschaft bzw. Institution (Sponsor, Organisator etc.): Fakultät Medien, Mediensysteme Bauhaus-Universität Weimar
Institut: Informatik
Dokumentart: InProceedings (Aufsatz / Paper einer Konferenz etc.)
Sprache: Deutsch
Erstellungsjahr: 2006
Publikationsdatum: 06.05.2011
Kurze Inhaltszusammenfassung auf Englisch Hashing-basierte Indizierung ist eine mächtige Technologie für die Ähnlichkeitssuche in großen Dokumentkollektionen [Stein 2005]. Sie basiert auf der Idee, Hashkollisionen als Ähnlichkeitsindikator aufzufassen – vorausgesetzt, dass eine entsprechend konstruierte Hashfunktion vorliegt. In diesem Papier wird erörtert, unter welchen Voraussetzungen grundlegende Retrieval- Aufgaben von dieser neuen Technologie profitieren können. Weiterhin werden zwei aktuelle, hashing-basierte Indizierungsansätze präsentiert und die mit ihnen erzielbaren Verbesserungen bei der Lösung realer Retrieval-Aufgaben verglichen. Eine Analyse dieser Art ist neu; sie zeigt das enorme Potenzial maßgeschneiderter hashing-basierter Indizierungsmethoden wie zum Beispiel dem Fuzzy- Fingerprinting.
DDC-Sachgruppe: Informatik
Lizenz: Veröffentlichungsvertrag