|
|
|
»manage
it«
als
|
Vertikale SuchmaschinenEs muss nicht immer Google seinGoogle & Co. bekommen zunehmend Konkurrenz – das erwarten zumindest die Analysten des Marktforschungs- und Beratungsunternehmens Forrester Research. Auch wenn der Suchmaschinengigant Google derzeit mit 90 Prozent Marktanteil an der Spitze steht, liebäugeln viele Internetuser mit neuen Technologien, die exaktere Ergebnisse für ihre Suchanfragen liefern.
er glaubt, dass die Weiten des Web-Universums grenzenlos sind, irrt. Viele Wissenschaftler sind fest davon überzeugt, dass Universal-Suchmaschinen wie Google bald an ihre Grenzen stoßen. Denn das rasante Wachstum und die immer schneller stattfindenden Veränderungen der Inhalte stellen die Internet-Suchmaschinen vor immer neue Herausforderungen. So hat Prof. Dr.-Ing. Christoph Lindemann von der Universität Leipzig kürzlich in einer Web-Measurement-Studie zum deutschsprachigen Web entdeckt, dass inzwischen allein in der Top-Level-Domäne .de mehr als vier Millionen Domains mit Inhalten – das heißt Websites – online geschaltet sind. Darunter sind allerdings nur ein paar Hundert sehr populäre Domains mit hochwertigen redaktionell gepflegten Inhalten wie amazon.de, t-online.de, web.de oder das Gesundheitsportal netdoktor.de. Der Großteil dieser vier Millionen Domains ist dagegen den meisten Usern nicht geläufig und enthält veraltete und häufig auch automatisch erzeugte Inhalte. »Ich fand es sehr interessant«, sagt der Wissenschaftler, »dass es im deutschen Web Tausende unbekannter Websites gibt, die mehr als 100.000 Webdokumente umfassen und mehr als 100.000 eingehende Verweise besitzen.« Aufgrund dieser immer stärker werdenden Vermischung im Web von derartigem meist unnützem Content mit hochwertigen Inhalten werde es für allgemeine Internet-Suchmaschinen immer schwieriger, dem Nutzer die relevanten Informationen zu liefern. Als eine Lösung für dieses Problem forschen der Leipziger Wissenschaftler und sein Team an sogenannten Web-Data-Mining-Verfahren. Mit denen lassen sich Websites automatisch in vorgegebene Klassen unterteilen und automatisch bestimmte Informationen wie etwa Produktmarken extrahieren. Eine Fokussierung der Suchmaschinen auf bestimmte Themenbereiche hält Prof. Lindemann ebenfalls für eine pragmatische Lösung, um auch in Zukunft noch den Überblick im Web-Universum zu behalten. Das hat auch Google inzwischen erkannt und im englischsprachigen Raum den vertikalen Suchdienst »Google Scholar« eingerichtet. Über diesen kann man weltweit nach wissenschaftlichen Publikationen recherchieren. Suchmaschinen mit Tiefgang Vertikale Suchmaschinen bahnen auch den deutschen Internetusern schon heute einen Weg durch das Datendickicht. Sie listen Treffer zu einem begrenzten Themenfeld auf, das dafür aber sehr viel intensiver abgegrast wird. So gibt es zum Beispiel solche Angebote für medizinische Themen, Gesetzestexte, Urlaubsmöglichkeiten oder Immobilien. Darauf spezialisiert, alles zu finden, was zu einem eingetippten Namen passt, hat sich beispielsweise Yasni.de (www.yasni.de). Die Meta-Suchmaschine durchkämmt dazu soziale Netzwerke und Seiten wie Facebook, Xing, Wikipedia, Amazon und MySpace nach Informationen über deren Nutzer.
Yasni.de ist eine Meta-Suchmaschine für das Finden von Personen. »Knapp 30 Prozent der Suchanfragen im Internet sind personenbezogen«, weiß Firmengründer Steffen Rühl. Mit Yasni will er Transparenz geschaffen. »Wir helfen bei der Pflege des eigenen Rufs, denn viele Internetnutzer wissen gar nicht, was alles über sie im Netz steht«, so Rühl. Wer sich bei der Suchmaschine kostenlos registriert und ein Profil anlegt, kann darüber die angezeigten Ergebnisse auch beeinflussen und Fehltreffer entfernen. Gut sortierte Listen von ausgewählten Webseiten verspricht auch die Web-2.0-Suchmaschine WeFind, die seit November letzten Jahres unter www.wefind.de im Netz ist. Hier bekommt der Nutzer Ärzte, Hotels, Musik, Unternehmen und Treffer aus vielen weiteren Spezialgebieten aufgelistet. WeFind bestimmt dabei zunächst automatisch das »Themengebiet« der Suche und untergliedert die Menge der Treffer in sogenannte »Spezialgebiete«. Dafür durchsuchen und filtern die Nachrichten- und Blog-Suchmaschinen über tausend News-Portale und Blogs. Der Suchindex wird in einem fünfminütigen Rhythmus aktualisiert. Darüber hinaus kooperiert WeFind mit nationalen und internationalen Suchpartnern – so findet der Nutzer Bücher und weitere Produkte von Amazon, öffentliche Ausschreibungen vom Deutschen Auftragsdienst, Arztbewertungen von DocInsider, Unternehmensinformationen von Firmenwissen.de, Arbeitgeberbewertungen von Kununu, Musik von Last.fm, Gebrauchtwaren von Trade-A-Game, Micro-Blogs von Twitter, Webcams von webcams.travel und Nachrichten aus dem Archiv von Welt.de.
WeFind.de ist eine Web-2.0-Suchmaschine für spezielle Themengebiete.
Branchen-Know-how ist gefragt Auf qualifizierte Firmendaten aus 50 Branchen konzentriert sich das Dortmunder Softwarehaus cometrics mit seiner Firmensuchmaschine infometrics (www.infometrics.de). Deren Index enthält nach Angaben der Betreiber mehr als 20 Millionen automatisch klassifizierte Webseiten von deutschen Unternehmen. Interessierte Firmen können sich kostenlos bei infometrics eintragen, sofern sie bestimmte Kriterien erfüllen. Im Unterschied zu den herkömmlichen Suchmaschinen sind alle Trefferlisten mit digitalen Firmenprofilen der jeweiligen Unternehmen angereichert, die die kompletten Kontaktdaten wie Adresse, Telefon- oder Faxnummer enthalten. Viele dieser Profile bieten zudem zusätzliche Informationen über die von den jeweiligen Unternehmen angebotenen Produkte mit Links zu den entsprechenden Unternehmens-Webseiten. Haben Firmen mehrere Standorte, so sind diese ebenfalls in den erweiterten Profilen zu sehen. »Die hinterlegten Kontaktdaten werden regelmäßig automatisch mit Hilfe eines Web-Mining-Verfahrens mit den Informationen auf den Webseiten der Unternehmen abgeglichen und bei Bedarf aktualisiert«, erläutert Silvia Wallner von cometrics. Bei der Suche nach Produkten und Dienstleistungen – so die praktische Erfahrung – kommt der Nutzer so häufig schneller zum Ziel als mit Google & Co., weil er sich nicht erst durch zahlreiche Treffer von Wikipedia, Online-Redaktionen, Forschungseinrichtungen und vor allem Spam-Seiten hindurchklicken muss, bevor er zu den Seiten von passenden Anbietern gelangt. Lokale Suche nach Markenprodukten und Dienstleistungen Mit der neuen Funktion »lokale Suche« kann auf infometrics.de neuerdings auch gezielt nach einem Anbieter für ein bestimmtes Produkt oder Dienstleistung in einer bestimmten Stadt gefahndet werden. Benötigt man zum Beispiel einen Dienstleister für Eventkommunikation in Essen, werden in das Suchfenster einfach die Stichworte eventkommunikation essen oder statt der Ortsbezeichnung die Postleitzahl eingegeben und auf den Button »Suchen« geklickt. Sofort erscheinen auf dem Bildschirm zuerst Treffer von Firmen aus der Ruhrgebietsmetropole, auf deren Webseiten das Stichwort Eventkommunikation enthalten ist und danach eine Liste von Unternehmen aus anderen Städten, die diese Dienstleistung ebenfalls anbieten.
Infometrics ist ein vertikaler Suchdienst für den Geschäftsbereich.
Auch bei der Suche nach speziellen Markenprodukten wird der Anwender schneller fündig. Will er zum Beispiel einen Händler in Dortmund finden, der Markenbüromöbel vom Hersteller USM Haller im Angebot hat, muss er in das Suchfenster lediglich usm dortmund eingeben. Um die Trefferquote noch zu verbessern, lässt sich die Suche zusätzlich auf die Branchenkategorie »Handel – Büro- und Ladenmöbel« einschränken. Dadurch werden zuerst Händler aus Dortmund angezeigt, die die gesuchte Möbelmarke anbieten, und danach weitere Firmen aufgelistet, die sich in der Umgebung von Dortmund befinden. »Unsere Suchmaschinensoftware, die bei infometrics.de zum Einsatz kommt, kann auch zum Aufbau von vertikalen Suchdiensten für beliebig viele andere Themen wie Sport, Finanzen oder Gesundheit mit bis zu 100 Millionen Webdokumenten genutzt werden«, erklärt Silvia Wallner. Stolz ist sie auf die Leistungskennzahlen der Software, die im Dauerbetrieb mindestens 15 Suchanfragen pro Sekunde bearbeiten kann und eine sogenannte Crawler/Indexer-Performance von zwei Millionen Dokumenten pro Stunde aufweist. »Mit diesen Zahlen müssen wir uns auch vor den weltweit führenden Anbietern nicht verstecken«, ist die cometrics-Expertin überzeugt.
|