Metacrawler - Software und Technik
Die Basis
Die Suche startet
Die Analyse der Ergebnisse
Auf dieser Seite möchten wir Ihnen (ohne allzu große Geheimnisse zu verraten :-)) die technischen Details unseres Metacrawlers vorstellen (insbesondere die Algorithmen zur Gewichtung von Suchergebnissen). Für Fragen, Anmerkungen und Kritik steht Ihnen unser Forum zur Verfügung:
Die Basis
-
Derzeit läuft nettz.de auf Standard Linux-Systemen mit leicht modifiziertem Kernel. Als 2. Spiegelserver dient zwischenzeitlich ein BSDi-Server. Als Hardware kommen div. CPUs von 2,4 MHz bis 3,2 GHz (1024-2048MB RAM) zur Anwendung. Vom System bereitgestellte Software umfasst die Programmiersprache Perl (in der Version 5.6.0) und einen Standard-Compiler (cc).
Die Suche startet
-
Wenn Sie Suchbegriffe in das Suchfeld (und ggf. Tabu-Worte) eingegeben haben und den Button "Suchanfrage starten" gedrückt haben, beginnt unser Metacrawler mit seiner Arbeit.
- Zunächst bereit er Ihre Suche passend für jede Suchmaschine auf, die ja alle eine jeweils andere Syntax und Optionen haben.
- Danach schickt er diese überarbeitete Suchanfrage an den Suchanbieter.
- Wenn die Antwort einer Suchmaschine zurückgeliefert wird, filtert nettz.de die Ergebnisse aus dem sonstigen Text und speichert diese.
- Alle diese Vorgänge laufen bis hier strikt parallel, nettz.de startet alle Anfragen zur gleichen Zeit und kann auch mehrere Antworten gleichzeitig verarbeiten.
- Sind die Antworten von allen Suchmaschinen eingetroffen, startet nettz.de mit der Analyse der Daten und sortiert dabei alle Ergebnisse nach ihrer jeweiligen Relevanz. Mehr Informationen zur Analyse finden Sie unten.
- Die Ergebnisse werden gem. der gewünschten Sortierung aufgelistet.
- Unter den Ergebnissen wird Ihnen noch ein Menü angezeigt, mit dem Sie Ihre Suche entweder direkt bei den jeweiligen Suchmaschinen oder in einer anderen nettz.de-Rubrik fortsetzen können (One-Click Bedienung).
Die Analyse der Ergebnisse
-
Unser Metacrawler hat einige Algorithmen eingebaut, mit deren Hilfe er versucht, für Sie wichtige Ergebnisse zu erkennen und Ihnen anzuzeigen. Wir möchten Ihnen nachfolgend kurz vorstellen, worauf unser Metacrawler bei den Ergebnissen achtet und was er bewertet. Folgende Liste soll Ihnen zeigen, wie unsere Software ein einzelnes Suchergebnis prüft:
- Befindet sich der Suchbegriff in der URL? Wenn Ja:
- Findet sich der Suchbegriff speziell im Domainnamen? Wenn Ja:
- Besteht der Domainname (außer Extension) nur aus dem Suchbegriff? Oder:
- Steht der Suchbegriff am Anfang? Oder:
- Steht der Suchbegriff am Ende? Oder:
- Steht der Suchbegriff mittendrin?
- Findet sich der Suchbegriff im URL (außer im Domainnamen?)?
- Findet sich der Suchbegriff speziell im Domainnamen? Wenn Ja:
- Welche Extension hat die Ziel-Adresse (DE-Adressen zählen z. B. bei einer D-Suche mehr als ausländische Domains)?
- Findet sich der Suchbegriff im Titel? Wenn Ja:
- Besteht der Titel nur aus dem Suchbegriff? Oder:
- Steht der Suchbegriff am Anfang? Oder:
- Steht der Suchbegriff am Ende? Oder:
- Steht der Suchbegriff mittendrin?
- Findet sich der Suchbegriff in der Beschreibung? Wenn Ja:
- Kommt der Suchbegriff zu häufig vor?
- Existieren aktuelle Nachrichten zum Suchbegriff?
- Existieren Übereinstimmungen mit dem Wikipedia Lexikon?
- Die Position des Ergebnis bei der jeweiligen Suchmaschine (meist Platz 1 bis 10)
- Mehrfach-Nennung in mehreren Suchmaschinen
- Aktualität der Seite
Wenn Sie mehrere Suchbegriffe angeben, wird diese Analyse mehrmals durchgeführt. Neben dem reinen Wortvergleich dann auch mit Direktvergleich als Phrase bzw. als Phrase mit Füllwörtern.
Zusätzlich zu beachten ist, das die Reihenfolge Ihrer Suchbegriffe wichtig ist. So bringt eine Suche nach "dänemark ferienhaus strand" andere Ergebnisse als "strand ferienhaus dänemark" (fallende Wichtung).
Zusätzliche Wichtungspunkte kann ein Ergebniss durch folgende Kriterien erhalten:
Falls Sie Fragen zu einzelnen Punkten haben oder der Meinung sind, wir sollten z. B. unsere Wichtungskriterien erweitern bzw. anders einstellen, würden wir uns über Ihre Nachricht sehr freuen!
| Vorheriges Thema | Navigation | Nächstes Thema |
|---|---|---|
| Einstellungen | [ Nach oben ] [ Startseite ] | Metacrawler FAQ |
