Systemanforderrungen
Aus Deutsches Nutch Wiki
Inhaltsverzeichnis |
Hardware Anforderungen
Im Allgemeinen brauchen das Indexieren und Updaten der Datenbank viel Festplatenplatz und Suchanfragen werden umso schneller bearbeitet desto mehr RAM Speicher vorhanden ist. Aber die jeweiligen Anforderungen hängen davon ab wie groß dein Suchindex werden soll und wie viele Suchanfragen du erwartest.
Als Allgemeine Regel gilt, jede Indexierte Seite braucht insgesamt in etwa 10KB Festplattenplatz (für den Cache der Seite, ihren Text, den Index, Datenbankeinträge, etc.). Also wird für je 100.000.000 Seiten ein Terabyte Festplattenplatz gebraucht.
Anforderungen für die Suchanfragen
Kommt noch.
Fragen und Antworten
-Hier könnt ihr gerne Fragen bezüglich der Systemanforderungen stellen.-
Beispiele
1.) Beispiel
Auf einem Linux (kernel 2.4) Computer mit 1 GB RAM und 900 MHz ist es möglich bis zu 200 fetcher.threads.fetch gleichzeitig laufen zu haben, welche zusammen mit 5 MBits/s indexieren.
2.) Beispiel
Auf einem Linux (kernel 2.4) Computer mit 512 MB RAM und 2.4 GHz haben wir fetcher.threads.output auf "2" herabgesezt. Es scheint, dass wir für jeden fetcher.thread.output eine Systemlast von etwas über 1 bekommen. Deises System indexiert mit 25 fetcher.threads.fetch und ungefähr 4 MBits/s.
Dieser Text ist im Allgemeinen eine Übersetzung dieses Artikels aus dem original nutch-Wiki.
