Technischer Aufbau einer Suchmaschine!
Huhu zusammen.
Ich arbeite grad an einer Präsie zu dem Thema Suchmaschinen.
Hierzu wollte ich einerseits die Theorie wie Suchmaschinen arbeiten (also: Meta-Suchmaschine funzt, Webkataloge, Volltextsuchmaschinen, Social Bookmarks...) einfliessen lassen.
Dies ist soweit nicht aufwendig und zum großen Teil sowieso Allgemeinwissen.
DIe andere Seite, der technische Aufbau und deren Nutzung / Belastung ist interessant.
Server1 mit Spider durchsucht das Web (nach welchem Verzeichnis eigentl?) und lädt die Websites, die hinter den Links stehen, herunter.
Dahinter stehen dann 5 Server, die die von diesem Spider geladenen Website via bestimmter Progs und Verfahren analysieren/Wörter indexieren usw.
Dahinter steht die Datenbank für die Indexe und die Datenbank die (glaub Alta Vista macht das) die das Web 1-1 kopiert.
Auf die Datenbanken greift der Abfrageservewr zu in dem der Nutzer die Abfrage eingibt.
Bei Förderierten Suchmaschinen gibts nur die Abfrageserver, die dann halt auf die Volltextsuchmaschinen zugreifen + eine eigene Datenbank.
Sowas in der Richtung nur in "richtig" und mit ein bisschen Tiefe ist das was ich versucht habe/versuche zu finden.
Es Geht dabei darum, wie komplex Suchmaschinen aufgebaut sind, wie die Relationen sind zwischen Abfrageservern, Spider-servern und Datenbanken usw und auch darum, warum man mit einer Suchanfrage einige Watt Strom verbraucht usw.
Was kostet eine Suchanfrage insgesamt?
Google hat etliche Tausend Server, wieviele Server werden benötigt meine Suchabfrage zu bedienen. Schließlich greife ich bei einer Suche zwecks Geschwindigkeitsoptimierung auf einige Server auf einmal zu.
Sowas in Abstrakter Form wäre genau das richtige.
Und überhaupt iwas sinnnvolles nur in der groben Richtung zu finden...
ich habs nicht geschafft.
Wäre echt super wenn ihr mir Tipps geben könnt, wo ich was finde.
Mfg,
Nis-Peter.
Ich arbeite grad an einer Präsie zu dem Thema Suchmaschinen.
Hierzu wollte ich einerseits die Theorie wie Suchmaschinen arbeiten (also: Meta-Suchmaschine funzt, Webkataloge, Volltextsuchmaschinen, Social Bookmarks...) einfliessen lassen.
Dies ist soweit nicht aufwendig und zum großen Teil sowieso Allgemeinwissen.
DIe andere Seite, der technische Aufbau und deren Nutzung / Belastung ist interessant.
Server1 mit Spider durchsucht das Web (nach welchem Verzeichnis eigentl?) und lädt die Websites, die hinter den Links stehen, herunter.
Dahinter stehen dann 5 Server, die die von diesem Spider geladenen Website via bestimmter Progs und Verfahren analysieren/Wörter indexieren usw.
Dahinter steht die Datenbank für die Indexe und die Datenbank die (glaub Alta Vista macht das) die das Web 1-1 kopiert.
Auf die Datenbanken greift der Abfrageservewr zu in dem der Nutzer die Abfrage eingibt.
Bei Förderierten Suchmaschinen gibts nur die Abfrageserver, die dann halt auf die Volltextsuchmaschinen zugreifen + eine eigene Datenbank.
Sowas in der Richtung nur in "richtig" und mit ein bisschen Tiefe ist das was ich versucht habe/versuche zu finden.
Es Geht dabei darum, wie komplex Suchmaschinen aufgebaut sind, wie die Relationen sind zwischen Abfrageservern, Spider-servern und Datenbanken usw und auch darum, warum man mit einer Suchanfrage einige Watt Strom verbraucht usw.
Was kostet eine Suchanfrage insgesamt?
Google hat etliche Tausend Server, wieviele Server werden benötigt meine Suchabfrage zu bedienen. Schließlich greife ich bei einer Suche zwecks Geschwindigkeitsoptimierung auf einige Server auf einmal zu.
Sowas in Abstrakter Form wäre genau das richtige.
Und überhaupt iwas sinnnvolles nur in der groben Richtung zu finden...
ich habs nicht geschafft.
Wäre echt super wenn ihr mir Tipps geben könnt, wo ich was finde.
Mfg,
Nis-Peter.
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 118677
Url: https://administrator.de/contentid/118677
Ausgedruckt am: 22.11.2024 um 18:11 Uhr
2 Kommentare
Neuester Kommentar
Wäre echt super wenn ihr mir Tipps geben könnt, wo ich was
finde.
Mfg,
Nis-Peter.
finde.
Mfg,
Nis-Peter.
Hallo Peter,
habe mal was gefunden:
http://infolab.stanford.edu/~backrub/google.html
Ist wohl so ne Art Abschlussarbeit über Google. Schau einfach mal rein ob Du damit was anfangen kannst, ich selbst habe es jetzt aber nur überflogen.
Würde mich freuen wenn Du Dich bei mir meldest wenn es Dir geholfen hat.
Grüße aus dem bayrischen Schwaben
Benedikt