Wie funktionieren Suchmaschinen?

Für viele Menschen ist Google das Internet. Es ist wohl die wichtigste Erfindung seit dem Internet selbst. Und während Suchmaschinen sich seither stark verändert haben, sind die zugrunde liegenden Prinzipien immer noch dieselben.

Für viele Menschen ist Google das Internet.  Es ist wohl die wichtigste Erfindung seit dem Internet selbst.  Und während Suchmaschinen sich seither stark verändert haben, sind die zugrunde liegenden Prinzipien immer noch dieselben.
Werbung

Artikel aktualisiert von Joel Lee am 10/10/2017

Entsperren Sie jetzt den Spickzettel "Top Google Search Keyboard Shortcuts"!

Dies wird Sie zu unserem Newsletter anmelden

Geben Sie Ihre E-Mail-Entsperrung ein Lesen Sie unsere Datenschutzrichtlinie

Für viele ist Google das Internet. Es ist der Ausgangspunkt für die Suche nach neuen Websites und ist wohl die wichtigste Erfindung seit dem Internet selbst. Ohne Suchmaschinen wären neue Webinhalte für die Massen nicht zugänglich.

Aber wissen Sie, wie Suchmaschinen arbeiten? Jede Suchmaschine hat drei Hauptfunktionen: Crawlen (um Inhalte zu entdecken), Indizierung (um Inhalte zu verfolgen und zu speichern) und Retrieval (um relevanten Inhalt zu holen, wenn Benutzer die Suchmaschine abfragen).

Krabbeln

Krabbeln ist, wo alles anfängt: die Erfassung von Daten über eine Website.

Dies umfasst das Scannen von Websites und das Sammeln von Details zu jeder Seite: Titel, Bilder, Schlüsselwörter, andere verknüpfte Seiten usw. Verschiedene Crawler können auch nach anderen Details suchen, wie Seitenlayouts, wo Anzeigen platziert werden, ob Links eingepfercht sind usw.

Aber wie wird eine Website gecrawlt? Ein automatisierter Bot ("Spinne" genannt) besucht Seite für Seite so schnell wie möglich und verwendet Seitenverknüpfungen, um herauszufinden, wohin er als nächstes gehen soll. Schon in den Anfängen konnten Googles Spinnen mehrere hundert Seiten pro Sekunde lesen. Heutzutage ist es in den Tausenden.

Wie funktionieren Suchmaschinen? Web-Crawler-Diagramm

Wenn ein Webcrawler eine Seite besucht, erfasst er jeden Link auf der Seite und fügt ihn der Liste der nächsten zu besuchenden Seiten hinzu. Es geht zur nächsten Seite in seiner Liste, sammelt die Links auf dieser Seite und wiederholt sie. Web-Crawler besuchen auch gelegentlich vergangene Seiten, um zu sehen, ob irgendwelche Änderungen stattgefunden haben.

Dies bedeutet, dass jede Site, die von einer indizierten Site verlinkt ist, irgendwann gecrawlt wird. Einige Websites werden häufiger gecrawlt, andere werden in größere Tiefen gecrawlt. Manchmal gibt ein Crawler jedoch auf, wenn die Seitenhierarchie einer Site zu komplex ist.

Eine Möglichkeit zu verstehen, wie ein Webcrawler funktioniert, ist, einen selbst zu erstellen. Wir haben ein Tutorial zum Erstellen eines einfachen Web-Crawlers in PHP geschrieben, überprüfen Sie das, wenn Sie Programmiererfahrung haben.

Wie funktionieren Suchmaschinen? Google Suche auf Tablet

Beachten Sie, dass Seiten als "noindex" markiert werden können, ähnlich wie wenn Suchmaschinen aufgefordert werden, ihre Indizierung zu überspringen. Nicht-indizierte Teile des Internets werden als "Deep Web" bezeichnet. Was ist das Deep Web? Es ist wichtiger als Sie denken, was ist das Deep Web? Es ist wichtiger als du denkst Das tiefe Netz und das dunkle Netz klingen beide gruselig und ruchlos, aber die Gefahren sind übertrieben. Hier ist, was sie tatsächlich und wie Sie selbst auf sie zugreifen können! Lesen Sie mehr, und einige Websites, wie sie im TOR-Netzwerk gehostet werden, können nicht von Suchmaschinen indiziert werden. (Was ist TOR und Zwiebel-Routing? Was ist Onion Routing, genau? [MakeUseOf erklärt] Was ist Onion Routing, genau? [MakeUseOf erklärt] Internet-Privatsphäre. Anonymität war eines der größten Merkmale des Internets in seiner Jugend (oder eine der seine schlimmsten Eigenschaften, je nachdem, wen Sie fragen.) Lassen Sie die Art von Problemen beiseite, die entstehen ... Lesen Sie weiter)

Indizierung

Bei der Indexierung werden die Daten aus einem Crawl verarbeitet und in einer Datenbank gespeichert.

Stellen Sie sich vor, Sie würden eine Liste aller Ihrer Bücher, ihrer Verleger, ihrer Autoren, ihrer Genres, ihrer Seitenzahlen usw. erstellen. Beim Crawlen durchforsten Sie jedes Buch, während Sie es indexieren, wenn Sie es in Ihre Liste aufnehmen.

Stellen Sie sich vor, es ist nicht nur ein Raum voller Bücher, sondern jede Bibliothek der Welt. Dies ist eine kleine Version von dem, was Google tut, wer all diese Daten in riesigen Rechenzentren mit Tausenden von Petabyte im Wert von Laufwerken Speichergrößen erklärt - Gigabyte, Terabyte und Petabyte in Layman Terms Memory Größen erklärt - Gigabytes, Terabyte und Petabytes in Laymans Bedingungen Es ist leicht zu sehen, dass 500 GB mehr als 100 GB sind. Aber wie vergleichen verschiedene Größen? Was ist ein Gigabyte für ein Terabyte? Wo passt ein Petabyte? Lasst es uns klären! Weiterlesen .

Hier sehen Sie einen Blick in eines der Such-Rechenzentren von Google:

Wie funktionieren Suchmaschinen? Google Search-Datencenter
Bildquelle: Google

Abruf und Ranking

Beim Abrufen verarbeitet die Suchmaschine Ihre Suchanfrage und gibt die relevantesten Seiten zurück, die Ihrer Suchanfrage entsprechen.

Die meisten Suchmaschinen unterscheiden sich durch ihre Abrufmethoden: Sie verwenden unterschiedliche Kriterien, um auszuwählen, welche Seiten am besten zu dem passen, was Sie finden möchten. Deshalb variieren die Suchergebnisse zwischen Google und Bing und warum Wolfram Alpha so einzigartig nützlich ist. 10 Coole Verwendung von Wolfram Alpha Wenn Sie in der englischen Sprache lesen und schreiben 10 Coole Verwendung von Wolfram Alpha Wenn Sie in der englischen Sprache lesen und schreiben, dauerte es Ich habe mir etwas Zeit genommen, um Wolfram Alpha und die Abfragen, die es benutzt, um diese Ergebnisse auszuspucken. Sie müssen tief in Wolfram Alpha tauchen, um es wirklich auszunutzen, um ... Read More.

Ranking-Algorithmen überprüfen Ihre Suchanfrage auf Milliarden von Seiten, um die Relevanz zu ermitteln. Unternehmen schützen ihre Ranking-Algorithmen aufgrund ihrer Komplexität als patentierte Branchengeheimnisse. Ein besserer Algorithmus führt zu einer besseren Suche.

Sie wollen auch nicht, dass Web-Ersteller das System spielen und auf unfaire Weise an die Spitze der Suchergebnisse klettern. Wenn die interne Methodik einer Suchmaschine jemals herauskommen würde, würden alle möglichen Leute dieses Wissen zu Ungunsten von Suchern wie Ihnen und mir nutzen.

Wie funktionieren Suchmaschinen? Stift HTML-Suchmaschine Meta
Bildquelle: photovibes über Shutterstock

Die Suchmaschinenauswertung ist natürlich möglich, aber nicht mehr so ​​einfach.

Ursprünglich rangierten die Suchmaschinen die Websites nach der Häufigkeit, mit der die Keywords auf einer Seite erschienen, was zu "Keyword-Stuffing" führte - das Füllen von Seiten mit Keyword-schwerem Unsinn.

Dann kam das Konzept der Link-Wichtigkeit: Suchmaschinen bewerteten Sites mit vielen eingehenden Links, weil sie die Popularität von Websites als relevant interpretierten. Dies führte jedoch zu einem Link-Spamming im gesamten Internet. Heutzutage gewichten Suchmaschinen Links abhängig von der "Autorität" der verlinkten Seite. Suchmaschinen legen mehr Wert auf Links von einer Regierungsbehörde als Links aus einem Link-Verzeichnis.

Heute sind Ranking-Algorithmen in mehr Geheimnis als je zuvor, und "Suchmaschinen-Optimierung" Demystify SEO: 5 Search Engine Optimization Guides, die Ihnen helfen, entmystifizieren SEO: 5 Search Engine Optimization Guides, die Ihnen helfen, Search Engine Mastery braucht Wissen, Erfahrung und viel Versuch und Irrtum. Sie können anfangen, die Grundlagen zu erlernen und häufige SEO Fehler mit Hilfe von vielen SEO Guides, die im Web verfügbar sind, zu vermeiden. Read More ist nicht so wichtig. Gute Suchmaschinen-Rankings kommen jetzt von hochwertigen Inhalten und tollen User Experiences.

Was kommt als nächstes für Suchmaschinen?

Ah, jetzt gibt es eine interessante Frage. Die Antwort ist "Semantik": die Bedeutung des Seiteninhalts. Lesen Sie mehr in unserem Überblick über semantisches Markup und dessen zukünftige Auswirkungen Was Semantic Markup ist und wie es das Internet für immer verändern wird [Technologie erklärt] Was Semantic Markup ist und wie es das Internet für immer verändern wird [Technologie erklärt] Read More.

Aber hier ist der Kern davon.

Im Moment können Sie nach "glutenfreien Keksen" suchen, aber die Ergebnisse können Rezepte für glutenfreie Kekse zurückgeben. Stattdessen finden Sie möglicherweise regelmäßige Cookie-Rezepte, die sagen: "Dieses Rezept ist nicht glutenfrei." Es hat die richtigen Schlüsselwörter, aber die falsche Bedeutung.

Mit der Semantik können Sie nach Keksrezepturen suchen und dann bestimmte Zutaten entfernen: Mehl, Nüsse usw. Sie können die Ergebnisse auch auf Rezepte mit Vorbereitungszeiten von weniger als 30 Minuten eingrenzen und Bewertungen von 4/5 oder höher überprüfen. Das wäre cool, oder? Da gehen wir hin!

Immer noch verwirrt darüber, wie Suchmaschinen arbeiten? Sehen Sie, wie Google den Prozess erklärt:

Wenn Sie das interessant fanden, möchten Sie vielleicht auch mehr über die Funktionsweise von Bildsuchmaschinen erfahren.

Bildquelle: prykhodov / Depositphotos

In this article