3 Wege, wie Sie unerwünschte Blog-Seiten von Google entfernen können

Glauben Sie an die Idee, dass sobald etwas im Internet veröffentlicht wird, es für immer veröffentlicht wird? Nun, heute werden wir diesen Mythos zerstreuen. Es liegt wirklich vollständig unter Ihrer Kontrolle.

Glauben Sie an die Idee, dass sobald etwas im Internet veröffentlicht wird, es für immer veröffentlicht wird?  Nun, heute werden wir diesen Mythos zerstreuen.  Es liegt wirklich vollständig unter Ihrer Kontrolle.
Werbung

Glauben Sie an die Idee, dass sobald etwas im Internet veröffentlicht wird, es für immer veröffentlicht wird? Nun, heute werden wir diesen Mythos zerstreuen.

Die Wahrheit ist, dass es in vielen Fällen möglich ist, Informationen aus dem Internet zu löschen. Sicher, es gibt eine Aufzeichnung von Webseiten, die gelöscht wurden, wenn Sie die Wayback Machine suchen, richtig? Ja, absolut. Auf der Wayback Machine gibt es Aufzeichnungen von Webseiten, die viele Jahre zurückliegen - Seiten, die Sie bei einer Google-Suche nicht finden, weil die Webseite nicht mehr existiert. Jemand hat es gelöscht oder die Website wurde heruntergefahren.

Also, es gibt nichts, oder? Informationen werden für immer in den Stein des Internets eingraviert, dort für Generationen zu sehen? Nun, nicht genau.

Die Wahrheit ist, dass es zwar schwierig oder unmöglich ist, wichtige Nachrichten, die sich von einer Nachrichtenwebsite oder einem Blog zu einem anderen verbreitet haben, zu löschen. Es ist jedoch ziemlich einfach, eine Webseite oder mehrere Webseiten aus allen Datensätzen vollständig zu löschen der Existenz - um diese Seite für beide Suchmaschinen sowie die Wayback Machine zu entfernen Die neue Wayback Machine lässt Sie in Internet-Zeit zurückreisen Die neue Wayback Machine lässt Sie in Internet-Zeit zurückreisen Es scheint, dass seit der Wayback Machine in 2001 haben sich die Seitenbetreiber entschieden, das Alexa-basierte Back-End wegzuwerfen und mit eigenem Open-Source-Code neu zu gestalten. Nach Tests mit dem ... Read More. Es gibt natürlich einen Haken, aber wir kommen dazu.

3 Möglichkeiten, Blog-Seiten aus dem Internet zu entfernen

Die erste Methode ist diejenige, die die Mehrheit der Website-Besitzer verwendet, weil sie es nicht besser wissen - einfach Webseiten löschen. Dies kann passieren, weil Sie festgestellt haben, dass auf Ihrer Website doppelte Inhalte vorhanden sind oder weil Sie eine Seite haben, die nicht in den Suchergebnissen angezeigt werden soll.

Einfach die Seite löschen

Das Problem mit dem vollständigen Löschen von Seiten von Ihrer Website besteht darin, dass es wahrscheinlich Links von Ihrer eigenen Website sowie externe Links von anderen Websites zu dieser bestimmten Seite gibt, da Sie die Seite bereits im Internet eingerichtet haben. Wenn Sie es löschen, erkennt Google diese Seite sofort als fehlende Seite.

Datei nicht gefunden

Beim Löschen Ihrer Seite haben Sie also nicht nur ein Problem mit Crawling-Fehlern "Nicht gefunden" verursacht, sondern Sie haben auch ein Problem für jeden geschaffen, der jemals mit der Seite verlinkt ist. In der Regel sehen Nutzer, die über einen dieser externen Links auf Ihre Website gelangen, Ihre 404-Seite. Dies ist kein großes Problem, wenn Sie den benutzerdefinierten 404-Code von Google verwenden, um Nutzern hilfreiche Vorschläge oder Alternativen zu geben. Aber, würden Sie denken, dass es elegantere Möglichkeiten geben könnte, Seiten aus den Suchergebnissen zu löschen, ohne alle 404 für bestehende eingehende Links auszulösen, richtig?

Nun, da sind sie.

Entfernen Sie eine Seite aus den Google-Suchergebnissen

Zunächst sollten Sie verstehen, dass wenn Sie nicht möchten, dass die Webseite, die Sie aus den Google-Suchergebnissen entfernen möchten, eine Seite Ihrer eigenen Website ist, dann sind Sie Pech, es sei denn, es gibt rechtliche Gründe oder die Website hat Ihre persönlichen Daten veröffentlicht Informationen online ohne Ihre Erlaubnis. Wenn dies der Fall ist, verwenden Sie die Problembehebungshilfe von Google, um eine Anfrage zum Entfernen der Seite aus den Suchergebnissen zu senden. Wenn Sie einen gültigen Fall haben, finden Sie vielleicht einen Erfolg mit dem Entfernen der Seite - natürlich haben Sie vielleicht noch größeren Erfolg nur Kontakt mit dem Besitzer der Website Wie Entfernen von falschen persönlichen Informationen im Internet Wie Entfernen von falschen persönlichen Informationen im Internet Lesen Sie mehr wie ich schon im Jahr 2009 beschrieben habe.

Nun, wenn die Seite, die Sie aus den Suchergebnissen entfernen möchten, auf Ihrer eigenen Website ist, haben Sie Glück. Alles, was Sie tun müssen, ist eine robots.txt- Datei zu erstellen und sicherzustellen, dass Sie entweder die bestimmte Seite, die nicht in den Suchergebnissen enthalten sein soll, oder das gesamte Verzeichnis mit den Inhalten, die nicht indiziert werden sollen, nicht zugelassen haben. Hier sehen Sie, wie eine einzelne Seite blockiert wird.

 User-Agent: * Disallow: /my-deleted-article-that-i-want-removed.html 

Sie können blockieren, dass Bots ganze Verzeichnisse Ihrer Site wie folgt durchforsten.

 Benutzeragent: * Disallow: / content-about-personal-stuff / 

Google hat eine ausgezeichnete Supportseite, die Ihnen beim Erstellen einer robots.txt-Datei helfen kann, wenn Sie noch nie eine erstellt haben. Das funktioniert sehr gut, wie ich kürzlich in einem Artikel über die Strukturierung von Syndication Deals erklärt habe Wie man Syndikatsgeschäfte aushandelt und Ihre Search Rankings regelt Wie man Syndication Deals aushandelt und Ihre Search Rankings schützt Syndicating ist die ganze Wut in diesen Tagen. Aber plötzlich können Sie feststellen, dass der Syndikationspartner in den Suchergebnissen für eine Geschichte, die Sie ursprünglich geschrieben haben, höher gelistet ist als Sie! Schützen Sie Ihre Suchrankings. Lesen Sie weiter, damit sie Sie nicht verletzen (die Syndizierungspartner werden aufgefordert, die Indexierung ihrer Seiten, auf denen Sie syndiziert sind, zu verbieten). Nachdem mein eigener Syndikationspartner zugestimmt hatte, verschwanden die Seiten, die aus meinem Blog dupliziert wurden, vollständig aus den Suchlisten.

Google-Einträge

Nur die Hauptwebseite kommt auf den dritten Platz für die Seite, auf der sie unseren Titel aufführen, aber mein Blog ist jetzt sowohl an der ersten als auch an der zweiten Stelle gelistet; etwas, das fast unmöglich gewesen wäre, wenn eine Website mit höherer Autorität die doppelte Seite indexiert hätte.

Was viele nicht wissen, ist, dass dies auch mit dem Internet Archive (der Wayback Machine) möglich ist. Hier sind die Zeilen, die Sie Ihrer robots.txt-Datei hinzufügen müssen, damit dies geschieht.

 User-Agent: ia_archiver Disallow: / Beispiel-Kategorie / 

In diesem Beispiel fordere ich das Internetarchiv dazu auf, im Unterverzeichnis "Sample-Kategorie" auf meiner Site alles aus dem Wayback-Computer zu entfernen. Das Internet-Archiv erklärt, wie Sie dies auf der Hilfeseite "Ausschluss" tun. Hier erklären sie auch, dass "das Internetarchiv nicht daran interessiert ist, Zugang zu Websites oder anderen Internetdokumenten anzubieten, deren Autoren ihre Materialien nicht in der Sammlung haben wollen."

Dies widerspricht der landläufigen Meinung, dass alles, was ins Internet gestellt wird, für immer in das Archiv hineingefressen wird. Nein - Webmaster, denen der Inhalt gehört, können den Inhalt mithilfe des robots.txt-Ansatzes gezielt aus dem Archiv entfernen lassen.

Entfernen Sie eine einzelne Seite mit Meta-Tags

Wenn Sie nur ein paar einzelne Seiten haben, die Sie aus den Suchergebnissen der Google-Suche entfernen möchten, müssen Sie die robots.txt-Methode überhaupt nicht verwenden. Sie können einfach den einzelnen Meta-Tag "robots" zu den einzelnen Seiten hinzufügen. und sagen Sie den Robotern, dass sie keine Links auf der gesamten Seite indizieren oder folgen sollen.

externe Links3

Sie könnten das oben genannte "robots" -Meta verwenden, um Roboter daran zu hindern, die Seite zu indizieren, oder Sie könnten dem Google-Roboter ausdrücklich mitteilen, dass die Seite nicht nur aus den Google-Suchergebnissen entfernt wird, und andere Suchroboter können weiterhin auf den Seiteninhalt zugreifen.

Es liegt ganz bei Ihnen, wie Sie verwalten möchten, was Roboter mit der Seite machen und ob die Seite aufgelistet wird. Für einige einzelne Seiten ist dies möglicherweise der bessere Ansatz. Um ein ganzes Inhaltsverzeichnis zu entfernen, verwenden Sie die Methode robots.txt.

Die Idee des "Entfernens" von Inhalten

Dies stellt den gesamten Begriff "Löschen von Inhalten aus dem Internet" auf den Kopf. Technisch gesehen, wenn Sie alle Ihre eigenen Links zu einer Seite auf Ihrer Website entfernen und Sie diese aus der Google-Suche und dem Internet-Archiv mithilfe der robots.txt-Technik entfernen, wird die Seite praktisch aus dem Internet "gelöscht". Die coole Sache ist jedoch, dass wenn Links zur Seite bestehen, diese Links trotzdem funktionieren und Sie keine 404-Fehler für diese Besucher auslösen werden.

Es ist eine "sanftere" Herangehensweise, Inhalte aus dem Internet zu entfernen, ohne die bestehende Linkpopularität Ihrer Website im Internet völlig zu stören. Letztendlich liegt es bei Ihnen, zu verwalten, welche Inhalte von Suchmaschinen und dem Internet-Archiv gesammelt werden, aber denken Sie immer daran, dass trotz allem, was die Leute über die Lebensdauer der online geposteten Dinge sagen, sie wirklich vollständig von Ihnen kontrolliert wird .

In this article