976 Beiträge rss | 39 Nutzer online

Der Google GAU von 2002

Vor einem Monat kam es zum Super-Such-GAU: Meine Website ist bei Google rausgeflogen. Die Folge: Zwei Drittel weniger Besucher und Pageviews. Und das, obwohl ich mich den ganzen Sommer auf Abrufzahlen bis zu 10.000 Pageviews am Tag hochgearbeitet hatte.

(erschienen in Internet Professionell 12/2002)

Ob mir Google etwas übel genommen hat? Nein, das kann eigentlich nicht sein. Ich bin mit jedenfalls keiner Schuld bewusst. Weder Meta-Tag-Spamming noch unsichtbare Texte oder ähnliches unsauberes Werkzeug habe ich verwendet. Auch auf das in letzter Zeit populäre Spamming mit rekursiven Querverweisen auf meine Seite habe ich verzichtet.

Suchmaschinen-Spamming bringt meiner Ansicht eh nicht viel. Meine These: Google richtet sich in erster Linie nach Titelzeile und dem Textinhalt der Seite.

Dennoch hat mein Problem wohl bei der Suche nach dem besseren Google-Ranking begonnen: Irgendwo habe ich gelesen, dass im Google-Ranking steigt, wer einen Suchbegriff auch in der URL unterbringt. Bislang hat ein Skript aus den dynamischen Daten, statische, durchnummerierte Dokumente erzeugt und den Suchmaschinen vorgeworfen, die nicht gerne in Datenbanken buddeln. Übrigens scheint auch Google diese statischen Seiten allem dynamischen vorzuziehen. Meine Idee: an Stelle der Nummern in den Dateinamen könnte doch gleich die Titelzeile des entsprechenden Textes aus der Datenbank stehen. Gedacht, programmiert. Das PHP-Skript holt sich den Titel eines Beitrags aus der Datenbank, ersetzt alle Leerzeichen mit einem Unterstrich:

$FilePrefix=ereg_replace("[[:space:]]","_", $row["thead"]);

wirft alle Tags heraus,

$FilePrefix=ereg_replace("<[^>]*>","",$FilePrefix);

entfernt Entities,

$FilePrefix=ereg_replace("&[^;]*;","",$FilePrefix);

ersetzt Umlaute,

$FilePrefix=str_replace("ä", "ae", $FilePrefix);

[..]

und wirft alles heraus, was nicht Buchstabe oder Zahl ist:

$FilePrefix=eregi_replace("[^a-zA-Z0-9_]","",$FilePrefix);

Das Problem war nur: als ich dachte, das Programm wäre ok, habe ich alle bislang verwendeten statischen Dateien gelöscht. Das war ein Fehler. Und aus dem folgt Merksatz Nummer 1: Löschen Sie niemals alte Daten auf Webseiten, bevor nicht die neuen Dateien fertig, verlinkt und auffindbar sind.

Danach habe ich eine Weile herumgewurstelt und das Umwandlungsprogramm von seinen bösen Fehlern gereinigt. Schließlich war es spät am Abend und ich habe die Arbeit eine Nacht ruhen lassen. Das waren Fehler und Merksatz Nummer 2: Wenn Sie an einem lebenden Web-Server operieren, hinterlassen Sie nie halbfertige Arbeit.

Vermutlich hat Google genau in dieser Nacht vorbei geschaut. Die ursprünglich gut bei Google vertretenen statischen Dateien mit den Zahlen als Dateinamen waren nicht mehr da. Die anderen statischen Seiten mit den langen Dateinamen waren noch nicht da. Google – dumm wie ein Computer nur sein kann – zieht sich daraufhin zurück.

Jetzt sitze ich hier und rufe stündlich das Weblog meines Servers auf. Immer in der Hoffnung, Google erbarmt sich meiner Seiten und schaut wieder rein.

Die Moral von der Geschicht' ist nicht nur eine technische sondern auch eine netz-politische. Falls es noch niemand gemerkt hat: Google ist auf dem Weg zum Suchmonopol.

Denn Google ist die beste Suchmaschine. Und Google hat so gute Technik, dass sie alle anderen Suchmaschinen aussticht. Außerdem breitet sich Google immer mehr aus. AOL sucht mit Google, Yahoo sucht mit Google und Web.de auch. Sprich: Fällt man ein Mal aus Google heraus, existiert man auch in diesen Partner-Suchmaschinen nicht mehr.

Gut, man kann Google kein aggressives Marketing vorwerfen. Die Marktmacht resultiert aus überlegener Technik. Dennoch sollten sich im Interesse des Internet und der User alle anderen Suchmaschinen anstrengen und an Google abgegebene Marktanteile zurück gewinnen. Dann schmerzt der nächste Google-Rauswurf auch nicht mehr so sehr.

Woran es wirklich lag, lesen Sie in Aus Google verschwunden wegen Session ID.

Mehr dazu:

Aktualisiert am: 19.01.2006




Ihr Kommentar:


Name:


Copyright © goldmann.de 1999-2012   | Tippscout 5.0
Zurück Startseite