475 Beiträge rss | 22 Nutzer online

Aus Google verschwunden wegen Session ID

Endlich: Die Google-lose Zeit ist vorbei. Die Suchmaschine hat mich wieder. Sie kommt jeden Tag vorbei und crawlt und crawlt. Wie es zur Rückkehr kam, erzählt der dritte Teil der Google-Trilogie.

(erschienen in Internet Professionell 2/2003)

Wohin wendet sich ein Webmaster in aller Verzweiflung? An eine Newsgroup. Doch das fällt nicht leicht. Denn man weiß nie, was einen dort erwartet. Sind es freundliche Gesellen, die geduldig auch die dümmste Frage beantworten? Oder sind es die, die sich sofort auf den Newsgroup-Beitrag stürzen, jeden Kommafehler ankreiden und darauf hinweisen, dass die Frage schon zehn mal gestellt wurde und man sich doch gefälligst in die nächste FAQ verziehen möge?

Zum Glück ist die Google-Support-Newsgroup google.public.support.general gefüllt mit freundlichen Vertretern der ersten Gattung. Zwei Tage nach meiner Frage, warum Google nur die Eingangsseite erkennt und den Rest liegen lässt, hatte ich die Antwort. Der freundliche Zeitgenosse hatte sich meine Site angesehen und folgendes festgestellt: Da werden Session-IDs vergeben. Diese von PHP erzeugten Zeichenungetüme gibt es auf meiner Seite dann, wenn der Client keine Cookies annimmt. Nun sei es unwahrscheinlich, klärte mich der freundliche Helfer auf, dass der Googlebot sich mit Cookies abgeben würde. Also findet der Bot die Session IDs – und die wechseln mit jedem Besuch. Offenbar ist dieser Wechsel ein Knock-out-Kriterium für Google.

Also habe ich meine Header-Datei so umgebaut, dass sie den Googlebot erkennt und in diesem Fall die Session-Behandlung und damit Cookies wie IDs abschaltet. Nach ein paar Tagen war es endlich so weit: Google hatte uns wieder. Die Abrufzahlen verdoppelten sich innerhalb von zwei Wochen. Und nun hoffe ich, dass bald wieder das alte Niveau erreicht ist.

Das komische: An allem ist reine Angeberei schuld. Ich wollte wie viele andere Seiten im Web auch so einen tollen Besucherzähler. Und der geht nicht ohne Session-Handling. Denn schließlich muss jeder User eindeutig identifiziert werden. Mit der Einführung dieses an sich nutzlosen Features kamen auch die Session-IDs. Das allein hat aber für die Katastrophe nicht gereicht. Auch die zeitweise Abwesenheit wichtiger Seiten des Servers haben ihren Teil beigetragen: Google hat die alten Seiten aus dem Index geschmissen und konnte die neuen Versionen wegen der Session-IDs nicht aufnehmen. Das war die berühmte Verkettung unglücklicher Umstände.

In jedem Fall ist es ärgerlich, dass das Wohlergehen einer Site so sehr von einer Suchmaschine abhängt. Denn auch wenn sich in der Google-losen Zeit ordentlich Besucher von MSN-Search oder der T-Online-Suchseite kamen: Diese Suchdienste konnten kaum liefern, was Google gebracht hat. Da fürchtet man ein Suchmonopol und schon malen einige Google-Gespenster von Zensur und Medien-Macht an die Wand. Doch ganz so schlimm wird es nicht werden, wenn sich andere Suchmaschinen am Riemen reißen und endlich nachholen, was Google ihnen vorgemacht hat. Doch dafür ist es höchste Zeit.

Ein Gutes hatte der Google-Crash immerhin. Ich habe seitdem so gut wie alle Tipps umgesetzt, die das Googlebot-Wohlwollen wecken könnten: Javascripts sind in Extra-Dateien ausgelagert, ebenso CSS-Vorlagen. Ich habe alle Dateien nach Fehlern in der HTML-Syntax durchforstet und bin zu meinem Entsetzen mehr als einmal fündig geworden. Der Text auf meinen Seiten ist im HTML-Dokument weiter nach vorne gerückt. Und die robots.txt sowie die robot-Meta-Tags sind auf Hochglanz poliert. Doch ob das die drei Monate mit einem Drittel der Abrufzahlen wert war? Ich glaube nicht.


Bedingungen fuer die Kommentareingabe
Hinweis


Ihr Kommentar:


Name: E-Mail:
Name und E-Mail in einem Cookie auf Ihrer Festplatte speichern

Copyright © goldmann.de 1999-2010   | powered by Tippscout 5.0
Zurück Startseite