Kontakt: 0221 6778 237 0

Google soll nun auch Formulare ausfüllen

Das sogenannte „Deep Web“ (oder auch „Hidden Web“ oder „Invisible Map“) war bisher für die Suchmaschinen weitestgehend unzugänglich.
„Deep Web“ bezeichnet jenen Teil des Internets, der über Suchmaschinen nicht zugänglich ist, weil er von den Crawlern nicht ausgelesen werden kann. Beispiele dafür sind Flash-generierte Texte, bestimmte Dateiformate und Datenbank-Inhalte, die nur über das Ausfüllen von Formularen zu erreichen sind.
Das Ganze stellt allerdings nur ein Experiment dar und wird nur auf einigen bestimmten „hochqualitativen“ Seiten getestet.

Wie funktioniert das Ganze?
Die wohl interessanteste Frage ist, woher der Crawler weiß, was er in ein Formular eingeben muss.
Prinzipiell füllt der Crawler nur Formulare aus, die die GET-Methode verwenden, also nur um Informationen zu bekommen. POST-Formulare hingegen, Formulare, die Benutzereingaben erfordern, wie Registrierung, Kommentare, Kontaktaufnahme oder Beiträge, werden nicht ausgefüllt. Somit ist also auch nicht zu befürchten, dass durch den Webcrawler unnötiger Spam auf den Seiten verursacht wird.
Was nun aber ausgefüllt wird, ist abhängig vom Typ des Eingabefeldes. Bei normalen Texteingabe-Feldern, gibt der Googlebot Wörter ein, die sehr häufig auf der Website vorkommen. Select-Felder oder Checkboxen werden mit vorgegeben Werten aus dem HTML-Code befüllt.

Was ist noch interessant?
Der Googlebot wird nicht alle möglichen Varianten eines Formulars durchspielen, um den Server der Website nicht unnötig zu belasten.
Alle Seiten, die über Formulare ausgelesen werden, werden anders behandelt, als normale Seiten. Sprich, man braucht keine Verschlechterung der Seite zu befürchten, etwa wegen doppeltem Kontent, oder weil die Zielseite einen geringeren PageRank hat.
Darüberhinaus besteht immer noch die Möglichkeit durch die allseits bekannten Robots.txt den Crawler auszuschließen.

Für die SEO-Branche stellt das Ganze keine große Neuerung dar, weil hier ohnehin schon Möglichkeiten bekannt waren, die gesamte Seite für den Googlebot sichtbar zu machen.
Den größten Nutzen wird somit der User haben, der in Zukunft wohl auf mehr Informationen, als bisher, zugreifen werden kann.

Schreibe einen Kommentar

Kontakt

Aachener Str. 1253, Bürogebäude 1, 50858 Köln
Telefon:+49 (0) 221 6778 237 0
Fax: +49(0) 221 6778 237 9