Spider – Die Heuschrecken des Internets

29. Mai 2009 Aus Von BerndWohlers

Spider Heuschrecken des InternetsEs gibt unendlich viele Webseiten und Blogs, in ihnen steckt viel Zeit, Liebe zum Metier und Arbeit. Die Betreiber sind meist Mädchen für alles. Sie müssen den Server in Ordnung halten, Seiten gestalten, Logdateien auswerten und das Wichtigste, lesenswerten Content beschaffen, immer wieder neu. Wenn dann mal Zeit bleibt, kann man sich ja mal mit PHP, HTML, CSS und Java-Script beschäftigen. Es ist ein Hobby, wie viele andere auch, es kostet Geld und fordert die/den ganze/n Frau/Mann. So freut sich jeder, der einen Blog oder Webseite hat, wenn sich mit der Zeit immer mehr Besucher bei ihm einfinden. Es entwickeln sich daraus auch manchmal nette Kontake, die man gerne pflegt.

Es kommen aber auch schweigsame Besucher, Robots von Suchmaschinen. Sie weisen sich aus, tragen einen Namen im USER_AGENT, ihre IP Nummern sind allgemein bekannt. Ohne Suchmaschinen würde uns keiner finden, so ist jeder Besuch von Googlebot, Slurp, MSNbot und einigen wenigen anderen gern gesehen. Leben Suchmaschinen und Webseitenbetreiber doch in einer fruchtbaren Symbiose. Ohne Webseiten hätten Suchmaschinen keinen Lebenszweck und ohne Suchmaschinen findet keiner eine Webseite. Diesen Robots rufen wir zu: „Herzlich Willkommen“. Wo Licht ist, da ist auch Schatten und so ist es nicht verwunderlich, dass auch Besucher kommen, bei denen der Wirt lieber die Hacken als die Schuhspitzen sieht.

Unsere unliebsamen Besucher kommen meist von weit her, aus Asien und Osteuropa, einige sind aber auch in unseren Gefilden heimisch. Sie sind alle miteinander verwandt, sie nennen sich Spider, Crawler, Robot und Spambot. Sie kommen leise, ohne Getöse, sie melden sich nicht an, sie sagen nicht Tschüß. Sie fressen in Sekunden alles was du mühsam zusammengetragen und geschrieben hast und du musst ihnen noch den notwendigen Trafic spendieren. Haben sie deine Seiten, oft Hunderte in wenigen Minuten ratzekahl gefressen, verschwinden sie wieder, wie die Heuschrecken die weiter ziehen, um einen anderen Landstrich leerzufressen. Was die räuberische Horde wohl mit deinem geistigen Eigentum anstellt? Von einigen habe ich gehört, sie blähen ihre Webseiten mit den bei dir geklauten Inhalten auf, um sie später besser verkaufen zu können. Viel Inhalt – Viel Pageranking – Viel Money.

So werden sie mehr und mehr, die modernen Heuschrecken des Internets. Sie abzuwehren kostet viel Zeit, zuviel Zeit. Zeit die jeder lieber in die Gestaltung seiner Seite stecken würde. Es ist die Zeit gekommen, sie zu verjagen. Sperrt sie aus, wo ihr könnt. Mit wenigen Zeilen in der htaccess kann man sie zum Teufel jagen – macht es – fangt an euch zu wehren!