Neue Google- Richtlinien zur robots.txt

  • Das ist nur Zufall, aber ich hatte diesen Hinweis auch schon in einem anderen Blog gelesen.


    Google modernisiert also seine eigenen Systeme und Seitenbetreiber/Administratoren werden aufgefordert, das Abrufen von Javascript- und CSS-Dateien durch diese robots.txt-Dateien nicht zu beschränken. Bislang soll Google beim Aufrufen einer Website lediglich einen textbasierten Browser imitiert haben, die besagten CSS- und Javascript-Dateien (wie in einem Design) blieben davon unberührt.


    Ein Google-Mitarbeiter schrieb auf Google+ wörtlich, wer dem nicht nachkommen würde, der würde Ranking-Einbußen seiner Website in Kauf nehmen müssen. Hier der Link zum Zitat: https://plus.google.com/+PierreFar/posts/TLeHSDRwjhB


    Der selbe Hinweis bei Google's Webmaster Zentrale:


    "Wenn ihr das Crawling von JavaScript-oder CSS-Dateien in der robots.txt-Datei eurer Website nicht zulasst, wirkt sich dies unmittelbar auf die Darstellung und Indexierung eurer Inhalte durch unsere Algorithmen aus und kann zu schlechteren Rankings führen." Quelle





    Ich bin jetzt bekanntlich keine Expertin, aber wenn wir hier so unter uns sind, mein erster Gedanke beim Lesen war, dass Google erneut die Fühler bzw. Crawler in Richtung Informationen ausstreckt. Bislang konnten diese Dateien so also nicht abgegriffen werden, das versucht man also nun so, indem man die Drohkeule schwinkt und einen Rankingverlust ankündigt. Ich könnte mir vorstellen, dass schon diese Drohung dazu führt, dass Seitenbetreiber der Aufforderung nachkommen, weil sie eben Angst haben, sonst rangtechnisch abzurutschen.



    Die Frage wäre dann doch auch, warum nutzen Webmaster diese robots.txt-Dateien? Simpel gesagt ist es doch so: Ich nehme z.B. meine Javascript-Datei, packe sie in ein Verzeichnis, das eben durch Einsatz der robots.txt-Datei nicht vom Crawler erreicht werden kann. Wenn ich das mache, könnte ich dadurch im Grunde Google verwirren (täuschen?), indem ich Text simuliere, den aber meine Forennutzer gar nicht sehen müssen. Nur, Google könnte das im Gegenzug ja nicht sehen, will aber eigentlich Zugriff auf all das, was die Nutzer sehen können, richtig? Wenn man das nun vereinfacht so sagen kann, wäre die neue Richtlinie der Versuch genau diese Situation auzuhebeln?



    Diese brachiale Drohung hinsichtlich eines möglichen Ranking-Todes erscheint mir, subjektiv gesagt, etwas zu deutlich platziert, als dass ich glaube, dass das wirklich binnen Kürze stattfinden würde. Sprich, nun würden reihenweise Websites ins Nirvana verschwinden. Wie viele Seiten nutzen denn wirklich robots.txt-Dateien und gibt es nicht auch andere Wege, um bestimmte Inhalte so zu verstecken, dass sie nicht angetastet werden können?



    Vielleicht liege ich komplett falsch, lasse mich gerne eines Besseren belehren, aber mir erscheint das komisch und eventuell nicht ganz wie nur heiße Luft, aber zumindest bleibt der Nachgeschmack hinsichtlich der Droh-Wirkung und dass Google's Neugier eben nicht neu wären.

    Einmal editiert, zuletzt von Gabbid () aus folgendem Grund: Wenn ein "Nicht" den Satz zunichte macht...

    • Teambeitrag

    Google modernisiert also seine eigenen Systeme und Seitenbetreiber/Administratoren werden aufgefordert, das Abrufen von vollen Javascript- und CSS-Dateien durch diese robots.txt-Dateien zu beschränken.


    Das ist genau anders herum. Google verlangt nun Zugriff auf CSS und JS falls der vorher geblockt worden ist. Das ist im Prinzip jetzt aber auch nichts das ein Problem darstellt weil ohne CSS und JS sowieso keine Website funktioniert. Google will wohl einfach das der Crawler die Website so wie ein normaler Nutzer sieht.


    Die Frage wäre dann doch auch, warum nutzen Webmaster diese robots.txt-Dateien?


    Ich nutze die hier zum Beispiel um das Impressum aus Google auszuschließen (Fon, Fax, Steuernummer) usw. Hab sonst auch keine großartige Verwendung für die robots.txt. Man könnte sicher etwas Datenvolumen sparen wenn man das optimiert und Verzeichnisse aussperrt, aber das ist ja nun hiermit auch vorbei.


    Hmmm, was bedeutet das nun genau?


    Das bedeutet wenn du Verzeichnisse wie /style/ oder /js/ in der robots.txt für den Googlebot gesperrt hast, solltest du die wieder frei geben ansonsten wirst du abgestraft. Falls nicht braucht dich das nicht weiter kümmern.

    Deine Anfrage wurde nicht beantwortet? Dann bitte einfach noch mal kurz im Thema nachfragen.


    Mein Blog: TwentyMag <- Lesen, Teilen, Liken, Kommentieren, Abonnieren. Ihr wisst bescheid, was labere ich hier groß rum :eyes:

  • Das bedeutet wenn du Verzeichnisse wie /style/ oder /js/ in der robots.txt für den Googlebot gesperrt hast, solltest du die wieder frei geben ansonsten wirst du abgestraft.


    Eine dumme Frage von einer die nicht viel Ahnung davon hat. Ich habe ja nur Stiles von anderen, also zb den Discolor von cls, keine eigenen. Wo und wie kann man das denn machen, dass diese style oder js freigegeben werden für die robots.txt?


    Lg Seele

  • Tom:
    Hab Dank für deinen Hinweis! :) Da sieht man, wie schnell man das Wörtchen "nicht" in einem Satz vergessen und es dann unbeachtet nicht im Text partizipieren kann. :whistling: :D


    Ich hoffe jetzt, ich erscheine nicht wirklich paranoid und interpretiere Dinge hinein, die so nicht gegeben sind, aber Tom, wie erklärst du dir jetzt als Seitenbetreiber diese Richtlinie? Damit meine ich, ist das einfach eine "logische" und harmlose Maßnahme, es hat also nichts mit dem Absuchen von Daten zu tun und dass Google eben wirklich alles sehen will, was die Seitenbetrachter sehen, oder gibt es die berühmten Hintergedanken?


    Und dann die zweite Frage, wie stufst die Drohung bezüglich des Ranking ein - reine Einschüchterungsrhetorik oder reale zukünftige Maßnahme?



    Einen Test in Richtung Google-Ausschluss beim Crawlen wurde ja schon hier veröffentlicht: http://www.internetkapitaene.d…endig-fuer-suchmaschinen/, das Ergebnis zusammengefasst:


    Zitat


    Man kann jetzt der Untersuchung leider nicht entnehmen, ob diese Sperrungen wirklich einen Grund haben/hatten oder ob z.B. einfach die Einstellungen nicht im Laufe der Zeit geändert wurden. Wie würde das Ergebnis nun aber bei WBB-Seiten aussehen, wenn wir spekulieren sollten? Damit meine ich, haben wir in der WBB-Welt tendenziell auch Seiten, die nun die Einstellungen ändern müssten oder sind es eher Einzelfälle?






    @Seelensturm:


    Google hat Hilfetexte bzw. einen Test zur Verfügung gestellt, schau einmal hier: https://support.google.com/webmasters/answer/6062598?hl=de Dort siehst du, wie du bei dir testen kannst, ob etwas versteckt ist und nun freigegeben werden müsste (wie es geht, was du wo ändern müsstest, steht auch in der Anweisung). Hilft das?

  • Danke Gabi, für die Erklärung und den Link.
    Hatte es vorhin mal probiert aber irgendwas klappt da nicht, alles was ich erreichte war das ich selber keinen Zutritt mehr auf das Forum hatte.
    Machte das was bei dem robot.txt Tester stand, also eine Datei runtergeladen, auf boardList.tpl hochgeladen (nach Nachfrage bei Freundin) und danach hatte ich dann keinen Zutritt mehr auf das Forum. Löschte den Teil dann wieder aus der boardList und danach ging alles wieder normal.


    Werde mir das ganze Morgen nochmal ansehen und es erneut versuchen.

  • Darf ich Fragen was du in der boardList wolltest?


    Nun ich habe den Link von Gabbid geklickt https://support.google.com/webmasters/answer/6062598?hl=de
    Dort steht das man Testen kann mit dem robots txt Tester.


    Zitat

    Mit dem robots.txt-Tester können Sie feststellen, ob durch Ihre robots.txt-Datei eine Datei oder ein Verzeichnis Ihrer Website für den Googlebot blockiert wird. Beispielsweise können Sie dieses Tool verwenden, um zu testen, ob der Googlebot-Image-Crawler die URL eines Bilds crawlen kann, das Sie für die Google-Bildersuche blockieren möchten.


    Diesen Link wo robots txt -Tester ist, klickte ich und bekam dann folgendes



    Hier steht in Punkt 2 das man den Code, der bei Punkt 1 genannt wird, in die index php/BoardList/ hohgeladen werden soll. Ich fragte dann die Freundin wo ich diese BoardList finde, sie sagte das die unter Forum - Templates ist. Also folglich habe ich das dann da reingebaut.



    Wo gehört das denn hin wenn nicht in die BoardList was ja in der Anweisung der Seite steht? Der Tester geht ja nur so wenn ich das so einstelle, was anderes hat es mir nicht angezeigt.


    Lg Seele