Frage zu Urls die Google als DC ausgibt

Thema wurde von hartwigbusse, 10. Dezember 2018 erstellt.

  1. hartwigbusse

    hartwigbusse Erfahrener Benutzer

    Registriert seit:
    10. Dezember 2014
    Beiträge:
    1.179
    Danke erhalten:
    264
    Danke vergeben:
    426
    Hallo und guten Tag,
    ich habe da mal ne Frage. Es ist ja nun bekannt, dass sich Google gerne Urls zusammen bastelt und dann als DC zur richtigen Url ausgibt.
    Ich habe hier mal wieder 2 Kandidaten, einmal ?reviews_id=6 und dann noch ?language=de.
    Nun meine Frage: kann ich Diese durch die Robots.txt sperren lassen und Sie dann entfernen?
    Freue mich auf Input.
     

    Anhänge:

    • DC.jpg
      DC.jpg
      Dateigröße:
      120,5 KB
      Aufrufe:
      13
  2. Dominik Späte

    Dominik Späte Erfahrener Benutzer

    Registriert seit:
    16. Oktober 2018
    Beiträge:
    1.171
    Danke erhalten:
    1.055
    Danke vergeben:
    366
    Das sieht nach einem historischen Problem aus. Die Canonical-URLs scheinen ebenso richtig zu sein wie die Links. Dadurch sollte sich das Problem in einigen Monaten oder Jahren von selbst lösen. Ich würde aber zusätzlich eine Weiterleitung einrichten:

    RewriteCond %{QUERY_STRING} ^language=de$
    RewriteRule (.*) $1? [L,R=301]

    Was es mit dem reviews_id-Parameter auf sich hat, weiß ich nicht. Aber wenn der ebenso überflüssig ist wie der language-Parameter, kannst Du die äquvialente Regel anwenden:

    RewriteCond %{QUERY_STRING} ^reviews_id=\d+$
    RewriteRule (.*) $1? [L,R=301]

    Und hier wäre die Weiterleitung auch wirklich sinnvoll, weil der Canonical-Link auch die reviews_id enthält und somit wirklich DC produziert - vorausgesetzt, die reviews_id ist wirklich funktionslos.
     
  3. hartwigbusse

    hartwigbusse Erfahrener Benutzer

    Registriert seit:
    10. Dezember 2014
    Beiträge:
    1.179
    Danke erhalten:
    264
    Danke vergeben:
    426
    Danke für die Antwort,
    Na funktionslos ist Sie nicht, der Artikel wird aufgerufen. Oder habe ich da was falsch verstanden?
     
  4. Dominik Späte

    Dominik Späte Erfahrener Benutzer

    Registriert seit:
    16. Oktober 2018
    Beiträge:
    1.171
    Danke erhalten:
    1.055
    Danke vergeben:
    366
    Sorry, was ich meinte ist:
    Macht es funktional irgendeinen Unterschied, z.B. ergeben sich unterschiedliche Inhalte, ob Du nun
    lisa-3.html aufrufst oder
    lisa-3.html?reviews_id=6
    Wenn es keinen Unterschied zwischen den beiden Seiten gibt, dann solltest Du m.E. die zweite RewriteRule auf jeden Fall auch einfügen.

    Noch der Vollständigkeit halber: Die RewriteRules gehören in Webserver-Konfigurationsdateien bzw. die .htaccess-Datei unterhalb von "RewriteEngine On". Die robots.txt hat damit nichts zu tun.
     
  5. Wilken (Gambio)

    Wilken (Gambio) Erfahrener Benutzer

    Registriert seit:
    7. November 2012
    Beiträge:
    18.737
    Danke erhalten:
    7.310
    Danke vergeben:
    2.208
    Ich hab das kurz geprüft und den Eindruck bei den language Parametern stimmt noch was in 3.11 nicht, zumindest wenn man die Sprache per GET-Parameter abbildet und einen language Parameter anhängt, der zu keiner Aktion führt.
     
  6. Dominik Späte

    Dominik Späte Erfahrener Benutzer

    Registriert seit:
    16. Oktober 2018
    Beiträge:
    1.171
    Danke erhalten:
    1.055
    Danke vergeben:
    366
    Den jetzt von mir für die .htaccess-Datei vorgeschlagenen Redirect auf die Canonical hattet Ihr mal in PHP, oder?

    Ansonsten sehen für mich von außen (scheint ja nur "de" aktiviert zu sein) Links, Canonical und Sitemap völlig okay aus.
     
  7. Wilken (Gambio)

    Wilken (Gambio) Erfahrener Benutzer

    Registriert seit:
    7. November 2012
    Beiträge:
    18.737
    Danke erhalten:
    7.310
    Danke vergeben:
    2.208
    Wir haben in 3.11 die Sprachumschaltung umgebaut von GET auf POST Requests. Vorher gab es zum einen unnötig in der URL sichtbare Parameter beim Wechsel von Währung und Wohnort und je nach Konfiguration manchmal bei der Sprache, zum anderen haben sich Crawler da manchmal witzige Sachen zusammengebaut. Das tut auch alles, aber eine Bedingung bei der alten GET-Variante scheint mir nicht mehr hinzuhauen.