Um das Duplicate Content Problem zu lösen gibt es seit einigen Tagen den “Canonical Meta-Tag” den die Suchmaschinen Google, Yahoo! und Microsoft unterstützen.
Als Duplicate Content bezeichnen die Suchmaschinen wenn zwei Websites den gleichen Inhalt haben.
Gerade bei Content Management Systemen wie TYPO3 passiert es oft das durch eine Unachtsamkeit oder mangelnde Konfiguration zwei URL’s auf den gleichen Inhalt zeigen.
Beim CMS TYPO zum Beispiel:
http://www.domain.com/index.php?id=201 und http://www.domain.com/seitenname.html oder http://www.domain.com/index.php?id=201&L=1 usw.
Bei grösseren Websites mit diversen Modulen kann die Eliminierung durchaus aufwendig werden, Abhilfe schafft hier auf einfache Art und Weise der Canonical Meta-Tag.
In diesem Beispiel sollte der Tag folgend aussehen:
<link rel=”canonical” href=”http://www.domain.com/seitenname.html” />
Somit werden alle anderen URL’s die auf diesen Inhalt zeigen nicht berücksichtigt.
Mit folgendem TypoScript lässt sich der Tag automatisch mit dem korrekten Inhalt auf jede Seite bringen.
lib.canonical >
lib.canonical = TEXT
lib.canonical.value = <link rel=”canonical” href=”{getIndpEnv:TYPO3_REQUEST_URL}” />
lib.canonical.insertData = 1
Und an gewünschter Stelle in den HTML Header einfügen:
page = PAGE
page {
typeNum = 0
headerData = COA
headerData {
900 = TEXT
900 < lib.canonical
}
}
Als Grundvoraussetzung für dieses Beispiel empfehlen wir die Extension “realurl” und eine korrekte Konfiguration der URL’s in der localconf.php
Eine Alternative ist nach wie vor natürlich auch eine robots.txt Datei im Root Verzeichnis abzulegen wo man betreffende URL vor dem Indexieren ausschliesst.
Beispiel Inhalt:
User-agent: *
Disallow: /*?id=*
Disallow: /*&type=98
ect.
8 Kommentare für "TYPO3 und Canonical"
hype.yeebase.com
18.02.2009TYPO3 und der Canonical Tag…
Um das Duplicate Content Problem zu lösen gibt es seit einigen Tagen den “Canonical Meta-Tag” den die Suchmaschinen Google, Yahoo! und Microsoft unterstützen.Als Duplicate Content bezeichnen die Suchmaschinen wenn zwei Websites den gleichen Inhal…
Felix Eggbert
19.02.2009Sehr schön, aber funktioniert dies auch mit CoolURI?
admin
19.02.2009REQUEST_URL gibt ja immer die derzeit verwendete URL zurück, sollte also auch mit CoolURI funktionieren, Nachteil ist das es natürlich auch eine Parameter URL so zurück gibt.
Fladi
19.02.2009Den gleichen Ansatz hatte ich auch zunächst. Aber bei Aufruf einer Seite per id=XY steht dann als canonical natürlich nicht die schöne RealURL drin. Deshalb habe ich das ganze etwas anders angegangen. -> http://www.fladi.de/2009/02/17/howto-einbinden-von-canonical-in-den-header-mit-typo3/
Michael Fritz
20.02.2009Tut mir leid, so ist das mit dem Canonical nicht gemeint.
Bei deinem TYPOSCRIPT kann ich ja beliebige Parameter anhängen und die zeigt TYPO3 dann im HTML Header als canonical URL an. Genau das sollte ja vermieden werden, dass beliebige URLs indiziert werden..
admin
20.02.2009Michael, ja da hast du Recht das geht natürlich nur mit einer sauberen RealURL Konfiguration, aber schau dir die Lösung vom Fladi an, die löst das Problem mit den Parameter URL’s.
Michael Fritz
23.02.2009Unser TypoScript baut den aktuellen Link mit Berücksichtigung aller erlaubter URL-Parameter mithilfe des cHash auf. Alle von TYPO3 nicht explizit erlaubten URL-Parameter fliegen dann raus. Das klappt soweit mit allen Extensions, die sich der cHash-Logik bedienen, z.B. tt_news, cal
http://blog.marit.ag/2009/02/23/canonical-tag-fur-die-suchmaschinen/
Georg Ringer
21.04.2009die extension canonical geht einen etwas anderen weg, indem sie den tag überall dort erstellt wo mit Sicherheit duplicate content vorliegt: bei tt_news mit backpids, Mountpoints usw. Eine Vorstellung gibts auf http://typo3blogger.de/extension-canonical-zur-vermeidung-von-duplicate-content/
@ michael fritz: naja warum sollte ein bot zu links kommen, die nicht vom System erzeugt worden sind? Eine venünftige extension nimmt sowieso die cHashes her