Um das Duplicate Content Problem zu lösen gibt es seit einigen Tagen den “Canonical Meta-Tag” den die Suchmaschinen Google, Yahoo! und Microsoft unterstützen.

Als Duplicate Content bezeichnen die Suchmaschinen wenn zwei Websites den gleichen Inhalt haben.

Gerade bei Content Management Systemen wie TYPO3 passiert es oft das durch eine Unachtsamkeit oder mangelnde Konfiguration zwei URL’s auf den gleichen Inhalt zeigen.

Beim CMS TYPO zum Beispiel:
http://www.domain.com/index.php?id=201 und http://www.domain.com/seitenname.html oder http://www.domain.com/index.php?id=201&L=1 usw.

Bei grösseren Websites mit diversen Modulen kann die Eliminierung durchaus aufwendig werden, Abhilfe schafft hier auf einfache Art und Weise der Canonical Meta-Tag.

In diesem Beispiel sollte der Tag folgend aussehen:

<link rel=”canonical” href=”http://www.domain.com/seitenname.html” />

Somit werden alle anderen URL’s die auf diesen Inhalt zeigen nicht berücksichtigt.

Mit folgendem TypoScript lässt sich der Tag automatisch mit dem korrekten Inhalt auf jede Seite bringen.

lib.canonical >
lib.canonical = TEXT
lib.canonical.value = <link rel=”canonical” href=”{getIndpEnv:TYPO3_REQUEST_URL}” />
lib.canonical.insertData = 1

Und an gewünschter Stelle in den HTML Header einfügen:

page = PAGE
page {
typeNum = 0
headerData = COA
headerData {
900 = TEXT
900 < lib.canonical
}
}

Als Grundvoraussetzung für dieses Beispiel empfehlen wir die Extension “realurl” und eine korrekte Konfiguration der URL’s in der localconf.php

Eine Alternative ist nach wie vor natürlich auch eine robots.txt Datei im Root Verzeichnis abzulegen wo man betreffende URL vor dem Indexieren ausschliesst.

Beispiel Inhalt:

User-agent: *
Disallow: /*?id=*
Disallow: /*&type=98
ect.