Veröffentlichungsdatum: 09. Dezember 2014
Änderungsdatum: 04. Februar 2021
weblication suche index indexierung indizierung indizieren ausschliessen ausschließen einschränken bereiche noindex search wsearch
Dieser Artikel beschreibt, wie Sie Seiten bzw. Bereiche beim Indizieren ausschliessen.
Das Weblication® CMS Zusatzmodul Volltextsuche indiziert die Präsenz als Robot und erfasst somit die Daten in Inhaltsseiten, wie diese ausgegeben werden.
Um nun komplette Seiten bzw. Bereiche innerhalb einer Seite von der Suchindexierung auszuschliessen bzw. Bereiche einzuschränken, stehen Ihnen folgende Möglichkeiten zur Verfügung.
Im Beispielprojekt lassen sich über die Bearbeitung der Metadaten Einstellungen zur Suche vornehmen. So können Sie über die Auswahlbox "Durchsuchbar" (siehe Screenshot) eine Datei von der Suchindizierung ausschliessen, indem Sie diese Einstellung auf "Nein" setzen.
Dies wird im Quelltext der Datei innerhalb des value's des wd:robots Tags gesetzt (index bzw. noindex), siehe Quelltextbeispiel.
... <wd:document xmlns:wsl="http://weblication.de/5.0/wsl" xmlns:wd="http://weblication.de/5.0/wd" version="1.0" type="page.standard" checksum="6dd4d84db4e280ef57a8d867a4a3b5be"> <wd:extension type="weblication" version="5.0" uid="94f58dd0ce155bf76528221fc050653c"> <wd:meta> <wd:title>Startseite</wd:title> <wd:description>Weblication CMS Demoseite</wd:description> ... <wd:robots value="index"/> ... </wd:meta> ...
Sie können eine Seite auch über den HTTP-Header für Suchdienste verbieten, wozu Ihnen das X-Robots-Tag zur Verfügung steht (siehe z.B. Google: Spezifikationen für Robots-Meta-Tags und X-Robots-Tag-HTTP-Header).
Beachten Sie dazu, daß keine Sicherheit/Gewähr besteht, daß Suchdienste dies korrekt interpretieren!
Teilbereiche einer Seite werden standardmässig schon dadurch bei der Suchindizierung ausgeschlossen, indem die Weblication® Volltextsuche nur die Inhalte von Webseiten erfasst, die innerhalb von CONTENT:START und CONTENT:STOP Kommentaren liegen. Mehrere CONTENT:START / CONTENT:STOP Blöcke werden ab Version 005.048.005.000 unterstützt. Alles ausserhalb dieser Kommentare wird nicht in den Suchindex mit aufgenommen. Sofern diese Kommentare nicht gesetzt sind, wird alles innerhalb des Body indiziert.
... <!-- Inhaltsgruppe 1 (content1): Hier wird der Hauptinhalt eingebunden --> <xsl:template name="content1"> <xsl:comment>CONTENT:START</xsl:comment> <xsl:apply-templates select="/wd:document/wd:extension/wd:object"/> <xsl:comment>CONTENT:STOP</xsl:comment> </xsl:template> ...
Sofern Sie darüber hinaus ganz bestimmte Teilbereiche der Seite von der Indexierung
ausschließen möchten, können Sie mit den folgenden Kommentaren arbeiten.
... <xsl:comment>wSearch:noindex</xsl:comment> ... auszuschliessender Bereich ... <xsl:comment>/wSearch:noindex</xsl:comment> ...
... <xsl:comment>wSearch:nosearch</xsl:comment> ... auszuschliessender Bereich, keine Linkverfolgung ... <xsl:comment>/wSearch:nosearch</xsl:comment> ...
... <xsl:comment>wSearch:nofollow</xsl:comment> ... Bereich wird indiziert, keine Linkverfolgung ... <xsl:comment>/wSearch:nofollow</xsl:comment> ...
Beachten Sie, daß CONTENT:START ... CONTENT:STOP Blöcke nicht ineinander verschachtelt werden dürfen. Dies beinträchtigt die Funktionsweise für die Suche.