In dit artikel lees je alles over duplicate content. Wat is het, welke invloed heeft het op je vindbaarheid en hoe kun je het voorkomen? Lees snel verder!

Inhoudsopgave

Wat is duplicate content

Duplicate content is content dat op meer dan één plek op het internet te vinden is. Het gaat hier niet alleen over exact gedupliceerde content, maar ook over content dat heel veel op elkaar lijkt. Te veel duplicate content kan negatieve gevolgen hebben op je positie in de zoekresultaten.

Duplicate content kan voorkomen op webpagina’s van verschillende websites, maar ook op webpagina’s binnen dezelfde website.

Waarom is duplicate content slecht voor SEO

Veel website eigenaren zijn bang dat duplicate content kan leiden tot een zogenaamde penalty, wat zou betekenen dat je website wordt verwijderd uit de zoekresultaten.

Dit gebeurt echter maar heel zelden. Zolang je je niet bezighoudt met black hat SEO hoef je je hier geen zorgen over te maken.

In Google Search Central blog schreef Susan Moskwa (in die tijd Webmaster Trends Analist bij Google) hier het volgende over.

Let’s put this to bed once and for all, folks: There’s no such thing as a “duplicate content penalty.” At least, not in the way most people mean when they say that.
Susan Moskwa (voormalig Webmaster Trends Analist bij Google)

Hiermee bevestigd Susan dat er niet iets bestaat als een duplicate content penalty. Tenminste, niet op de manier zoals de meeste mensen denken.

Toch kan duplicate content wel degelijk zorgen voor verschillende problemen op het gebied van SEO. Zo kan het leiden tot een lagere positie in de zoekresultaten en gaat het ten koste van je crawlbudget.

Lagere positie in de zoekresultaten

Zoekmachines zijn in staat om dubbele pagina’s te herkennen.

Omdat de zoekmachine maar één van deze pagina’s wilt laten voorkomen in de zoekresultaten groepeert deze alle pagina’s waarvan het vindt dat ze op elkaar lijken. Vervolgens wordt er één pagina geselecteerd als canonical URL.

Maar als er veel content op elkaar lijkt kan de zoekmachine moeite hebben om de juiste pagina aan te wijzen en vervolgens de verkeerde pagina ranken.

Duplicate content gaat ten koste van je crawl budget

Iedere website krijgt een bepaalt crawl budget toegewezen. Het crawl budget is het aantal pagina’s dat er maandelijks gecrawld wordt.

Pagina’s met een grotere domein autoriteit hebben een hoger crawlbudget dan pagina’s met een lagere autoriteit.

Als je veel identieke pagina’s hebt zal Google al deze pagina’s crawlen (het weet namelijk niet dat het dubbele pagina’s zijn), maar zal het er uiteindelijk maar één indexeren.

Concreet betekent dit dat het kan voorkomen dat nieuwe pagina’s niet worden geïndexeerd en bijgewerkte pagina’s niet opnieuw worden beoordeeld.

Oorzaken van duplicate content

Voordat we kijken naar veelvoorkomende oorzaken van duplicate content is het belangrijk om in je achterhoofd te houden dat zoekmachines jouw website op een hele andere manier bekijken dan dat mensen dat doen. Hierdoor kan het zijn dat je duplicate content hebt, zonder dat je het zelf door hebt.

Verschillende URL’s

De oorzaak van duplicate content is daarom vaak de URL die om wat voor reden dan ook veranderd, zonder dat je dit door hebt.

De onderstaande URL’s leiden bijvoorbeeld allemaal naar dezelfde webpagina:

https://defellow.nl/
http://www.defellow.nl/
https://defellow.nl/
https://www.defellow.nl/
https://defellow.nl
http://www.defellow.nl

Als je website goed is geconfigureerd, is de webpagina maar via één specifieke URL bereikbaar. Alle andere varianten worden doorverwezen door middel van een redirect.

Het gebeurd echter vaak dat een website niet is geconfigureerd en dat de website via twee of meer varianten bereikbaar is. In dit geval ziet Google al deze varianten als afzonderlijke pagina’s.

Productpagina’s en categoriepagina’s met filters

Dit is een veelvoorkomend probleem bij webshops. Productpagina’s kunnen namelijk zonder dat je het doorhebt leiden tot honderden duplicate pagina’s.

Stel, je hebt een productpagina waarop je schoenen verkoopt. De schoenen zijn beschikbaar in drie verschillende kleuren en acht verschillende maten.

Sommige websites maken voor iedere verschillende schoen (in dit geval zijn dat er 3×8=24) een andere pagina.

Voor mensen zijn dit allemaal verschillende pagina’s, maar voor zoekmachines zijn deze pagina’s nagenoeg identiek.

Dit probleem vind je ook vaak bij categoriepagina’s met filters, waar er voor iedere filter een aparte URL wordt aangemaakt.

Praktische tips om duplicate content te voorkomen

Er zijn meerdere manieren om duplicate content te voorkomen. Enkele veelgebruikte manieren lees je hieronder.

301 redirect
Canonical tag
Consistente interne links

301 redirect

In veel gevallen is een 301 redirect een goede oplossing om duplicate content aan te pakken. Hiermee verwijs je zowel de bezoeker als de zoekmachine door naar de juiste pagina. Daarnaast wordt met een 301 redirect ook alle pagina autoriteit doorgegeven.

Je gebruikt zo’n 301 redirect bijvoorbeeld om iemand van een http variant door te sturen naar een https variant.

Canonical tag

Eerder gaf ik het gebruik van product- of productcategorie filter als voorbeeld als mogelijke oorzaak van duplicate content.

Een 301 redirect zal hier geen oplossing bieden. Je kunt in dit geval beter kiezen voor een canonical tag.

Met een canonical tag kan een bezoeker de gefilterde pagina nog steeds bekijken, maar geef je in de broncode aan dat een andere pagina primair is (en dus geïndexeerd zou moeten worden).

Wees consistent met interne links

Een canonical tag is een goed begin om duplicate content te voorkomen, maar dan ben je er nog niet. Een canonical tag is namelijk geen richtlijn, maar een voorkeur.

Google neemt jouw voorkeur mee in haar overweging, maar kijkt ook naar andere factoren, zoals interne links. Het is daarom ontzettend belangrijk om hier consistent mee om te gaan.

Je website controleren op duplicate content

Er zijn verschillende SEO-tools die je kunnen helpen bij het vinden van duplicate content. Hieronder vind je twee handige gratis tools.

Duplicate content op je eigen website

Siteliner is een gratis tool om je eigen website te checken op duplicate content. De tool scant je complete website en genereert vervolgens een lijst met pagina’s die op elkaar lijken (en hoeveel woorden er overeen komen).

Duplicate content vinden op het complete web

Om er zeker van te zijn dat jouw content uniek is, of dat niemand jouw content heeft overgenomen, kun je gebruik maken van Copyscape.

Met Copyscape krijg je een lijst met URL’s waarbij de content overeenkomt met de content van de door jou opgegeven pagina.

Vind je een stuk tekst dat ook op andere websites wordt gebruikt? Dan kun je (een deel van) deze tekst kopiëren en tussen dubbele aanhalingstekens zoeken in Google.

Als je eigen webpagina vervolgens bovenaan in de zoekresultaten verschijnt, ziet Google jouw pagina als het origineel en hoef je in principe niets te doen.

Blijkt het dat iemand jouw content (nagenoeg) exact heeft overgenomen en zit diegene daarmee in jouw vaarwater? Dan kun je drie dingen doen:

De website-eigenaar vragen om de content te verwijderen of aan te passen.
De website-eigenaar vragen om jouw pagina als canonical URL op te geven. De canonical tag werkt namelijk cross-domein.
Google vragen om de pagina uit de zoekresultaten te verwijderen.

Duplicate content