как узнать дубли страниц Думаю большинство знает что дублированный контент на сайте не есть хорошо и поисковые системы считает такие сайт за плагиат. И что самое плохое когда на сайте дублируются не куски текста, а целые страницы. Давайте разберем откуда появляется дубли страниц на вашем сайте, ведь многие даже не подозревают, что мешает наполнять подобного рода страницы.

Самые распространенные причины генерации дублей страниц является движок, так называемая CMS сайта. Достаточно создать неосторожно краткое описание страницы как у вас возникает клон исходной страницы. При все при этом, очень редко где можно встретить описание, как избежать дублей страниц.

Есть проверенные способы для определения, есть ли на сайте дубли страниц:

Первое необходимо проверить количество ваших реальных постов и соотнести с числом страниц в индексе. Таким образом, если число страниц в индексе превышает число страниц на сайте, значит ищите клоны. Их можно вычислить прейдя по ссылке, которая отличается по исходному URL или если у вас ЧПУ то найти двойники будет гораздо легче.

Второй способ это сравнить показатели индексации в Goole и Yandex если расхождение весьма велико то какие то страницы являются копиями.

Теперь давайте рассмотрим пример, у вас на сайте есть информация, где можно купить фаркоп на ауди и у вас появилась страница-клон, где тоже  можно узнать о фаркопах на ауди, такую страницу необходимо закрыть от индексации. Самое простое это конечно же удаль такие страницы, но бывают ситуации когда движок не позволяет этого сделать или вы сами по каким то причинам не можете этого сделать. в таком случае необходимо сослаться на основную страницу вот так:

<link rel=»canonical» href=»основной_адрес_страницы.html» />