Очень много работая с различными сайтами, я выделил для себя два действительно хороших способа борьбы с дублями страниц - канонические ссылки и 301 редирект. Что это такое и как они помогают? Об этом дальше.
Что такое канонические ссылки? Убираем дубли страниц с их помощью
Каноническая ссылка - это некий метатег, указываемый в HTML документе и явно прописывающий, что данная страница относится к определенному URL. Обычно он указывается в части head страницы. Например, для данной страницы его нужно прописать вот таким образом:
<link rel="canonical" href="https://vitalik.ws/search-engine-optimization/115-kak-ubrat-dubli-stranic-kanonicheskie-ssylki-i-301-redirekt.html"/>
Что он делает? В чем заключается его суть? Предположим, что мы используем какую-нибудь CMS, в которой SEO оптимизация выполнена не на очень высоком уровне, или же вообще не выполнена. Тогда текущая статья будет доступна сразу по множеству URL, например:
https://vitalik.ws/test/115-kak-ubrat-dubli-stranic-dva-rabochie-sposoba-ot-vitalikws.html https://vitalik.ws/search-engine-optimization/115-test-test.html https://vitalik.ws/search-search-search/115-kak-ubrat-dubli.html и так далее...
В силу недостаточной оптимизации под поисковые системы, по всем ссылкам будет открываться одна и та же статья. И поисковые системы могут проиндексировать все версии URL, добавив ещё и другие. На лицо мы получим множество дублей страниц и их нужно убирать. В поисковой системе необходимо оставить лишь одну версию страницы и убрать другие дубли страниц сайта.
Именно для этого и нужны канонические ссылки - они указывают на единственно верную версию текущей страницы. То есть, имея дубли, что я напечатал выше, мы просто вписываем для текущей статьи мета тег link rel="canonical":
<link rel="canonical" href="https://vitalik.ws/search-engine-optimization/115-kak-ubrat-dubli-stranic-kanonicheskie-ssylki-i-301-redirekt.html"/>
В результате поисковые системы (ПС) видят, что есть лишь одна правильная версия страницы, а всё остальное - дубли. ПС склеивают все не верные страницы и в поиск выходит только та, что и должна быть. В итоге: поисковая оптимизация по этому пункту выполнена!
301 редирект - что это такое и для чего он нужен? Способ против дублей
301 редирект (или более правильно будет 301 redirect) - это способ перенаправления посетителя с одной страницы на другую с пометкой "Перемещено навсегда". Что это значит и для чего он нужен?
Если углубиться в заголовки, которые отдаёт сервер, то полный ответ будет HTTP/1.1 301 Moved Permanently. Эта фраза просто говорит браузеру и поисковым системам: "по старой ссылке больше ничего нет, но то, что было тут раньше, теперь доступно по новой ссылке". То есть, с точки зрения поисковой оптимизации, появляется связь между старой ссылкой и новой. Ссылочная масса переносится на новый URL, позиции тоже - все довольны. Но каким же образом 301 редирект помогает бороться с дублями страниц?
Пример удаления дублей с помощью 301 редиректа - это мой блог. То есть, если вы перейдёте, скажем, по ссылке:
https://vitalik.ws/test/115-test.html
то Вас сразу же перенаправит на "правильный" URL и сделается это через 301 редирект. Вы этого, скорее всего, не заметите, но это будет сделано. То есть, в моём случае, я написал 301 редирект на PHP с проверкой URL и, в результате, большинство дублей будут просто переадресованы на правильную страницу. Способы 301 редиректа - это тема для отдельной статьи или заметки, которую я постараюсь написать чуть позже.
Что бы реализовать склейку дублей таким образом - нужны знания PHP. Да, смотря правде в глаза, даже в таком случае не помешало бы добавить каноническую ссылку. Лишним не будет. А в комплексе - два этих метода будут элегантным решением против дублей.
Вот я и рассказал вам о том, как лучше всего убирать дубли страниц. Я использую эти методы на многих проектах, и они работают. Надеюсь, что они помогут и Вам. Удачных экспериментов и не забывайте оставлять комментарии со своими мыслями!
Все комментарии к статье "Как убрать дубли страниц? Два рабочие способа"
Оставьте свой комментарий первым!