WordPress и канонические URLs: Когда и как их использовать. Канонические ссылки (rel="canonical") Где прописывать rel canonical

В этой статье мы рассмотрим канонические ссылки в html (атрибут rel="canonical"). Поговорим зачем они были введены и для чего использовать. Скажу сразу, что появились они в 2009 году в компании Google.

Что такое каноническая ссылка

Дубли на сайте - страницы содержащие одинаковый контент , но имеющие разные адреса URL.

Чаще всего дубли возникают в результате недоработок движка сайта . Такие проблемы есть почти у каждого сайта на CMS. Ничего страшного в этом нету, если их грамотно обработать. Бороться с дублями необходимо прежде всего для того, чтобы занимать хорошие места в поисковой выдаче. Как известно, дубли негативно влияют на траст сайта в целом, а следовательно и на его позиции.

Для борьбы с дублями существует несколько способов:

robots.txt (все про robots.txt)
301 редиректом (как сделать 301 редирект)
404 страницей (404 ошибка - как правильно настроить)

Однако есть и четвертый способ решения этой проблемы - использование атрибута rel="canonical" .

Атрибут rel="canonical" - как пользоваться

Синтаксис rel="canonical"

... ...

Этот атрибут прописывается в заголовочных тегах . На всех одинаковых страницах (дублях) нужно указать адрес главной страницы (основной). Ссылки в href="" и есть канонические ссылки.

Например, если на сайте есть одинаковые страницы

site/catalog/tovar site/catalog/tovar?sort=abc site/catalog/tovar?sort=price

Для уточнения какая из этих страниц является главной достаточно написать на каждой странице:

Тем самым показывая поисковой системе, что адрес основной страницы является - site/catalog/tovar .

Ответы на часто задаваемые вопросы

1. Стоит ли пользоваться каноническими ссылками?

Да, стоит. В рассмотренным примере, можно было пользоваться только каноническими ссылками или robots.txt. Можно совмещать эти два способа.

При использовании нужно быть осторожным, чтобы не давать роботу ложные рекомендации на тех страницах, где это делать не нужно.

2. Что будет если канонически ссылки противоречат друг другу

Это плохо, но поисковый робот тогда самостоятельно разберется, какую страницу оставить главной. Лучше не допускать таких противоречий.

3. Случаи, когда робот может проигнорировать ваши рекомендации

Из справки Яндекса:

Документ по каноническому адресу недоступен для индексирования
В качестве канонического адреса указывается URL в другом домене или поддомене
Вы указали несколько канонических адресов

4. Можно ли использовать цепочку канонических URL

Например, /stranica/123 ссылается на /stranica/12, а эта в свою очередь на /stranica/. Поисковый робот может проигнорировать такую конструкцию.

5. Как правильно выбрать канонический урл

Сложно ответить и рассмотреть все варианты в паре предложений. Дадим общие рекомендации. На мой взгляд нужно смотреть на привлекательность URL (или точнее на ЧПУ). К примеру, если есть страница /cat/2323fdfds34.html и страница /cat/rel-canonical. Очевидно, что второй адрес гораздо предпочтительней.

Если все не так очевидно, то стоит выбирать менее вложенные статьи в каталоги и менее короткие URL. К примеру /cat/podcat/podpodcat/str.html лучше заменить на /cat/str.html

И последнее: если какая-то страница уже долго время существует и хорошо ранжируется, то все новые "дубли", лучше ссылать на нее. Смена адреса путем rel canonical, конечно, не должна повлиять на позиции, но лучше не рисковать, если они и так высокие по этому запросу.

6. Можно ли ссылаться на другой домен канонической ссылкой

В атрибуте rel canonical можно использовать ссылки только внутри домена или поддоменов. Нельзя ссылаться на внешние сайты.

7. Можно ли делать rel canonical сама на себя

Да можно. Смысла в этом нету, но и плохого тоже.

Канонические URL – это загадка для многих людей, и потому многие могут неправильно использовать такие URL для задания, к примеру, 301 редиректа. Люди предполагают, что эта возможность имеет отношение к SEO, однако они не знают, когда и как следует использовать их. В WordPress в частности (по сравнению с обычным HTML сайтом) может быть достаточно тяжело вручную задавать канонические URL для каждой страницы сайта без обращения к плагинам вследствие работы шаблонов темы, имеющихся в системе управления контентом.

В этой статье мы поможем разрешить некоторые пользовательские вопросы, которые связаны с каноническими URL. Пользователи, которые не работают с WordPress, также могут найти эту статью полезной для себя, поскольку в ней будут предложены основные принципы канонических адресов, применимые к любой системе управления контентом или к методам разработки.

Обратите внимание, что эта статья может показаться для вас достаточно сложной, если у вас нет технических навыков, связанных с WordPress, базовым HTML или SEO. Мы познакомим вас сначала с основными терминами. Если вдруг что-то в статье вам покажется непонятным, вы всегда можете поискать в поисковой системе ответы на возникшие вопросы.

Что представляет собой канонический URL?

Канонический URL (часто описываемый как rel=canonical, канонический тег и т.д.) – это то, что используется поисковыми системами при отсылке к материалу на вашем сайте, когда страница с материалом имеет несколько версий на вашем сайте или даже в сети. Сегодня канонические URL используются для решения некоторых сложных проблем с дублированием контента, и иногда эта возможность применяется для задания 301 редиректа.

Google предлагает прекрасное объяснение целей канонических URL . Я настоятельно рекомендую изучить его. Они сделали его максимально ясным.

Возможно, вы считаете, что ваш сайт не имеет дублированного контента. Прекрасно, если вы позаботились о том, чтобы ваш контент не повторялся на разных страницах. В противном случае это может вылиться в снижение ваших показателей в поисковой выдаче.

Если вы решили продублировать текст на вашем сайте, подумайте об этом серьезно: если бы вы были поисковой системой, которая старается дать ответ на пользовательский запрос, вы бы предложили пользователю две идентичных страницы в поисковой выдаче? Нет! Это бесполезно для людей. Вместо этого вы бы предложили столько разнообразных результатов в выдаче (SERP), сколько сможете найти, что, соответственно, полностью отвечало бы поисковым потребностям людей.

Таким образом, если вы дублируете контент на своем сайте, вы можете – и должны – ожидать, что Google не будет ранжировать все ваши страницы. Однако это не слишком хорошо, если вы думаете только о показателях поисковых систем и присутствию в SERP.

Дубли URL-адресов, о которых вы, возможно, не знали

Отлично, давайте вернемся назад и предположим, что мы убедились в уникальности наших страниц сайта. Однако у вас по-прежнему могут остаться некоторые «скрытые» дублируемые URL, о которых вы просто не знаете (в реальности они, конечно же, не скрыты). Это может удивить вас, но вы должны знать – поисковые системы видят следующие URL как совершенно обособленные, отдельные, даже если они выводят на экран один и тот же контент:

http://www.examplesite.com (обратили внимание на www?)
http://examplesite.com
https://examplesite.com (обратили внимание на https?)
http://www.examplesite.com/ (обратили внимание на слэш в конце?)
http://examplesite.com/index.php

Именно по этой причине нам и нужны канонические URL в теге HEAD кода HTML всех ваших страниц. Вы должны сообщить поисковым системам, какую из версий всех вышеупомянутых URL (и других версий) они должны просмотреть.

Да, вы должны принять окончательное решение о том, собираетесь ли вы использовать www или нет во всех ваших ссылках в процессе веб-маркетинга. Вы должны придерживаться одной ссылочной стратегии по всему сайту, и даже за его пределами. Все те, кто пользуется вашими URL, должны знать это: сотрудники, партнеры, каталоги, в которых вы перечислены, люди, которые ссылаются на вас – все.

Вы также должны определиться с тем, будете ли вы использовать слэш в конце URL, а также будете ли вы использовать https (если вы принимаете на сайте важную информацию, такую как, к примеру, данные кредитных карт). Выберите один вариант и придерживайтесь его. На вашем месте я бы выбрал тот, который используется чаще всего, чтобы избежать головной боли при исправлении своих URL.

К счастью, если вы пользуетесь WordPress, то большую часть этих проблем удастся решить. Мы рассмотрим разные плагины и другие вещи, которые помогут вам справиться с этим.

Однако есть и другие места, в которых канонические URL оказываются очень полезными.

Дублируемый контент, создаваемый таксономиями

Допустим, вы пишете статью, и вы включаете ту статью в многочисленные рубрики блога с разными метками в WordPress (все это называется таксономиями). Люди всегда делают это. Или, допустим, вы занимаетесь электронной коммерцией, и ваши продукты появляются в многочисленных рубриках. У нас появляется проблема: контент может быть представлен несколько раз по разным URL, что упрощает пользователям навигацию по сайту. К примеру:

http://examplesite.com/store/candy/chocolate-truffles
http://examplesite.com/store/foods/chocolate-truffles

Вы хотите, чтобы ваши пользователи могли найти шоколадные трюфели в двух рубриках: «candy» и «food». Это прекрасно. Но какой из двух URL должен быть проиндексирован поисковыми системами? Помните, что они не станут ранжировать оба URL. Таким образом, вы должны выбрать это самостоятельно. И именно в этом случае на первый план выходят канонические URL. Такие URL расскажут поисковым системам: «эй, этот контент точно такой же, что и на другой странице; пожалуйста, проиндексируй его».

Помните, что ни одна поисковая система не обязана повиноваться данной канонизации, и они могут проигнорировать ее, если посчитают ее неправильной.

Использование перекрестных канонических URL при дублировании контента с других сайтов

Есть самая важная причина, почему вам требуется канонический URL. Про нее мы поговорим ниже (есть и другие, но они более сложные, при этом принцип – тот же самый). Бывает так, что вы публикуете на своем сайте контент, который также появляется на других сайтах. Самый простой пример такой ситуации – синдикация (к примеру, пресс-релизы).

Допустим, ваша компания публикует пресс-релиз и передает его на ваш сайт. Это вполне нормальное явление. Однако пресс-релизы работают следующим образом: они могут бесплатно использоваться любым издателем контента. Они специально создаются для того, чтобы их копировали и распространяли. Есть даже целые сети синдикации, как, к примеру, PRWeb. Это достаточно старая форма маркетинга.

Однако она порождает проблемы с SEO. Для робота поисковой системы контент пресс-релиза на вашем сайте является точно таким же, как контент пресс-релиза на других новостных сайтах. Как понять, где оригинал? Какой URL выводить в SERP (поисковой выдаче)? Помните – вы должны его выбрать.

Обычно поисковые системы выбирают его самостоятельно, если вы ничего им не предложите. И делается такое предложение при помощи канонического URL. В случае с пресс-релизами, однако, маловероятно, что каждый небольшой новостной журнал будет задавать канонический URL, указывающий на ваш сайт. Помните, что многие про это просто не знают. Я сомневаюсь, что они будут торопиться с указанием оригинального источника контента и с соответствующим кодированием HTML. Они ведь публикуют по несколько разных статей в день.

Таким образом, вы должны позаботиться об этом на своем сайте. На вашем месте я бы использовал канонический URL на странице, содержащей ваш пресс-релиз, и ссылался бы на его копию в основной сети синдикации, в которой вы опубликовали статью для последующей дистрибуции. К примеру, вы можете сослаться на копию статьи на сайте PRweb.com (если вы используете этот сервис).

Если вы хотите увидеть живой пример ситуации, не касающейся пресс-релизов, и при этом затрагивающей канонические URL, давайте посмотрим на следующую статью, которую я написал для KISSmetrics год назад:

Вскоре после этого сайт Entrepreneur.com взял эту статью, потому что у них было соглашение с KISSmetrics (помните, у них было разрешение!)

Теперь у нас есть тот же самый контент, доступный по двум URL адресам. В техническом плане это – дублируемый контент, а это плохо! Однако не стоит бояться. Если вы посмотрите исходный код статьи на Entreprenuer.com, то вы найдете там следующее:

Это говорит поисковым системам о том, где был представлен оригинальный контент, что является верным решением. Это также снимает подозрения о краже контента в глазах поисковых роботов (которые не могут знать о ваших законных правах на публикацию работы).

Однако не стоит создавать целый сайт, состоящий из статей других людей. В этом случае канонический URL вряд ли поможет вам с ранжированием. Поэтому не злоупотребляйте данной тактикой.

В каких случаях вы не можете использовать канонические URL для внешнего дублируемого контента

Я хочу рассказать об этом, поскольку я часто сталкиваюсь с такими ситуациями. Если вы хотите вывести описание компании или персональную биографию на вашем сайте, я не рекомендую использовать те же самые слова и фразы, которые вы используете в ваших социальных профилях или в других местах сети.

Если вы задаете то же самое описание, которое указано у вас в LinkedIn или на вашей бизнес-странице Google Plus, то вы, по сути, дублируете контент. Не стоит использовать канонический URL на странице About, и подцеплять к ней ваш профиль из социальной сети. Ваша страница About должна ранжироваться самостоятельно. В таком случае, пожалуйста, используйте уникальное описание для внешнего использования. Я делаю так для всех своих клиентов.

Как использовать канонические URL в WordPress

Есть несколько способов сделать это, но я собираюсь показать вам самый лучший, которым пользуюсь я сам: просто воспользуйтесь плагином WordPress SEO от Joost De Valk.

Как только вы установите этот плагин на своем сайте, он позволит вам позаботиться о многочисленных SEO показателях, в том числе и о канонических URL. Однако плагин предлагает и другие настройки, на которые нужно обратить внимание.

На скриншоте ниже вы можете видеть, что на экране редактирования отдельной записи или страницы (плагин работает и для произвольных типов записей) панель WordPress SEO предлагает массу настроек и полей. Чтобы задать канонические URL, которые вы можете использовать для разных вещей – пресс-релизов или внешних дублей контента, – перейдите на вкладку Advanced:

Щелкните по выпадающему списку, чтобы выбрать тип URL для канонического адреса в теге head всех ваших страниц:

Когда не нужно использовать канонический URL

Во-первых, прочтите следующую в блоге Google Webmaster Central о распространенных ошибках с rel=canonical URL. Убедитесь в том, что вы – или ваш разработчик – не допустили их. Во-вторых, не используйте канонические URL в следующих ситуациях:

Когда вы хотите сделать 301 редирект

Если вы хотите перенаправить одну страницу к другой, чтобы пользователи, которые ввели старый URL или нажали на мертвую ссылку, были перенаправлены к новому URL, вам нужно использовать 301 редирект. Не используйте для этого канонические URL. Однако в SEO они часто применяются таким вот образом.

Редирект означает, что есть только одно место, где представлен контент, и вы вынуждаете пользователей перейти к этой странице. Это подходит, к примеру, в том случае, если вы перенесли свой сайт на новый домен или настроили новую структуру URL вследствие реконструкции сайта. Вы можете также использовать 301 редирект для отправки людей к версии вашего сайта с www или без www (это позволяет убедиться в том, что никто не перейдет на ваш сайт по неправильному адресу).

Благодаря каноническим адресам, вы можете иметь тот же самый контент на разных страницах в сети, и иметь один «оригинальный» источник контента. Иными словами, разные страницы, содержащие один и тот же контент, могут существовать и просматриваться пользователями.

Однако еще в 2011 году Рэнд Фишкин провел один интересный эксперимент, в котором он использовал канонический URL в хэдере всех страниц старого домена, чтобы таким образом улучшить ранжирование другого нового домена. И это сработало. Он поведал об этой истории в своей записи . Запись также объясняет, почему канонические URL так важны для кросс-доменной синдикации контента в мире SEO. Я не думаю, что сегодня это сработает, но можете попробовать в качестве эксперимента.

Когда вы хотите, чтобы поисковые системы проигнорировали вашу страницу

Помните, что rel=canonical – это не решение проблем с дублями контента. Поисковая оптимизация гораздо сложнее, и иногда более подходящее решение заключается в том, чтобы использовать файл robots для закрытия страниц от индексации. Именно поэтому плагин WordPress SEO включает в себя соответствующие опции.

Я рекомендую своим клиентам закрывать от индексации некоторые страницы, которые не являются полезными для посетителей. К примеру, зачем вам в выдаче страница Terms and Conditions, страницы входа в систему? Их там быть не должно. Лучше освободить дорогу более ценному контенту. К нему относятся продающие страницы, описания товаров и информативные записи блога.

Я также советую использовать правило no-index для страниц с очень малым количеством контента (поскольку ваш сайт в таком случае выглядит слишком несодержательным) и для архивов, которые дублируют контент. В WordPress это применимо к архивам авторов, архивам по дате, и, в моем случае, к архивам меток (поскольку они содержат тот же контент, что и архивы рубрик). Вы можете также закрыть от индексации произвольные типы записей и их архивы, если они только передают контент с других страниц вашего сайта.

Примечание: если вы что-то закрываете от индексации, то вам нужно будет удалить этот контент также из карты сайта, иначе это приведет к ошибкам в Google Webmaster Tools.

Поправляем URL-адрес для соответствия его с каноническим указателем

Помните, мы говорили выше о том, что нужно выбрать одну версию URL, которая будет использовать во всех ссылках с данного момента? Отлично, как только вы сделаете это, вам нужно будет «почистить» или исправить URL-адреса на вашем сайте и в других местах, чтобы они ссылались на выбранную вами версию. Допустим, что вы приняли решение использовать версию без www на вашем сайте. Теперь вам нужно убедиться в том, что все внешние и внутренние ссылки используют выбранную вами версию. Если нет, то надо постараться изменить URL-адреса. Да, это может показаться достаточно сложным действием, но это стоит того.

Чтобы быстро заменить все URL на своем сайте, вы можете использовать такой инструмент, как Search Replace DB . Однако используйте его только в том случае, если вы понимаете, что вы делаете.

Есть также плагины, которые позволяют провести поиск и замену через консоль WordPress. После проведенной замены удалите все, что соединено с вашей базой данных, чтобы избежать лишних рисков, связанных с безопасностью.

Чтобы справиться с мертвыми ссылками в записях и страницах, воспользуйтесь плагином, таким как, к примеру, Redirection , который выполнит эту задачу за вас.

Когда вы все это сделаете, убедитесь в том, что вы вошли в свой аккаунт Google Webmaster Tools и установили предпочтительный URL для вашего сайта. Кроме того, отправьте обе версии – с www и без www – вашего сайта в Google Webmaster Tools, чтобы задать предпочтения.

Заключение: используйте канонические URL для преимуществ в плане SEO

Надеемся, мы справились с хаосом, который имелся вокруг канонических ссылок и влияния их на SEO. Если вы по-прежнему не разобрались во всех аспектах, я рекомендую перейти по ссылкам, приведенным в данной статье. Однако самое лучшее достижение – теперь вы знаете, как использовать канонические адреса, знаете, что у них есть потенциал, который позволит добиться великолепных SEO результатов.

Дублированный контент – проблема, с которой могут справиться далеко не все владельцы бизнес-сайтов. Порой у них просто нет времени, чтобы решать эту проблему. К счастью, поисковые системы понимают, что порой тот же самый контент может быть доступен по разным URL-адресам, причем вполне законно. Поисковые системы предложили нам инструмент, который мы можем использовать – так давайте же воспользуемся им в своих интересах!

Доброго дня читателям. Для большинства людей канонические URL – это вещь крайне загадочная, и зачастую они могут быть ошибочно использованы для таких операций, как 301 редирект. Пользователи знают, что такие ссылки имеют отношение к SEO, но не совсем уверены в том, как их можно использовать. Говоря же о WordPress (в противовес HTML сайту), то здесь не так легко вручную прописывать канонические ссылки для каждой отдельной страницы вашего сайта, без использования плагина, так как это идет вразрез с тем, как работает шаблон системы управления содержимым сайта.

Данная статья поможет прояснить некоторые вопросы, которые могут возникнуть у пользователей WordPress в связи с использованием канонических URL. Не WordPress пользователи также найдут эту статью полезной, потому что смогут узнать основные принципы и затем применить эти правила к собственной системе управления контентом или обогатить свой опыт разработчика. Как бы то ни было, эта статья может показаться вам сложной в освоении в том случае, если у вас не достает технических знаний о WordPress или базовой информации о HTML и поисковой оптимизации (SEO). Мы осветили все термины, чтоб вы могли с ними познакомиться в первую очередь. Но, в любом случае, из этой публикации вы сможете почерпнуть тот необходимый базис, с которого можно начать гуглить, чтоб найти больше информации для получения более полной картины.

Что представляет из себя канонический URL?

Канонический URL (также известен, как rel=canonical, канонический тег и под другими названиями) – это то, на что ссылаются поисковые системы, когда они видят дублированные версии страницы на вашем сайте или же в интернет-пространстве. Сейчас этот прием используется для решения сложных проблем, связанных с дублированным контентом, так как часто он является лучшим решением, чем использование 301 редиректа.

Возможно, вы думаете, что на вашем сайте нет дублированного контента. И это здорово, если вы следите за тем, чтоб ваш контент не повторялся на множестве страниц. В противном случае, это может привести к понижению ранга вашего сайта в поисковой выдаче.

Если на вашем сайте есть повторяющийся текст, постарайтесь серьезно подумать над этой проблемой: если бы вы были поисковой системой, которая пытается ответить на запрос пользователя, вы бы выдали этому пользователю две идентичные страницы в результатах поисковой выдачи? Конечно же, нет! Это же совершенно бесполезно. Вы бы выдали им столько разных результатов (в поисковой выдаче), чтоб они могли найти то, что им необходимо.

Таким образом, если контент на вашем сайте повторяется снова и снова, ожидаемо, что Google просто не будет ранжировать такие страницы. И это нехорошо, если вы хотите занимать хоть какие-то позиции в поисковой выдаче.

Ссылки на дублированный контент, о существовании которых вы даже не подозреваете

Хорошо, теперь давайте вернемся назад и предположим, что вы все сделали правильно и уверены в том, что все ваши страницы абсолютно уникальны. Но, возможно, на вашем сайте все же присутствуют «скрытые» дублированные URLы, о которых вы знать ничего не знаете (на самом деле они не скрытые, я просто их так назвал). Это может вас удивить, но знали ли вы что поисковики воспринимают следующие URL, как полностью самостоятельные, даже не смотря на то, что для вас это одно и то же, и отображает одинаковый контент?

http://www.examplesite.com (заметили www?)

http://examplesite.com

https://examplesite.com (заметили https?)

http://www.examplesite.com/ (заметили слэш в конце?)

http://examplesite.com/index.php

Вот почему вам нужен канонический URL в теге HTML-кода всех ваших страниц. Необходимо оповестить поисковые машины о том, на какую версию типов URL приведенных выше или других они должны обращать внимание.

Это значит, что вы должны раз и навсегда решить отказаться ли вам или нет от использования www во всех ссылках вашего веб-проекта. Это должно стать вашей стратегией перелинковки сайта как внутри него, так и за его пределами. И это должны знать все, кто используют ваши URL: фрилансеры, работающие на вас, ваши партнеры, совладельцы, а также этот адрес должен быть указан во всех каталогах, где есть ваш сайт. Кроме того нужно решить, хотите ли вы слэш в конце или https (если на вашем сайте вводится специфическая информация, типа кредитных карт). Выберите один вариант и придерживайтесь его всегда. Если бы выбирать приходилось мне, я бы предпочел вариант, который используется чаще всего, чтоб снизить уровень головной боли, когда дело доходит до наведения порядка в URLах.

К счастью, если вы работаете с WordPress, большинство таких проблем решаются довольно просто. Мы расскажем вам о необходимых плагинах и действиях, которые нужно проделать далее в этой статье.

Но опять же повторюсь, что для канонических ссылок есть гораздо больше применений.

Дублированный контент, созданный таксономией

Скажем, вы написали статью и включили ее в разные категории блога и теги в WordPress (все это называется таксономией). Люди постоянно это делают. Или, например, есть у вас интернет-магазин, в котором товары заносятся в разные категории. Тогда, по замыслу, для удобства передвижения пользователей по сайту, один и тот же контент появляется по разным URL, но это приводит к появлению проблем. Например:

http://examplesite.com/store/candy/chocolate-truffles

http://examplesite.com/store/foods/chocolate-truffles

Вам хочется, чтоб посетители нашли эти самые «шоколадные трюфели» в обеих категориях: «сладости» и «еда». Неплохое стремление. Но на какой URL должны обращать внимание поисковые машины? Вы же помните, что они не будут ранжировать обе ссылки. Так что нужно выбрать. И вот здесь вам пригодятся канонические ссылки. Они скажут поисковым машинам «эй, на этой странице тот же контент, что и на той, пожалуйста, ранжируй эту страницу, а не ту».

Помните, что это просьба – ни одна поисковая система не обязана повиноваться вашей канонизации, и они могут ее проигнорировать, если посчитают неправильной.

Использование кроссдоменного канонического URL для дублированного контента

Это последняя причина, по которой вам нужен элемент канонический URL, который будет описан в данной статье (есть и другие, но они сложные, да и принцип использования не меняется): когда вы публикуете контент на вашем сайте, который также появляется и на других сайтах. Наиболее очевидные случаи такого дублирования – это пресс релизы. Так ваша компания публикует пресс релиз и размещает его на вашем сайте. Это вполне законно. Но, традиционно, пресс релиз – это такая штука, которую может опубликовать у себя кто угодно. Они создаются для того, чтоб ими делились и копировали. В этом заключается принцип работы сообществ дистрибьюторов, типа PRWeb . Это старый, как мир маркетинговый прием.

Но это рождает конфликт SEO интересов. Для поискового робота контент пресс релиза на вашем сайте – это то же самое, что и на сайтах его позаимствовавших. Так, где же оригинальная копия? Какую ссылку ранжировать в поисковой выдаче? Помните, что нужно выбрать только одну.

Обычно поисковые машины выбирают за вас, если только вы не предложите им свой вариант. И вы можете это сделать, использовав канонический URL. В случае пресс релизов, вы, как бы то ни было, вряд ли каждый новостной сайт будет публиковать вашу статью с каноническим URL на ваш ресурс. Помните, что для многих данный элемент не особо понятен. Я так же сомневаюсь, что кто-то будет тратить время на то, чтоб найти ресурс с исходной статьей и правильно кодировать свой HTML. Они публикуют по несколько статей в день, так что только вы можете позаботиться о правильных ссылках на вашем сайте. На вашем месте я бы поставил канонический URL на страницу, которая содержит пресс релиз, и обратился бы к копии, на странице крупного сообщества, где вы изначально разместили статью для заимствования. Например, закинем копию статьи на сайт PRweb.com (если вы используете данный сервис). Просто мои пять копеек.

Вот пример из реальной жизни, не связанный с ситуацией пресс релизов, где канонический URL пришелся весьма кстати: взгляните на статью, которую я написал о KISSmetrics около года назад:

Вскоре после этого Entrepreneur.com разместили эту статью у себя, так как у них было соглашение с KISSmetrics.

Вот URL той статьи:

http://www.entrepreneur.com/article/231237

Теперь у нас есть одинаковый контент, на который ведут две разные ссылки. Технически это дублированный контент, а дублированный контент – это «плохо», помните? Но не стоит бояться! Если вы посмотрите на исходный код Entreprenuer.com, то вы увидите это

Это говорит поисковым системам, где находится оригинальный контент, что представляет собой правильный выход из ситуации.

Это снимает подозрение в воровстве контента в глазах поисковых систем (которые не могут иначе узнать, кому именно принадлежат легальные права на публикацию контента).

Вероятно, вам бы не хотелось иметь такой сайт, на котором публикуются только чужие материалы. Тут элемент канонический URL, вряд ли поможет вам улучшить ранжирование сайта. Так что не злоупотребляйте использованием данной тактики.

Когда вы не можете использовать канонический URL для дублированного контента с другого сайта

Мне хочется осветить один момент, так как я много раз наблюдал такую ситуацию. Если вы собираетесь написать описание компании или персональную биографию на вашем сайте я бы не рекомендовал вам использовать тот же набор слов в ваших профилях в социальных сетях или на любых других сайтах. Если вы пишите одно и то же снова и снова на странице вашей компании на LinkedIn, бизнес странице на Google Plus и т. д., вы просто дублируете ваш контент. Вы не сможете использовать канонический URL на странице, посвященной компании или человеку, и сделать отсылку к профилю в социальной сети: вам не захочется чтоб такая страница ранжировалась сама по себе. В этом случае, пожалуйста, просто пишите каждый раз новое уникальное описание.

Как использовать канонические URLs в WordPress

Это можно сделать разными способами, но я расскажу вам о лучшем варианте, который мне известен: используйте плагин от Joost De Valk. Как только вы установите это расширение на вашем сайт, он начнет заботиться о вашем SEO, включая управление каноническими URL для того, что я назвал «скрытыми» URLами (смотри выше). Но все-таки стоит обратить внимание на некоторые настройки. На скрине ниже, виден экран настройки для единичной записи или страницы (так же применимо для пользовательских типов записей, если вы такие используете), и SEO-бокс WordPress содержит много полей и настроек. Для настройки канонических URL, которые пригодятся для штук типа пресс релизов и контента, дублированного на других сайтах, кликните таб “Advanced”:

Этот плагин значительно упростит для вас элемент канонический URL. Все, что нужно сделать, это ввести полный url оригинального источника вашего контента, который публикуется на данной странице. Другими словами, URL, который копирует контент, это та ссылка, которая должна использовать каноническую URL в HTML «шапки». Копированный контент теперь будет сигнализировать поисковикам о том, что он всего лишь копия. Имеет смысл, да?

Хорошо, но это всего лишь принцип. Исходя из примера, данного выше, вам может иногда захотеться указать, что вы всего лишь копируете контент, хотя это совсем не так, так как вам просто трудно контролировать распространение контента. Вы можете опубликовать пресс релиз на сайте своей компании и, если нужно, вы можете использовать атрибут для оригинального источника контента в сети синдикации, которую вы используете. В этом смысле вы будете действовать, как один из синдикаторов. (между прочим, это всего лишь мое мнение. Этот совет могут не одобрить другие SEO-эксперты. Так что используйте его на свой страх и риск. Google «клянется», что он очень хорош в идентификации оригинального источника контента, и канонические указатели – это только дополнительная подмога. Поисковые системы могут их проигнорировать).

В других случаях канонические URL, которые вы вводите, будут внутренними ссылками вашего сайта, содержащими дублированный контент. Скажем, например, вы публикуете описание вашего товара на статичной странице для оптовых покупателей. Но вы используете это же описание в разделе вашего сайта, где люди покупают товары в розницу.

Используя поле для канонического URL в SEO-настройках WordPress, вы можете подсказать поисковым машинам какую ссылку вы бы хотели, чтоб они ранжировали.

Замечание: Вам нужно выбрать версию ссылки с www или без www для каждой страницы, используя эти настройки. Плагин WordPress SEO делает это автоматически. Вам могут понадобиться эти настройки только в том случае, когда URL очень отличается или контент находится на другом домене.

Настройка https глобальной канонической URL с использованием WordPress SEO

Вот еще кое-что, что вы можете сделать с каноническими ссылками, используя плагин WordPress SEO. Если вы используете сертификаты SSL (для продаж в Интернете) вы можете сделать так, чтоб ваш канонический тег использовал https версию ваших ссылок в том случае, если страницы могут находиться и по http, и по https. Для этого идем в SEO > Permalinks и прокручиваем до «Canonical Settings» (канонические ссылки) в вашей консоли WordPress.

Кликаем на развернувшееся меню, где можно выбрать тип URL, который вы хотите сделать элементом canonical URL в теге всех ваших страниц:

Канонический тег (rel=”canonical”) является довольно важным инструментом поисковой оптимизации. Зачастую он даже лучше, чем 301 редирект при работе с дублированным контентом.

Разберём более подробно этот тег.

Что плохого в дублированном контенте

Дублированный контент – это два одинаковых по своему содержанию документа. Когда Google видит дубль, он старается исключить его из индекса, т.к. по идее пользователь не захочет видеть один и тот же документ в поисковой выдаче несколько раз. Да и к тому же самому поисковику не хочется постоянно обрабатывать тысячи и даже миллионы дублированных страниц, тратя на это свои производственные мощности.

Проблема для веб-мастера состоит в том, что если одна и та же информация находится на разных страницах, то в выдаче будет только одна из этих страниц. Но url, который выберет Гугл, не всегда является наиболее оптимальным для пользователя, и не всегда является первоисточником.

Пока поисковик не определит первоисточник, результаты выдачи не будут удовлетворять целям первоначального автора контента. В данном случае канонический тег имеет ограниченную пользу, поскольку те, кто крадут ваш контент, скорее всего, не будут ставить теги.

С другой стороны, если дублирование происходит на вашем сайте, то тег будет как нельзя кстати. Даже если на вашем сайте будут ссылки на дублированный контент, ценность для выдачи будет составлять только страница-первоисточник. Таким образом, даже при наличии ссылок на несколько дублей, значимой для Google будет считаться только одна из этих страниц. И не пострадает.

Естественно, это не лучшее решение с точки зрения SEO. Но это не приведёт к каким-либо санкциям со стороны Гугла.

Что такое тег rel=”canonical”

Тег имеет следующий синтаксис: Таким образом Google и Bing поймут, что все дубли ссылаются на канонический адрес, указанный в теге. Гугл имеет чёткое представление по поводу использования данного тега:

Да, rel=”canonical” должен использоваться только для выбора предпочитаемой страницы при дублировании (незначительные различия в содержании допустимы).

Другими словами, используйте его только для борьбы с дублированным контентом. При использовании его для других целей вы можете быть уличены в поисковом спаме.

Проблемы дублированного контента

Реализуйте теги надлежащим образом на вашем сайте. Это убережёт вас от проблем дублированного контента, некоторые из которых связаны с системами управления сайтами (CMS):

Tracking Codes . Некоторые системы требуют добавления переменных в конце url-адреса для обратных ссылок на ваш сайт. Формат может быть такой: www.example.com?tracking-variable или такой: www.example.com/example.htm?tracking-code. Проблема заключается в том, что поисковые системы разделяют адреса, даже если те различаются всего одним символом. Хотя Google и Bing и имеют в своём распоряжении технологии, которые помогают определять такие адреса, до сих пор возникает множество ошибок при их обработке. Интересно будет отметить, что некоторые ссылаются на ваш сайт, дабы получить взаимную обратную ссылку, используя данный метод. Канонический тег защитит вас от этого.
Приставки к url . Как мы уже уяснили, любые два адреса, отличающиеся хотя бы одним символом, рассматриваются как отдельные страницы. И есть несколько случаев, когда приставки к адресам могут привести к дублированию контента. К ним относятся, например, дополнительный язык сайта (русская и английская версии страницы) или создание движком дополнительных страниц (ярко выражено в WordPress).
Разбивка на страницы . Это когда сайт разбивается автоматически на несколько страниц с одинаковым контентом. Например, если у вас интернет-магазин и продукцию можно отсортировать по цвету товара или по его цене (при этом для результата сортировки генерируется отдельная страница с одинаковыми описаниями товаров).
WWW . По большей части это не проблема, т.к. Google обычно правильно определяет адреса с www и без. Но до сих пор бывает такое, что поисковик индексирует как бы две версии сайта (example.com и www.example.com). В результате половина вашего контента проиндексирована с www, а другая половина – без www. Обычно это дело прописывается в robot.txt, но и канонический тег тут тоже может помочь.
Если невозможно реализовать 301 редирект . Как ни странно, но в некоторых случаях у веб-мастера нет возможности реализовать 301 редирект, например, из-за ограниченного доступа к серверу. Канонический тег в данном случае является альтернативой, с той лишь разницей, что исходная страница будет продолжать существовать.

Но всё-таки, в соответствии с политикой Google, канонический тег это рекомендация, а не обязательное для исполнение правило. Эта опция поможет владельцам сайтов самостоятельно указывать, какую страницу Гугл должен считать канонической. Таким образом, для Google будет проще определить, какую страницу необходимо включить в индекс при дублировании контента.

Атрибут rel=“canonical” - один из способов борьбы с дублирующимся контентом. Он размещается на любой HTML-странице между тегами . Поисковые роботы начинают считать страницу, указанную в атрибуте rel=“canonical”, приоритетной (канонической). Каноническая страница будет отображаться в поиске, на неё перейдут ссылочный вес и другие характеристики страниц с одинаковым содержанием.

Таким образом, если на вашем сайте есть идентичный или очень похожий контент, доступный по разным URL, с помощью атрибута rel=“canonical” можно указать тот URL, который является предпочтительным для индексации.

Когда нужно использовать канонические ссылки

1. Для предупреждения появления различных дублей. Например:

страниц сортировок: /*sort, asc, desc, list=*;
дублей из-за UTM-меток: *utm_source=, /*utm_campaign=, /*utm_content=, /*utm_term=, /*utm_medium=;
других страниц c GET-параметрами в URL;
дублей в результате особенностей работы CMS (движка).

В этом случае нужно добавить атрибут rel=“canonical” на все статические страницы сайта. Например, для страницы https://site.ru/category-1/page-2, rel=“canonical” будет выглядеть следующим образом:

href=“https://site.ru/category-1/page-2” />

2. Для доступных по разным URL страниц с очень похожим контентом.

Например, это могут быть страницы одной серии товара, который отличается только расцветкой или страницы товара, который расположен сразу в нескольких категориях.

В этом случае нужно указать со всех страниц rel=“canonical” на основную, приоритетную страницу.

В таком случае на каждой из страниц пагинации нужно указать канонической страницу «Показать всё».

Например, для страницы https://site.ru/category-1/page-2 нужно прописать канонический URL:

ru /category-1/show-all” />

Как указать основной URL при помощи атрибута rel=“canonical”?

Прописать между тегами любой HTML-страницы

Это основной способ. Чтобы указать каноническую ссылку, пропишите между тегами на странице полный URL страницы, которая должна быть в индексе.

Например, для страницы https://site.ru/*utm_content= канонической будет https://site.ru/.

Для получения такого результата, на странице https://site.ru/*utm_content= мы указали тег:

ru /” />

Важно!
Чтобы снизить вероятность ошибки в элементах link, после атрибута rel=“canonical” используйте абсолютные, а не относительные ссылки.

В файле Sitemap

В XML-карте сайта вы можете прописать канонический (основной) URL для любой страницы.

Важно!
Атрибут rel=“canonical” - это рекомендация для поисковой системы, а не правило. В этом случае ПС могут проигнорировать их.

В заголовке HTTP

Лучше всего использовать для документов не HTML-формата. Например, для файлов формата PDF.

В таком случае сервер, при запросе дублирующего файла, должен отдавать ссылку на файл-оригинал:

Link: ; rel=“canonical”

Важно!
Этот способ подойдёт, если у вас есть доступ к настройкам сервера. Не рекомендуется использовать для HTML-документов.

С помощью плагина

Для CMS существуют различные плагины, которые позволяют настроить канонический URL. Например:
— для WordPress можно настроить canonical с помощью Yoast SEO ;
— в OpenCart - реализовано в настройках CMS (нужно зайти в настройки товара и задать параметр SEO URL);
— для настройки атрибута canonical в Joomla (версии 3.х и выше) нужно включить в настройках CMS функцию SEF. После включения для технических страниц вида /index.php?option будет добавлен атрибут rel=“canonical” (с указанием URL на страницу с настроенным ЧПУ).

Как проверить правильно ли настроен rel=“canonical”?

Провести анализ можно специальной программой для SEO-анализа сайта - .

С помощью этой программы вы увидите:
— какие страницы на сайте без атрибута rel=“canonical”;
— на каких страницах стоит атрибут rel=“canonical”, и какие страницы являются для них каноническими;

Основные ошибки использования rel=“canonical”

— Канонический URL отдаёт 404 ошибку.
— Указанный канонический URL находится на другом домене или поддомене.
— Каноническая ссылка не является индексируемой.
— Использование rel=“canonical” со страниц пагинации на первую страницу.

Для всех страниц пагинации неправильно прописывать канонической первую страницу. Это делает индексацию всех страниц пагинации невозможной.

Для страниц пагинации в качестве канонических нужно указывать эти же страницы.

Например, страница https://site.ru/category-1/page-2 должна содержать каноническую ссылку:

— Несколько ссылок rel=“canonical” с одной страницы.

Для одной страницы должна быть одна каноническая страница, в ином случае будет учтён только первый URL.

— Разные канонические URL.

Указывайте одни и те же канонические страницы при разных способах реализации атрибута (например, через XML-карту сайта и через rel=“canonical” на самой странице).

Заключение

Атрибут rel=“canonical” - удобный и полезный инструмент для поискового продвижения. При правильном использовании, он повысит эффективность работы и ускорит индексирование сайта, что, в свою очередь, существенно повлияет на его ранжирование.

Подписаться на рассылку

SEO-аналитик

Оптимизирую сайты с 2009 года. Люблю сложные кейсы, которые оказались не по зубам специалистам с других компаний. Делаю очень подробные аудиты.

Пишу статьи-инструкции на блог SiteClinic по SEO-инструментам и аналитике.

Любимая цитата: Чтобы добиться успеха, надо искренне любить то, чем вы занимаетесь.