Всем известно, как поисковики не любят дублирование контента, и все веб-мастера, кто не поленился уделить этой проблеме необходимый минимум времени, сделали на своих сайтах единую домашнюю страницу, расставив нужные редиректы. Напомню, речь идет о таких страницах как www.site.com, site.com, site.com/index.html и т.д., которые (теоретически) для поисковика являются разными страницами с одинаковым контентом, то есть дубликатами. Об этом есть целая статья в Справочнике веб-мастера Google, написано море статей, как этого избежать. Однако и посковые технологии не стоят на месте, основная часть дублированных “домашних” страниц успешно распознается роботами, тем самым спасая нерадивых владельцев сайта от положенного за нарушение бана. Кроме того, Google в своем инструменте Webmasters Tools первым внедрил возможность установить предпочтительный домен для сайта. Теперь эта возможность есть и в Яндекс.Вебмастере.
В общем, казалось бы, вопрос закрыт. Но нет – видимо, процент невнимательных разработчиков велик, и проблема для поисковых машин стоит остро. Итак, три крупнейших поисковика (Yahoo, Live и Google) объединились с целью поддержки нового атрибута веб-страницы, который позволит вебмастерам указать правильный (канонический) URL для ресурса. Вот пример того, как этот атрибут должен выглядеть:
<link rel="canonical" href="http://mysite.com"/>
То есть, если робот загрузил страницу по адресу www.mysite.com/default.aspx и обнаружил в ней такой атрибут, он будет знать, что вместо текущего URL в следующий раз нужно будет пойти на mysite.com/.
Атрибут имеет некоторые ограничения:
- Атрибут не имеет абсолютной силы, и рассматривается только в качестве вспомогательного метода разрешения конфликтных ситуаций.
- В качестве значения параметра href может выступать не только абсолютный, но и относительный путь.
- Страница, содержащая атрибут canonical и страница, на которую он указывает, должны принадлежать к одному домену 2-го уровня. В то же время, они могут находиться в разных его поддоменах.
- Еще нет информации о фактическом внедрении поддержки этого атрибута поисковиками.
Я уже знаю по крайней мере одно место, где захочу использовать canonical, где с редиректами возиться нет практического смысла, а атрибут не помешает. Кроме того, возможно, он пригодится при указании урлов для дублирующих страниц https, так как закрывать их от индексации рука не поднимается. Яндекс?