Канонічні посилання (rel = "canonical"). Новий тег rel=canonical для видалення дублікатів сторінок Тега rel canonical

Якщо ваш сайт має ідентичний або дуже схожий контент, доступний за різними URL-адресами, тоді новий формат дозволить вказати той URL-адресу, який повинен повертатися в пошуковій системі. Також можна бути впевненим, що всі характеристики, такі як вага ваги і т.д. передадуть потрібну версію адреси.

Тепер ви можете додати цей тег, щоб вказати вашу версію адреси, всередині тега на сторінках із дубльованим контентом:

Таким чином, Google зрозуміє, що всі дублікати посилаються на канонічний адресу, вказану в тегу. Додаткові властивості адреси, такі як PageRank та зв'язані сигнали, також перенесуться з дубльованих сторінок на вказану.

Подібний тег буде корисним в основному при використанні різних движків (phpBB, IPB, WordPress, і т.д., напр. безліч схожих сторінок, наприклад, це можуть бути сторінки:

друкованої версії статті:
http://site.ru/article01.html?print=true
текстової версії статей для моб. телефонів:
http://site.ru/lofiversion/article01.html
дубльовані через нестачу двигуна:
http://site.ru/articles/?id=1&category=new
http://site.ru/articles/?id=1&tag=keyword
та ряд інших…

Цей стандарт може бути адаптований будь-якою пошуковою машиною під час індексації сайту.

Для популярного блог-движка WordPress вже розроблений плагін canonical, що вставляє тег на потрібні сторінки. Інші популярні двигуни для блогів, форумів, інтернет-магазинів і т.д. також у найближчому майбутньому розширять свою функціональність (стежте за оновленнями).

Відповіді на деякі популярні питання за тегом:

Чи є rel=“canonical” підказкою чи директивою?
Це підказка, яку ми беремо до уваги та взаємодії з іншими сигналами обчислюємо найбільш релевантну сторінку для відображення в пошукових результатах.

Чи можу я використовувати відносний шлях для вказівки canonical, наприклад так: ?
Так, відносні шляхи розпізнаються так само, як і у звичайному тегу . Навіть якщо ви введете тег з посиланням на документ, тоді відносні шляхи будуть зважати на базову URL .

Це нормально, якщо канонічні адреси містять не повністю дубльований контент?
Ми дозволяємо невеликі відмінності, такі як порядок сортування у таблиці продуктів. Також ми розуміємо, що канонічні адреси можуть парситися роботом у різний час, тому все це нормально.

Що, якщо rel=“canonical” повертає 404 помилку?
Ми продовжимо індексувати ваш контент і використовувати евристичний підхід для визначення канонічної адреси, однак, ми рекомендуємо, щоб ви використовували існуючі URL-адреси як канонічні.

Що, якщо rel=“canonical” ще не проіндексовано?
Ми намагаємось достукатися до канонічного URL швидко. Як тільки ми його проіндексуємо, тоді одразу переглянемо підказку rel=“canonical”.

Чи може канонічний урл утримувати редирект?
Так, ви можете вказати редирект, у цьому випадку пошукова машина обробить просес перенаправлення як завжди і спробує проіндексувати нову адресу.

Що якщо я маю суперечливі сигнали для rel=“canonical”?
Наші алгоритми м'які: ми можемо слідувати канонічним ланцюгам, проте, ми настійно рекомендуємо, щоб ви на сторінках вказували єдину канонічний адресу, щоб бути впевненим в оптимальному результаті канонізації.

Чи може цей тег для посилання запропонувати канонічний адресу на іншому домені?
Ні. Щоб мігрувати на інший домен, більш підходящий. В даний час Google підтримує канонізацію всередині піддоменів або в одному домені. Таким чином, власники сайтів можуть вказати www.example.comзамість example.comабо help.example.comпроте не можуть вказати example.comзамість example-widgets.com.

Звучить цікаво, але чи можу побачити приклад?
Так, wikia.com допомогла нам як трастовий тестер. Наприклад, ви зауважите, що вихідний кодза адресою http://starwars.wikia.com/wiki/Nelvana_Limited містить rel=canonical http://starwars.wikia.com/wiki/Nelvana.

Дві адреси майже ідентичні, крім того, що Nelvana_Limited, перший URL , містить коротке повідомлення біля заголовка. Це хороший приклад використання тега у майбутньому. З rel=canonical, властивості двох адрес об'єднуються і результати пошуку відображають потрібну версію.

Якщо у вас є питання щодо використання нового тега, ви можете їх задати в коментарях на офіційному блозі Google для вебмайстрів .

1. Крім позбавлення від природного дубльованого контенту (через нестачу движка), ми також позбавляємося від дубльованого штучного контенту, коли конкуренти нам намагаються насолити, додаючи в сторінки з довільними параметрами в URL .

2. Тепер немає потреби використовувати robots.txt для заборони індексації таких сторінок, як “друкована версія” та інших дублікатів (напр. WordPress потрібно було закривати шлях /teg/) і догоджати кожному пошуковику окремо (є загальні стандарти для robots.txt, але є також і ряд особливостей роботи кожного пошуковика з цим файлом, тому ми раніше не могли передбачити заборону індексації деяких сторінок відразу для всіх роботів).

3. Ми тепер маємо хороший інструментдля прискорення індексації сайту 🙂

Канонічні URL - це загадка для багатьох людей, і тому багато хто може неправильно використовувати такі URL для завдання, наприклад, 301 редиректа. Люди припускають, що ця можливість стосується SEO, однак вони не знають, коли і як слід використовувати їх. У WordPress зокрема (порівняно зі звичайним HTML сайтом) може бути досить важко вручну задавати канонічні URL для кожної сторінки сайту без звернення до плагінів внаслідок роботи шаблонів теми, що є в системі керування контентом.

У цій статті ми допоможемо вирішити деякі запитання користувача, які пов'язані з канонічними URL. Користувачі, які не працюють з WordPress, також можуть знайти цю статтю корисною для себе, оскільки в ній будуть запропоновані основні принципи канонічних адрес, які застосовуються до будь-якої системи керування контентом або методів розробки.

Зверніть увагу, що ця стаття може здатися вам досить складною, якщо у вас немає технічних навичок, пов'язаних з WordPress, базовим HTML або SEO. Ми познайомимо вас спочатку із основними термінами. Якщо раптом щось у статті вам здасться незрозумілим, ви завжди можете пошукати в пошуковій системі відповіді на запитання.

Що таке канонічний URL?

Канонічний URL (часто описуваний як rel=canonical, канонічний тег і т.д.) – це те, що використовується пошуковими системами під час відсилання до матеріалу на вашому сайті, коли сторінка з матеріалом має кілька версій на вашому сайті або навіть у мережі. Сьогодні канонічні URL-адреси використовуються для вирішення деяких складних проблем із дублюванням контенту, і іноді ця можливість застосовується для завдання 301 редиректа.

Google пропонує прекрасне пояснення цілей канонічних URL. Я рекомендую вивчити його. Вони зробили його максимально зрозумілим.

Можливо ви вважаєте, що ваш сайт не має дубльованого контенту. Прекрасно, якщо ви подбали про те, щоб ваш контент не повторювався на різних сторінках. В іншому випадку це може вилитися у зниження ваших показників у пошуковій видачі.

Якщо ви вирішили продублювати текст на вашому сайті, подумайте про це серйозно: якби ви були пошуковою системою, яка намагається дати відповідь на запит користувача, ви б запропонували користувачеві дві ідентичні сторінки в пошуковій видачі? Ні! Це марно для людей. Натомість ви б запропонували стільки різноманітних результатів у видачі (SERP), скільки зможете знайти, що відповідно повністю відповідало б пошуковим потребам людей.

Таким чином, якщо ви дублюєте контент на своєму сайті, ви можете – і повинні – очікувати, що Google не ранжуватиме всі ваші сторінки. Однак це не надто добре, якщо ви думаєте лише про показники пошукових систем та присутність у SERP.

Дублі URL-адрес, про які ви, можливо, не знали

Добре, повернемося назад і припустимо, що ми переконалися в унікальності наших сторінок сайту. Однак у вас, як і раніше, можуть залишитися деякі «приховані» URL, які дублюються, про які ви просто не знаєте (насправді вони, звичайно ж, не приховані). Це може здивувати вас, але ви повинні знати – пошукові системи бачать наступні URL-адреси як абсолютно відокремлені, окремі, навіть якщо вони виводять на екран один і той же контент:

  • http://www.examplesite.com (звернули увагу на www?)
  • http://examplesite.com
  • https://examplesite.com (звернули увагу на https?)
  • http://www.examplesite.com/ (звернули увагу на слеш наприкінці?)
  • http://examplesite.com/index.php

Саме тому нам і потрібні канонічні URL у тезі HEAD коду HTML всіх ваших сторінок. Ви повинні повідомити пошукові системи, яку з версій всіх вищезгаданих URL (та інших версій) вони повинні переглянути.

Так, ви повинні прийняти остаточне рішення про те, чи збираєтеся ви використовувати www чи ні у всіх ваших посиланнях у процесі веб-маркетингу. Ви повинні дотримуватися однієї стратегії посилання по всьому сайту, і навіть за його межами. Всі, хто користується вашими URL, повинні знати це: співробітники, партнери, каталоги, в яких ви перераховані, люди, які посилаються на вас – все.

Ви також повинні визначитися з тим, чи будете ви використовувати слеш в кінці URL, а також використовувати https (якщо ви приймаєте на сайті важливу інформацію, Таку як, наприклад, дані кредитних карт). Виберіть один варіант та дотримуйтесь його. На вашому місці я вибрав би той, який використовується найчастіше, щоб уникнути головного болю при виправленні своїх URL.

На щастя, якщо ви користуєтеся WordPress, то більшість цих проблем вдасться вирішити. Ми розглянемо різні плагіни та інші речі, які допоможуть вам впоратися із цим.

Однак є й інші місця, де канонічні URL виявляються дуже корисними.

Контент, що дублюється, створюваний таксономіями

Припустимо, ви пишете статтю, і ви включаєте ту статтю до численних рубрик блогу з різними мітками в WordPress (все це називається таксономіями). Люди завжди роблять це. Або, скажімо, ви займаєтеся електронною комерцією, і ваші продукти з'являються в численних рубриках. У нас виникає проблема: контент може бути представлений кілька разів по різних URL, що спрощує користувачам навігацію по сайту. Наприклад:

  • http://examplesite.com/store/candy/chocolate-truffles
  • http://examplesite.com/store/foods/chocolate-truffles

Ви хочете, щоб ваші користувачі могли знайти шоколадні трюфелі у двох рубриках: candy і food. Це прекрасно. Але яка з двох URL має бути проіндексована пошуковими системами? Пам'ятайте, що вони не будуть ранжувати обидва URL-адреси. Таким чином, ви повинні вибрати це самостійно. І саме у цьому випадку на перший план виходять канонічні URL-адреси. Такі URL розкажуть пошуковим системам: «Гей, цей контент такий самий, як і на іншій сторінці; будь ласка, проіндексуй його».

Пам'ятайте, що жодна пошукова система не повинна коритися даної канонізації, і вони можуть проігнорувати її, якщо вважають її неправильною.

Використання перехресних канонічних URL-адрес при дублюванні контенту з інших сайтів

Є найважливіша причина, чому вам потрібна канонічна URL-адреса. Про неї ми поговоримо нижче (є й інші, але вони складніші, у своїй принцип – той самий). Буває так, що ви публікуєте на своєму веб-сайті контент, який також з'являється на інших веб-сайтах. Найпростіший приклад такої ситуації – синдикація (наприклад, прес-релізи).

Допустимо, ваша компанія публікує прес-реліз і передає його на ваш сайт. Це цілком нормальне явище. Проте прес-релізи працюють так: вони можуть безкоштовно використовуватися будь-яким видавцем контенту. Вони спеціально створюються для того, щоб їх копіювали та розповсюджували. Є навіть цілі мережі синдикації, як, наприклад, PRWeb. Це досить давня форма маркетингу.

Однак вона породжує проблеми із SEO. Для робота пошукової системи контент прес-релізу на вашому сайті є таким самим, як контент прес-релізу на інших сайтах новин. Як зрозуміти де оригінал? Який URL виводити у SERP (пошуковій видачі)? Пам'ятайте – ви маєте його вибрати.

Зазвичай пошукові системи вибирають його самостійно, якщо ви нічого їм не запропонуєте. І робиться така пропозиція за допомогою канонічного URL. У випадку з прес-релізами, однак, малоймовірно, що кожен невеликий журнал новин буде задавати канонічний URL, що вказує на ваш сайт. Пам'ятайте, що багато хто про це просто не знає. Я сумніваюся, що вони будуть поспішати із зазначенням оригінального джерела контенту та з відповідним кодуванням HTML. Адже вони публікують по кілька різних статей на день.

Таким чином, ви повинні подбати про це на своєму сайті. На вашому місці я використав би канонічний URL на сторінці, що містить ваш прес-реліз, і посилався б на його копію в основній мережі синдикації, в якій ви опублікували статтю для подальшої дистрибуції. Наприклад, ви можете послатись на копію статті на сайті PRweb.com (якщо ви використовуєте цей сервіс).

Якщо ви хочете побачити живий приклад ситуації, що не стосується прес-релізів і при цьому стосується канонічних URL, давайте подивимося на наступну статтю, яку я написав для KISSmetrics рік тому:

Незабаром після цього сайт Entrepreneur.com узяв цю статтю, тому що у них була угода з KISSmetrics (пам'ятайте, вони мали дозвіл!)

Тепер у нас є той же контент, доступний за двома URL-адресами. У технічному плані це дубльований контент, а це погано! Однак не варто боятися. Якщо ви подивіться вихідний код статті на Entreprenuer.com, ви знайдете там наступне:

Це говорить пошуковим системам у тому, де було представлено оригінальний контент, що є правильним рішенням. Це також знімає підозри про крадіжку контенту в очах пошукових роботів (які не можуть знати про ваші законні права на публікацію роботи).

Однак не варто створювати цілий сайт, який складається зі статей інших людей. У цьому випадку канонічний URL навряд чи допоможе вам із ранжуванням. Тому не зловживайте такою тактикою.

У яких випадках ви не можете використовувати канонічні URL-адреси для зовнішнього дубльованого контенту

Я хочу розповісти про це, оскільки часто стикаюся з такими ситуаціями. Якщо ви хочете вивести опис компанії або персональну біографію на вашому сайті, я не рекомендую використовувати ті ж слова та фрази, які ви використовуєте у ваших соціальних профіляхабо у інших місцях мережі.

Якщо ви задаєте той самий опис, який вказано у вас у LinkedIn або на вашій бізнес-сторінці Google Plus, то ви, по суті, дублюєте контент. Не варто використовувати канонічний URL на сторінці About, і підчеплювати до неї ваш профіль з соціальної мережі. Ваша сторінка About має ранжуватися самостійно. У такому випадку, будь ласка, скористайтеся унікальним описом для зовнішнього використання. Я роблю це для всіх своїх клієнтів.

Як використовувати канонічні URL у WordPress

Є кілька способів зробити це, але я збираюся показати вам найкращий, яким я користуюся сам: просто скористайтеся плагіном WordPress SEO від Joost De Valk.

Як тільки ви встановите цей плагін на своєму сайті, він дозволить вам подбати про численні SEO показники, у тому числі і про канонічні URL. Однак плагін пропонує й інші налаштування, на які слід звернути увагу.

На скріншоті нижче можна побачити, що на екрані редагування окремого запису або сторінки (плагін працює і для довільних типів записів) панель WordPress SEO пропонує масу налаштувань та полів. Щоб задати канонічні URL-адреси, які ви можете використовувати для різних речей – прес-релізів або зовнішніх дублів контенту, – перейдіть на вкладку Advanced:

Клацніть по списку, щоб вибрати тип URL для канонічної адреси в тезі head всіх сторінок:

Коли не потрібно використовувати канонічний URL

По-перше, прочитайте наступну в блозі Google Webmaster Central про поширені помилки з rel=canonical URL. Переконайтеся, що ви або ваш розробник не допустили їх. По-друге, не використовуйте канонічні URL у таких ситуаціях:

Коли ви хочете зробити 301 редирект

Якщо ви бажаєте перенаправити одну сторінку до іншої, щоб користувачі, які ввели стару URL або натиснули на мертве посилання, були перенаправлені до нової URL, вам потрібно використовувати 301 редирект. Не використовуйте для цього канонічні URL-адреси. Однак у SEO вони часто застосовуються таким чином.

Редирект означає, що є лише одне місце, де представлений контент, і ви змушуєте користувачів перейти до цієї сторінки. Це підходить, наприклад, якщо ви перенесли свій сайт на новий домен або налаштували нову структуру URL внаслідок реконструкції сайту. Ви також можете використовувати 301 редирект для відправки людей до версії вашого сайту з www або без www (це дозволяє переконатися в тому, що ніхто не перейде на ваш сайт за неправильною адресою).

Завдяки канонічним адресам, ви можете мати той самий контент на різних сторінках у мережі, і мати одне «оригінальне» джерело контенту. Іншими словами, різні сторінки, що містять той самий контент, можуть існувати і переглядатися користувачами.

Однак ще в 2011 році Ренд Фішкін провів один цікавий експеримент, в якому він використав канонічний URL у хедері всіх сторінок старого домену, щоб покращити ранжування іншого нового домену. І це спрацювало. Він розповів про цю історію у своєму записі. Запис також пояснює, чому канонічні URL такі важливі для крос-доменної синдикації контенту у світі SEO. Я не думаю, що сьогодні це спрацює, але можете спробувати як експеримент.

Коли ви хочете, щоб пошукові системи проігнорували вашу сторінку

Пам'ятайте, що rel=canonical – це не вирішення проблем із дублями контенту. Пошукова оптимізація набагато складніша, і іноді більш слушне рішення полягає в тому, щоб використовувати файл robots для закриття сторінок від індексації. Саме тому плагін WordPress SEO включає відповідні опції.

Я рекомендую своїм клієнтам закривати від індексації деякі сторінки, які не є корисними для відвідувачів. Наприклад, навіщо у видачі сторінка Terms and Conditions, сторінки входу в систему? Їх там не повинно бути. Краще звільнити дорогу ціннішому контенту. До нього відносяться сторінки, що продають, описи товарів та інформативні записи блогу.

Я також раджу використовувати правило no-index для сторінок з дуже малою кількістю контенту (оскільки ваш сайт у такому разі виглядає надто незмістовним) та для архівів, які дублюють контент. У WordPress це стосується архівів авторів, архівів за датою, і, в моєму випадку, до архівів міток (оскільки вони містять той самий контент, що й архіви рубрик). Ви можете також закрити від індексації довільні типи записів та їх архіви, якщо вони лише передають контент з інших сторінок вашого сайту.

Примітка: якщо ви щось закриваєте від індексації, вам потрібно буде видалити цей контент також з карти сайту, інакше це призведе до помилок у Google Webmaster Tools.

Поправляємо URL-адресу для відповідності її з канонічним покажчиком

Пам'ятаєте, ми говорили вище про те, що потрібно вибрати одну версію URL, яка використовуватиме у всіх посиланнях з цього моменту? Відмінно, як тільки ви зробите це, вам потрібно буде «почистити» або виправити URL-адреси на вашому сайті та інших місцях, щоб вони посилалися на вибрану вами версію. Припустимо, що ви вирішили використовувати версію без www на вашому сайті. Тепер вам потрібно переконатися в тому, що всі зовнішні та внутрішні посилання використовують вибрану версію. Якщо ні, то треба постаратися змінити URL-адресу. Так, це може здатися досить складною дією, але це варте того.

Щоб швидко замінити всі URL-адреси на своєму сайті, ви можете використовувати такий інструмент, як Search Replace DB . Однак, використовуйте його тільки в тому випадку, якщо ви розумієте, що ви робите.

Є також плагіни, які дозволяють провести пошук та заміну через консоль WordPress. Після заміни видаліть все, що з'єднано з базою даних, щоб уникнути зайвих ризиків, пов'язаних з безпекою.

Щоб впоратися з мертвими посиланнями в записах та сторінках, скористайтеся плагіном, таким як, наприклад, Redirection, який виконає це завдання за вас.

Коли ви все це зробите, переконайтеся, що ви увійшли до свого обліковий запис Google Webmaster Tools і встановили кращий URL для вашого сайту. Крім того, надішліть обидві версії – з www і без www – вашого сайту до Google Webmaster Tools, щоб задати перевагу.

Висновок: використовуйте канонічні URL для переваг у плані SEO

Сподіваємося, ми впоралися з хаосом, який був навколо канонічних посилань та впливу їх на SEO. Якщо ви все ще не розібралися в усіх аспектах, я рекомендую перейти за посиланнями, наведеними в цій статті. Однак найкраще досягнення – тепер ви знаєте, як використовувати канонічні адреси, знаєте, що у них є потенціал, який дозволить досягти чудових SEO результатів.

Дубльований контент – проблема, з якою можуть упоратися далеко не всі власники бізнес-сайтів. Часом вони просто не мають часу, щоб вирішувати цю проблему. На щастя, пошукові системи розуміють, що часом той самий контент може бути доступний за різними URL-адресами, причому цілком законно. Пошукові системи запропонували нам інструмент, який ми можемо використовувати – тож давайте скористаємося ним у своїх інтересах!

Канонічний тег (rel="canonical") є досить важливим інструментом пошукової оптимізації. Найчастіше він навіть кращий, ніж 301 редирект під час роботи з дубльованим контентом.

Розберемо докладніше цей тег.

Що поганого у дубльованому контенті

Дубльований контент – це два однакові за своїм змістом документи. Коли Google бачить дубль, намагається виключити його з індексу, т.к. за ідеєю користувач не захоче бачити один і той же документ у пошуковій видачі кілька разів. Та й, до того ж, самому пошуковику не хочеться постійно обробляти тисячі і навіть мільйони дубльованих сторінок, витрачаючи на це свої виробничі потужності.

Проблема для веб-майстра полягає в тому, що якщо та сама інформація знаходиться на різних сторінках, то у видачі буде тільки одна з цих сторінок. Але url, який вибере Google, не завжди є найбільш оптимальним для користувача, і не завжди є першоджерелом.

Поки пошуковик не визначить першоджерело, результати видачі не задовольнять цілі початкового автора контенту. У цьому випадку канонічний тег має обмежену користь, оскільки ті, хто краде ваш контент, швидше за все, не ставитиме теги.

З іншого боку, якщо дублювання відбувається на вашому сайті, то тег буде дуже доречним. Навіть якщо на вашому сайті будуть посилання на дубльований контент, цінність для видачі складатиме лише сторінка-першоджерело. Таким чином, навіть за наявності посилань на кілька дублів, значущою для Google вважатиметься лише одна з цих сторінок. І не постраждає.

Звичайно, це не найкраще рішення з точки зору SEO. Але це не призведе до санкцій з боку Гугла.

Що таке тег rel="canonical"

Тег має наступний синтаксис: Таким чином, Google і Bing зрозуміють, що всі дублі посилаються на канонічний адресу, вказану в тегу. Google має чітке уявлення щодо використання даного тегу:

Так, rel="canonical" повинен використовуватися тільки для вибору сторінки, що віддається перевагу при дублюванні (незначні відмінності в змісті допустимі).

Іншими словами, використовуйте його лише для боротьби з дубльованим контентом. Використовуючи його для інших цілей, ви можете бути викриті в пошуковому спамі.

Проблеми дубльованого контенту

Реалізуйте належним чином теги на вашому сайті. Це убереже вас від проблем дубльованого контенту, деякі з яких пов'язані із системами керування сайтами (CMS):

  1. Tracking Codes. Деякі системи вимагають додавання змінних наприкінці URL-адреси для зворотних посилань на ваш сайт. Формат може бути такий: www.example.com?tracking-variable або такий: www.example.com/example.htm?tracking-code. Проблема полягає в тому, що пошукові системи поділяють адреси, навіть якщо ті відрізняються одним символом. Хоча Google і Bing мають у своєму розпорядженні технології, які допомагають визначати такі адреси, досі виникає безліч помилок при їх обробці. Цікаво буде зазначити, що деякі посилаються на ваш сайт, щоб отримати взаємне зворотне посилання, використовуючи цей метод. Канонічний тег захистить вас від цього.
  2. Приставки до URL. Як ми вже зрозуміли, будь-які дві адреси, що відрізняються хоча б одним символом, розглядаються як окремі сторінки. І є кілька випадків, коли приставки до адрес можуть призвести до дублювання контенту. До них відносяться, наприклад, додаткова мова сайту (російська та англійська версії сторінки) або створення движком додаткових сторінок (яскраво виражено в WordPress).
  3. Розбивка на сторінки. Це коли сайт розбивається автоматично на кілька сторінок із однаковим контентом. Наприклад, якщо у вас інтернет-магазин і продукцію можна відсортувати за кольором або за його ціною (при цьому для результату сортування генерується окрема сторінка з однаковими описами товарів).
  4. WWW. Здебільшого це проблема, т.к. Google зазвичай правильно визначає адреси з www та без. Але досі буває таке, що пошуковик індексує дві версії сайту (example.com і www.example.com). В результаті половина вашого контенту проіндексована з www, а інша половина без www. Зазвичай ця справа прописується в robot.txt, але канонічний тег тут теж може допомогти.
  5. Якщо неможливо реалізувати 301 редирект. Як не дивно, але в деяких випадках у веб-майстра немає можливості реалізувати 301 редирект, наприклад, через обмеженого доступудо сервера. Канонічний тег у разі є альтернативою, з тією лише різницею, що вихідна сторінка продовжуватиме існувати.

Але все-таки, відповідно до політики Google, канонічний тег це рекомендація, а не обов'язкове для виконання правило. Ця опція допоможе власникам сайтів самостійно вказувати, яку сторінку Google має вважати канонічною. Таким чином, для Google буде простіше визначити, яку сторінку необхідно включити до індексу під час дублювання контенту.

Доброго дня читачам. Для більшості людей канонічні URL – це річ вкрай загадкова, і часто вони можуть бути помилково використані для таких операцій, як 301 редирект. Користувачі знають, що такі посилання стосуються SEO, але не зовсім впевнені в тому, як їх можна використовувати. Говорячи про WordPress (на противагу HTML сайту), то тут не так легко вручну прописувати канонічні посилання для кожної окремої сторінки вашого сайту, без використання плагіна, оскільки це йде врозріз з тим, як працює шаблон системи управління вмістом сайту.

Ця стаття допоможе прояснити деякі питання, які можуть виникнути у користувачів WordPress через використання канонічних URL. Не WordPress користувачітакож знайдуть цю статтю корисною, тому що зможуть дізнатися про основні принципи і потім застосувати ці правила до власної системи управління контентом або збагатити свій досвід розробника. Як би там не було, ця стаття може здатися вам складною в освоєнні в тому випадку, якщо у вас не дістає технічних знань про WordPress або базової інформації про HTML та пошукову оптимізацію (SEO). Ми висвітлили всі терміни, щоб ви могли з ними познайомитися насамперед. Але, у будь-якому випадку, з цієї публікації ви зможете почерпнути той необхідний базис, з якого можна почати гуглити, щоб знайти більше інформації для отримання повнішої картини.

Що являє собою канонічний URL?

Канонічний URL (також відомий як rel=canonical, канонічний тег і під іншими назвами) – це те, на що посилаються пошукові системи, коли вони бачать дубльовані версії сторінки на вашому сайті або в інтернет-просторі. Зараз цей прийом використовується для вирішення складних проблем, пов'язаних із дубльованим контентом, так як часто він є кращим рішенням, ніж використання 301 редиректу.

Можливо, ви вважаєте, що на вашому сайті немає дубльованого контенту. І це чудово, якщо ви стежите за тим, щоб ваш контент не повторювався на багатьох сторінках. В іншому випадку це може призвести до зниження рангу вашого сайту в пошуковій видачі.

Якщо на вашому сайті є текст, що повторюється, постарайтеся серйозно подумати над цією проблемою: якби ви були пошуковою системою, яка намагається відповісти на запит користувача, ви б видали цьому користувачеві дві ідентичні сторінки в результатах пошукової видачі? Звичайно ж ні! Це ж абсолютно марно. Ви видали їм стільки різних результатів (у пошуковій видачі), щоб вони могли визначити те, що їм необхідно.

Таким чином, якщо контент на вашому сайті повторюється знову і знову, очікується, що Google просто не ранжуватиме такі сторінки. І це недобре, якщо ви хочете займати хоч якісь позиції у пошуковій видачі.

Посилання на дубльований контент, про існування яких ви навіть не підозрюєте

Добре, тепер давайте повернемося назад і припустимо, що ви зробили правильно і впевнені в тому, що всі ваші сторінки абсолютно унікальні. Але, можливо, на вашому сайті все ж таки присутні «приховані» дубльовані URL-адреси, про які ви знати нічого не знаєте (насправді вони не приховані, я просто їх так назвав). Це може вас здивувати, але чи знали ви що пошукові системи сприймають такі URL-адреси, як повністю самостійні, навіть не дивлячись на те, що для вас це одне і те ж, і відображає однаковий контент?

http://www.examplesite.com (помітили www?)

http://examplesite.com

https://examplesite.com (помітили https?)

http://www.examplesite.com/ (помітили слеш наприкінці?)

http://examplesite.com/index.php

Ось чому вам потрібна канонічна URL у тезі HTML-код всіх сторінок. Необхідно сповістити пошукові машини про те, на яку версію типів URL наведених вище чи інших вони повинні звертати увагу.

Це означає, що ви повинні раз і назавжди вирішити чи відмовитися вам чи ні від використання www у всіх посиланнях вашого веб-проекту. Це має стати вашою стратегією перелінкування сайту як усередині нього, так і за його межами. І це повинні знати всі, хто використовують ваші URL: фрілансери, які працюють на вас, ваші партнери, співвласники, а також ця адреса має бути вказана у всіх каталогах, де є ваш сайт. Крім того потрібно вирішити, чи ви хочете слеш в кінці або https (якщо на вашому сайті вводиться специфічна інформація, типу кредитних карток). Виберіть один варіант та дотримуйтесь його завжди. Якби вибирати доводилося мені, я віддав би перевагу варіанту, який використовується найчастіше, щоб знизити рівень головного болю, коли справа доходить до наведення порядку в URLах.

На щастя, якщо ви працюєте з WordPress, більшість з таких проблем вирішуються досить просто. Ми розповімо вам про необхідні плагіни та дії, які потрібно зробити далі в цій статті.

Але знову ж таки повторюся, що для канонічних посилань є набагато більше застосувань.

Дубльований контент, створений таксономією

Скажімо, ви написали статтю та включили її в різні категорії блогу та теги у WordPress (все це називається таксономією). Люди постійно це роблять. Або, наприклад, у вас є інтернет-магазин, в якому товари заносяться в різні категорії. Тоді, за задумом, для зручності пересування користувачів по сайту, той самий контент з'являється по різних URL, але це призводить до появи проблем. Наприклад:

http://examplesite.com/store/candy/chocolate-truffles

http://examplesite.com/store/foods/chocolate-truffles

Вам хочеться, щоб відвідувачі знайшли ці «шоколадні трюфелі» в обох категоріях: «солодкості» і «їжа». Непогане прагнення. Але на яку URL повинні звертати увагу пошукові машини? Ви ж пам'ятаєте, що вони не ранжуватимуть обидві посилання. Тож потрібно вибрати. І ось тут вам знадобляться канонічні посилання. Вони скажуть пошуковим машинам "Гей, на цій сторінці той же контент, що і на тій, будь ласка, ранжируй цю сторінку, а не ту".

Пам'ятайте, що це прохання – жодна пошукова система не повинна коритися вашій канонізації, і вони можуть її проігнорувати, якщо вважають неправильною.

Використання кросдоменного канонічного URL для дубльованого контенту

Це остання причина, з якої вам потрібен елемент канонічний URL, який буде описаний в даній статті (є й інші, але вони складні, та й принцип використання не змінюється): коли ви публікуєте контент на вашому сайті, який також з'являється на інших сайтах . Найбільш очевидні випадки такого дублювання – це прес-релізи. Так ваша компанія публікує прес реліз та розміщує його на вашому сайті. Це цілком законно. Але, традиційно, прес реліз – це така штука, яку може опублікувати в себе будь-хто. Вони створюються у тому, щоб ними ділилися і копіювали. У цьому полягає принцип роботи угруповань дистриб'юторів, типу PRWeb. Це старий як світ маркетинговий прийом.

Але це породжує конфлікт SEO інтересів. Для пошукового робота контент прес релізу на вашому сайті – це те саме, що і на сайтах, які його запозичили. То де ж оригінальна копія? Яке посилання ранжувати у пошуковій видачі? Пам'ятайте, що потрібно вибрати лише одну.

Зазвичай пошукові машини вибирають за вас, якщо ви не запропонуєте їм свій варіант. І ви можете це зробити, використовуючи канонічний URL. У випадку прес релізів, ви, як би там не було, навряд чи кожен сайт новин буде публікувати вашу статтю з канонічним URL на ваш ресурс. Пам'ятайте, що для багатьох цей елемент не особливо зрозумілий. Я так само сумніваюся, що хтось витрачатиме час на те, щоб знайти ресурс з вихідною статтею і правильно кодувати свій HTML. Вони публікують кілька статей на день, так що тільки ви можете подбати про правильні посилання на вашому сайті. На вашому місці я поставив би канонічний URL на сторінку, яка містить прес реліз, і звернувся б до копії, на сторінці великої спільноти, де ви спочатку розмістили статтю для запозичення. Наприклад, закинемо копію статті на сайт PRweb.com (якщо ви використовуєте даний сервіс). Просто мої п'ять копійок.

Ось приклад із реального життя, не пов'язаний із ситуацією прес релізів, де канонічний URL був дуже доречним: погляньте на статтю, яку я написав про KISSmetrics близько року тому:

Незабаром після цього Entrepreneur.com розмістили цю статтю у себе, оскільки вони мали угоду з KISSmetrics.

Ось URL тієї статті:

http://www.entrepreneur.com/article/231237

Тепер ми маємо однаковий контент, на який ведуть два різні посилання. Технічно це дубльований контент, а дубльований контент – це погано, пам'ятаєте? Але ж не варто боятися! Якщо ви подивіться на вихідний код Entreprenuer.com, ви побачите це

Це говорить пошуковим системам, де знаходиться оригінальний контент, що є правильним виходом із ситуації.

Це знімає підозру у крадіжці контенту в очах пошукових систем (які не можуть по-іншому дізнатися, кому саме належать легальні права на публікацію контенту).

Ймовірно, вам не хотілося б мати такий сайт, на якому публікуються тільки чужі матеріали. Тут елемент канонічний URL, навряд чи допоможе вам покращити ранжування сайту. Тож не зловживайте використанням тактики.

Коли ви не можете використовувати канонічний URL для дубльованого контенту з іншого сайту

Мені хочеться висвітлити один момент, тому що я багато разів спостерігав за такою ситуацією. Якщо ви збираєтеся написати опис компанії або персональну біографію на вашому сайті, я б не рекомендував вам використовувати той же набір слів у ваших профілях у соціальних мережах або на будь-яких інших сайтах. Якщо ви пишіть те саме знову і знову на сторінці вашої компанії на LinkedIn, бізнес сторінці на Google Plus і т. д., ви просто дублюєте ваш контент. Ви не зможете використовувати канонічний URL на сторінці, присвяченій компанії або людині, і зробити відсилання до профілю в соціальній мережі: вам не захочеться, щоб така сторінка ранжирувалася сама по собі. У цьому випадку, будь ласка, просто пишіть щоразу новий унікальний опис.

Як використовувати канонічні URLs у WordPress

Це можна зробити різними способами, але я розповім вам про кращому варіантіякий мені відомий: використовуйте плагін від Joost De Valk. Як тільки ви встановите це розширення на вашому сайті, він почне піклуватися про ваш SEO, включаючи управління канонічними URL для того, що я назвав «прихованими» URL (дивися вище). Але все ж таки варто звернути увагу на деякі налаштування. На скрині нижче, видно екран налаштування для одиничного запису або сторінки (так само застосовно для типів користувача записів, якщо ви такі використовуєте), і SEO-бокс WordPress містить багато полів і налаштувань. Для налаштування канонічних URL, які стануть у нагоді для штук типу прес релізів та контенту, дубльованого на інших сайтах, клацніть таб “Advanced”:

Цей плагін значно спростить вам елемент канонічний URL. Все, що потрібно зробити, це ввести повний URL оригінального джерела вашого контенту, який публікується на даній сторінці. Іншими словами, URL, який копіює контент, це те посилання, яке має використовувати канонічну URL у HTML «шапки». Копійований контент тепер сигналізуватиме пошуковикам про те, що він лише копія. Чи має сенс, так?

Добре, але це лише принцип. Виходячи з прикладу, даного вище, вам може іноді захотітися вказати, що ви лише копіюєте контент, хоча це зовсім не так, так як вам просто важко контролювати поширення контенту. Ви можете опублікувати прес-реліз на сайті своєї компанії і, якщо потрібно, ви можете використовувати атрибут для оригінального джерела контенту в мережі синдикації, яку ви використовуєте. У цьому сенсі ви діятимете, як один із синдикаторів. (між іншим, це лише моя думка. Ця порада можуть не схвалити інші SEO-експерти. Так що використовуйте його на свій страх і ризик. Google «клянеться», що він дуже гарний в ідентифікації оригінального джерела контенту, і канонічні покажчики – це (додаткова допомога. Пошукові системи можуть їх проігнорувати).

В інших випадках канонічні URL-адреси, які ви вводите, будуть внутрішніми посиланнями вашого сайту, що містять дубльований контент. Скажімо, наприклад, ви публікуєте опис вашого товару на статичній сторінці для оптових покупців. Але ви використовуєте цей опис у розділі вашого сайту, де люди купують товари в роздріб.

Використовуючи поле для канонічного URL у SEO-налаштуваннях WordPress, ви можете підказати пошуковим машинам яке посилання ви хотіли б, щоб вони ранжували.

Примітка: Вам потрібно вибрати версію посилання з www або без www для кожної сторінки за допомогою цих налаштувань. Плагін WordPress SEO робить це автоматично. Ці параметри можуть знадобитися лише в тому випадку, якщо URL дуже відрізняється або контент знаходиться на іншому домені.

Налаштування https глобальної канонічної URL за допомогою WordPress SEO

Ось ще щось, що ви можете зробити з канонічними посиланнями, використовуючи плагін WordPress SEO. Якщо ви використовуєте сертифікати SSL (для продажу в Інтернеті) ви можете зробити так, щоб ваш канонічний тег використовував https версію ваших посилань у тому випадку, якщо сторінки можуть знаходитися і по http, і https. Для цього йдемо в SEO > Permalinks і прокручуємо до Canonical Settings (канонічні посилання) у вашій консолі WordPress.

Клацаємо на меню, що розгорнулося, де можна вибрати тип URL, який ви хочете зробити елементом canonical URL в тезі всіх ваших сторінок:

Щоб здійснювати правильне просування сторінок сайту пошукових системах, необхідно повідомляти роботам, які URL найкращі для попадання в індекс. Це задається за допомогою спеціальних тегів.

Що таке rel canonical?

Зупинимося докладніше на тегу rel = canonical. Його основна мета - боротьба з дублями сторінок та неінформативними сторінками (наприклад, сторінками пагінації), а також підвищення якості індексації за допомогою прописування пріоритетної адреси.

У мене був сайт із обмеженим краулінговим бюджетом. Тобто за фактом там було тисяч 10 сторінок, але в індексі могли бути лише 2 тисячі (бо сайт був молодий і не трастовий). У результаті ті сторінки, які мені потрібні були в індексі, часто туди не потрапляли. Допоміг канонікал - проставлення зі сторінок пагінації канонікалу на основні URL дозволило чітко дати пошукачам зрозуміти, які сторінки мають бути в індексі.

Що таке канонічна посилання?

Тег canonical буде надзвичайно корисним, якщо на вашому сайті є сторінки-дублі, які доступні за різними адресами. За допомогою нього необхідно прописати пріоритетний канонічний URL для сприйняття пошуковими системами.

Що важливо - буде також передаватися посилальна вага та інші характеристики сторінки (PageRank та ін.).

Цей атрибут вказується всередині тега на URL-дублікатах із зазначенням бажаного URL. Оформляється він таким чином:

Навіщо потрібен канонікал?

За наявності схожих сторінок в індексації пошуковими системами беруть участь всі вони одночасно. У результаті жодна їх повною мірою не просувається через те, що внутрішні посилання є на обидві сторінки. Пошуковик не знає, який із них потрібно віддати пріоритет.

Те саме стосується і зовнішніх посилань - просувається не один URL, а кілька, а вага також розподіляється між ними. І сайт знаходиться на нижчих позиціях, аніж міг би бути.

Завдяки канонікал в індексі пошукових систем буде відданий канонічний URL.

Приклади використання

Наприклад, у вас є друкована версія сторінки. Або окремий урл для мобільної версії. І ви ставите канонікал з них на основну сторінку, в результаті ця основна сторінка отримує більшу вагу і плюс при ранжируванні, а з індексу забирається купа сміття.

Як канонікал використовується для пагінації

Потрібно проставити rel canonical зі сторінок пагінації (site.ru/category/page/2) на першу з них (site.ru/category).

Думки про налаштування пагінації різняться - деякі фахівці говорять про необхідність закриття від пошукових систем всіх сторінок пагінації, інші - про те, що краще їх залишити в доступі роботів пошукових систем.

Яндекс рекомендує зі всіх сторінок пагінації налаштовувати канонічне посилання на першу з них.Як результат – яндекс-робот сприйме, що саме першу сторінку необхідно індексувати. Про індексацію товарів уточнюється, що за іншими посиланнями Яндекс все одно переходитиме.

Фахівці Google схиляються до таких варіантів:

  1. залишити все, як і раніше - пошуковик по-різному розпізнає і сприймає різні види сторінок;
  2. створити окрему URL-адресу «Показати все» і встановити її як канонічний - особливо рекомендується для багатосторінкових статей;
  3. прописати в тезі лінк атрибути rel="prev" та rel="next» з метою фіксації взаємозв'язку між URL-адресами; пошуковик видаватиме перший із них.

А ось відос Девакі, де він докладно пояснює за пагінацію:

Атрибути rel="next" та rel="prev"

Є також інша думка — типу сторінки пагінації закривати не треба, що вони навпаки повинні отримувати додатковий трафік. І тут важливі два моменти:

  • Всі URL повинні мати унікальний параметр тега Title, унікальний текст та meta-теги;
  • Якщо ви більше орієнтуєтеся на Google, рекомендовано обов'язкове використання атрибутів rel="next" і rel="prev", які потрібно налаштувати так, щоб кожна попередня сторінка посилалася на наступну. На кореневій адресі задається URL наступного, на наступних – URL попередньої та наступної, на останній – тільки попередньої.

Можна прописати пагінацію цими тегами, а канонічне посилання оформити на першу або на головну сторінку- Залежно від особливостей ресурсу.

Тема із SEO пагінатором

Ось припустимо один із блогів (Sawynih або якось так, вже не пам'ятаю) писав про кейс, коли сторінки пагінації давали додатковий трафік.

Якщо на різних URL-адресах представлений схожий товар, навігацію можна задати такими способами:

  1. Прописати унікальні значення параметрів автоматично, збираючи заголовки з окремих частин, наприклад:

    (купити|замовити|придбати) спідниці у (саратові|ростові|астрахані) (за низькою ціною|вигідно|дешево) зі знижкою (у магазині|в інтернет магазині)

    Буде створено унікальні значення метатегів.

  2. Найефективнішим і трудомістким є самостійне прописування цих параметрів вручну. Всі заголовки будуть унікальними і дуже відрізнятимуться один від одного, в тому числі за змістом. Це дозволить просунути кожну URL за низькочастотними та низько конкурентними ключовим запитаму ТОП видачі пошукових систем. Завдяки застосуванню цього способу розшириться семантичне ядро. Плюс також у тому, що для інтернет-магазину багато статей писати недоцільно.

Важливо здійснити цю роботу один раз індивідуально для кожного URL-адреси. Параметри будуть зафіксовані пошуковими системами.

Налаштування Canonical для WordPress

Багато плагінів для WordPress чудово працюють з цим тегом.

Більшість із них прості у застосуванні – активуємо плагін, а канонічні посилання прописуються автоматично. В інших SEO-плагінах достатньо встановити галочку біля цього параметра в налаштуваннях. Якщо якась стаття стосується одночасно різних категорій, то канонічна посилання фіксується самостійно.

При використанні плагіна Yoast SEO та розташування посту в різних категоріях, пошуковик бачитиме лише одну сторінку.

Що ще корисно знати про канонікал?

Важливо наголосити на наступних моментах:

  1. Тег canonical - не директива, а підказка, яку слід врахувати та проаналізувати, виділивши найбільш підходящу URL для пошукової видачі.
  2. Щодо оформлення канонічних посилань відсутня заборонний момент у вигляді відносного шляху. Навіть у разі введення тега з посиланням на документ, відносні шляхи сприйматимуться так, як прописано в базовій URL.
  3. Канонічні сторінки можуть містити абсолютно однакове наповнення, і це логічно. Можуть бути незначні відмінності.
  4. Навіть за наявності помилки 404 контент буде індексуватися. Але рекомендується вказувати робочі URL-адреси як канонічні.
  5. Якщо канонічний URL поки не проіндексований, залишається чекати - зазвичай недовго. Коли він розпізнається, підказку буде переглянуто.
  6. Можна використовувати редирект - пошуковик сприйме перенаправлення і враховуватиме іншу адресу.
  7. Рекомендується задавати ідентичний тег rel canonical, щоб результат канонізації був оптимальним.
  8. Канонічний урл може прописуватися лише з поточного домену. Для вказівки урла з іншого домену слід використовувати 301 редирект.
  9. Як оформлюються канонічні url, можна вивчити на прикладі сайту wikia.com, відкривши вихідний код сторінки http://starwars.wikia.com/wiki/Nelvana_Limited, що містить canonical url http://starwars.wikia.com/wiki/Nelvana
    Обидві посилання практично однакові, але в першому прописаний атрибут канонікал - і Google відображатиме версію, задану в цьому параметрі.
  10. Питання застосування канонікал можна поставити в офіційному блозі для веб-майстрів пошуковика Google.

У цьому випадку канонікал проставлено на чорну вівцю

Переваги, пов'язані з умінням правильно налаштовувати індексацію за допомогою тега canonical:

  • звільнення від схожого контенту, пов'язаного з недоліками двигуна, а також створеного штучно цілеспрямованими діями конкурентів;
  • відсутність необхідності у застосуванні robots.txt для заборони індексації окремих сторінок та догодження всім пошуковикам.