Полезная информация
Каталог   Добавить ссылку   Добавить статью   Администрирование   Карта  
 

Борьба с дублями страниц

Избавление от дублей страниц – важнейшая задача оптимизатора

Появление дублированного контента, особенно на сайтах, построенных на всевозможных CMS – настоящий бич современного веб-мастера. Рассмотрим способы, при помощи которых можно избавиться от дубликатов.

Что такое дубли страниц?

Зачастую администраторы сайтов даже не подозревают, что некоторые страницы на их веб-ресурсах копируют друг друга. Однако многие, возможно, замечали, что при открытии одной и той же страницы, допустим, из архива материалов или по ссылке «Читать далее», её URL выглядит иначе. Для обычного пользователя это обстоятельство совершенно непринципиально, однако поисковые машины подобные вещи воспринимают однозначно. В их понимании это дубли страниц – разные страницы с одинаковым содержанием.
А что же значит в глазах поискового робота появление дубля страницы? В первую очередь то, что её содержимое неуникально, а это крайне негативным образом сказывается на результатах, которую она займёт в поисковой выдаче. К тому же наличие дублей может свести на нет усилия администратора по внутренней и внешней оптимизации сайта, когда ссылочный вес с других страниц или сайтов, направленный на конкретную страницу, «размывается» по её дублям.

Причины появления дубликатов страниц

В большинстве случаев дубли страниц генерируются при использовании веб-мастером различных CMS и недостаточным вниманием, уделяемым их настройке. При этом невозможно дать конкретные рекомендации ни по выбору определённой системы управления контентом, которая не генерировала бы дубли страниц, ни по тому, каким образом эти дубликаты необходимо удалять. Универсального рецепта не существует, однако если вы не боитесь ещё больше «утяжелить» такие ресурсоёмкие CMS как Joomla или WordPress, можно использовать специализированные плагины. Например для Joomla дубли легко склеить средствами sh404sef
Данные утилиты могут уберечь от полных дублей страниц, то есть полностью идентичных, возникших из-за несовершенства CMS. Однако на многих сайтах можно встретить большое количество нечётких дублей с частичным дублированием контента, возникающих исключительно по вине администратора. Это могут быть анонсы, повторяющие содержимое основной части статьи, либо карточки товаров в интернет-магазинах, практически полностью идентичные за исключением одного или двух предложений.

Как найти дублированные страницы

Перед поиском дублей полезно сравнить количество проиндексированных страниц в Яндексе и Google. Сделать это очень просто: достаточно лишь ввести в строку поиска запрос вида site:ваш домен.ru. Обычно, если на сайте много дублированного контента, то результаты будут различаться в десятки раз.
Иногда дублированные страницы можно легко отличить по виду URL. Так, если в настройках сайта включена функция ЧПУ, то все ссылки вида index.php?s=5z7j3508t почти наверняка будут относиться к страницам-копиям. Бывает полезным и способ их выявления посредством ввода ключевых фраз в формы поиска Яндекса или Google. Так, если в результатах выдачи по одному запросу окажется две или более страниц, то это свидетельствует о наличии дублей.
Но, конечно, проверка подобного рода подходит только для сайтов с небольшим количеством страниц. В противном случае без использования специальных утилит, таких как Xenu`s Link Sleuth просто не обойтись. Она обработает все имеющиеся на вашем ресурсе внутренние и внешние ссылки на предмет их работоспособности, а полученные результаты можно будет экспортировать в один из редакторов и проанализировать на предмет наличия дублей. Кроме данной программы можно воспользоваться средствами для проверки индексации страниц Google Webmaster Tools и «Яндекс.Вебмастер».

Удаляем дублированный контент на сайте

Для устранения дублей страниц можно также использовать несколько способов.

  1. Ручное удаление. Но такой метод применим только в том случае, если у нескольких страниц появились дубликаты по недосмотру веб-мастера. Иначе такое удаление займёт уйму времени.
  2. Если при открытии сайта в адресной строке может отображаться домен как с «www», так и без него, то необходимо настроить редирект 301 для «склеивания» подобных страниц.
  3. В некоторых случаях применение атрибута rel=”canonical” может оказаться крайне полезным. Впервые ведено это правило было компанией Google, а сегодня и Яндекс стал его учитывать. Постановкой rel=”canonical” в элемент , в разделе можно указать поисковику на нечёткие копии основной страницы. При этом для канонической страницы данный атрибут не ставится.
  4. И конечно, не стоит забывать, что дубли страниц, в URL которых имеются общие элементы, можно массово запретить к индексации, изменив настройки файла robots.txt.

Итак, вы уже наверняка поняли, что не стоит пренебрегать удалением дубликатов страниц на продвигаемом сайте. В противном случае довольно трудно будет добиться попадания ресурса в ТОП-10 по достаточно высокочастотным запросам, ведь сайтов – миллионы, и чтобы выбиться в лидеры веб-мастер должен проводить грамотную и тщательную внутреннюю оптимизацию, в том числе и за счёт удаления дублированного контента.



Комментарии:

Комментариев нет

Добавить свой комментарий:

Имя:

E-Mail адрес:

Комментарий:

Ваша оценка:

Введите число, которое Вы видите на картинке:
Информация
Источник:
http://webcomme.ru/item/borba-s-dubliami-stranitc.html
Автор: Игорь Вялов
Категории:
Оценка модератора: Нет
Оценка пользователей: Нет
Переходов на сайт:222
Переходов с сайта:0