Broken Link Checker: Поиск и проверка битых ссылок

SEO оптимизация
Всем привет, дорогие друзья. Сегодня я пол дня занимался пиаром своего конкурса, поэтому слегка запоздал со статьёй. Ну, ничего, план будет выполнен! Сегодня мы поговорим на тему: проверка и поиск битых ссылок на сайте, обсудим методы поиска, в частности плагин Broken Link Checker - наверное лучшее решение. Но, давайте обо всём по порядку!

Всем привет, дорогие друзья. Сегодня я пол дня занимался пиаром своего конкурса, поэтому слегка запоздал со статьёй. Ну, ничего, план будет выполнен! Сегодня мы поговорим на тему: проверка и поиск битых ссылок на сайте, обсудим методы поиска, в частности плагин Broken Link Checker — наверное лучшее решение.

Но, давайте обо всём по порядку!

Сразу хочу сообщить прикол. Я, если честно, был в шоке.

Распиарил я значит конкурс, пошел по своим делам. Возвращаюсь вечером, а там вот это.

битые ссылки
Это за пол дня-то! Трындец.!

Не, ну спасибо, ребята :)

Было бы здорово, конечно, если бы все эти комментарии были участниками конкурса. Но ладно. Участники тоже есть.

Так, но мы не сегодня не об этом.

Что такое битые ссылки и почему они возникают?

Битая ссылка — ссылка, которая ведет пользователя на страницу, которой нет. Как правило, вместо какой-то страницы показывается 404 ошибка (страница не найдена). Ну или пользователь получит какое-то служебное сообщение от сервера — но это в худшем случае.

Конечно, вы можете догадаться уже, что такие плохие битые ссылки, которые никуда не ведут — плохо сказывается как на поведенческих факторах, так и на отношении к вам поисковиков в целом. Траст вашего блога стремительно падает.

Поэтому от битых ссылок нужно как можно быстрее избавляться!

Почему возникают битые ссылки?

Давайте попробуем смоделировать различные ситуации:

1. Один из ваших комментаторов (блоггер), при комментировании вашего блога оставил урл на свой блог. Через какое-то время он забросил свой блог, удалил/продал — не важно. Вот вам и битая ссылка. Ссылка есть, а блога нет!

Читайте также:  Проверка релевантности страницы - что это?

2. Вы сделали обзор какого-то сервиса! Через какое-то время сервис прекратил своё существование. Вот вам и битая ссылка!

3. Вы обменялись постовыми и вам блоггер-партнер забил на блог — еще одна битая ссылка.

Таких ситуаций можно моделировать очень долго. Я думаю вы все уловили суть.

Как проверить блог на битые ссылки в Яндекс и Гугл вебмастере

Кому эта часть будет утомительна — можете проматать. Однако для общего развития — я бы рекомендовал к прочтению.

Тем более она не большая.

Итак.

Давайте начнем с гугл вебмастера. Заходим в него, идем в Сканирование — Ошибки сканирования

И там видим подобную картинку:

ошибки сканирования
Это скрин на одном из моих сайтов, который был взломан! Как видито 25 000 не найденных страниц — это не шутки!

За это поисковики вас легко могут понизить в поисковой выдаче.

Вы сможете нажать на ссылки, которые вам предоставит вебмастер от гугла и посмотреть на какой странице эта ссылка есть! А также исправить ситуацию.

Теперь переходим к вебмастеру от Яндекса. Заходим в Индексирование сайта — Исключенные страницы

битые ссылки и вебмастер
В Яндекс вебмастере вообще можно узнать много полезного, но нас сейчас интересуют именно 404 страницы, т.е. ссылки на несуществующие страницы, которые Яндекс учитывает.

выбор битых ссылок
Яндекс (как и гугл) даёт вам возможность выгрузить в XLS формате список битых ссылок, чтобы их потом обработать и исправить.

выгрузка
Вот в принципе и все возможности наших уважаемых вебмастеров.

А что вы хотели? Задача панели вебмастера — дать вам информацию, а вот лечить проблемы вебмастера не обязаны!

Программа для поиска битых ссылок

Кто не знает как пользоваться вебмастерами Яндекс или Гугл, или вам может быть просто удобнее пользоваться каким-то софтом?

Читайте также:  Микроразметка schema org: введение

Вам я рекомендую программу Xenu Link Sleuth — сам ей пользовался достаточно долго и она до сих пор у меня установлена, правда несколько для других задач.

Так вот, открываете программу, и нажимаете кнопку «Check URL»

проверить битые ссылки
Я в открывшееся окно ввожу URL своего блога и… процесс пошел…

Программа автоматически находит вам битые ссылки.

процесс поиска битых ссылок
На картинке показано, как работает программа, одна строчка — это один url.

Статус «ОК» — это значит что всё здорово! Страница доступна. Помечается зеленым.

Статус «Busy» — значит что ссылка в данный момент проверяется. Помечается серым.

Статус «not found» — страница не найдена! Помечается красным!

Статус «no such host» — Такого сервера не существует. Вы ссылаетесь на несуществующий домен. Помечается красным!

Статус «no connection» — Не удалось присоединиться к серверу / Редирект. Помечается красным!

После того как проверка завершена — я отсортировываю список страниц по статусу. И получаю в итоге вот такую картинку.

статусы xenu
АФИГЕТЬ! Блин!

Ладно, буду разбираться!

Нажимаем дважды на какую-то строчку и видим следующее:

два раза нажали на строчку
Нам сразу становится понятно, кто куда ссылается и каким анкором.

В моём случае, я поставил в одной из статей не правильную ссылку. Сам виноват!

Теперь мы можем приступать к чистке. Правда всё это вручную делается очень неохотно и долго, согласны?

Скачиваем в репозитории.

Устанавливаем.

И… даём плагину поработать. Он всё делает автоматически.

работа плагина broken link
Если мы вошли сюда сразу как только установили плагин — мы сможем увидеть, как он «на лету» проверяет все ссылки. Проверенных ссылок становится всё больше и больше.

Ждать особо не стоит. Как только увидели какой-то касяк — сразу можете его исправлять.

сортировака ссылок
Плагин будет автоматически бережно сортировать всё по разделам. Где-то будет перенаправление, где-то реальная битая ссылка.

Читайте также:  Что такое пузомерки сайта?

[tip]Самое главное, плагин Broken Link Checker умеет:

— Автоматически определять битые ссылки.
— Автоматически определять битые картинки.
— Автоматически определять битые видео файлы.[/tip]

Я обычно оставляю плагин «до завтра» и ухожу. А на завтра я смотрю на показатели. И вижу что-то подобное.

найдена битая ссылка
О, найдена одна битая ссылка.

Заходим в список урлов в плагине. Смотрим.

исправление битых ссылок
Отсюда можно сразу перейти по ссылке, кликнув на неё и убедиться что она реально битая!

Я убедился и вот что я сделал:

удаление битой ссылки
Да, я её просто удалил.

Прошу заметить, что при наведении на строку с битых урлом — есть несколько вариантов решения проблемы.

а) можно удалить (что я и сделал)

б) можно просто отредактировать урл и ссылаться на нормальную, существующую страницу.

в) Not Broken — сказать плагину, что он ошибся, что ссылка не битая.

г) Dismiss — убрать уведомление до следующей проверки

д) ReCheck — перепроверить прямо сейчас. Когда вы вручную отредактировали ссылку (исправили ситуацию) — нажимайте эту кнопку.

Но я предпочитаю или удалять или редактировать урл прямо отсюда, из плагина.

[tip]Плагин может редактировать код ссылок самостоятельно!

Вам не нужно лазить по статьям и копаться в коде. Одно нажатие и ссылки нет.

Вместо неё будет анкор в виде стандартного текста![/tip]

Вооот. На этом наверное и всё.

Блин, здесь точно должно быть моё видео на тему плагина и битых ссылок. Но уже поздновато. Обязательно запишу. Для всех статей! Чуть позже.

Давайте, ребята так — вы сейчас участвуйте в конкурсе, пишите конкурсные статьи. А пока вы их пишете и рассказываете об этом конкурсе друзьям — я буду записывать видосы для всего блога! Окей? :)

Все, до завтра!

[bye]

Оцените статью
Добавить комментарий для Вадим Отменить ответ

  1. Александр

    Я закрываю исходящие ссылки на блоге в urlspan, при проверке через этот плагин показывает что якобы все ссылки на блоге битые. Не знаю как с этим бороться. Вроде и нормально а выдает такую информацию. Может как то иначе закрывать ссылки, даже не знаю.

    Ответить
    1. У меня нет такой проблемы, но я не использую плагин. А для закрытия ссылок использую всё тот же urlspan , код которого руками прописал.

      Ответить
    2. Наталья Краснова

      Я тоже закрываю ссылки urlspan. Плагин только один раз показал ссылку как нерабочую, хотя переход по ней осуществлялся нормально.

      Ответить
  2. Сергей

    То есть хотите сказать, что если я сейчас на своём сайте, да и всяких других насоздаю и накидаю несуществующих ссылок на этот Ваш блог, то это отрицательно отразится на его, так скажем, репутации в глазах Яндекса?

    Ответить
    1. наоборот:
      1. когда я буду ссылаться на несуществующие страницы — мне плохо.
      2. когда яндекс знал урл как существующий ,а потом резко стало много урлов несуществующими — мне плохо.

      Ответить
  3. Вадим

    Я закрываю исходящие ссылки на блоге в urlspan

    Я смотрю это нынче в тренде. Все закрывают свои ссылки таким способом. Да чего там далеко ходить, я тоже внедрил такую штуку. Вот только почему-то не одной ссылки не «закрыл» :)
    Мне вот интересно, опять некоторые наши блогеры считают себя умнее яндекса и гугла? А что будет, если завтра ПС начнут игнорировать эту штуку или, чего хуже, введут новые фильтры за такие ссылки?
    Кстати, а о посетителях кто-нибудь думает? Меня вот, например, раздражает, когда подводишь курсор к ссылке и не видишь куда ведет эта ссылка.

    Ответить
  4. Сергей Оксак

    Хороший плагин, мне нравится, использую его у себя на сайте, правда периодически, раз или два в месяц т.к. прочитал предупреждение о том, что он дает достаточно серьезную нагрузку. И каждый месяц он что-нибудь находит, так что вещь очень полезная и даже незаменимая…

    Ответить