Tag Archives: ссылки



Broken Link Checker: Поиск и проверка битых ссылок

Разместил: | 21.11.2015

Всем привет, дорогие друзья. Сегодня я пол дня занимался пиаром своего конкурса, поэтому слегка запоздал со статьёй. Ну, ничего, план будет выполнен! Сегодня мы поговорим на тему: проверка и поиск битых ссылок на сайте, обсудим методы поиска, в частности плагин Broken Link Checker — наверное лучшее решение.

Но, давайте обо всём по порядку!

Сразу хочу сообщить прикол. Я, если честно, был в шоке.

Распиарил я значит конкурс, пошел по своим делам. Возвращаюсь вечером, а там вот это.

битые ссылки
Это за пол дня-то! Трындец.!

Не, ну спасибо, ребята :)

Было бы здорово, конечно, если бы все эти комментарии были участниками конкурса. Но ладно. Участники тоже есть.

Так, но мы не сегодня не об этом.

Что такое битые ссылки и почему они возникают?

Битая ссылка — ссылка, которая ведет пользователя на страницу, которой нет. Как правило, вместо какой-то страницы показывается 404 ошибка (страница не найдена). Ну или пользователь получит какое-то служебное сообщение от сервера — но это в худшем случае.

Конечно, вы можете догадаться уже, что такие плохие битые ссылки, которые никуда не ведут — плохо сказывается как на поведенческих факторах, так и на отношении к вам поисковиков в целом. Траст вашего блога стремительно падает.

Поэтому от битых ссылок нужно как можно быстрее избавляться!

Почему возникают битые ссылки?

Давайте попробуем смоделировать различные ситуации:

1. Один из ваших комментаторов (блоггер), при комментировании вашего блога оставил урл на свой блог. Через какое-то время он забросил свой блог, удалил/продал — не важно. Вот вам и битая ссылка. Ссылка есть, а блога нет!

2. Вы сделали обзор какого-то сервиса! Через какое-то время сервис прекратил своё существование. Вот вам и битая ссылка!

3. Вы обменялись постовыми и вам блоггер-партнер забил на блог — еще одна битая ссылка.

Таких ситуаций можно моделировать очень долго. Я думаю вы все уловили суть.

Как проверить блог на битые ссылки в Яндекс и Гугл вебмастере

Кому эта часть будет утомительна — можете проматать. Однако для общего развития — я бы рекомендовал к прочтению.

Тем более она не большая.

Итак.

Давайте начнем с гугл вебмастера. Заходим в него, идем в Сканирование — Ошибки сканирования

И там видим подобную картинку:

ошибки сканирования
Это скрин на одном из моих сайтов, который был взломан! Как видито 25 000 не найденных страниц — это не шутки!

За это поисковики вас легко могут понизить в поисковой выдаче.

Вы сможете нажать на ссылки, которые вам предоставит вебмастер от гугла и посмотреть на какой странице эта ссылка есть! А также исправить ситуацию.

Теперь переходим к вебмастеру от Яндекса. Заходим в Индексирование сайта — Исключенные страницы

битые ссылки и вебмастер
В Яндекс вебмастере вообще можно узнать много полезного, но нас сейчас интересуют именно 404 страницы, т.е. ссылки на несуществующие страницы, которые Яндекс учитывает.

выбор битых ссылок
Яндекс (как и гугл) даёт вам возможность выгрузить в XLS формате список битых ссылок, чтобы их потом обработать и исправить.

выгрузка
Вот в принципе и все возможности наших уважаемых вебмастеров.

А что вы хотели? Задача панели вебмастера — дать вам информацию, а вот лечить проблемы вебмастера не обязаны!

Программа для поиска битых ссылок

Кто не знает как пользоваться вебмастерами Яндекс или Гугл, или вам может быть просто удобнее пользоваться каким-то софтом?

Вам я рекомендую программу Xenu Link Sleuth — сам ей пользовался достаточно долго и она до сих пор у меня установлена, правда несколько для других задач.

Так вот, открываете программу, и нажимаете кнопку «Check URL»

проверить битые ссылки
Я в открывшееся окно ввожу URL своего блога и… процесс пошел…

Программа автоматически находит вам битые ссылки.

процесс поиска битых ссылок
На картинке показано, как работает программа, одна строчка — это один url.

Статус «ОК» — это значит что всё здорово! Страница доступна. Помечается зеленым.

Статус «Busy» — значит что ссылка в данный момент проверяется. Помечается серым.

Статус «not found» — страница не найдена! Помечается красным!

Статус «no such host» — Такого сервера не существует. Вы ссылаетесь на несуществующий домен. Помечается красным!

Статус «no connection» — Не удалось присоединиться к серверу / Редирект. Помечается красным!

После того как проверка завершена — я отсортировываю список страниц по статусу. И получаю в итоге вот такую картинку.

статусы xenu
АФИГЕТЬ! Блин!

Ладно, буду разбираться!

Нажимаем дважды на какую-то строчку и видим следующее:

два раза нажали на строчку
Нам сразу становится понятно, кто куда ссылается и каким анкором.

В моём случае, я поставил в одной из статей не правильную ссылку. Сам виноват!

Теперь мы можем приступать к чистке. Правда всё это вручную делается очень неохотно и долго, согласны?

Плагин Broken Link Checker

Скачиваем в репозитории.

Устанавливаем.

И… даём плагину поработать. Он всё делает автоматически.

работа плагина broken link
Если мы вошли сюда сразу как только установили плагин — мы сможем увидеть, как он «на лету» проверяет все ссылки. Проверенных ссылок становится всё больше и больше.

Ждать особо не стоит. Как только увидели какой-то касяк — сразу можете его исправлять.

сортировака ссылок
Плагин будет автоматически бережно сортировать всё по разделам. Где-то будет перенаправление, где-то реальная битая ссылка.

Самое главное, плагин Broken Link Checker умеет:

— Автоматически определять битые ссылки.
— Автоматически определять битые картинки.
— Автоматически определять битые видео файлы.

Я обычно оставляю плагин «до завтра» и ухожу. А на завтра я смотрю на показатели. И вижу что-то подобное.

найдена битая ссылка
О, найдена одна битая ссылка.

Заходим в список урлов в плагине. Смотрим.

исправление битых ссылок
Отсюда можно сразу перейти по ссылке, кликнув на неё и убедиться что она реально битая!

Я убедился и вот что я сделал:

удаление битой ссылки
Да, я её просто удалил.

Прошу заметить, что при наведении на строку с битых урлом — есть несколько вариантов решения проблемы.

а) можно удалить (что я и сделал)

б) можно просто отредактировать урл и ссылаться на нормальную, существующую страницу.

в) Not Broken — сказать плагину, что он ошибся, что ссылка не битая.

г) Dismiss — убрать уведомление до следующей проверки

д) ReCheck — перепроверить прямо сейчас. Когда вы вручную отредактировали ссылку (исправили ситуацию) — нажимайте эту кнопку.

Но я предпочитаю или удалять или редактировать урл прямо отсюда, из плагина.

Плагин может редактировать код ссылок самостоятельно!

Вам не нужно лазить по статьям и копаться в коде. Одно нажатие и ссылки нет.

Вместо неё будет анкор в виде стандартного текста!

Вооот. На этом наверное и всё.

Блин, здесь точно должно быть моё видео на тему плагина и битых ссылок. Но уже поздновато. Обязательно запишу. Для всех статей! Чуть позже.

Давайте, ребята так — вы сейчас участвуйте в конкурсе, пишите конкурсные статьи. А пока вы их пишете и рассказываете об этом конкурсе друзьям — я буду записывать видосы для всего блога! Окей? :)

Все, до завтра!

[bye]



А на что вы пойдете чтобы скрыть партнерскую ссылку?

Разместил: | 23.10.2014

Всем привет дорогие друзья, не так давно мы обсудили темы трастовых сайтов и спасибо вам за комментарии. Артем – вы дали ссылки на действительно классный материал, спасибо.

Сегодня же мы поговорим о том как скрыть партнерскую ссылку от посторонних глаз. Причем это может быть как и реферальная ссылка, так и просто урл вашего блога, который не хотите афишировать до того момента, как человек переидет по ссылке. Но обо всем по порядку. Читать запись полностью. »