Несомненным преимуществом глобальной паутины является множество поддерживаемых форматов и свобода распространения информации. Поисковые роботы стараются максимально корректно ранжировать и индексировать весь доступный контент, но до сих пор не вся информация воспринимается поисковиками именно так, как того хотели бы веб-мастера.
Итак, а теперь подробно о наиболее популярных ошибках, которые допускают веб мастера:
- навигация через скрипты. Самым распространенным способом размещения ссылок является тег A. Но для навигации между страницами можно использовать и другие способы. Некоторые веб-мастера используют технологии Flash или JavaScript. Следует отметить, что поисковые роботы не переходят по ссылкам, реализованным с использованием скриптов. Поэтому их следует дублировать классическими текстовыми ссылками.
- использование тега iframe. Не следует использовать тег iframe, это помешает корректному ранжированию документа и не даст поисковым роботам проиндексировать его.
- избыточные редиректы. По возможности следует избегать использования редиректов. Они могут быть полезны лишь в том случае, если по техническим причинам меняются адреса страниц и возникла необходимость перенаправления пользователей по новому адресу. От корректной постановки редиректа напрямую зависят результаты поисковой выдачи. В частности, используемый серверами по умолчанию 302 редирект не гарантирует поисковой выдачи запрашиваемой страницы. Поэтому целесообразнее все же использовать 301 редирект.
- адреса страниц. Каждая страничка сайта должна быть доступна по постоянному единственному адресу. При этом желательно, чтобы адреса страниц не содержали идентификаторы сессий. Также следует избавить их от явных списков cgi-параметров.
- клоакинг. Необходимо не допускать ситуаций, когда поисковая система индексирует одно содержание странички, а пользователь при обращении к ней получает абсолютно другое. Такое явления часто встречается в версиях сайтов, которые ориентированы на целевую аудиторию сразу из нескольких регионов.
- изображения вместо текста. Не стоит злоупотреблять созданием страниц, которые не содержат текст. Если главная страница сайта представляет собой изображение, являющееся ссылкой на основную его часть – могут возникнуть проблемы с ранжированием. Это происходит по той причине, что большинство внешних ссылок ведет именно на главную страницу. А если она не содержит текст – надежность определения содержания документа стремится к нолю.
- soft 404. Пожалуй, самая распространенная ошибка веб-мастеров состоит в замене сообщения об ошибке 404 на страничку-заглушку. В этом случае поисковые роботы полагают, что страница с некорректным адресом все же существует. А это, в свою очередь, приводит к замедлению индексации рабочих страниц сайта.
- движок сайта. Необходимо следить за корректностью работы ПО сайта. Ошибки в скриптах могут негативно отразиться на процессе индексирования. А также ошибки могут использовать злоумышленники как для размещения ссылки, ведущей на вредоносный ресурс, так и для менее приятных целей.