Как google индексирует javascript

Многие вебмастера по прежнему думают, что поисковики не индексируют javascript. Сегодня я хочу поделиться интересной статьей.

Она на английском, поэтому я кратко изложу её суть.

 

 

По мнению автора статьи, первые попытки к индексации javascript, гугл предпринял ещё в 2008 году. Тогда это было реализовано в условном варианте. Сегодня гугл справился с этой задачей и за последний год переиндексировал все страницы учитывая js.

Не все вебмастера понимают, что браузер отрисовывает страницы с помощью DOM. По сути это независящий от языка интерфейс, который связывает языки программирования и разметки в одно целое. Для браузеров он образует мост между html, css, xml и javascript.
Далее автор описывает тесты, разбитые на пять категорий. Его цель — понять насколько хорошо гугл справляется с этой задачей.

Редиректы

Для начала мы проверили как гугл относится к редиректам на основе javascript инструкции window.location. В результате он быстро заметил этот сигнал и начал его учитывать.  В другом тесте мы перенаправили посетителей с одной страницы, уже находящейся в выдаче, на абсолютно новую, но с таким же контентом. Поисковик так же быстро сообразил и принял это за 301 редирект. Оригинальная страница в выдаче была заменена на новую, при этом позиции не пострадали. Вывод — такие редиректы интерпретируются как редиректы с ответом 301.

Ссылки

Мы перепробовали многие варианты вставки ссылок и все они были успешно проиндексированы. Далее нашей целью было понять, проиндексирует ли гугл ссылку, если её вывод будет зависеть от поведения пользователей. Например если ссылка будет появляться только при наведении мышки, в результате выяснилось что такие ссылки индексируются гуглом. Так же выяснилось, что гугл находит ссылки, которые были специально разбиты на несколько частей и склеивались с помощью javascript.

Динамический контент

Для проверки индексации динамического контента мы создали несколько тестов. В первом текст находился в коде страницы и выводился с помощью js. Во втором текст был внесен во внешний javascript фаил, в обоих случаях контент проиндексировался. Это касается любого контента — текста, картинок. видео и т.д.

Мета данные

Мы предприняли попытки динамически формировать важные теги для seo, такие как title, description, meta robots и т.д. Эти изменения так же интерпретировались гуглом и учитывались при ранжировании.

Важный эксперимент

Поучительный пример. Мы создали две ссылки с помощью html, одна с тэгом nofollow, другая без него. При загрузке страницы второй ссылке динамически присваивался такой же тэг nofollow. В первом случае, как и предполагалось, гугл учитывал эту инструкцию и не индексировал страницу. Во втором это не сработало, гугл успел отправил эту ссылку на индексацию, прежде чем разобрать javascript. Так же тесты показали, что иногда гугл предпочитает указания из js, нежели чем из html, если они конфликтуют между собой.

p.s. от себя.
Скорей всего это связано с тем, что google использует два бота. Один обычный, который индексирует по старинке, и специальный, который анализирует/исполняет js. Специальному требуется больше ресурсов, поэтому индексирует он реже.

Выводы думаю понятны, теперь лучше два раза подумать, если хотите обмануть пс с помощью js. Ну а проблем с индексацией сложных сайтов в google больше нет.

  • http://seoonly.ru/ seoonly.ru

    А по логам на сервере боты какие на сайт приходили?