Как работают поисковые системы

Если мы хотим влиять на поисковую систему, нам нужно понимать, как работают поисковые системы. Начнем с базовых принципов.

Поисковая система НЕ ищет в интернете.

Многие думают, что стоит задать вопрос Google, и он начинает бегать по всему интернету и искать подходящие вам страницы. Это не совсем так. Для показа ответа на ваш запрос Google использует заранее собранную поисковую базу данных. В ней хранятся миллионы и миллиарды разнообразных страниц, структурированных по ключевым словам и контекстам.

Как страницы попадают в поисковую базу данных Google?

Для подготовки базы данных поисковые системы используют программы — пауки (web crawler). Они ползают по интернету, сканируют тексты, картинки и ссылки. Выглядит это так — зашел такой паук на вашу страницу, разложил текст по словам, обработал картинки, скопировал ссылки ведущие на другие страницы сайта в список очередь. Затем взял следующую страницу очереди и занялся анализом следующей страницы. Таким образом от одной страницы к другой он передвигается в интернете.

Как тогда Google показывает результаты при поиске?

Когда программа паук обрабатывает текст, она это делает с помощью разных алгоритмов. Например таких — паук считает какие слова, как часто и в каких местах встречаются в тексте. Затем программа строит частотные таблицы, и на их основе обновляет поисковую базу данных. Процесс попадания данных с сайта в поисковую базу данных называется индексированием.

В результате, когда человек пишет запрос «купить ноутбук», поисковая система не бежит по всему интернету, а выбирает подходящие страницы, на которых есть слово «ноутбук», и сайт похож на магазин, и на нем есть кнопка купить (или ее синоним).

Как сделать чтобы мой сайт попал в поисковую базу данных?

Для этого надо пригласить роботов. Для этого можно:

Пройдет немного времени и ваш сайт появится в поиске.

Как проверить, попал ли мой сайт в поисковую базу данных?

Введите в поиске специальные команды:

  • site:domain.lv — увидите все ваши страницы, по которым работает поиск.
  • cache:domain.lv — сохранённую пауком страницу сайта.

В следующей статье мы поговорим о том, что такое ранжирования и релевантность. Почему одни страницы показываются выше, чем другие. Как Google понимает, что именно вы ищите.

Wikipedia — Поисковая система

 

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *