Поисковая система (англ. search engine, синонимы: поисковый сервер, поисковая машина) — специальный веб-сайт, на котором пользователь по заданному запросу может получить ссылки на сайты, соответствующие этому запросу.
Как правило, работа поисковой системы состоит из двух этапов. Поисковый робот (паук, crawler) постоянно обходит сеть и собирает информацию с веб-страниц (индексирует их). Когда пользователь задает запрос, поиск идет по предварительно построенному индексу. Результатом поиска является так называемая поисковая выдача — список ссылок на документы (веб-страницы), соответствующие запросу.
Робот поисковой системы — компонента или программа, которая посещает веб-страницы, считывает (индексирует) полностью или частично их содержимое и далее следует по ссылкам, найденным на данной странице. Робот возвращается через определенные периоды времени и индексирует страницу снова. Вся информация заносится роботом в индексы поисковой системы.
В Интернете поисковых систем сотни и тысячи, но с точки зрения важности для нас отметим следующие основные и наиболее авторитетные.
Яндекс (www.yandex.ru) — крупнейший российский портал, ежедневная аудитория Яндекса — 4,000,000 человек, что составляет порядка 65% суточной аудитории всего русского Интернета, ежемесячная — около двадцати четырех миллионов.
Рамблер (www.rambler.ru) — посещает около 1,000,000 уникальных человек в день.
Google (www.google.ru) — посещаемость неизвестна (предположительно около 500,000 человек в день, данные 2007 года). Это самая большая поисковая система в мире, которая очень хорошо ищет в русскоязычных документах и важна по той причине, что следующая упомянутая ниже поисковая система использует ее движок.
Поиск@Mail.ru (go.mail.ru) — самая молодая поисковая система. Работает на движке Google, но, в отличие от нее, ищет только по русской части Интернета и с учетом морфологии русского языка.
В белорусском Интернете поисковых систем нет. Но есть порталы и каталоги сайтов, которые осуществляют поиск посредством поисковых систем Яндекс или Google. Наиболее популярные из них:
TUT.BY (www.tut.by) — наиболее посещаемый белорусский портал существующий с 5 октября 2000 года. Число заходов уникальных посетителей на титульную страницу составляет более 70000 в сутки;
All.by (www.all.by) — интернет портал, мета-поиск которого реализован на основе данных Яндекс.XML и All.by;
Br.by (www.br.by) — каталог ресурсов белорусской части Интернета. Поиск по ресурсам зоны .by;
Поиск.com (www.poisk.com) — каталог сайтов и полнотекстовая поисковая система. Проект основан осенью 1999 года.
В целом, поисковые системы и каталоги являются самыми посещаемыми сайтами в Интернете. Важны два основных факта:
1. Почти каждый пользователь хотя бы раз в день заходит на поисковую систему.
2. От 5 до 90% посетителей приходят на сайт через поисковые системы.