Поисковые системы(Search Tools) размещаются в Internet на общедоступных серверах и представляют собой специализированные web-узлы. Пользователь сообщает системе данные о содержании искомой web-страницы, а система выдает список гиперссылок на страницы, соответствующие запросу.
После перехода на web-страницу, можно найти на ней определенный текст, выбрав команду приложения Internet Explorer Правка ► Найти на этой странице, ввести ключевое слово или фразу, либо искать информацию по смысловым категориям.
Существуют две модели, на которых основана работа поисковых систем: поисковые (тематические) каталоги и поисковые машины.
Поисковые (тематические) каталоги
Обратившись к поисковому каталогу, можно найти на его главной странице список крупнейших тематических категорий (основных рубрик). Каждая запись в списке категорий – это гиперссылка. Щелчок по ней открывает следующую страницу поискового каталога, на которой данный раздел (рубрика) представлен более подробно. Продолжая погружение в тему, можно дойти до списка сайтов и конкретных web-страниц.
Количество поисковых каталогов в Internet сравнительно невелико, что связано с высокой трудоемкостью их содержания и обслуживания. Такие каталоги создаются вручную: высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирая наиболее важные ресурсы по каждой из тем. Крупнейший поисковый каталог – Yahoo! (http://www.yahoo.com).
Поисковые каталоги принято использовать для первичного, реферативного поиска информации. Они обеспечивают поиск классических, наиболее содержательных ресурсов.
Поисковые машины
Поисковые машины (автоматизированные индексы – Search Engines) – это роботизированные системы, которые обеспечивают поиск актуальной уникальной и специализированной информация, которая не охвачена и не может быть охвачена поисковыми каталогами. Они дают во много раз больший охват ресурсов WWW (до 20%), так как процесс наполнения базы данных поисковых машин автоматизирован. Разумеется, при этом значительно снижается качество ссылок, предоставляемых по результатам поиска, но одновременно увеличивается их количество.
Основной принцип работы поисковой машины заключается в поиске web-ресурсов по ключевым словам. Пользователь описывает искомый документ с помощью ключевых слов, после чего дает задание на поиск. Поисковая система просматривают свою базу данных, и выдает список гиперссылок на web-страницы, соответствующие запросу. Вместе с гиперссылками выдаются краткие сведения о найденных ресурсах (заголовки, адреса и описания документа) и отрывки (цитаты) из документов, где встречаются искомые слова, на основании которых пользователь может выбрать нужные ему ресурсы.
Результирующий список подвергается фильтрации и ранжированию. Под фильтрацией понимают отсев ссылок, которые выдавать нецелесообразно (прежде всего, проверяется наличие дубликатов). Ранжирование заключается в создании специального порядка представления результирующего списка, при котором наиболее «полезные» (с точки зрения поисковой системы) ссылки приводятся в начале списка, а наименее «полезные» - в конце.
Упорядочение результирующего списка по степени соответствия содержанию найденных документов поисковому запросу, называется сортировкой по релевантности. Стандартную сортировку по релевантности можно заменить сортировкой по дате обновления страницы.
На сегодняшний день в Internet имеется около 10 тысяч поисковых машин. К наиболее известным относятся Яндекс (http://www.yandex.ru), Гугл (http://www.google.ru), Alta Vista (http://www.altavista.com).
Большинство поисковых машин сегодня включает в себя и каталоги, которые составляются редакторами и обычно организуются в соответствии с предметной классификацией. Отдельной разновидностью каталога являются рейтинги (счетчики посещений web-ресурсов).