Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Особенности поисковых машин

Лабораторная работа №4

Работа с поисковыми системами

Цель: Получить практические навыки работы с поисковыми системами

Теоретическая часть

Общее представление о поисковых службах

Поиск информации – основная цель пользователя в WWW.

Для того, чтобы понять, что скрывается за теми действиями, которые Вы выполняете, следует более формально рассмотреть процесс поиска. Итак:

1. У Вас появляется необходимость найти сведения по какому-либо вопросу. На языке теории информационного поиска это называется информационной потребностью.

2. Для того, чтобы «объяснить» поисковой службе, что Вам необходимо найти, следует сформулировать свою информационную потребность. Этот процесс, как правило, сводится к выявлению набора понятий и терминов, характеризующих информационную потребность. Такие понятия и термины получили название ключевые слова, а выделенное множество ключевых слов именуется запросом.

3. На следующем этапе Вы через интерфейс информационно-поисковой системы вводите запрос. Система выбирает необходимые документы, соответствующие Вашему запросу, и формирует результат.

4. Список документов, отобранных поисковой системой, называются выдачей или откликом. Выданные документы по содержанию делятся на две группы: соответствующие (релевантные) и несоответствующие информационной потребности (информационный шум).

Информационно-поисковые системы на пространстве WWW

Информационно-поисковые системы в Интернет на пространстве WWW бывают различных типов.

Первым классификационным признаком поисковых служб является способ организации пополнения базы данных о документах сети. Поэтому признаку системы делятся на каталоги и поисковые машины.

Под каталогом принято понимать информационно-поисковую систему, предназначенную для поиска и просмотра информации содержащейся в иерархически упорядоченной базе данных по Интернет-ресурсам. В основе каталога лежит база данных (рубрикатор) документов, информация в которую заносится человеком. Под поисковой машиной мы будем понимать информационно-поисковую систему, предназначенную для поиска и просмотра информации содержащейся в индексированной базе данных. В отличие от каталогов, поисковые машины исследуют Сеть с целью пополнения своих баз данных документов. В настоящее время наметилась тенденция к созданию так называемых гибридных поисковых систем, которые сочетают в себе функции как каталога, так и поисковой машины.

Второй способ классификации поисковых служб – классификация по глубине охвата ресурса. По данному признаку системы делятся на глобальные и локальные. Глобальные каталоги и поисковые машины действуют на всем пространстве WWW. Это означает, что все документы WWW потенциально могут попасть в базу данных такой информационно-поисковой системы. В качестве примеров глобальных каталогов можно привести Yahoo <яхо> (www.yahoo.com), а в качестве примеров поисковых машин – Altavista <альтависта> (www.altavista.com). К сожалению, русскоязычных глобальных поисковых систем нет.

В локальных информационно-поисковых системах поисковое пространство является частью пространства WWW и, следовательно, не все документы этого ресурса могут попасть в базу данных таких систем. Примером локальных каталогов служат российские каталоги «Русский медицинский сервер» (dir.rusmedserv.com), Каталог сайтов «Referal.ru» (referal.ru), Инернет-справочник свободного Рунета «Freedom.ru» (www.freeedom.ru). В качестве локальных поисковых машин, действующих на пространстве РУНет, следует назвать Арогt (www.aport.ru), Rambler (www.rambler.ru) и Яndeх (www.yandex.ru). Очевидно, что сужение информационно-поискового пространства снижает результаты поиска.

Кроме того, некоторые сайты Интернет располагают собственными механизмами поиска (в пределах данного сайта). На сайте БелГУ имеется ссылка «поиск» по разным подразделениям университета.

Особенности каталогов

Основной характеристикой каталогов является объем базы данных, т.е. количество представленных документов. По сравнению с поисковыми машинами скорость увеличения баз данных каталогов достаточно мала, поскольку их пополнение происходит вручную. Однако это может рассматриваться и как преимущество поисковых систем данного типа, поскольку ручной отбор позволяет повысить точность поиска.

В качестве второй характеристики следует выделить количество категорий или рубрик в каталоге. Естественно, чем выше это значение, тем большей точностью характеризуются результаты поиска.

Принципы работы с каталогами достаточно просты. Как правило, главная страница сайта каталога содержит в себе список категорий, или рубрик, каждая из которых представлена гиперссылкой. По такой гиперссылке пользователь может перейти на страницу, содержащую список подрубрик или документов, соответствующих этой рубрике. В качестве примера на рисунке 1 представлена главная страница каталога Referal.Ru (http://referal.ru)

Рис.1 Главная страница каталога Referal.Ru

Особенности поисковых машин

Поисковые машины устроены гораздо сложнее каталогов. В структуре поисковой машины выделяют три составляющих – специальную программу, именуемую поисковым роботом (спайдер, гусеница), базу данных документов, называемую индексом, и интерфейсную часть, предназначенную для взаимодействия с пользователем. Поисковый робот осуществляет просмотр сети с целью выявления новых документов для включения их в базу данных поисковой машины.

В процессе занесения документов в индекс поисковая машина составляет список слов документа, которые являются потенциальными ключевыми словами. И когда вы запрашиваете информацию, машина ищет документы в существующем индексе. Важным моментом является то, что поиск осуществляется не на реальном пространстве документов сети, а в некоторой модели, содержание которой может значительно отличаться от действительного содержания Интернет в момент проведения поиска.

Поисковая машина

Среди наиболее известных поисковых систем выделяют поисковую машину Yandex <Яндекс>. Ее адрес в Интернет http://www.yandex.ru

Яндекс относится к гибридным системам – одновременно присутствуют элементы, как каталога, так и поисковой машины.

Основные разделы каталога располагаются в центре страницы. Ниже расположены ссылки на основные службы сайта.

Рис.2 Поисковая система Яндекс

 

Охарактеризуем некоторые службы Яндекса.

 

Здесь вы можете зарегистрироваться и получить адрес электронной почты имя@yandex.ru

Здесь собран перечень различных словарей, энциклопедий и можно осуществлять поиск одновременно по имеющимся источникам.

 

Данная служба дает возможность искать информацию по ведущим информационным агентствам. Здесь же можно заказать доставку новостей по электронной почте.

 

В верхней части страницы расположена Панель поиска.

Рис.3 Поиск информации с помощью Яндекса

 

Для примера ввели запрос «Цицерон». Через несколько секунд получили результат поиска. Обратите внимание на строку заголовка – в скобках указывается количество найденных страниц. Если много документов – поставьте флажок «искать в найденном» на Панели поиска.

Ссылка похожие документы дает нам возможность найти большее количество необходимых документов.

Допустим, Ваш запрос состоит из двух ключевых слов. Целесообразно между ними ставить знак «+», чтобы сузить круг поиска с целью уменьшения количества выданных документов. И наоборот знак «-» ставится с целью исключения тех документов, которые содержат ненужные понятия. Приведем примеры организации запросов в Яндексе:

Законы России
находит документы, содержащие одновременно `законы` и `России`, а также по отдельности.

Законы and Россия
находит документы, содержащие и `законы` и `Россия`

Закон ~России
находит документы, содержащие `законы`, но не содержащие `Россия`.

 


Поисковая машина

В 1996г. был запущен в эксплуатацию поисковый механизм Рамблер (http://www.rambler.ru).

В данной системе работает рейтинговая система Рамблер Top 100, которая считается одним из лучших классификаторов Российского Интернет (Рунет). Она располагается в центре главной страницы Рамблера, разделы которой могут быть отсортированы по алфавиту или по категориям.

Организация поиска в Рамблере такая же как в Яндексе. Степень значимости ключевых слов также определяется знаками «+» и «-». По умолчанию найденные документы сортируются по релевантности, то есть соответствующие запросу. Однако можно попросить отсортировать документы по дате.

Рис.4 Поисковая система Rambler

 

Выше поисковой панели располагаются различные службы Рамблера, слева внизу – рубрики каталога.

Эффективность поиска в сети в значительной мере зависит от опыта и кругозора пользователя. Когда вы ищете материалы по определенной тематике, ни в коем случае не следует полагаться на «интеллект» машины: вы сами должны учитывать особенности лексики данной темы, возможное сочетание терминов и т.п.


Практическая часть

 

Задачи: 1. Найти сведения в Интернете с помощью поисковых систем о ветеранах 2-ой мировой войны – однофамильцах студента, выполняющего работу.

2. Найти сведения о значении и происхождении имени студента, выполняющего работу.

3. Ответить на вопросы карточки (карточка выдается преподавателем).

Ход выполнения работы

1. Запустите Интернет-браузер.

2. В адресной строке впишите адрес поисковой системы (один из: http://www.yandex.ru/, http://www.rambler.ru/, http://www.google.com/, http://www.aport.ru/).

3. В строке вопроса введите свой вопрос, используя следующие правила:

a. Слово(а), взятые в кавычки, будут искаться буквально без искажений

b. Если в начале слова неотделимо стоит знак «-», то страницы, содержащие это слово, будут исключаться (полезно исключать такие слова как «магазин», «заказать», «купить», «оплатить», «в корзину»)

c. Полезно использовать помимо прямого вопроса вспомогательные слова «скачать» «просмотреть» …

d. Если результат поиска дает слишком много страниц, попробуйте сузить его, воспользовавшись расширенным поиском (у каждой поисковой системы структура расширенного поиска разная).

4. После нахождения данных (для заданий 1-2) сохраните их в своей папке (Пункт меню Файл→Сохранить как…).

5. Попробуйте выполнить один и тот же поиск (задания 1-2) в различных поисковиках.

6. Выполните поиск информации по заданию 3. Ответы впишите в карточку.

7. Сообщите о выполнении заданий преподавателю. У вас на диске должно быть не менее 2 различных документов по каждому из заданий 1-2 (всего не менее 4), а также заполненная карточка с ответами по заданию 3.

 

Контрольные вопросы

1. Опишите процесс поиска информации. Чем отличаются ключевые слова от запроса?

2. Какие типы информационно-поисковых систем вы знаете?

3. Чем отличается каталог от поисковой машины?

4. Что понимается под гибридной поисковой системой?

5. Назовите отличие глобальных систем от локальных.

6. Какие особенности каталогов и поисковых машин вам известны?

 




Поиск по сайту:

©2015-2020 studopedya.ru Все права принадлежат авторам размещенных материалов.