Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Глобальные информационно-поисковые системы

⇐ ПредыдущаяСтр 4 из 5Следующая ⇒

Информационно-поисковые системы (ИПС) появились на свет достаточно давно. Теории и практике построения таких систем посвящено множество статей, основная масса которых приходится на конец 70-х - начало 80-х годов прошлого столетия. Среди отечественных источников следует выделить научно-технический сборник "Научно-техническая информация. Серия 2", который выходит до сих пор. На русском языке издана так же и "библия" по разработке ИПС - "Динамические библиотечно-информационные системы" Ж. Солтона, в которой рассмотрены основные принципы построения информационно-поисковых систем и моделирования процессов их функционирования. Таким образом, нельзя сказать, что с появлением Internet и бурным вхождением его в практику информационного обеспечения появилось нечто принципиально новое, чего не было раньше. ИПС в Internet - это признание того, что ни иерархическая модель Gopher, ни гипертекстовая модель World Wide Web еще не решают проблему поиска информации в больших объемах разнородных документов. И на сегодняшний день нет другого способа быстрого поиска данных, кроме поиска по ключевым словам.

В ответ на запрос пользователь обычно получает длинный список документов, многие из которых не имеют никакого отношения к тому, о чем он спрашивал. Такие документы называются нерелевантными (от англ. relevant - подходящий, относящийся к делу). Таким образом, релевантный документ - это документ, содержащий искомую информацию. Очевидно, что от умения грамотно формировать запрос зависит процент получаемых релевантных документов. Доля релевантных документов в списке всех найденных поисковой машиной документов называется точностью поиска. Нерелевантные документы называют шумовыми. Если все найденные документы релевантные (шумовых нет), то точность поиска составляет 100%. Если найдены все релевантные документы, то полнота поиска - 100%. Таким образом, качество поиска определяется двумя взаимозависимыми параметрами: точностью и полнотой поиска. Увеличение полноты поиска снижает точность, и наоборот.

Методы повышения эффективности поиска

Используйте различные инструменты для поиска информации разного профиля. Поиск в каталоге дает представление о структуре вопроса, поисковая система позволяет найти конкретный документ, подбор доменного имени помогает отыскать сервер фирмы, даже если она не индексирована ни одной поисковой системой.
Осуществляя поиск в поисковой машине, избегайте общих слов. Чем уникальнее ключевое слово, по которому осуществляется поиск, тем больше шансов найти именно то, что нужно. Логика рассуждений здесь очевидна: 400 наиболее часто употребляемых слов русского языка со всеми словоформами составляют одну треть всех слов в среднестатистическом тексте.
Ищите больше, чем по одному слову.
Сократить объем ссылок можно, определив несколько ключевых слов. Используйте синонимы.
Не пишите прописными (большими) буквами. Избегайте написания ключевого слова с прописной буквы. В ряде поисковых систем заглавные буквы позволяют искать имена собственные, например "телепередача Здоровье".
Используйте функцию "Найти похожие документы". Если один из найденных документов ближе к искомой теме, чем остальные, нажмите на ссылку "Найти похожие документы".
Пользуйтесь языком запросов. С помощью языка запросов можно сделать запрос более точным.
Пользуйтесь расширенным запросом. Во многих поисковых системах есть форма расширенного запроса, в которой можно использовать основные механизмы сужения поиска (не запоминая семантики языка запросов).
Пользуйтесь метапоисковыми системами, если по теме найдено мало документов.

Поисковые агенты.

Парадокс Интернета заключается в том, что с его ростом становится труднее найти необходимую информацию. Конечно, речь идет не о наиболее популярных вещах (напр., курс доллара или информация о погоде), а о поиске специализированной или редкой информации Понятно, что для работы с подобными объемами информации необходимо использовать эффективные средства и адекватные технологии. Пользователи должны иметь возможность с удобством искать и фильтровать данные в больших распределенных хранилищах и осуществлять мониторинг интересующей их информации в потоках новых или измененных данных, группировать материалы, а также выделять дубли и повторы, не содержащие никаких новых данных. Кроме того, часто возникает необходимость в дополнительной персонализации, например, пользователю нужна возможность дополнительной фильтрации или сортировки уже отобранной информации, которая просто не была предусмотрена разработчиками ресурса. Решение заключается в использовании специализированного программного обеспечения, разработанного с использованием принципов агентских технологий. Каковы преимущества агентов перед простым обращением к машинам поиска?

1. Поисковый агент передает пользователю не просто результаты работы машины (машин) поиска, а предварительно просматривает документы и выбирает из них наиболее релевантные с его точки зрения. Для этого агент использует определенную технологию оценки релевантности.

2. Агент может настраиваться на предпочтения пользователя, то есть учитывать ряд ограничений на поиск, формулируемых владельцем агента.

3. Некоторые агенты могут работать в режиме off-line, то есть когда пользователь дает задание агенту и отключается от Сети, а агент отправляется на сервер, где выполняет работу. Когда пользователь снова подключается, агент посылает ему выполненное задание.

Агенты могут быть настроены на поиск по расписанию: искать информацию каждый час, день, неделю, месяц и т.д. Эта опция полезна при поиске, например, новостей, какой-то информации, обновление которой происходит довольно часто или информации, которая пользователю необходима постоянно в его работе.

4. Агенты могут обучаться. Пользователь оценивает работу агента, а агент учитывая эти оценки может корректировать свои критерии отбора информации.

Таким образом, поисковые агенты могут рассматриваться как интеллектуальная надстройка над машинами поиска.

Понятие «агент»

Понятие термина «агент» варьируется в зависимости от сферы применения (напр., на производстве – это робот, в страховой сфере – это представитель компании, а в области телекоммуникаций ‑ программа). Одно из первых определений понятия агент в теории искусственного интеллекта приводится в работах Д.А. Поспелова и В.Н. Пушкина по теории гиромата. Гиромат – элементарная модель целесообразного поведения, способная адаптироваться с условием решаемой задачи, содержащая ряд модулей – блок мотивации, блок селекции (рецепторы), блок построения внутренней модели внешней среды, блок выдвижения гипотез, блок модельного опыта, блок выработки решений, блок модельного опыта, блок выработки решений, блок активного опыта, блок времени.

Алан Кэй, который начал первым продвигать теорию агентов, определил агент как программу, которая после получения задания способна поставить себя на место пользователя. Если агент попадает в тупик, он может задать пользователю вопрос, чтобы определить, каким образом ему необходимо действовать дальше.

Агенты рассматриваются как активные объекты, которые, в отличие от обычных (пассивных) объектов, не «засыпают» до получения следующего сообщения (от пользователя или из внешней среды) и его выполнения, а постоянно функционируют, решая порученные им задачи. Таким образом, главное их отличие состоит в том, что они сами являются инициаторами действий по изменению своего поведения в окружающей среде.

Обобщая множество определений агентов, данных разными исследователями, можно остановится на следующей нейтральной концепции: Агент ‑ это аппаратная или программная сущность, способная действовать в интересах достижения целей, поставленных пользователем. Агенты описываются так же рядом свойств, которые характеризуют понятие агента. Обычно агент обладает набором из следующих свойств:

· адаптивность: агент обладает способностью обучаться.

· автономность: агент работает как самостоятельная программа, ставя себе цели и выполняя действия для достижения этих целей.

· коллаборативность: агент может взаимодействовать с другими агентами несколькими способами, например, играя роль поставщика/потребителя информации или одновременно обе эти роли.

· способность к рассуждениям: агенты могут обладать частичными знаниями или механизмами вывода, например, знаниями, как приводить данные из различных источников к одному виду. Агенты могут специализироваться на конкретной предметной области.

· коммуникативность: агенты могут общаться с другими агентами.

· мобильность: способность к передачи кода агента с одного сервера на другой.

Агентские технологии

Повышенное внимание агентским технологиям начали уделять около 10 лет назад, но и за такое сравнительно короткое время интерес к ним уже переместился из области академических исследований в сферу коммерческих и промышленных приложений. При этом идеи и методы, лежащие в их основе, быстро мигрировали из теории искусственного интеллекта в практику разработки программного обеспечения реальных коммерческих приложений (персональные помощники, обработчики почты, программы для электронной коммерции, компьютерные игры, системы управления и контроля сложными процессами в медицине, промышленности, системы для поиска и обработки информации).

В рамках агентного подхода существует два направления развития теории. С точки зрения классического искусственного интеллекта (ИИ) агент обладает некоторым глобальным видение проблемы, действует в целях ее решения и ему доступны необходимые знания, навыки и ресурсы. В распределенном искусственном интеллекте организация агентных систем предполагает мультиагентность, когда решение сложной проблемы осуществляется набором агентов, каждый из которых имеет представление лишь о некоторой части общей проблемы и действует в целях решения выделенной локальной подзадачи. В мультиагентных системах концептуальной новизной является социальный аспект, поскольку для решения общей задачи агентам необходимо определенным образом взаимодействовать. Подобные способы организации с общением агентов и вызывают наибольший интерес, поскольку позволяют реализовывать весьма сложные, но в то же время эффективно работающие системы.

Простая программа отличается от агента тем, что не утруждает себя целевым поведением и анализом достигнутых результатов. Тогда как агент, представляя интересы пользователя, «заинтересован» в том, чтобы задание было выполнено. В случае неудачи или какого-то сбоя он должен повторить попытку позднее или иметь про запас альтернативный вариант решения проблемы.

Главная особенность интерфейса, формы и способов представления информации, которые могут предоставить агенты, состоит в том, что они оказываются персонифицированными. Это достигается за счет того, что интеллектуальные агенты способны к обучению. В одном случае они могут целенаправленно анкетировать пользователя, в другом ‑ агент получает информацию о привычках пользователя путем наблюдения за его действиями.

В принципе, многие задачи агенты могут выполнять и без использования методов искусственного интеллекта, однако ряд проблем без них просто не может быть решен. На данный момент существует ряд технологий, таких как нейронные сети и генетические алгоритмы, нечеткая логика и другие, которые успешно применяются в различных специализированных системах, агентах и мультиагентных системах (рис. 4).

Рис. 4. Технологии, используемые интеллектуальными агентами

⇐ Предыдущая 1 2 345 Следующая ⇒

Поиск по сайту: