Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Охарактеризувати технології пошуку в системі WWW та основні пошукові машини мережі Інтернет



Пошукова система – онлайн-служба (програмно-апаратний комплекс з веб-інтерфейсом), що надає можливість пошуку інформації в Інтернеті. У просторіччі під пошуковою системою розуміють веб-сайт, на котрому розміщено інтерфейс (фронт-енд) системи. Програмною частиною пошукової системи є пошуко́ва маши́на (пошуко́вий руші́й) – комплекс програм, що забезпечує функціональність пошукової системи і, зазвичай, є комерційною таємницею компанії-разробника пошукової системи.

Більшість пошукових систем шукають інформацію на сайтах Всесвітньої павутини, але існують також системи, здатні шукати файли на ftp-серверах, товари в інтернет-магазинах, а також інформацію в групах новин Usenet.

Індексація в пошукових системах сайтів здійснюється пошуковим роботом.

Пошукові машини Web намагаються створити базу даних усієї системи WWW за допомогою програмних систем, що називаються павуки.

Технологія роботи програм-павуків є наступною: павуки переповзають від одного Web-вузла до іншого за допомогою системи URL і «збирають» необхідну інформацію для комплексної бази даних.

Якщо не враховувати сам факт використання системи павуків, то можна стверджувати, що різноманітні пошукові машини працюють по-різному. Одні розміщують в свою базу даних усі слова кожної Web-сторінки, а інші спочатку досліджують адреси вузлів, щоб потім вибрати серед них найбільш ефективні. Успіх пошукової машини залежить від способу її дії.

Більше як 80% всього пошуку в Інтернеті доводитися на 3 основні системи: Google, Yahoo!, MSN.

GOOGLE - http://www.google.com - Пошуковик Google аналізує якісний зміст сторінок - шрифти, підрозділи, точне місцеположення кожного слова, плюс зміст сусідніх сторінок для забезпечення максимальної релевантності результатів пошуку. В компанії Google створено технологію пошуку для бездротових пристроїв з моментальним перетворенням HTML у формати для режимів WAP, І-mode, J-SKY і EZWeb. Google забезпечує пошук по гіпертекстових документах, що знаходяться в різних мовних зонах - українською, російською, англійською, німецькою і ін. Пошукова система Google має власні піддомени для більшості країн, наприклад, для України - google.com.ua, для Росії - google.ru. Це одна з найбільших пошукових баз в світі.

ПЕРЕВАГИ

· Використання механізму PageRank, який відображає «важливість» сайту і впливає на видачу результатів пошуку.

· Google шукає не лише гіпертекстові файли (html), але і файли у форматі PDF, DOC, PostScrіpt, Corel Word Perfect і ін.

· Пошукова система Google має можливість пошуку зображень. При цьому у запиті можна вказати бажаний розмір, глибину кольору, формат файлу.

· На відміну від багатьох пошуковиків, роботи Google індексують всі сторінки, а не лише найголовніші.

· Всі сторінки Google кешує (заносить в свою базу), і дозволяє користувачеві переглядати документ у кеші Google, не відкриваючи його в першоджерелі (що зазвичай є набагато швидше).

· Google дозволяє обрати мову інтерфейсу, мовні зони для пошуку, кількість повідомлень при видачі результатів та ін.

YAHOO - http://www.yahoo.com - на сьогоднішній день це найстаріший і якнайповніший каталог Інтернет-ресурсів. Ця система, що обслуговує мільйони запитів щодня, зародилася як проста колекція закладок. Yahoo має базу даних в більш, ніж 1 млн. проіндексованих сайтів. Також, у разі браку власної бази даних, Yahoo використовує базу даних Google (до липня 2000 року Yahoo користувався базою даних Іnktomі).

YANDEX.RU (Спрощено - http://ya.ru) Yandex виконує пошук по словяномовній частині Інтернету з урахуванням морфології словянських мов. Основною відмінною рисою Yandex є ретельно розроблений алгоритм оцінки відповідності відповіді запиту (релевантності), який враховує не лише кількість слів запиту, знайдених у тексті, але і «контрастність» слова (його відносну частоту для даного документа), відстань між словами, і положення слова в документі.

Мета - Потужна повнотекстова пошукова система, має оригінальну базу даних. Підтримує розвинену мову запитів, пошук за окремими полями документів. Виконує пошук з урахуванням морфології української, російської та англійської мов. Посилання супроводжуються анотаціями. Зручний та швидкий перегляд результатів.

 




Поиск по сайту:

©2015-2020 studopedya.ru Все права принадлежат авторам размещенных материалов.