Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Поиск текстовой информации



В интернете можно найти массу текстовой информации. Первоначально текстовая информация преобладала в интернете над всеми видами информации. Это происходило потому, что ее легче передать технически. Чисто психологически напечатанная информация всегда вызывает доверие. Например, сейчас в образовании возникла проблема, когда обучаемые находят нужные им сведения в интернете и принимают их как аксиому, забывая при этом, что интернет – это свободный источник данных, в котором практически нет контроля за достоверностью этих данных. Интернетом пользуются не только для получения образовательных, справочных сведений. Сегодня интернет стал источником повседневной, необходимой ежедневно каждому человеку информации. Например, прежде чем совершить покупку с ее характеристиками и ценами на нее знакомятся в Интернете, что с успехом могут использовать интернет-маркетологи. Даже новости приходят к большинству через Интернет. Это могут быть новостные порталы, или электронные версии печатных изданий газет и журналов. Практически каждое печатное издание сегодня имеет свой электронный аналог. И если раньше затруднительно было купить 3-5 газет ежедневно, то теперь ежедневно просматривают и большее количество изданий. Причем найти новости в электронной версии зачастую можно быстрее, чем в печатной.

Для улучшенного поиска текстовой информации полезно использовать страницы расширенного поиска и язык запросов поисковика.

Например, на страницу расширенных запросов Google можно попасть нажав на шестеренку в правом верхнем углу поисковика. В расширенном поиске можно:

1. указать ключевые слова и точные фразы, по которым будет производиться поиск;

2. указать «минус» слова, или слова, которые будут исключены из поиска;

3. указать диапазон для чисел;

4. задать язык страницы;

5. задать страну сайта;

6. задать диапазон, в течении которого были созданы или обновлены искомые страницы;

7. указать на каком сайте должен быть произведен поиск;

8. указать в какой части страницы должны быть расположены ключевые слова;

9. использовать безопасный поиск, или поиск исключающий сайты только для взрослых;

10. дополнительно задать формат разыскиваемого файла;

11. осуществлять поиск страниц, которые можно бесплатно использовать, распространять и изменять.

Такие же результаты поиска можно получить, используя язык поисковых запросов Google.

1. Логическое «И». По умолчанию Google ищет документы, содержащие все слова запроса. Это соответствует оператору AND. Например: [Минск Москва] или [Минск AND Москва].

2. Логическое «ИЛИ». Задается с помощью оператора OR или в виде вертикальной черты (|). Например: [Таксы длинношерстные OR гладкошерстные]. Google может показать и те страницы, где нет ключевых слов, но эти слова содержатся в ссылках на показанную страницу.

3. Google не чувствителен к регистру букв. Все буквы воспринимаются как прописные, вне зависимости от того, как их вводили в поисковую строку. Запросы [Минск Москва] и [минск москва] дадут одинаковые результаты.

4. Кнопка «Мне повезет» расположена на главной странице Google и переводит непосредственно на сайт, который Google считает самым релевантным (на первый в поисковой выдаче).

5. Стоп-слова. Слова, которые исключаются из поиска. Пример: [лиса –Алиса].

6. Оператор «Плюс» (+). Бывают ситуации, когда надо принудительно включить в текст какое-либо слово, которое может иметь варианты написания. В справке Google приводится пример с запросом «Star Wars Episode I», где римская единица представляет собой латинскую букву “I” (Ай). Если сделать запрос просто как [Star Wars Episode I]. То найдутся и «Episode II», «Episode IV» и т.д. Если сделать запрос: [Star Wars Episode +I], то результат будет только для «Episode I».

7. Для поиска точной фразы ее следует заключить в кавычки. Пример: ["крейсер Аврора"].

8. Поиск слов, разделенных одним или несколькими словами. Вместо разделяющих слов ставятся *. Например: [натуральный * сок].

9. cache: Поиск в кэше Google. Пробела между оператором cashe: и адресом запрашиваемой страницы быть не должно. Пример: [cache:www.mmf.bsu.by]. Кэшированная страница показывается в том виде, в котором она хранится в кэше поисковой машины и сопровождается надписью наверху страницы о том, что это страница из кэша. Там же содержится информация о времени создания кэшированной версии. На странице из кэша ключевые слова запроса подсвечены, причем каждое слово для удобства пользователя подсвечено своим цветом.

10. info: позволяет увидеть информацию, которая известна Google об этой странице. Например, [info:www.mmf.bsu.by].

11. site: ограничивает поиск конкретным сайтом. Пример: [декан site:www.mmf.bsu.by].

12. link: позволяет увидеть все страницы, которые ссылаются на страницу, по которой сделан запрос. [link:www.mmf.bsu.by].

13. allintitle: ищет страницы, в которых все слова запроса содержатся в заголовках, внутри тега Title в HTML. Например: [allintitle:интернет маркетинг].

14. intitle: ищет страницы, в кoтopыx только то слово, которое стоит непосредственно после оператора intitle:, содержится в заголовке, а все остальные слова запроса могут быть в любом месте страницы. Если поставить оператор intitle: перед каждым словом запроса, это будет эквивалентно использованию allintitle. Например: [интернет intitle:маркетинг].

15. allinurl: поиск по страницам, в которых все слова запроса содержатся только в адресе страницы, то есть в url. Например: [allinurl: razvedka].

16. inurl: cлово, которые расположено непосредственно слитно с оператором inurl:, будет найдено только в адресе страницы, а остальные слова могут располагаться в любом месте страницы. Например, для того, чтобы найти слово «belhard» на сайтах, содержащих в адресе сочетание букв «tc», можно сделать запрос: [inurl:tc belhard]. Если оператор inurl: поставить перед каждым словом запроса, это будет эквивалентно использованию allinurl.

17. related: ищет страницы, которые похожи на какую-то конкретную страницу. Например: [related:http://www.date.bs/].

18. define: выводит определение понятия.

19. Поиск синонимов. Если необходимо найти тексты, содержащие не только ключевое слово, но и его синонимы, то можно перед словом поставить знак тильды «~». Например: [~пакость].

20. Поиск в диапазоне значений. Пример: [телефон $100..150].

Яндекс имеет не меньшие, а может и большие возможности для поиска (http://help.yandex.ru/search/). Ниже перечислены некоторые основные особенности поиска Яндекса.

1. Яндекс лучше поддерживает морфологию русского языка и лучше находит словоформы слов из поисковых запросов.

2. Яндекс хорошо понимает запросы из нескольких слов и способен самостоятельно их интерпретировать. Он знает, в каких случаях надо искать страницы, в которых слова запроса расположены рядом, а когда достаточно словам встретиться в одном документе, чтобы страница хорошо соответствовала запросу.

3. Чтобы найти точную фразу или форму слова, ее надо взять в кавычки. Например: ["легка на помине"].

4. Как и в Google, поиск слов, разделенных одним или несколькими словами. Вместо слов ставятся звездочка. Например: [натуральный * сок].

5. При поиске цитат, в которых пропущено слово, можно взять всю цитату в кавычки, а вместо пропущенного слова поставить звездочку *. Например: ["ночь улица * аптека"].

6. Логическое «ИЛИ». Поиск страниц с любым из перечисленных через слэш слов. Например: [ананасы | рябчики | шампанское].

7. Поиск в пределах одного предложения. Если перечислить слова через амперсанд, то Яндекс найдет страницы, в которых эти слова стоят в одном предложении. Например:[ананасы & рябчики].

8. Для поиска документа, содержащего определенное слово необходимо поставить плюс перед нужным словом, не отделяя плюс от слова пробелом. Например: [Памятник Шолохову +бульвар].

9. «Минус» слова. Минус ставится вплотную без пробела перед словами, которые надо исключить из поиска. Например: [лиса ‑Алиса]. Или слова, которые исключаются из поиска, помечаются двумя тильдами перед ними. Например: [лиса ~~Алиса].

10. Для поиска по сайту надо указать ключевое слово site и двоеточие, а затем без пробелов указать адрес сайта. Например: [декан site:www.mmf.bsu.by].

11. Для поиска документов определенного типа указывается оператор mime и требуемое расширение файла. Например: [заявление на загранпаспорт mime:pdf].

12. Для поиска на сайтах на определенном языке указывается оператора lang. После lang нужно поставить двоеточие и написать, на каком языке нужны документы. Если это русский язык, то нужно указать ru, если украинский ‑ uk. Белорусский язык обозначается как be, английский ‑ en, французский ‑ fr. Например: [lang:en].

Также как и в Google, в Яндексе есть расширенный поиск. В нем можно указать:

1. сайт, на котором необходимо вести поиск;

2. регион поиска;

3. в каких частях страницы нужно вести поиск слов запроса (где угодно, в заголовке);

4. учитывать ли морфологию слов, т. е. только искать точные вхождения или и словоформы тоже;

5. язык страницы;

6. дату последнего обновления страницы;

7. формат документа;

Можно не использовать расширенный поиск, а воспользоваться языком запросов.

1. Для поиска слов в пределах одного документа между ними ставится два амперсанда. Например: [снаряжайся && добудь].

2. Если в запросе есть не ранжирующее «и», то выражение после оператора не влияет на позицию документа в выдаче. Например: [не смогешь << винить].

3. Можно указать на какое максимальное количество слов могут быть удалены друг от друга ключевые слова. Для этого между словами ставится слэш и количество слов. Например: [я должон /2 казнить].

4. Можно указать на какое максимальное количество слов в прямом порядке могут быть удалены друг от друга ключевые слова. Для этого между словами ставится слэш, плюс и количество слов. Например: [при моем /+2 уму].

5. Можно одновременно учитывать и прямой и обратный порядок. Например: [щи /(-1 +2) хлебаю], расстояние от одного слова в обратном порядке до двух слов в прямом.

6. Также можно указать на какое максимальное количество предложений могут быть удалены друг от друга ключевые слова. Для этого между словами ставятся два амперсанда, слэш и количество предложений. Например: [государственное дело && /3 улавливаешь нить].

7. Можно искать документы с предложениями, где одно ключевое слово встречается без другого слова. Например: [чай ~ лаптем], Поиск предложения, где слово чай встречается без слова лаптем.

8. Для поиска точных словоформ с заданным регистром перед словом ставится восклицательный знак. Например: [!Соображаю !что !чему].

9. Скобки формируют группы в сложных запросах. Например: [получается && (+на | !мне)], обязательно должно быть «на» (в любом регистре) или «мне» (точная словоформа с учетом регистра) и в этом же документе должно встретится любая словоформа слова «получается».

10. Для поиска словарной формы слова перед ним ставится два восклицательных знака. Например: [!!политика].

11. Поиск по заголовкам документов осуществляется с помощью оператора title:. Например: [title:(в стране)].

12. Поиск по URL осуществляется с помощью оператора url:. Например: [url:ptici.narod.ru/ptici/kuropatka.htm].

13. Поиск с учетом фрагмента URL ведется с помощью оператора inurl: Например: [беспременно inurl:vojne].

14. Поиск по по хосту осуществляется с помощью оператора host:. Например: [host:lib.ru].

15. Можно вести поиск по хосту в обратной записи. Для этого используется оператор rhost:. Например: [rhost:ru.lib.*].

16. Можно вести поиск с ограничением по домену. Например: [domain:ru].

17. Поиск может быть произведен по рубрике Яндекс.Каталога. Например: [cat:11000051]. Код рубрики можно получить в справке Яндекса.

18. При поиске есть возможность учитывать временной интервал. Например:[date:200712*], или [date:20071215..20080101], или [date:>20091231].

Поиск по изображениям

Кроме текстовой информации в интернете можно найти много изображений, аудио и видеоматериалов. С развитием технологий стало проще передавать в сети изображение и звук. Сайты сразу обрели красочность и голос. Много информации можно найти через поиск по изображениям. Один из самых распространенных сервисов для поиска копий изображений в Интернете http://www.tineye.com/. Tineye был первым поисковиком изображений, для которого не требовалось указывать ключевые слова или метаданные. В него можно загрузить свою картинку с диска или указать ссылку на изображение в интернете. В результате поиска можно:

· узнать, откуда взята та или иная картинка;

· узнать, на каких сайтах используется это изображение (возможно, незаконно);

· найти ту же картинку в другом качестве и большем разрешении;

· найти имеющиеся модификации;

· отследить использование изображения в интернете.

Tineye использует специальную технологию идентификации изображений. Сервис ищет похожие картинки, но не по тематике, а находит точные вхождения искомой картинки. То есть в результате найдутся изображения, которые созданы из исходного с помощью вырезания, изменения размера или эффектов фотошопа. Есть специальный плагин для Firefox (TinEye Reverse Image Search 1.1). Который добавляет в контекстное меню изображения предложение найти оригинальную картинку. Аналогичные плагины есть и у других браузеров.

Многие поисковики имеют свои встроенные сервисы для поиска картинок. Например. Google Similar Images сервис Google, который позволяет находить похожие изображения. Именно похожие, а не точные вхождения части изображения. Под картинкой размещается ссылка «Похожие». При переходе на которую поисковик выдает серию изображений, похожих на данное. Аналогичный сервис есть и Яндекса. Причем поиск осуществляется по цвету и форме объекта на изображении, а также по названию самой картинки. Можно искать изображение похожее на заданное, которое грузится с диска или указать его адрес в Интернете. Для этого надо нажать на изображение фотоаппарата рядом с поисковой кнопкой Google при поиске картинок.

Поиск по картинкам осуществляет и Retrievr (http://labs.systemone.at/retrievr). Он удобен, если то, что вы ищете проще нарисовать, чем описать словами. Слева вверху есть небольшое квадратное поле, где можно что-нибудь нарисовать. Набор инструментов крайне ограничен: можно лишь выбрать любой предложенный цвет или оттенок и один из четырех вариантов толщины линии. Как только процесс рисования прервется, справа появятся 20 картинок, которые Retrievr считает похожими на ваш рисунок. Картинку можно и загрузить или указать ее адрес в интернете.

Не так давно появилась социальная сеть, которая занимается только исключительно изображениями http://pinterest.com/. В ней тоже можно искать картинки.

Примером использования поиска по картинкам в конкурентной разведке может быть поиск людей с помощью аватарок. Многие пользователи имеют одинаковые аватарки на различных форумах, и если повезет, это могут быть уникальные, эксклюзивные аватарки. В этом случае по этим аватаркам можно отследить, на каких форумах бывает человек.

Еще В. И. Ленин сказал, что «из всех искусств для нас важнейшим является кино». Это потому, что по силе воздействия зрительное восприятие является одним из самых сильных. С развитием технических возможностей Интернет запестрел видео. Появились большие видео порталы. Один из крупнейших из них, например, http://www.youtube.com. Там можно найти не только забавные ролики, но много полезной и неожиданной информации. Интернет маркетинг сейчас активно рекламирует свою продукцию, свои услуги через Интернет, в том числе через youtube. Youtube можно рассматривать также как канал распространения информации. Естественно, что через этот канал можно не только распространять, но и собирать информацию.




©2015 studopedya.ru Все права принадлежат авторам размещенных материалов.