ВВЕДЕНИЕ
ГЛАВА 1. ОБЗОР ПОИСКОВЫХ СИСТЕМ СЕТИ ИНТЕРНЕТ
1.1 Основные задачи поисковых систем
1.2 Классификация поисковых систем
1.2.1 Дескрипторные поисковые системы
1.2.2 Классификационные поисковые системы
1.3 Показатели эффективности поисковых систем
1.4. Отечественные поисковые системы
Основные отечественные поисковые системы
1.5. Зарубежные поисковые системы
Глава 2. СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПОИСКОВЫХ СИСТЕМ СЕТИ ИНТЕРНЕТ
2.1 Сравнительный анализ Отечественных поисковых систем
2.2 Сравнительный анализ зарубежных поисковых систем
2.3 Сравнительный анализ дескрипторных и классификационных поисковых систем
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
В сети существуют различные способы поиска информации. Конечно же, если имеется справочник, в котором можно найти местонахождение интересующего вас источника конкретной информации, то, без всякого сомнения, следует этим и воспользоваться. Однако такие издания не всегда доступны. Кроме того, сеть является постоянно обновляющейся системой и поэтому находиться в курсе всего нового с помощью периодики, а тем более с помощью литературы, не всегда представляется возможным. Для поисковых целей в Internet существуют специальные поисковые машины, располагающие значительными базами данных и имеющие связь с себе подобными.
Существенно полезными возможностями у них является наличие системы поиска, которая строится по принципу: от общего — к конкретному. Задавая общее понятие (в виде ключевого слова, нескольких слов или фразы, — в зависимости от сервисных услуг конкретной машины), а затем, с каждым новым поиском все более и более конкретизируя его, можно получить интересующий результат.
В основе этой работы – сравнительный анализ крупнейших русскоязычных поисковых систем.
Актуальность. Выбрана именно эта тема, так как сейчас поиск Информации в Интернете очень долгое и утомительное дело из-за множества лишней и ненужной информации, которую туда помещают – спама. Поэтому мы решили сделать обзор крупных поисковых систем и выделить именно те, которые быстрее и надежнее помогают найти именно нужную информацию.
В первой части работы рассмотрены основные понятия, которые касаются поисковых систем, характер их работы и виды. Далее сделан обзор крупных международных и русскоязычных поисковых систем и каталогов. В третьем разделе я взял для сравнения самые крупные русские поисковые системы Яндекс, Рамблер и Апорт.
В исследовательской части приведены примеры нескольких экспериментов и проанализирован результат.
Предмет исследования: анализ поисковых систем сети Интернет
Объект исследования: поисковые системы сети Интернет
Цель: более глубоко рассмотреть и сравнить характер и особенности работы крупнейших поисковых систем.
Задачи:
- обобщить знания по важнейшим поисковым системам сети Интернет.
- выявить значимые особенности поиска информации в крупнейших русскоязычных поисковых системах.
ГЛАВА 1. ОБЗОР ПОИСКОВЫХ СИСТЕМ СЕТИ ИНТЕРНЕТ
1.1 Основные задачи поисковых систем
Поисковая система - это программное обеспечение, предоставляющее доступ к коллекции слабоструктурированной информации. Ориентация на слабоструктурированные данные, т.е. данные, которые нельзя представить в виде реляционной таблицы, отличает поисковую систему от СУБД.
В данном определении поисковой системы подразумевается информация различного рода, т.е. текст, аудио, видео, изображения и т.п. Однако следует отметить, что именно текстовые данные идеально подходят для описания полной функциональности поисковой системы, т.к. алгоритмы поиска мультимедийной информации, прежде всего, основываются на алгоритмах поиска текста.
Основная задача поисковой системы - минимизировать время, затрачиваемое пользователем на поиск релевантной запросу информации. Релевантность - одно из самых субъективных и запутанных понятий в науке информационного поиска. Наиболее часто говорят о релевантности с точки зрения пользователя, и тогда ``релевантная запросу информация'' и ``нужная пользователю информация'' - одно и то же. Именно о такой релевантности мы говорим в данном разделе. Вопрос заключается в том, какую информацию пользователь посчитает нужной? В некоторых обстоятельствах релевантную информацию можно определить как всю информацию из базы, имеющую отношение к запросу. Так, например, если пользователю нужно узнать все о конкретной фирме, то он заинтересован в нахождении всех документов, в которых упоминается об этой фирме. В других обстоятельствах релевантная информация - это только та информация, которая достаточна для выполнения определенной задачи пользователя, например, поиска ответа на конкретный вопрос. Если в последнем случае в результатах поиска будет много избыточных данных, т.е. данных, которые имеют отношение к запросу, но не нужны для выполнения данной задачи, то выборка нужной/релевантной информации займет у пользователя дополнительное время. [5]
Таким образом, традиционно к поисковой системе применяют две основные характеристики: точность и полнота, а точнее, их зависимость. Каждый раз, когда пользователь задает системе запрос, тем самым инициализируя поиск, все документы в коллекции поисковой системы делятся на четыре части. Точность определяет один аспект поиска, а именно, насколько хорошо поисковая система способна минимизировать время, затрачиваемое пользователем на поиск релевантной данному запросу информации. В то время как полнота определяет другой аспект - насколько хорошо система способна найти релевантную данному запросу информацию. Можно подобрать оптимальный запрос(ы), когда каждый найденный документ будет релевантным, и каждый релевантный документ будет найден.
Поисковые системы при использовании Интернет играют очень важную роль. В Интернете сосредоточено такое количество информации, что ее поиск уже превращается в отдельную задачу и отнимает очень много времени. Поисковые серверы выдают на запрос тысячи ссылок вместо нескольких страниц, где действительно имеется нужная информация. Пользователи всемирной сети Интернет, осознав преимущества, предоставляемые возможностью анализа пространственных данных, нуждаются в инструменте, позволяющем осуществлять быстрый и удобный поиск и доступ к цифровым снимкам местности и другой пространственной информации, сосредоточенной во многих правительственных, коммерческих и академических организациях.