Понятие поисковых систем и определение их задач. История развития и общие принципы поисковых систем. Рассмотрение рейтингов мировых поисковых систем в сети Интернет. Основные принципы функционирования и особенности поисковых машин Google и Yandex.
Официальная статистика утверждает, что на Земле Интернетом пользуются более 2,5 млрд. человек. Интернет становится основной формой существования информации, постепенно вытесняя традиционные, такие как газеты, радио, телевидение, всевозможные справочные службы. В наше время информация играет огромную роль во всех сферах жизнедеятельности. Ежедневно в сети появляются сотни тысяч новых документов. Каждому пользователю сети Интернет важно быстро находить в этом море информации действительно нужную.По мере роста объема информационных ресурсов, потенциально доступных одному человеку (например, посетителю библиотеки), были выработаны все более изощренные и совершенные поисковые средства и приемы, позволяющие найти необходимый документ. Поисковая система - это программно-аппаратный комплекс, имеющий веб-интерфейс, который предоставляет возможность поиска данных в Интернете. Поисковые системы это инструмент, позволяющий пользователю глобальной сети в кратчайшие сроки найти интересующую его информацию. Первоочередная задача любой поисковой системы - доставлять людям именно ту информацию, которую они ищут. Поэтому вводится качественная характеристика процедуры поиска - релевантность.Одним из первых способов организации доступа к информационным ресурсам сети стало создание каталогов сайтов, в которых ссылки на ресурсы группировались согласно тематике. После того, как число сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска информации по каталогу. Это, конечно же, не было поисковой системой в полном смысле, так как область поиска была ограничена только ресурсами, присутствующими в каталоге, а не всеми ресурсами сети Интернет. Причина этого очень проста - даже современные каталоги, содержащие огромное количество ресурсов, представляют информацию лишь об очень малой части сети Интернет. Самый большой каталог сети DMOZ (или Open Directory Project) содержит информацию о 5 миллионах ресурсов, в то время как база поисковой системы Google состоит из более чем 8 миллиардов документов.В индексе перечислены наиболее важные термины данной книги (ключевые слова) и номера страниц на которых они встречаются. По сути, когда пользователь вводит поисковой запрос (ключевое слово), он обращается к предметному указателю Интернета или индексу - списку всех ключевых слов Интернета, с указанием страниц, где они встречаются. Поисковая машина - это программа, которая составляет и хранит предметный указатель Интернета (индекс), а также находит в нем заданные ключевые слова. Затем поисковая машина, а точнее ее составная часть - поисковый робот, собирает все гипертекстовые ссылки с каждой из заданных страниц на другие страницы и добавляет все, найденные в ссылках адреса, к своему первоначальному списку адресов. Страница, на которую не ведет ни одна ссылка, не попадет в индекс поисковика никогда, поэтому если вы сделали новый сайт его необходимо зарегистрировать в поисковых системах, чтобы он попал в индекс.Лидер поисковых машин Интернета, Google занимает более 60 % мирового рынка, а значит, шесть из десяти находящихся в сети людей обращаются к его странице в поисках информации в Интернете. Была разработана в 1998 выпускниками Стэндфордского университета Сергеем Брином и Лари Пейджем, которые применили для ранжирования документов технологию PAGERANK, где одним из ключевых моментов является определение "авторитетности" конкретного документа на основе информации о документах, ссылающихся на него. Количественное значение авторитетности документа (другими словами, взвешенное количество ссылок или PAGERANK) относится к так называемым статическим факторам (то есть независящим от конкретного запроса) и учитывается при определении релевантности документа конкретному запросу как весовой коэффициент. Наряду с этим Google применил для определения релевантности документа не только текст самого документа, но и текст ссылок на него. Как только вы вводите запрос, алгоритм Google начинает искать нужную информацию. u Прежде чем будут получены результаты, запрос проходит расстояние в 2400 километров со скоростью, близкой к скорости света - миллиард километров в час, - посещая на своем пути различные центры обработки данных по всему миру. u Пока вы вводите запрос и еще не нажали клавишу Enter, Google уже показывает подсказки и подходящие результаты поиска, позволяя найти нужный ответ как можно быстрее.На страницу результатов поиска мгновенно помещаются наиболее релевантные материалы. Например, введя в строку поиска выражение "~лучшие игры - лучшие", копирайтер получит множество ссылок на страницы, которые содержат синонимы на слово "лучшие". Поисковая система Google также предоставляет возможность воспользоваться помощью оператора, если человек не определился с конкретным ключевым словом . Если, к примеру, ввести "купить телефон | смартфон, то пользователь в результате получит страницы, которые содержат либо "купить телефон", либо "купить смартфон".
План
Содержание
Введение
1. Понятие поисковых систем и поисковых машин
2. Краткая история развития поисковых систем
3. Общие принципы работы поисковых машин
4. Рейтинг мировых поисковых систем
5. Поисковая машина Google
6. Поисковая машина Yandex
7. Сравнительный анализ поисковых машин Google и Yandex
Заключение
Список использованной литературы поисковый система google yandex
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы