Контрольная: Поисковые системы Яндекс - текст контрольной. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Контрольная

Поисковые системы Яндекс

Банк рефератов / Информатика, информационные технологии

Рубрики  Рубрики реферат банка

закрыть
Категория: Контрольная работа
Язык контрольной: Русский
Дата добавления:   
 
Скачать
Архив Zip, 146 kb, скачать бесплатно
Заказать
Узнать стоимость написания уникальной работы

Узнайте стоимость написания уникальной работы

26 Содержание Поисковые системы: состав, функции, принцип работы ………………….2 · Понятие и функции поисковой системы………………………………….3 · Краткая история развития пои сковых систем……………………………5 · Состав и принципы работы пои сковой системы…………………………7 · Мо дуль индексирования …………………………………………………...7 · База данных ………… ………………………………………………………8 · Поисковый сервер ………………………………………………………….8 Что умеет Яndex………………………………………………………………...11 Резул ьтаты поиска ……………………………………………………………..13 · Поисковая форма……………………………………………………….…13 · Найденный документ………………… …………………………………..18 · Эпилог результатов поиска… …………………………………...……….20 Вывод ы …………………………………….…………………………….………22 Заключение ………………………………………………………………...……24 Список литературы ……………………………………………………… …….25 Поисковые системы: состав, фу нкции, принцип работы. Поисковые системы уже давно стали неотъемлемой частью российского Интернета. Поисковые системы сейчас – это огромные и сложн ые механизмы, представляющие собой не только инструмент поиска информа ции, но и заманчивые сферы для бизнеса. Большинство пользователей поисковых систем никогда не з адумывались (либо задумывались, но не нашли ответа) о принципе работы пои сковых систем, о схеме обработки запросов пользователей, о том, из чего эт и системы состоят и как функционируют… Данный мастер-класс призван дат ь ответы на эти вопросы. Однако, Вы не найдете здесь факторов, влияющих на ранжирование документов в поисковых системах. Об этом – отдельный мастер-класс . И тем более не стоит рассчитывать на подроб ное объяснение алгоритма работы Яндекса. Его, по словам Ильи Сегаловича, - директора по технологиям и разработке поисковой машины «Яндекс», можно узнать, лишь «под пыткой» самого Ильи Сегаловича… Понятие и функции поисковой системы П оисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользо вателя, задаваемый в виде текстовой фразы (поискового запроса), выдачей с писка ссылок на источники информации, в порядке релевантности (в соответ ствии запросу). Наиболее крупные международные поисковые системы: «Google» , «Yahoo» , «MSN» . В русском Интернете эт о – «Яндекс» , «Рамблер» , «Апорт» . Рассмотрим подробнее понятие поискового запроса на пр имере поисковой системы «Яндекс». Поисковый запрос должен быть сформул ирован пользователем в соответствии с тем, что он хочет найти, максималь но кратко и просто. Допустим, мы хотим найти информацию в «Яндексе» о том, как выбрать автомобиль. Для этого, открываем главную страницу «Яндекса» , и вводим текст поискового запроса «как выбрать автомобиль». Далее, наша задача сводится к тому, чтобы открыть предоставленные по нашему запросу ссылки на источники информации в Интернет. Однако, вполне можно и не найт и нужную нам информацию. Если таковое произошло, то либо нужно перефрази ровать свой запрос, либо в базе поисковой системе действительно нет ника кой актуальной информации по нашему запросу (такое может быть при задани и очень «узких» запросов, как, например «как выбрать автомобиль в Арханг ельске») Первоочередная задача любой по исковой системы – доставлять людям именно ту информацию, которую они ищ ут. А научить пользователей делать «правильные» запросы к системе, т.е. за просы, соответствующие принципам работы поисковых систем, невозможно. П оэтому разработчики создают такие алгоритмы и принципы работы поисков ых систем, которые бы позволяли находить пользователям искомую ими инфо рмацию. Э то означает, поисковая система должна «думать» так же, как думает пользо ватель при поиске информации. Когда пользователь обращается с запросом к поисковой машине, он хочет найти то, что ему нужно, максимально быстро и просто. Получая результат, он оценивает работу системы, руководствуясь н есколькими основными параметрами. Нашел ли он то, что искал? Если не нашел , то сколько раз ему пришлось перефразировать запрос, чтобы найти искомо е? Насколько актуальную информацию он смог найти? Насколько быстро обраб атывала запрос поисковая машина? Насколько удобно были представлены ре зультаты поиска? Был ли искомый результат первым или же сотым? Как много н енужного мусора было найдено наравне с полезной информацией? Найдется л и нужная информация, при обращении к поисковой системе, скажем, через нед елю, или через месяц? Для того, чтобы удовлетворить ответами все эти вопросы, разработчики по исковых машин постоянно совершенствуют алгоритмы и принципы поиска, до бавляют новые функции и возможности, всячески пытаются ускорить работу системы. Основные характеристики поисковой системы Опишем основные характеристики поисковых систем: · Полнота Полнота - одна из основных характеристик поисковой системы, предст авляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запро су. К примеру, если в Интернете имеется 100 страниц, содержащих словосочета ние «как выбрать автомобиль», а по соответствующему запросу было найден о всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, т ем меньше вероятность того, что пользователь не найдет нужный ему докуме нт, при условии, что он вообще существует в Интернете. · Точность Точность - еще одна основная характеристика поисковой машины, кото рая определяется степенью соответствия найденных документов запросу п ользователя. Например, если по запросу «как выбрать автомобиль» находит ся 100 документов, в 50 из них содержится словосочетание «как выбрать автомо биль», а в остальных просто наличествуют эти слова («как правильно выбра ть магнитолу и установить в автомобиль»), то точность поиска считается р авной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему д окументы, тем меньше различного рода «мусора» среди них будет встречать ся, тем реже найденные документы не будут соответствовать запросу. · Актуальность Актуальность - не менее важная составляющая поиска, которая характ еризуется временем, проходящим с момента публикации документов в сети И нтернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запр осами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексирова ны и доступны для поиска, благодаря существованию у крупных поисковых си стем так называемой «быстрой базы», которая обновляется несколько раз в день. · Скорость поиска Скорость поиска тесно связана с его устойчивостью к нагрузкам. Нап ример, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в ра бочие часы к поисковой машине Рамблер приходит около 60 запросов в секунд у. Такая загруженность требует сокращения времени обработки отдельног о запроса. Здесь интересы пользователя и поисковой системы совпадают: по сетитель желает получить результаты как можно быстрее, а поисковая маши на должна отрабатывать запрос максимально оперативно, чтобы не тормози ть вычисление следующих запросов. · Наглядность Наглядность представления результатов является важным компонентом уд обного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат тольк о нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различны е элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.одробные пояснения по странице результатов поиск а, например у «Яндекса» можно посмотреть по ссылке http://help.yandex.ru/search/?id=481937 . Краткая история развития поисковых систем В начальный период развития Интернет, число его пользователей было неве лико, а объем доступной информации сравнительно небольшим. В большинств е своем, доступ к сети Интернет имели лишь сотрудники научно-исследовате льской сферы. В это время задача поиска информации в Интернете не была ст оль актуальной, как в настоящее время. Одним из первых способов органи зации доступа к информационным ресурсам сети стало создание открытых к аталогов сайтов, ссылки на ресурсы в которых группировались согласно те матике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. Пос ле того, как количество сайтов в каталоге Yahoo значительно увеличилось, был а добавлена возможность поиска нужной информации по каталогу. В полном с мысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Инте рнет ресурсами. Каталоги ссылок широко использовались ранее, однако прак тически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информац ию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тог да как база поисковой системы Google состоит из более чем 8 миллиардов докумен тов. Первой полноценной поисковой системой стал проект WebCrawler, вы шедший в свет в 1994 году. В 1995 году появились поисковые системы Lycos и AltaVista. Последняя дол гие годы была лидером в области поиска информации в сети Интернет. В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машин у Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире! В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете. В настоящее время существуют три основные международные поисковые системы – Google, Yahoo и MSN, имеющих собственные базы и алгоритмы поиск а. Большинство остальных поисковых систем (коих насчитывается большое к оличество) использует в том или ином виде результаты трех перечисленных . Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo. В России основной поисковой сис темой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru ис пользует механизм и базу поиска «Яндекса». Состав и принципы работы поисковой системы Практически все крупные поисковые системы имеют свою собственную стру ктуру, отличную от других. Однако можно выделить общие для всех поисковы х машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов. М одуль индексирования Модуль индексирования состоит из трех вспомогательных программ (робот ов): Spider (паук) – программа, предназнач енная для скачивания веб-страниц. «Паук» обеспечивает скачивание стран ицы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Р аботает «паук» следующим образом. Робот на сервер передает запрос “get/path/document ” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ. Ссылки извлекаются из тэгов a, area, base, frame, frameset, и др. Наряду со ссылк ами, многими роботами обрабатываются редиректы (перенаправления). Кажда я скачанная страница сохраняется в следующем формате: · URL страницы · дата, когда страница была скачан а · http-заголовок ответа сервера · тело страницы (html-код) Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствую щие на странице. Его задача - определить, куда дальше должен идти паук, осн овываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, с ледуя по найденным ссылкам, осуществляет поиск новых документов, еще неи звестных поисковой системе. Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбир ает страницу на составные части и анализирует их, применяя собственные л ексические и морфологические алгоритмы. Анализу подвергаются различны е элементы страницы, такие как текст, заголовки, ссылки структурные и сти левые особенности, специальные служебные html-теги и т.д. Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся стран ицы, извлекать ссылки на новые страницы из получаемых документов и произ водить полный анализ этих документов. Б аза данных База данных, или индекс поисковой системы - это система хранения данных, и нформационный массив, в котором хранятся специальным образом преобраз ованные параметры всех скачанных и обработанных модулем индексировани я документов. П оисковый сервер Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависи т качество и скорость поиска. Поисковый сервер работает след ующим образом: · Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информаци онное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запро су текстовой информации на странице выдачи результатов поиска). · Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происхо дит обработка данных по всем документам, в результате чего, для каждого д окумента рассчитывается собственный рейтинг, характеризующий релеван тность запроса, введенного пользователем, и различных составляющих это го документа, хранящихся в индексе поисковой системы. · В зависимости от выбора пользов ателя этот рейтинг может быть скорректирован дополнительными условиям и (например, так называемый «расширенный поиск»). · Далее генерируется сниппет, то е сть, для каждого найденного документа из таблицы документов извлекаютс я заголовок, краткая аннотация, наиболее соответствующая запросу и ссыл ка на сам документ, причем найденные слова подсвечиваются. · Полученные результаты поиска пе редаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых рез ультатов. Как видно, все эти компоненты тесно связаны друг с другом и работают во вз аимодействии, образовывая четкий, достаточно сложный механизм работы п оисковой системы, требующий огромных затрат ресурсов. Запрос поступает в поисковую си стему через маршрутизатор Cisco 6000 series. Cisco передает его наименее загруженной ма шине первого уровня - frontend (1.1 - 1.3, на рис. машине 1.3). Frontend, в свою очередь, отправляет з апрос дальше, на один из восьми proxy-серверов, также выбирая наиболее свобод ный сервер (2.1 - 2.8, на рис. машине 2.2). Одновременно frontend отправляет запрос на маши ны, осуществляющие поиск по товарам (3.1 - 3.2, на рис. машине 3.1) и по базе Тор 100 (4.1 - 4.2, н а рис. машине 4.1). На proxy проводится поиск по ссылочному индексу, и его результ аты вместе с поисковым запросом передаются на машины, которые содержат о сновную индексную базу, - backends (5.1.х - 5.7.х, на рис. машинам 5.1.2, 5.2.11, 5.3.1 и т.д.) Та же информа ция отправляется на машины с "быстрой базой" (6.1 - 6.2). На текущий момент в поиск включено 77 backend'ов. Они сгруппирова ны по 11 машин, и каждая группа содержит копию одной из частей поискового и ндекса. Таким образом, информация о сайтах, условно входящих в красный се ктор Интернета, находится на backend'ах первой группы (5.1.1 - 5.1.11 на рис), оранжевый се ктор - на backend'ах второй группы (5.2.1 - 5.2.11) и т.д. Proxy-сервер выбирает наименее загруже нный backend в каждой группе машин и отправляет на него поисковый запрос с рез ультатами ссылочного поиска. На backend'ах осуществляется поиск по частям инд ексной базы и ранжирование с учетом результатов поиска по ссылочному ин дексу. При ранжировании для всех найденных документов высчитываются ве са по конкретному запросу. После того, как запрос обработан на backend'ах, информация о резу льтатах и ранжировании отдается обратно на proxy-сервер. Туда же поступают о тсортированные результаты с машин "быстрой базы". Proxy интегрирует данные, п олученные с восьми машин: клеит дубли, объединяет зеркала сайтов, перера нжирует документы в общий список по весам, рассчитанным на backend'ах. Так, перв ым в списке найденного может быть документ с машины 5.3.1, вторым и третьим - с 6.1, четвертым - с 5.5.2 и т.д. На proxy-сервере также реализуется построение цитат к д окументам и подсветка слов запроса в тексте. Полученные результаты отда ются на frontend. Помимо информации с proxy-сервера, frontend получает результаты из п оиска по товарам и из базы Тор 100, отсортированные, с цитатами и подсветкой слов запроса. Frontend осуществляет окончательное объединение результатов, г енерирует html со списком найденного, вставляет баннеры и перевязки (ссылки на различные разделы Рамблера) и отдает html Cisco, который маршрутизирует инфо рмацию пользователю. При написании мастер-класса был и использованы материалы и данные ООО «Рамблер Интернет Холдинг» , RuSeo.info Что умеет Яndex. П рограммные продукты серии Яndex ( Я зыковый i ndex ) - набор ср едств полнотекстовой индексации и поиска в текстовых данных с учетом мо рфологии русского языка. Яndex включает моду ли морфологического анализа и синтеза, индексации и поиска, а также набо р вспомогательных модулей, таких, как анализатор документов, языки разме тки, конверторы форматов, сетевой "паук". Алгоритмы морфологического а нализа и синтеза, основанные на базовом словаре, умеют нормализовать сло ва, то есть находить их начальную форму, а также строить гипотезы для слов , не содержащихся в базовом словаре. Система полнотекстового индексиров ания позволяет создавать компактный индекс и быстро осуществлять поис к с учетом логических операторов. Яndex предназначен для работы с текстами как в локальной так и в глобальной сети (технологии Intranet и Internet) , а также может быть подключен как модуль к другим системам. 1. Индексация Создаваемый индекс составляет около 1/3 объема текста (бе з картинок, tag'ов и пр.), при этом записывается подробный адрес слова - с точно стью до позиции в тексте, что потом позволяет искать с учетом близости. В б азу входят нормализованные формы слов текста, сами документы не хранятс я. Морфологический анализ слов те кста происходит одновременно с индексацией, что дает возможность сняти я омонимии. Скорость индексации - не менее 2 Мб/минуту. Написан свой роб от для обхода Web'а. Организация изменения индекса (полное либо частичное обн овление, слияние). Идет индексирование по всем словам, стоп-слова определяю тся статистически. 2. Поиск Язык запросов: ск обки; логическое И (в пределах одного абзаца); логическое ИЛИ; оператор И Н Е (в пределах одного абзаца); близость - расстояние в словах. Список выданных документов упорядочивается по релевант ности - по количеству найденных слов. В каждом документе выделяются (подс вечиваются) найденные слова. 3. Работа с языком Для интеллектуализации поиск а используется словарь на 90 тыс. слов. При индексации происходит нормализ ация, то есть слово ставится в свою исходную форму (для существительных - и менительный падеж единственного числа, для глаголов - неопределенная фо рма и т.д.) и в таком виде учитывается в базе. Алгоритм морфологического ра збора умеет корректно обрабатывать и слова, не найденные в словаре. Морф ология работает для русского и английского языка. Также индексируются ч исла. Результаты поиска. На странице результатов поиска Яндекса есть тексты, поя сняющие результаты поиска, и ссылки, дающие возможность сортировать най денное или уточнять запрос. Ниже приведен общий вид страницы результато в. Поисковая форма Искать в найденном Ес ли в результате запроса Яндекс нашел много документов, но по более широк ой теме, чем вам хочется, вы можете сократить этот список, уточнив запрос. Еще один вариант — включить флажок в найденном в форме поиска, задать дополнительные ключевые слова, и следующий поиск будет вестись только по тем документам, которые были отобраны в пр едыдущем поиске. Например, чтобы найти страницы про кондиционеры — сре дства, предназначенные для ухода за волосами (а не климатическую технику ), можно задать запрос кондиционеры , для опр еделения области поиска. А затем, поставив галочку в найд енном , — слово «волосы». Область поиска П од формой поиска могут появляться несколько дополнительных блоков. Адрес сайта. Яндекс позволяет искать информацию только по интересующ ему вас сайту, задав соответствующие параметры в расширенном поиске , с помощью Яндекс.Бара или нажав на ссылку «Еще с сайта» . Тогда рядом с поисковой формой появляется напомин ание, что результаты получены поиском по одному сайту. Если вы хотите про должить поиск по всем сайтам, достаточно перед очередным запросом снять флажок ... . Выбор региона. Поиск можно ограничить сайтами в нужном вам регионе или относящимися к интересной вам теме. Для поиска по всем сайтам снимите флажок в регионе . Выбор диапазона дат. Задав временной интервал , к которому должны относиться искомые докум енты, вы можете затем его исправить в результатах поиска, введя новые чис ла в формате «День-Месяц-Год». Ссылки над поисковой фор мой На д формой поиска видны две ссылки. Ссылка «Помощь» ведет на описание возможностей поиска . По ссылке «Настройка поиска», вы сможете изменить вид страницы с результатами поиска по своему вкусу, включить семейный поиск и отключить показ графическо й рекламы . Ссылка справа от формы поиск а ведет на расширенный поиск , позволяющий даже неопытному пользователю задавать слож ные поисковые запросы. Параллельные поиски Ян декс умеет искать не только сайты, но и новости, товары, картинки и т.д. Когд а вы задаете запрос, поиск ведется одновременно по всем «параллельным» базам , и если что-либо найдено, Яндекс покажет инфо рмацию среди результатов поиска. В правой колонке — товары и картинки , внизу или вв ерху страницы — новости , словари , карты , афиша , погода . И все это — од ним запросом! Пролог результатов поиска В верху списка найденных документов выдается статистика слов запроса и н айденных документов. Статистика запросов С татистика запросов показывает, сколько раз в течение предыдущего месяц а в запросах пользователей содержалось то или иное слово. Пример: Запросов за месяц: красота — 114 851, спас ет — 5 990, мир — 457 079. Статистика найденных страниц Ст атистика результатов поиска позволяет узнать количество найденных по запросу страниц и число сайтов, на которых они располагаются. Эти показа тели примерные и могут меняться . Пример: Результат поиска: страниц — 140, сайтов — не менее 96 Статистика слов Ст атистика слов в базе Яндекса показывается, только если вы указали это в настройках . Она говорит о том, сколько раз встретилось к аждое из слов запроса на всех страницах, известных Яндексу. Этот показат ель примерный и может меняться . Пример: Статистика слов: шерше — 277 256, ля — 7 154 215, фам — 683 279 Область поиска Ес ли в поиске по запросу участвовали не все проиндексированные страницы, в области поиска показываются эти ограничения. В их число входят ограниче ние по региону, сайту, языку, формату документа, страницы, похожие на задан ную, включенный семейный фильтр. Рубрики Каталога и Маркета Ко гда запросу соответствуют рубрики каталога или Яндекс.Маркета , перед результатами поиска выводятся ссылки на соответствующие рубрики. Тако е совпадение характерно для запросов, охватывающих широкую тему (таких к ак кондиционеры , открытки ), и каталог сайтов или товаров — хорошее место, чтобы найт и сайт с информацией или сделать покупку. Ответы «параллельных» поисков М ногие службы Яндекса «понимают», когда они могут дать хороший ответ на з апрос, и показывают соответствующую информацию в прологе результатов п оиска. Яндекс.Карты: Яндекс.Афиша: Яндекс.Погода: Яндекс.Словари: «Колдунщик» К огда поиск принес мало документов, Яндекс анализирует запрос и предлага ет способ, которым можно улучшить результаты. Мы называем этот модуль «к олдунщиком». Опечатки в запросе? Если Яндекс подозревает, что в запросе есть опечатка, он может предложить возможный вариант написания слов. Пример: На запрос муму подари лиошейник будет предложено: опечатка? возможно, имелось в виду: му ж у подарил и о шейник Ничего не найдено? Как правило, небольшое число документов выдает поиск цитаты , который очень требователен к тексту страни цы, поэтому, задав запрос "люблю грозу в конце апреля" , вы увидите сообщение: · ничего не найдено? попробуйте поискать без кавычек. Ссылка на фразе б ез кавычек ведет на результаты поиска по тому же запросу, н о уже без кавычек: люблю грозу в конце апреля . Когда запрос отдается на усмотрение Яндекса, он ищет сло ва запроса на таком расстоянии друг от друга, чтобы максимально повысить качество результатов поиска. Иногда это приводит к малому количеству на йденных страниц. Ссылка «с более мягкими условиями» ведет на результаты запроса, по которому отобраны страницы с заданными вами словами, независ имо от того, насколько близко они к друг другу расположены. · ничего не найдено? чтобы искать точнее, Яндекс ограничив ается документами, в которых слова из запроса близки друг к другу — поищ ите с более мягкими условиями В форме расширенного поиска вы м ожете задать, насколько близко друг к другу должны быть слова запроса в иск омом документе. Если с такими параметрами будет найдено мало страниц, Ян декс предложит соответствующий вариант изменения запроса: · ничего не найдено? Вы выбрали режим искать слова запроса подряд . Поищите с более мягкими условиями · ничего не найдено? В ы выбрали режим искать слова запроса в одном предложении . Поищите с более мягкими условиями · ничего не найдено? В ы выбрали режим искать слова запроса не очень далеко . Поищите с более мягкими условиями. Найденный документ Заголовок документа За головок документа отражает название документа, данное ему автором стра ницы. При нажатии на него откроется сам документ (в зависимости от настро ек, в новом или том же окне . Если вместо заголовка показывается адрес с траницы, значит, ее заголовок (title) не задан. Найденные слова Сс ылка «Найденные слова» открывает окно, в котором в тексте найденного док умента цветом фона подсвечены слова запроса. Красные стрелки рядом с каж дым словом позволяют передвигаться вперед-назад по списку найденных сл ов. Ссылки «первое слово» и «последнее слово» дают возможность найти пер вое и последнее вхождение слов запроса в текст документа. Ссылка «Посмот реть сохраненную копию» показывает текст документа (без форматировани я) в том виде, в каком он был в момент индексации. Даже если оригинал докуме нта не открывается, или был изменен, вы всегда можете увидеть его копию. Сс ылка «Найти похожие документы» аналогична ссылке Похожие документы в результатах поиска. Фрагмент текста Ан нотация документа составляется на основе его текста, из которого извлек аются предложения или их части, содержащие слова запроса. Если Яндекс сч итает такое описание недостаточно информативным, оно может быть дополн ено описанием страницы, которое составил ее владелец (тег meta description), или замен ено на описание сайта из каталога . Когда сайт найден по ссылкам , в качестве описания приводятся тексты ссылок. Пример: По запросу поисковая система главная страница Яндекса в результатах имеет описание: текст ссылок: Яндекс поисковая система по русскому интернету... поисковая система Yandex поисковый сервер дл я русского интернета... Это значит, что на странице yandex.ru нет фразы по исковая система , но на эту страницу так часто ссылаются. Статус документа П од описанием документа выдается информация о нем: · адрес страницы сайта, наиболее соответствующей запросу; · размер страницы; · дата последнего изменения стран ицы, если сервер ее выдает; · мера соответствия страницы запр осу. Возможны три варианта: o отсутствие статуса означает, что все слова запроса есть в тексте страницы; o «нестрогое соответствие» появля ется, когда Яндекс считает страницу недостаточно подходящей для ответа на запрос, но так как общее число найденных документов невелико, он предл агает рассмотреть и такой вариант; o «найден по ссылке» г оворит, что страница обнаружена по ссылкам и будет интересна вам, несмотря на то, чт о она не содержит слов запроса. Каждый из элементов описания может быть спрятан . Тема сайта Ес ли найденная страница расположена на сайте, зарегистрированном в каталоге Яндекса , то п од описанием документа отображается рубрика каталога, которой он прина длежит. Перейдя по этой ссылке, вы попадете в соответствующий раздел кат алога. Похожие документы Сс ылка «Похожие документы» позволяет найти страницы, которые похожи на вы бранную вами и могут отвечать на запрос столь же хорошо. Если страница-об разец уже удалена с сайта, Яндекс выдаст сообщение: «Запрошенный(е) докум ент(ы) не найден(ы)». По умолчанию ссылка не показывается, включить ее отоб ражением можно в настройках поиска . Вы также можете искать похожие документы в форме расширенного поиска. Еще с сайта. Сс ылка «Еще с сайта» позволяет увидеть все документы с выбранного сайта, с оответствующие запросу. Вы также можете задать ограничения по сайту в форме расширенного поиска. Эпилог результатов пои ска Другие ст раницы с результатами поиска Если вам недостаточно первых десяти ссылок ( или более ) на первой странице результатов, вы можете просмотреть др угие страницы. Ссылки «предыдущая» и «следующая» — переход на страницу , предшествующую или следующую за текущей. Ряд чисел, оформленных в виде с сылок, позволяет перейти сразу на нужную страницу результатов поиска. Мн оготочие в конце списка страниц - переход на страницу, следующую за переч исленными в списке. Сортировка результатов В ы можете отсортировать найденные страницы одним из двух способов: · по степени их соответствия запросу (релевантности); · по дате последнего изменения до кумента. По умолчанию сортировка идет п о релевантности, а сортировка по дате нужна, как правило, только когда вы и щете максимально свежие документы. Регионы найденных сайтов К аждый раз, получая ваш запрос, Яндекс определяет, к каким регионам относя тся найденные сайты. Нажав на одну из ссылок с названием нужного региона, вы отберете только те сайты, которые к нему относятся. Темы найденных сайтов Ян декс показывает темы (названия рубрик каталога ), к которым о тносится большая часть сайтов, найденных по запросу. Жирным шрифтом выде лены рубрики верхнего уровня, в скобках приведены подрубрики. Нажав на о дну из ссылок, вы отберете только те сайты, которые относятся к заданной т еме. Пример: Вы хотите найти информацию об эфирных и косметических ма слах (а не моторных маслах). Задав запрос масло , выберите дальше рубрику «Народная и нетрадиционная медицина». Как выбор темы сайтов, так и выбор региона заметно сужают область поиска, поэтому их эффективно применять дл я запросов, которые принесли слишком много результатов. Другие поисковые системы Е сли ответ Яндекса на ваш запрос оказался недостаточно точным, попробуйт е сформулировать запрос иначе, либо задайте его другим поисковым систем ам. Достаточно нажать на ссылку с именем поисковика, и в новом окне открою тся его результаты поиска. Выводы. Теперь подытожим все вышесказанное. · Первоочередная задача любо й поисковой системы – доставлять людям именно ту информацию, которую он и ищут. · Основные характеристики поиско вых систем: 1. Полнота 2. Точность 3. Актуальность 4. Скорость поиска 5. Наглядность · Первой полноценной поисковой системой стал проект WebCrawler, в ышедший в свет в 1994 году. · В состав поисковой системы вход ят компоненты: 1. Модуль индексирования 2. База данных 3. Поисковый сервер Надеемся, наш мастер-класс позволит Вам поближе ознакомиться с понятием поисковых систем, лучше узнать основные функции, характеристики и принц ип работы поисковиков. информация отправляется на маш ины с "быстрой базой" (6.1 - 6.2). На текущий момент в поиск включено 77 backend'ов. Они сгруппирова ны по 11 машин, и каждая группа содержит копию одной из частей поискового и ндекса. Таким образом, информация о сайтах, условно входящих в красный се ктор Интернета, находится на backend'ах первой группы (5.1.1 - 5.1.11 на рис), оранжевый се ктор - на backend'ах второй группы (5.2.1 - 5.2.11) и т.д. Proxy-сервер выбирает наименее загруже нный backend в каждой группе машин и отправляет на него поисковый запрос с рез ультатами ссылочного поиска. На backend'ах осуществляется поиск по частям инд ексной базы и ранжирование с учетом результатов поиска по ссылочному ин дексу. При ранжировании для всех найденных документов высчитываются ве са по конкретному запросу. После того, как запрос обработан на backend'ах, информация о резу льтатах и ранжировании отдается обратно на proxy-сервер. Туда же поступают о тсортированные результаты с машин "быстрой базы". Proxy интегрирует данные, п олученные с восьми машин: клеит дубли, объединяет зеркала сайтов, перера нжирует документы в общий список по весам, рассчитанным на backend'ах. Так, перв ым в списке найденного может быть документ с машины 5.3.1, вторым и третьим - с 6.1, четвертым - с 5.5.2 и т.д. На proxy-сервере также реализуется построение цитат к д окументам и подсветка слов запроса в тексте. Полученные результаты отда ются на frontend. Помимо информации с proxy-сервера, frontend получает результаты из п оиска по товарам и из базы Тор 100, отсортированные, с цитатами и подсветкой слов запроса. Frontend осуществляет окончательное объединение результатов, г енерирует html со списком найденного, вставляет баннеры и перевязки (ссылки на различные разделы Рамблера) и отдает html Cisco, который маршрутизирует инфо рмацию пользователю. При написании мастер-класса был и использованы материалы и данные ООО «Рамблер Интернет Холдинг» , RuSeo.info Заключение. Теперь подытожим все вышесказанное. · Первоочередная задача любо й поисковой системы – доставлять людям именно ту информацию, которую он и ищут. · Основные характеристики поиско вых систем: 1. Полнота 2. Точность 3. Актуальность 4. Скорость поиска 5. Наглядность · Первой полноценной поисковой системой стал проект WebCrawler, в ышедший в свет в 1994 году. · В состав поисковой системы вход ят компоненты: 1. Модуль индексирования 2. База данных 3. Поисковый сервер Надеемся, наш мастер-класс позв олит Вам поближе ознакомиться с понятием поисковых систем, лучше узнать основные функции, характеристики и принцип работы поисковиков. Список литературы: 1. Е. Колмановская, CompTek International, Яndex: система русского поиска Internet/Intranet. 2. Аброс имов А.Г., Абрамов Н.В., Мотовилов Н.В., Корпоративные экономические информа ционные системы, уч. пос. СГЭА, 2005. 3. Информационно-поисковые системы. – http://www.comptek.ru/yandex/yand_about.html. 4. Аликберов А. Поисковые машины. – http :// citforum . ru / win / internet / search / index . shtml . 5. Талантов М. Поиск информации в И нтернете: подводные камни // КомпьютерПресс.– № 9, 1999. 6. Троян Г.М. Поиск в русскоязычной ча сти Интернет: поисковая система Rambler // Радиолюбитель. Ваш компьютер. – № 8-10, 1999. 7. Троян Г.М. Поиск в русскоязычной ча сти Интернет: поисковая система Yandex // Радиолюбитель. Ваш компьютер. – № 1-3, 2000. 8. Современный самоучитель работы в сети Интернет. Самые популярные программы: Практ. пособ. – Под ред. Комяг ина В.Б. – М.: Издательство «Триумф», 1999. – 368 с.
1Архитектура и строительство
2Астрономия, авиация, космонавтика
 
3Безопасность жизнедеятельности
4Биология
 
5Военная кафедра, гражданская оборона
 
6География, экономическая география
7Геология и геодезия
8Государственное регулирование и налоги
 
9Естествознание
 
10Журналистика
 
11Законодательство и право
12Адвокатура
13Административное право
14Арбитражное процессуальное право
15Банковское право
16Государство и право
17Гражданское право и процесс
18Жилищное право
19Законодательство зарубежных стран
20Земельное право
21Конституционное право
22Конституционное право зарубежных стран
23Международное право
24Муниципальное право
25Налоговое право
26Римское право
27Семейное право
28Таможенное право
29Трудовое право
30Уголовное право и процесс
31Финансовое право
32Хозяйственное право
33Экологическое право
34Юриспруденция
 
35Иностранные языки
36Информатика, информационные технологии
37Базы данных
38Компьютерные сети
39Программирование
40Искусство и культура
41Краеведение
42Культурология
43Музыка
44История
45Биографии
46Историческая личность
47Литература
 
48Маркетинг и реклама
49Математика
50Медицина и здоровье
51Менеджмент
52Антикризисное управление
53Делопроизводство и документооборот
54Логистика
 
55Педагогика
56Политология
57Правоохранительные органы
58Криминалистика и криминология
59Прочее
60Психология
61Юридическая психология
 
62Радиоэлектроника
63Религия
 
64Сельское хозяйство и землепользование
65Социология
66Страхование
 
67Технологии
68Материаловедение
69Машиностроение
70Металлургия
71Транспорт
72Туризм
 
73Физика
74Физкультура и спорт
75Философия
 
76Химия
 
77Экология, охрана природы
78Экономика и финансы
79Анализ хозяйственной деятельности
80Банковское дело и кредитование
81Биржевое дело
82Бухгалтерский учет и аудит
83История экономических учений
84Международные отношения
85Предпринимательство, бизнес, микроэкономика
86Финансы
87Ценные бумаги и фондовый рынок
88Экономика предприятия
89Экономико-математическое моделирование
90Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
Все невыспавшиеся люди в следующей жизни обязательно превратятся в котов.
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, контрольная по информатике и информационным технологиям "Поисковые системы Яндекс", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2016
Рейтинг@Mail.ru