Реферат: Поиск информации в Интернете - текст реферата. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Реферат

Поиск информации в Интернете

Банк рефератов / Информатика, информационные технологии

Рубрики  Рубрики реферат банка

закрыть
Категория: Реферат
Язык реферата: Русский
Дата добавления:   
 
Скачать
Архив Zip, 22 kb, скачать бесплатно
Заказать
Узнать стоимость написания уникального реферата

Узнайте стоимость написания уникальной работы

Содержание Со держание 1 Вв едение 1 Ин формационные ресурсы сети Интернет 2 Типология методов поиска 4 Технология поиска с использованием поисков ых машин 6 Вл адение пользовательскими инструментами и техникой 10 За ключение 11 Сп исок литературы 13 Введение Основная задача Интернет – пр едоставление необходимой информации. Интернет – это информационное п ространство, в котором можно отыскать ответ практически на любой интере сующий пользователя вопрос. Это огромная глобальная сеть, в которую как информационные ручейки стекаются потоки более мелких сетей. Любой поль зователь, располагающий ПК и соответствующими программами, сможет подк лючиться к сети, используя её возможности для самых разных целей – пров едения досуга, обучения, чтения научных работ, отправки электронной почт ы и т.д. По различным данным, в 2004 г. количество пользователей глобальной си стемы Интернет составило от 600 до 900 миллионов человек. Это число продолжае т стремительно расти и уже в 2006 г. оно достигло миллиарда человек. Сегодня г лобальная сеть превращается в важный социальный и политический фактор современного информационного общества. С развитием Интернет-технологи й появился новый гигантский источник информационных ресурсов, доступ к которым является не только относительно дешевым, но и очень быстрым. Информационные ресурсы сети Интернет Благодаря повсеместному раз витию и применению компьютерных технологий в настоящее время в той или и ной электронной форме находится информация всех областей человеческой деятельности: наука, производство, коммерция, литература, развлечения и т.д. Сеть Интернет имеет совместимость с различными электронными сетями и базами данных и позволяет получить удобный доступ практически к любом у виду информации. Для миллионов людей разных профессий Интернет стал не обходимым инструментом в работе и универсальным средством развлечения в часы досуга. В связи с этим возникает потребность в программных средст вах, эффективно решающих проблемы поиска необходимой пользователю сет и Интернет информации. Информационные ресурсы, доступные ч ерез Интернет, огромны. Это десятки миллионов документов, представленны х различными способами, число которых постоянно увеличивается. В зависи мости от способа представления, вида и характера информации разнятся и м етоды доступа к ней, поэтому, прежде чем рассматривать методы поиска, рас смотрим классификацию информационных ресурсов. По принципу организации и использования средства поиска можно разделить на каталоги (справочники, директории) и поисковые машин ы. Каталоги Каталоги являются справочни ками, содержащими списки адресов Интернет, сгруппированные по определе нным признакам. Как правило, они объединяются по тематике (наука, искусст во, новости и т.д.), где каждая тема разветвляется на несколько подуровней. Особенность этих средств поиска инф ормации состоит в том, что создание структуры, базы данных и их постоянно е обновление осуществляется "вручную", коллективом редакторов и програм мистов, и сам процесс поиска требует непосредственного участия пользов ателя, самостоятельно переходящего от ссылки к ссылке. Поисковые машины Действие поисковых машин зак лючается в постоянном последовательном исследовании всех узлов Интерн ет, доступных данной системе поиска, со всеми их связями и ответвлениями. В связи с постоянным обновлением информации машина поиска регулярно во звращается через определенный срок (порядка месяца) к уже изученным узла м, чтобы обнаружить и зарегистрировать изменения. Вся прочитанная инфор мация индексируется, то есть создается специализированная база данных, в которой закодированы все исследованные системой страницы Интернет. При поступлении запроса от пользова теля машина поиска рассматривает всю индексированную информацию и выд ает список документов, соответствующих задаче поиска. Найденные докуме нты ранжируются в зависимости от местоположения ключевых слов (в заголо вке, в начале текста, в первых параграфах) и частоты их появления в тексте. Несмотря на схожий принцип работы, машины поиска различа ются по языкам запроса, зонам поиска, глубине поиска внутри документа, ме тодам ранжирования и приоритетов, поэтому применение разных поисковых машин дает различные результаты. Типология методов поиска Более или менее серьезный по дход к любой задаче начинается с анализа возможных методов ее решения. П оиск информации в Интернете может быть произведен по нескольким метода м, значительно различающимся как по эффективности и качеству поиска, так и по типу извлекаемой информации. В ряде случаев приходится использоват ь весьма трудоемкие методы - результат того стоит. Можно выделить следующие основные м етоды поиска информации в Интернете, которые, в зависимости от целей и за дач ищущего, используются по отдельности или в комбинации друг с другом: 1. Непосредственный поиск с исп ользованием гипертекстовых ссылок. Поскольку все сайты в пространстве WWW фактически оказыв аются связанными между собой, поиск информации может быть произведен пу тем последовательного просмотра связанных страниц с помощью броузера. Хотя этот полностью ручной метод пои ска выглядит полным анахронизмом в Сети, содержащей более 60 млн. узлов, "ру чной" просмотр Web-страниц часто оказывается единственно возможным на зак лючительных этапах информационного поиска, когда механическое "копани е" уступает место более глубокому анализу. Использование каталогов, клас сифицированных и тематических списков и всевозможных небольших справо чников также относится к этому виду поиска. 2. Использование поисковых маши н. Сегодня этот метод является одним из основных и фактиче ски единственным при проведении предварительного поиска. Результатом последнего может являться список ресурсов Cети, подлежащих детальному р ассмотрению. Как правило, применение поисковых ма шин основано на использовании ключевых слов, которые передаются поиско вым серверам в качестве аргументов поиска: что искать. Если делать все пр авильно, то формирование списка ключевых слов требует предварительной работы по составлению тезауруса. 3. Поиск с применением специаль ных средств. Этот полностью автоматизированный метод может оказаться весьма эффективным для проведения первичного по иска. Одна из технологий этого метода основана на применении специализи рованных программ - спайдеров, которые в автоматическом режиме просматр ивают Web-страницы, отыскивая на них искомую информацию. Фактически это авт оматизированный вариант просмотра с помощью гипертекстовых ссылок, оп исанный выше (поисковые машины для построения своих индексных таблиц ис пользуют похожие методы). Нет нужды говорить, что результаты автоматичес кого поиска обязательно требуют последующей обработки. Применение данного метода це лесообразно, если использование поисковых машин не может дать необходи мых результатов (например, в силу нестандартности запроса, который не мо жет быть адекватно задан существующими средствами поисковых машин). В ря де случаев этот метод может быть очень эффективен. Выбор между использованием спайдер а или поисковых серверов являет собой вариант классического выбора меж ду применением универсальных или специализированных средств. 4. Анализ новых ресурсов. Поиск по новообразованным ресурсам может оказаться не обходимым при проведении повторных циклов поиска, поиска наиболее свеж ей информации или для анализа тенденций развития объекта исследования в динамике. Другой возможной причиной может яви ться то, что большинство поисковых машин обновляет свои индексы со значи тельной задержкой, вызванной гигантскими объемами обрабатываемых данн ых, и эта задержка обычно тем больше, чем менее популярна интересующая те ма. Это соображение может оказаться весьма существенным при проведении поиска в узкоспециальной предметной области. Технология поиска с использованием поисковых машин Определение географических регионов поиска Поскольку проведение информационн ого поиска преследует практические цели - практическая ценность информ ационного ресурса может зависеть от географического расположения соот ветствующего источника. Составление тезауруса Для эффективного использования поисковых серверов необ ходим список ключевых слов, организованный с учетом семантических отно шений между ними, т.е. тезаурус. При составлении тезауруса необходимо пре дусмотреть обработку синонимов, омонимов и морфологических вариаций к лючевых слов. Использование законов Зипфа Число, показывающее сколько раз встречается слово в текс те, называется частотой вхождения слова. Если расположить частоты по мер е убывания и пронумеровать, то порядковый номер частоты называется ранг частоты. Вероятность обнаружения слова в тексте = частота вхождения слов а / число слов в тексте. Зипф нашел, что если умножить вероятность обнаруже ния слова в тексте на ранг частоты, то получившаяся величина приблизител ьно постоянна для всех текстов на одном языке: С = (частота вхождения слов X ра нг частоты) / число слов Это значит, что график зависи мости ранга от частоты - равносторонняя гипербола. Зипф также установил, что зависимост ь количества слов с данной частотой от частоты - также гипербола и постоя нная для всех текстов в пределах одного языка. Что можно извлечь из этих законов? Исследования вышеуказ анных зависимостей для различных текстов показали, что наиболее значим ые слова текста лежат в средней части диаграммы, так как слова с максимал ьной частотой как правило являются предлогами, частицами, местоимениям и, в английском языке - артиклями (так называемые "стоп-слова"), а редко встре чающиеся слова в большинстве случаев не имеют решающего значения. Основ ываясь на этой закономерности, можно предложить следующую методику. Составление списка ключевых слов Для составления оптимального набора ключевых слов испол ьзуют процедуру, основанную на применении законов Зипфа, которая заключ ается в следующем: берут любой текст-источник, близкий к искомой теме, т.е. " образец", и анализируют его, выделяя значимые слова. В качестве текста-ист очника может служить книга, статья, Web-страница, любой другой документ. Ана лиз текста производится таким образом: - Удаление из текста стоп-слов. Вычисление частоты вхождения каждо го слова и составление списка, в котором слова расположены в порядке убы вания их частоты. Выбор диапазона частот, лежащего в середине списка, и отбо р из этого диапазона слов, наиболее полно соответствующих смыслу текста. Составление запроса к поиско вой машине в форме перечисления отобранных таким образом ключевых слов, связанных логическим оператором ИЛИ (OR). Запрос в таком виде позволяет обн аружить тексты, в которых встречается хотя бы одно из перечисленных слов . Число документов, полученных в результате поиска по этому запросу, может быть огромно. Однако, благодаря ранжированию документов (расположению и х в порядке убывания частоты вхождения слов запроса в документ), применя емому в большинстве поисковых машин, на первых страницах списка практич ески все документы окажутся релевантными, причем документ-источник мож ет находиться далеко от начала. Более адекватной представляется ст руктура тезауруса в виде так называемых семантических срезов, где для ка ждого основного термина отдельно строится таблица сопутствующих слов и слов шумовых (которые не должны встречаться в источнике), - некоторые пои сковые машины (AltaVista) позволяют это использовать. Таким образом, вместо един ой иерархической структуры терминов мы получаем пакет таблиц, которые м огут расширяться и модифицироваться отдельно. Отбор поисковых машин Устанавливается последовательность использования пои сковых машин в соответствии с убыванием ожидаемой эффективности поиск а с применением каждой машины. Всего известно около 180 поисковых серверов, различающихся по регионам охвата, принципам проведения поиска (а следовательно, по вхо дному языку и характеру воспринимаемых запросов), объему индексной базы , скорости обновления информации, способности искать "нестандартную" инф ормацию и тому подобное. Основными критериями выбора поисковых серверо в являются объем индексной базы сервера и степень развитости самой поис ковой машины, то есть уровень сложности воспринимаемых ею запросов. Составление и выполнение запросов к поисковым машинам Это наиболее сложный и трудоемкий этап, связанный с обраб откой большого количества информации (в основном шумовой). На основе тез ауруса формируются запросы к выбранным поисковым серверам, после чего в озможно уточнение запроса с целью отсечения очевидно нерелевантной ин формации. Затем производится отбор ресурсов, начиная с наиболее интерес ных, с точки зрения целей поиска. Данные с ресурсов, признанных релевантн ыми, собираются для последующего анализа. Формирование запросов Как формат, так и семантика запросов варьируются в зависи мости от применяемой поисковой машины и конкретной предметной области. Запросы составляются так, чтобы область поиска была максимально конкре тизирована и сужена. Предпочтение отдается использованию нескольких узких з апросов по сравнению с одним расширенным. В общем случае для каждого осн овного понятия из тезауруса готовится отдельный пакет запросов. Так же п роизводится пробная реализация запросов - как для уточнения и пополнени я тезауруса, так и с целью отсечения шумовой информации. Результат запроса (список ссылок) обрабатывается в два эт апа. На первом этапе производится отсечение очевидно нерелевантных ист очников, попавших в выборку в силу несовершенства поисковой машины или н едостаточной "интеллектуальности" запроса. Параллельно проводится сем антический анализ, имеющий целью уточнение тезауруса для модификации п оследующих запросов. Дальнейшая обработка производится путем последов ательного обращения на каждый из найденных ресурсов и анализа находяще йся там информации. Анализ ресурсов и сбор информации Первичный анализ ресурсов основывается на аннотациях - в случае их наличия, и в необходимых случаях - на ознакомлении с информацио нным наполнением ресурса. Информация с отобранных источников извлекае тся с использованием соответствующих конкретному источнику методов, ч то может потребовать значительных коммуникационных, вычислительных и дисковых ресурсов. В русскоязычной части Интернета в настоящее время досту пен ряд ресурсов, предоставляющих вторичную информацию, как правило, в т абулированной форме. Предоставление информации для публикации в подоб ных источниках является более дешевым вариантом для компаний, не имеющи х собственного представительства в Интернете. Владение пользовательскими инструментами и техникой Следует не забывать о команде Find броузера. Если ваш броузер имеет в меню Файл, Правка или Вид команду Find (На йти), используйте ее для обнаружения трудноуловимых ключевых слов стран ицы. Чтобы отыскать слово, которое вам нужно, воспользуйтесь комбинацией клавиш CTRL+F в вашем броузере и введите искомое ключевое слово. Необходимо так же фиксировать резул ьтаты ссылками и закладками: 1. Сохраняйте ссылки на важные и часто посещаемые страницы , используя команду Добавить в "Избранное". Используйте подобные механиз мы для регистрации предварительных результатов поиска в процессе бегл ого отбора с целью дальнейшего подробного изучения. 2. Поддерживайте свою персона льную коллекцию ссылок в рабочем состоянии: актуализируйте и системати зируйте ее, удаляйте устаревшие и ненужные. 3. Некоторые машины поиска, например AltaVista, позволяют отмечать закладкой успешный результат поиска. Благодаря этому позднее можно вернуться к данной подборке документов и просмотре ть ее. 4. Существуют специализированные программные средства - и нтегрируемые модули расширения для стандартных броузеров, которые инд ексируют информационные ресурсы ранее посещаемых узлов. Они способны в ыполнять полнотекстовый поиск документов на любом узле, включая резуль таты обработки запросов. Сохраняйте копии важных докум ентов. Активно используйте команды контекстного меню Сохранить объект как… и Сохранить рисунок как… и команду меню Файл - Сохранить как… для соз дания копий необходимой вам информации из сети Интернет на локальном ре сурсе вашего ПК. Этим вы решите некоторые проблемы: 1) изменчивости и недолговечнос ти WWW (когда со своих адресов со временем исчезают страницы и целые сайты), 2) концентрации внимания исключитель но на целях определенного этапа поиска (например отбор адресов или предв арительный просмотр найденной информации), 3) экономии времени on-line подключения и перевод изучения отоб ранных материалов в режим off-line. Отключайте вывод изображений. Если вы не желаете видеть многочисленные рекламные заставки и для вас ва жен не дизайн сайтов, а их содержательная информация, измените заданный режим просмотра в броузере на режим вывода только текста (исключив возмо жности мультимедиа). Это значительно увеличит скорость поиска. При этом, если возникнет необходимость быстрого просмотра важной графической ин формации, воспользуйтесь пунктом контекстного меню Показать рисунок, к ликнув для его вызова правой кнопкой мыши в место невыведенного рисунка. Заключение В сети Интернет хранится очень большой объем информации по различной тематике в виде статей в электрон ных газетах, отчетов, справочников, графических изображений, аудио- и вид ео-файлов и многого другого. Путешествуя по Интернет, можно найти любую и нформацию, не выходя из дома или офиса, иначе говоря, если какие-либо данны е вводились когда-либо в компьютер, то вероятнее всего их можно найти где- то на необозримых просторах Интернет. Для этого нужен только непосредст венно сам компьютер, подключенный к Интернет с установленной специальн ой программой – браузером, предназначенной для просмотра содержимого Web-страниц. С появлением World Wide Web (WWW) - гипертекстовой информационной системы, опутавшей весь мир, связавшей сотни и сотни комп ьютеров, тысячи и тысячи страниц гипертекстовых документов - без высокоэ ффективных средств поиска просто не обойтись. Благодаря разнообразию п оисковых систем, специально разработанным для рядового пользователя, к аждый может без труда отсечь заведомо ненужный поток информации, лишь пр авильно сформулировав цель поиска. Список литературы Гармашов М. Ю., Коротков А. М. Подготов ка учащихся к продуктивной деятельности в дидактической компьютерной среде. - Волгоград, 2001. Норенков И.П. Управление знаниями в информационно-образо вательной среде. - М.: МЭСИ, 2000. Путилов Г.П. Концепция построения информационно-образов ательной среды технического вуза. - М.: МГИЭМ, 1999. Средства поиска информации в INTERNET // Афанасий-биржа (Тверь). - 28 марта 1997. Усков В.Л. Дистанционное инженерное образование на базе Internet / Библиотечка журнала "Информационные технологии", 2000, № 3.
1Архитектура и строительство
2Астрономия, авиация, космонавтика
 
3Безопасность жизнедеятельности
4Биология
 
5Военная кафедра, гражданская оборона
 
6География, экономическая география
7Геология и геодезия
8Государственное регулирование и налоги
 
9Естествознание
 
10Журналистика
 
11Законодательство и право
12Адвокатура
13Административное право
14Арбитражное процессуальное право
15Банковское право
16Государство и право
17Гражданское право и процесс
18Жилищное право
19Законодательство зарубежных стран
20Земельное право
21Конституционное право
22Конституционное право зарубежных стран
23Международное право
24Муниципальное право
25Налоговое право
26Римское право
27Семейное право
28Таможенное право
29Трудовое право
30Уголовное право и процесс
31Финансовое право
32Хозяйственное право
33Экологическое право
34Юриспруденция
 
35Иностранные языки
36Информатика, информационные технологии
37Базы данных
38Компьютерные сети
39Программирование
40Искусство и культура
41Краеведение
42Культурология
43Музыка
44История
45Биографии
46Историческая личность
47Литература
 
48Маркетинг и реклама
49Математика
50Медицина и здоровье
51Менеджмент
52Антикризисное управление
53Делопроизводство и документооборот
54Логистика
 
55Педагогика
56Политология
57Правоохранительные органы
58Криминалистика и криминология
59Прочее
60Психология
61Юридическая психология
 
62Радиоэлектроника
63Религия
 
64Сельское хозяйство и землепользование
65Социология
66Страхование
 
67Технологии
68Материаловедение
69Машиностроение
70Металлургия
71Транспорт
72Туризм
 
73Физика
74Физкультура и спорт
75Философия
 
76Химия
 
77Экология, охрана природы
78Экономика и финансы
79Анализ хозяйственной деятельности
80Банковское дело и кредитование
81Биржевое дело
82Бухгалтерский учет и аудит
83История экономических учений
84Международные отношения
85Предпринимательство, бизнес, микроэкономика
86Финансы
87Ценные бумаги и фондовый рынок
88Экономика предприятия
89Экономико-математическое моделирование
90Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
Социальная реклама против суицида: "После смерти нет интернета".
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, реферат по информатике и информационным технологиям "Поиск информации в Интернете", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2016
Рейтинг@Mail.ru