Реферат: Взаимодействия с ЭВМ на естественном языке - текст реферата. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Реферат

Взаимодействия с ЭВМ на естественном языке

Банк рефератов / Программирование

Рубрики  Рубрики реферат банка

закрыть
Категория: Реферат
Язык реферата: Русский
Дата добавления:   
 
Скачать
Microsoft Word, 461 kb, скачать бесплатно
Заказать
Узнать стоимость написания уникального реферата

Узнайте стоимость написания уникальной работы

Обеспечение взаимодействия с ЭВМ на е стественном языке (ЕЯ ) является важнейшей задачей исследований по искусственному интелле кту (ИИ ). Базы данных , пакеты прикладных про грамм и экспертные системы , основанные на ИИ , требуют оснащения их гибким интерфейсом для многочисленных пользователей , не желающих общаться с компьютером н а иску сственном языке . В то время как многие фундаментальные проблемы в области обработки ЕЯ ( Natural Language Processing , NLP ) еще не решены , прикладные системы могут оснащаться и нтерфейсом , понимающем ЕЯ при определенных ог раничениях. Существуют дв а вида и , следовательно , две концепции обработки естественного языка : · для отдельных предложений ; · для ведения интерак тивного диалога. Природа обра ботки естественного языка Обработка естественного языка - эт о формулирование и исследование компьютер но-эффективных механизмов для обеспечения коммуни кации с ЭВМ на ЕЯ . Объектами исследований являются : · собственно естественные языки ; · использование ЕЯ как в коммуникации между людьми , так и в коммуникации челове ка с ЭВМ. Задача исследов аний - создание компьютерно-эффективных моделей ком муникации на ЕЯ . Именно такая постановка з адачи отличает NLP от задач традиционной лингвистики и других дисциплин , изучающих ЕЯ , и позв оляет отнести ее к области ИИ . Проблемой NLP занимаются две дисциплины : лингвистика и когнитивная психология. Традиционно лингвисты занимались созданием формальных , общих , структурных моделей ЕЯ , и поэтому отдавали предпочтение тем из них , которые позволяли извлекать как можно бо льше языковых законом ерностей и делать обобщения . Практически никакого внимания не уделялось вопросу о пригодности моделей с точки зрения компьютерной эффективности их применения . Таким образом , оказалось , что лингвистические модели , характеризуя собственно я зык , не рассматри в али механизмы ег о порождения и распознавания . Хорошим примеро м тому служит порождающая грамматика Хомского , которая оказалась абсолютно непригодной на практике в качестве основы для компьютер ного распознавания ЕЯ. Задачей же когнитивной психологии являетс я моделирование не структуры языка , а его использования . Специалисты в этой облас ти также не придавали большого значения в опросу о компьютерной эффективности. Различаются общая и прикладная NLP . Задачей общ ей NLP я вляется разработка моделей использования яз ыка человеком , являющихся при этом ком пьютерно-эффективными . Основой для этого является общее понимание текстов , как это подразум евается в работах Чарняка , Шенка , Карбонелла и др . Несомненно , общая NLP требует огромных знани й о реальном мире , и большая час ть работ сосредоточена на представлении таких знаний и их применении при распознавании поступающего сообщения на ЕЯ . На сегодняш ний день ИИ еще не достиг того уровня развития , когда для решения подобных зада ч в большом объеме использовались бы знан ия о ре а льном мире , и существу ющие системы можно называть лишь эксперимента льными , поскольку они работают с ограниченным количеством тщательно отобранных шаблонов на ЕЯ. Прикладная NLP занимается обычно не моделированием , а непосредственно возможностью коммуникаци и человека с ЭВМ на ЕЯ . В этом случае не так важно , как введенная фр аза будет понята с точки зрения знаний о реальном мире , а важно извлечение инф ормации о том , чем и как ЭВМ может быть полезной пользователю (примером может служить интерфейс экспертных си с тем ). Кроме понимания ЕЯ , в таких системах важно также и распознавание ошибок и их коррекция. Основная проблема обработки естественного языка Основной пробле мой NLP является языковая неоднозначность . Суще ствуют разные виды неоднозначности : · Синтаксическая (структурная ) неоднозначность : в о фразе Time flies like an arrow для ЭВМ неясно , идет ли речь о времени , которое летит , или о насекомых , т.е . является ли слово flies глаголом ил и существительным. · Смыс ловая неодн означность : во фразе The man went to the bank to get some money and jumped in слово bank может означать как банк , так и берег . · Падежная неоднозначност ь : предлог in в предложениях He ran the mile in four minutes / He ran the mile in the Olympics обозначает либо время , либо место , т.е . представлены совершенно различные отноше ния. · Референциальная неодноз начность : для системы , не обладающей знаниями о реальном мире , будет затруднительно опр еделить , с каким словом - table или cake - соотносится мест оиме ние it во фразе I took the cake from the table and ate it . · Литерация ( Literalness ): в диалоге Can you open the door ? — I feel cold ни просьба , ни ответ выражены нестандартным способом . В других обстоятельствах на вопрос может быть получен прямой отве т yes / no , но в данном случае в вопросе имплицитно выражена просьба откр ыть дверь. Центральная проблема как для общей , так и для прикладной NLP - разрешение такого рода неоднозначностей - решается с помо щью перевода внешнего представления на ЕЯ в некую внут реннюю структуру . Для о бщей NLP такое превращение требует набора знаний о реальном мире . Так , для анализа фразы Jack took the bread from the supermarket shelf , paid for it , and left и для к орректного ответа на такие вопросы , как What did Jack pay for ? , Wha t did Jack leave ? и Did Jack have the bread with him when he left ? необходимы знания о супермаркетах , проц ессах покупки и продажи и некоторые други е. Прикладные системы NLP имеют преимущество перед о бщими , т.к . работают в узких предметных обл астях . К приме ру , системе , используемой продавцами в магазинах по продаже компьюте ров , не нужно ”раздумывать” над неоднозначнос тью слова terminals в вопросе How many terminals are there in the order ? . Тем не менее , создание систем , имеющих возможность общения на ЕЯ в ши ро ких областях , возможно , хотя пока результаты далеки от удовлетворительных. Технологии анализа естестве нного языка Под технологией анализа ЕЯ по дразумевается перевод некоторого выражения на ЕЯ во внутрен нее представление . Фактиче ски все системы анализа ЕЯ могут быть распределены на следующие категории : подбор шаблона ( Pattern Matching ), синтаксический анализ , семантические грамм атики , анализ с помощью падежных фреймов , “жди и смотри” ( Wait And See ), слова рный экспертный ( Word Expert ), коннекционистс кий , “скользящий” ( Skimming ) анализ . Ниже пойдет речь о некоторых наиболее распространенных методах , оп исанных в статье. Подбор шаблона . Сущность данного подхода состоит в ин терпретации ввода в целом , а не в инт ерпретации смысла и структуры его отд ельных составляющих на более низком уровне . При использовании этого метода происходит сравнение уже имеющихся в системе шаблонов-об разцов с текстом , поступившим на вход . Обы чно шаблоны представлены в виде простого спис к а соответствий между классами высказываний и интерпретациями . Иногда они дополнены семантическими элементами или другими компонентами более высокого уровня . По та кому принципу работает система Элиза , имитирующая диалог с психотерапевтом . В действительности сис тема ничего не понимает , а лишь поддержива ет диалог , сравнивая реплики пациента с ша блонами и присвоенными им соответствующими от ветными репликами , такими , как : X всегда Y: Вы может е привести какой-нибудь пример ? Когда ? Действительно , всегда ? X Вы Y меня : Почему Вы дума ете , что я Y Вас ? Вам нравится думать , что я Y Вас , не правда ли ? Представьте , что я Y Вас . Что Вы об этом думаете ? В резул ьтате Элиза с пособна вести такой диалог : Пац .: Люди всегда пристально смотрят на меня. подбор по 1-му шаб лону с учетом всегда Эл .: Вы можете привести какой-нибудь при мер ? первый ответ по 1-му шаблону Пац .: Например , сейчас ты смотришь на меня. подбор по 2-му ша блону , Y= смотреть Эл .: Почему Вы думаете , что я смотрю на Вас ? первый ответ по 2-му шаблону Пац .: Потому что ты ненавидишь меня. подбор по 2-му шаблону , Y= ненавидеть Эл .: Вам нравится думать , что я ненавижу Вас , н е правда ли ? и т.д. второй ответ по 2-му шаблону Синтаксический анализ . При использ ов ании синтаксического анализа происходит интерпре тация отдельных частей высказывания , а не всего высказывания в целом . Обычно сначала производится полный синтаксический анализ , а затем строится внутренне представление введенн ого текста , либо производится интерпре тация. Деревья анализа и свободно-контекстные грамматики. Большинство способов синтаксического анализа реализовано в виде деревьев . Одна из простейших разновидностей - свободно-контекстная граммат ика , состоящая из правил типа S=NP+VP и ли VP=V+NP и полагающая , что левая часть правила м ожет быть заменена на правую без учета контекста . Свободно-контекстная грамматика широко используется в машинных языках , и с ее помощью созданы высокоэффективные метод ы анализа . Недостаток этого метода - отсутствие запрета на грамматически неправильные фразы , где , например , подлежащее не согласовано со сказуемым в числе . Для решения этой проблемы необходимо наличие двух отдельных , параллельно работающих грамматик : одно й - для единственного , другой - для множеств енного числа . Кроме того , необходима своя грамматика для пассивных предложений и т.д . Семантически неправильное предложение может по родить огромное количество вариантов разбора , из которых один будет превращен в с емантическую запись . Всё это делает ко личество правил огромным и , в свою очередь , свободно-контекстные грамматики непригодными для NLP . Трансформационная гр амматика . Трансформац ионная грамматика была соз дана с учет ом упомянутых выше недостатков и более ра ционального использования правил ЕЯ , но оказа лась непригодной для NLP . Трансформационная грамматика с оздавалась Хомским как порождающая , что , следо вательно , делало очень затруднительным обратное действие, т.е . анализ. Расширенная сеть переходов. Расширенная сеть переходов была разработана Бобровым ( Bobrow ), Фрейзеро м ( Fraser ) и во многом Вудсом ( Woods ) как продолжение идей синтак сического анализа и свобод но-контекстных грамматик в частности . Она представляет собой узлы и направленные стрелки , “расширенные” (т.е . дополненные ) рядом тестов (правил ), на основании которых выбирается путь для даль нейшего анализа . Промежуточные результаты записыв аются в ячейки ( регистры ). Ниже пр иводится пример такой сети , позволяющей анали зировать простые предложения всех типов (вклю чая пассив ), состоящие из подлежащего , сказуемо го и прямого дополнения , таких , как The rabbit nibbles the carrot (Кролик грызет морковь ) . Обозначени я у стрело к означают номер теста , а также либо п ризнаки , аналогичные применяемым в свободно-контек стных грамматиках ( NP ), либо конкретные слова ( by ). Тесты напис аны на языке LISP и представляют собой правила тип а если условие =истина , то присвоить анализиру емому слову признак Х и записать его в соответствующую ячейку. Разберем алго ритм работы сети на вышеприведенном примере . Анализ начинается слева , т . е . с перво го слов а в предложении . Словосочетание the rabbit про ходит тест , который выясняет , что оно не является вспомогательным глаголом ( Aux , стрелка 1), но является именной группой ( NP , стрелка 2). Поэтому the rabbit кладется в ячейку Subj, и предложение получает призна к TypeDeclarative , т.е . повествовательное , и система переходит ко втором у узлу . Здесь дополнительный тест не требу ется , поскольку он отсутствует в списке те стов , записанных на LISP . Следовательно , слово , стоящее п осле the rabbit - т . е . nibbles - глагол-ск азуемое (обозначение V на ст релке ), и nibbles записывается в ячейку с именем V . Перечерк нутый узел означает , что в нем анализ предложения может в принципе закончиться . Но в нашем примере имеется еще и дополн ение the carrot , так что анализ продолжается по с трелке 6 (выбор между стрелками 5 и 6 осущ ествляется снова с помощью специального теста ), и словосочетание the carrot кладется в ячейку с име нем Obj . На этом анализ заканчиваетс я (последний узел был бы использован в случае анализа такого пассивного предлож ения , как The carrot was nibbled by the rabbit ). Таким образом , в результате заполнены регистры (ячейки ) Subj , Type , V и Obj , используя которые , можно получить какое-либо представление (например , дерево ). Расширенная с еть переходов имеет свои недостатки : · немодульность ; · сложность при модиф икации , вызывающая непредвиденные побочные эффект ы ; · хрупкость (когда еди нственная неграмматичность в предложении делает невозможным дальнейший правильный анализ ); · неэффективность при переборе с возвратами , т.к . оши бки на промежуточных стадиях анализа не сохраняются ; · неэффективность с т очки зрения смысла , когда с помощью получе нного синтаксического представления оказывается невозможным создать правильное семантическое пре дставление. Семант ические гра мматики . Анализ Е Я , основанный на использовании семантических грамматик , очень похож на синтаксический , с той разницей , что вместо синтаксических кат егорий используются семантические . Естественно , се мантические граммати ки работают в узких предметных областях . Примером служит система Ladder , в строенная в базу данных американских судов . Ее грамматика содержит записи типа : S ® the of ® what is|[can you] tell me ® the | class ship Такая грамматика позволяет анали зировать такие запросы , как Can you tell me the class of the Enterprise? ( Enterprise - название корабля ). В данной си стеме анализатор составляет на основе запроса пользователя запрос на языке базы дан ных. Недостатки семантических грамматик состоят в том , что , во-первых , необходима разработка отдельной грамматики для каждой предметной области , а во-вторых , они очень быстро увеличиваются в размерах . Способы исправления этих недостатков - использование си нтаксиче ского анализа перед семантическим , применение семантических грамматик только в рамках реля ционных баз данных с абстрагированием от общеязыковых проблем и комбинация нескольких методов (включая собственно семантическую граммат ику ). Анализ с помощью падежных фреймов. С созданием падежных фреймов связан большой скачок в развитии NLP . Они приобрели популярность после работы Филлмора “Дело о падеже” . На сегодняшний день падежные фреймы - один и з наиболе е часто используемых методов NLP , т.к . он является наиболее компьютерно-эффективным п ри анализе как снизу вверх (от составляющи х к целому ), так и сверху вниз (от ц елого к составляющим ). Падежный фрейм состоит из заголовка и набора ролей (падежей ), связанны х опре деленным образом с заголовком . Фрейм для к омпьютерного анализа отличается от обычного ф рейма тем , что отношения между заголовком и ролями определяется семантически , а не с интаксически , т.к . в принципе одному и то же слово может приписываться разные р оли , например , существительное может быть как инструментом действия , так и его объектом. Общая структу ра фрейма такова : [Заголовочный глагол [падежный фр ейм агент : <активный агент , совершающий дейст вие > объект : <объе кт , над которым совершается действие > ин струмент : <инструмент , используемый при совершении действия > реципиент : <п олучатель действия - часто косвенное дополнение > направление : <цель (обычно физического ) действия > место : <место , где совершается действие > бенефициант : <сущность , в интересах которо й совершается действие > коагент : <вто рой агент , помогающий совершать действие > ]] Например , для фразы Иван дал мяч Кате падежный фрейм выглядит так : [Давать [падежный фр ейм агент : Иван объект : мяч реципиент : Ка тя ] [грам время : прош залог : акт ] ] Существуют обязательные , необяз ательные и запрещенные падежи . Так , для гл агола разбить обязательным будет падеж об ъект - без него высказывание будет незаконченным . Место и коагент будут в данном примере необязате льными падежами , а направление и реципиент - запрещенн ыми. Часто в NLP бывает полезным использовать семанти ческое представление в как можно более ка нонической форме . Наиболее известным способом такой репрезентации являются метод концептуальных зависимостей , разработанный Шенком для глаголов дейс твия . Он заклю чается в том , что каж дое действие представлено в виде одного и ли более простейших действий. Например , для предложений Иван дал мяч Кате (1) и Катя взяла мяч у Ивана (2), различающихся синтаксически , но оба обозн ачающих акт передачи , могут быть построены сл едующие репрезентации с использованием простейшего действия Atrans , применяющегося в грамматике конц ептуальных зависимостей : (1) (2) [Atrans [Atrans отн : обладание отн : обладание агент : Иван агент : Катя объект : мяч объект : мяч источник : Иван источ ник : Иван реципиент : Катя ] реципиент : Катя ] С помощ ью такого представления легко выявляются сход ства и различия фраз. Для облегчения анализа также используется деление роли на лексический маркер и заполнитель . Так , для роли объект может быть устан овлен м аркер прямое до полнение , для роли источник - маркер вида <маркер-из >=из |от | ... В общем а нализ текста с помощью падежных фреймов с остоит из следующих шагов : · Используя существующие фреймы , подобрать подходящий для заголовка . Если такого нет , текст не мож ет быть проанализирован. · Вернуть в систему подходящий фрейм с соответствующим заголовком-г лаголом. · Попытаться провести анализ по всем обязательным падежам . Если один или более обязательных заполнителей п адежей не найдены , вернуть в систему код ошибки . Такой случай может означать наличие эллипсиса , неверный выбор фрейма , не верно введенный текст или недостаток граммати ки . Следующие шаги используются уже для ан ализа и исправления таких ситуаций. · Провести анализ по всем необязательным падежам. · Если посл е этого во введенном тексте остались непроанали зированные элементы , выдать сообщение об ошиб ке , связанной с неправильным вводом , недостато чностью данного анализа или необходимостью пр овести другой , более гибкий анализ. Преимущества использования падежных ф реймов таковы : · совмещение двух стратегий анализа (сверху вниз и снизу вверх ); · комбинирование синтакси са и семантики ; · удобство при исполь зовании модульных программ. Устойчивость анализа Определенную трудность при анализе представляет вариативность одного и т ого же запроса . Например , на вход системы , управляющей зачислением и перераспределением учащихся на курсах разных специальностей , м ожет поступить запрос типа Переведите Петрова , если это возможно, с математики на , скажем , экономику . Наиболее легко такие трудности преодолева ются при использовании падежных фреймов . Прав ило , сформулированное Карбонеллом и Хейзом , гл асит : “Следует пропускать неизвестные введенные элементы до тех пор , пока не будет найд ен падежный маркер ; пропущенные элеме нты следует анализировать с учетом незаполнен ных падежей , используя только семантику”. Диалог Наряду с проблемой распознавания текста существует и проблема поддержания интерактивного диалога . При этом возник ают дополнительные особенности , характерные для диалогов , а именно : · анафора (т.е . использование местоимений вме сто их анафорических антецедентов - самостоятельны х частей речи ); · эллипсис ; · экстраграмматические п редложения (пропуск артиклей , опечатки , упо требления междометий и т.п .); · металингвистические пре дложения (т.е . попытка исправления введенного р анее ). Кроме того , пользователи систем с естественно-языковым интерфейсом стараются вы ражаться как можно короче , что в ряд е случаев также затрудняет анализ. Использование падежных фреймов , а именно слияние текущего фрейма с предыдущим , обе спечивает восстановление эллипсиса. Заключение Таким образом , процесс разраб отки систем , обеспечивающих понимание ЕЯ , требует создание механизмов , отличных от традиционных способов представлений ЕЯ , а сис темы с естественно-языковыми интерфейсами применя ются только в узких предметных областях. Encyclopaedia of Artificial Intellig ence. Entry Natural Language Understanding , pp. 660-677
1Архитектура и строительство
2Астрономия, авиация, космонавтика
 
3Безопасность жизнедеятельности
4Биология
 
5Военная кафедра, гражданская оборона
 
6География, экономическая география
7Геология и геодезия
8Государственное регулирование и налоги
 
9Естествознание
 
10Журналистика
 
11Законодательство и право
12Адвокатура
13Административное право
14Арбитражное процессуальное право
15Банковское право
16Государство и право
17Гражданское право и процесс
18Жилищное право
19Законодательство зарубежных стран
20Земельное право
21Конституционное право
22Конституционное право зарубежных стран
23Международное право
24Муниципальное право
25Налоговое право
26Римское право
27Семейное право
28Таможенное право
29Трудовое право
30Уголовное право и процесс
31Финансовое право
32Хозяйственное право
33Экологическое право
34Юриспруденция
 
35Иностранные языки
36Информатика, информационные технологии
37Базы данных
38Компьютерные сети
39Программирование
40Искусство и культура
41Краеведение
42Культурология
43Музыка
44История
45Биографии
46Историческая личность
47Литература
 
48Маркетинг и реклама
49Математика
50Медицина и здоровье
51Менеджмент
52Антикризисное управление
53Делопроизводство и документооборот
54Логистика
 
55Педагогика
56Политология
57Правоохранительные органы
58Криминалистика и криминология
59Прочее
60Психология
61Юридическая психология
 
62Радиоэлектроника
63Религия
 
64Сельское хозяйство и землепользование
65Социология
66Страхование
 
67Технологии
68Материаловедение
69Машиностроение
70Металлургия
71Транспорт
72Туризм
 
73Физика
74Физкультура и спорт
75Философия
 
76Химия
 
77Экология, охрана природы
78Экономика и финансы
79Анализ хозяйственной деятельности
80Банковское дело и кредитование
81Биржевое дело
82Бухгалтерский учет и аудит
83История экономических учений
84Международные отношения
85Предпринимательство, бизнес, микроэкономика
86Финансы
87Ценные бумаги и фондовый рынок
88Экономика предприятия
89Экономико-математическое моделирование
90Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
Настоящая бедность - это когда жену берешь в ипотеку.
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, реферат по программированию "Взаимодействия с ЭВМ на естественном языке", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2016
Рейтинг@Mail.ru