Вход

Особенности взаимодействия «человек-компьютер»

Реферат* по информатике и информационным технологиям
Дата добавления: 02 июня 2013
Язык реферата: Русский
Word, rtf, 272 кб
Реферат можно скачать бесплатно
Скачать
Данная работа не подходит - план Б:
Создаете заказ
Выбираете исполнителя
Готовый результат
Исполнители предлагают свои условия
Автор работает
Заказать
Не подходит данная работа?
Вы можете заказать написание любой учебной работы на любую тему.
Заказать новую работу
* Данная работа не является научным трудом, не является выпускной квалификационной работой и представляет собой результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала при самостоятельной подготовки учебных работ.
Очень похожие работы









Государственное профессиональное учреждение высшего

профессионального образования

«Московский государственный лингвистический

университет»

Факультет гуманитарных и прикладных наук

Кафедра прикладной и экспериментальной лингвистики

Специальность – теоретическая и прикладная

лингвистика






Реферат на тему:

ОСОБЕННОСТИ ВЗАИМОДЕЙСТВИЯ

«ЧЕОВЕК-КОМПЬЮТЕР»




Москва 2009






Содержание:

  1. Введение ……………………………………………..…….......……....…...….…

3

  1. Коммуникация «человек-компьютер»……………...….…………...…….….

4

  1. Коммуникация с помощью текстового сообщения.……………....………..

6

  1. Коммуникация с помощью изображений……….…………………..……….

9

  1. Речевая коммуникация ………………………………..……...……………….

15

Система распознавания речи……………………………...….….……………...

18

Трудности и проблемы при распознавании речи ЭВМ……….….….……...…

21

  1. Заключение………………………………………………….…….………...…...

23

  1. Список литературы………………………………………….……………...…..

25





Введение

Человек всегда взаимодействовал с техникой, еще со времен изобретения первых орудий труда. Они помогали ему ощутить свое господство над природой. Развиваясь, человек совершенствовал технику, и она становилась частью него - без техники человек был бессилен. Современный человек намного больше общается с техническими устройствами, в особенности такими, как компьютер. Теперь он не просто облегчают человеку его работу, как умственную, так и физическую, как было ранее, а является помощником, способными выполнять и некоторую интеллектуальную работу.

Компьютер в настоящее время является персональным помощником человека практически во всех сферах его деятельности. Он помогает ему в науках и их развитии, является незаменимым помощником на предприятиях различного характера, и даже задействуется в творческой деятельности человека и в быту. Современный человек не представляет себе более жизнь без компьютера. Кто-то мог бы возразить, упомянув, что в ранние времена человек свободно обходился без ЭВМ. Однако компьютер намного облегчает деятельность человека, сокращает время работы, оптимизирует и структурирует имеющуюся информацию, с легкостью справляется с вычислительными операциями, а также другими более сложными, требующими специально разработанных программ. Внедрение в компьютер различных технических средств (телефон, радио, видео- и фотосредства, диагностическую аппаратуру и т. п.) обеспечивает компьютерный слух, зрение, осязание, способность речевого воспроизведения. Таким образом, компьютер может отвечать практически всем органам чувств человека.

Человек и дальше стремится совершенствовать и развивать компьютер для решения все более широкого круга задач. Это позволит человеку использовать колоссальные возможности машины, о которых мы, молодые студенты, возможно еще и не подозреваем.

Взаимодействие человек-компьютер таким образом становится все более тесным, органичным и развивающим. Машина совершенствуется человеком, и человек также меняется под влиянием машины. Меняется его мировоззрение, становясь более глобальным, меняются привычки и образ жизни.





Коммуникация «человек-компьютер»

Коммуникация в теории информации определяется как процесс взаимного обмена сообщениями между динамическими системами. Если рассматривать коммуникацию в биологической и технической сфере, можно выделить такую особенность как наличие или отсутствие цели. Живые системы взаимодействуют как правило при наличие на то цели, и это касается не только человека, а всех живых организмов, включая самые примитивные. Наличие цели у организмов определяют имеющиеся у них потребности. Машины же, обмениваясь информацией друг с другом, не преследуют каких-либо собственных целей. Цель задается машине человеком, который ей управляет. Живые организмы обладают целым рядом сигналов: химические, тактильные, акустические, визуальные. При этом акустические средства коммуникации более эффективны, так как распространяются с огромной скоростью, для них практически не существует преград, в отличие от оптических сигналов, и они не зависят от светового фактора, в отличие от визуальных коммуникаций. Акустическая коммуникация человека отличается от звуковой коммуникации животных. Применение акустической сигнализации человеком является неотъемлемой частью окружающего мира, как и у животных, однако человеческая коммуникация требует длительного обучения и может быть к тому же абстрактной, сохраняя при этом свое значение. [1, с.16-17]

Коммуникация между человеком и ЭВМ так же как и между живыми организмами происходит с помощью языка. «Этот способ первичен, универсален, возникает с самим зарождением человеческого интеллекта и служит надежным инструментом его развития. Язык – это не столько «форма выражения» готовых мыслей, сколько способ содержательной организации и представления знаний»[5, c.85]. Проще говоря, язык – это система знаков, служащая для обмена информации. Различают такие языки как человеческие и формальные. К человеческим относятся естественные, искусственные и жестовые языки (используются для общения среди глухонемых). К формальным относят компьютерные языки. Компьютерные языки и языки программирования составляют основу и искусственных языков, они служат для обработки информации с помощью ЭВМ. [http://ru.wikipedia.org/wiki/Язык] Естественный же язык изначально служил исключительно для коммуникации людей друг с другом.

Если обратиться к истории, язык является одним из важнейших факторов в развитии информационных технологий. Возникновение письменности, изобретение книгопечатания, а затем создание искусственных языков – все эти достижения объединяет естественный язык.

Однако достичь взаимопонимания между машиной и человеком оказалось задачей не из легких. ЭВМ не обладает человеческой нервной системой, кроме того лишена человеческих коммуникативных интересов. Поэтому работа с искусственным интеллектом тесно связана с областью психологии и часто зависит от психологических исследований. Ученые стремятся к тому, чтобы машина идеально понимала человека, а коммуникация «человек-компьютер» давалась бы человеку также легко, как с взаимодействие «человек-человек».

Таким образом, прогресс пришел к тому, что взаимодействовать с компьютером можно несколькими способами: визуально, т.е. с помощью образов, акустически – с помощью речи, и самый распространенный на сегодняшний день – это способ взаимодействия с помощью сообщения.







Коммуникация с помощью текстового сообщения

Письменное сообщение всегда являлось актуальным при коммуникации человека и машины. Человек взаимодействовал и продолжает взаимодействовать с компьютером при помощи текста, письменного языка. Такой способ облегчает общение между этими разными системами, делает его оптимальным. Однако и в подобном процессе коммуникации могут возникнуть некоторые сложности.

Первоначально взаимодействие «человек-компьютер» осуществлялось в машинных кодах. Естественно, такое средство коммуникации было крайне неудобно для любого пользователя ЭВМ, что и обусловило интенсивную разработку более совершенного метода взаимодействия. Появились автокоды и мнемокоды, а потом и алгоритмические языки разных уровней. В дальнейшем при разработке компьютерных языков все больше учитывались психофизиологические закономерности, но все они до сих пор были недостаточно хороши и удобны. Требовалось еще более углубленное изучение человеческой психологии. Впоследствии ученые подошли к выводу, что нет ничего удобнее и эффективнее чем коммуникация на естественном языке. Огромный плюс такого общения – увеличение количества пользователей ЭВМ, так как такое серьезное препятствие, как изучение языка программирования отпугивало многих потенциальных пользователей компьютера. Кроме того, естественный язык помог бы человеку в творчестве, при решении задач, ему не надо будет отвлекаться на описание способа ее решения и на выполнение синтаксических правил, которые в любом из известных языков программирования достаточно далеки от правил грамматики естественного языка. Человек смог бы полностью сконцентрироваться на задаче. Что касается сферы вне творчества, для пользователей информационно-поисковых систем естественный язык был наиболее предпочтителен для выражения их информационной потребности.[3, с. 298-300]

Однако были и противники сближения языка программирования с естественным. Так Х.Халперн называл «пассивным» язык программирования, близкий к естественному. То есть это такой язык, синтексис которого отличается от грамматики естественного языка, программа же, составленная на нем, понятна для любого пользователя, носителя естественного языка. «На пассивном языке удобно читать готовую программу, обучение же такому языку отнюдь не облегчено по сравнению с обучением другим языкам программирования, большинство из которых, конечно, и не претендуют на близость к естественному языку».[3, с.301] Халперн так характеризует пассивный язык: «Объединяя многословие и зашумленность естественного языка со строгостью и произвольностью, типичной для языков программирования, он демонстрирует худшие свойства их обоих, но ни одного достоинства, присущего какому-либо из них»[3, c. 302]. Он выступал против создания пассивных языков, и противопоставлял ему язык «активный», то есть тот, который позволил бы свободно пользоваться естественным языком для составления программ[3, с.301-302]. В общем-то именно к этому и стремятся ученые.

Однако в дискуссиях на тему создания оптимального языка, учеными часто забывалось, что коммуникация – процесс двусторонний, так как она подразумевает не только обучение машины человеком, но и ответ машины человеку [3, с.302-303]. Практика подтвердила необходимость уделять внимание обоим этим процессам, и язык сообщения, передаваемого человеком машине, должен несколько отличаться от языка сообщения, передаваемого машиной человеку. Анализируя отдельно передачи сообщения, где пользователь в одном случае – отправитель, в другом - получатель, выяснилось, что человеку удобнее передавать сообщения на активном языке, а пассивный удобен для пользователя при получении сообщения. К такому выводу ученые пришли еще и потому, что интересы человека и машины при коммуникации не совпадают. ЭВМ не обладает человеческой нервной системой, соответственно она лишена человеческих коммуникативных интересов. [3, с.315] То есть при коммуникации с машиной, человек может проявлять свои интересы как в качестве отправителя, так и в качестве получателя.

Естественный язык человека в отличие от формализованного компьютерного, на котором строятся программы ЭВМ, может содержать неоднозначные понятия, то есть одно и то же слово может иметь несколько значений. В искусственном же языке слова должны быть однозначны. Таким образом установление понимания между человеком и ЭВМ усложняется. В психологии термин «понимание» трактуется как сложный, комплексный, многоуровневый познавательный процесс, включающий узнавание языковых средств и осмысление содержания и направленный на раскрытие связей и отношений реальной действительности. Если же исходить из сферы коммуникации компьютера и человека, понимание можно определить как «установление соответствия между семантическими и грамматическими системами составителя сообщения и реципиента».[3, с.316-317] Раципиент в данном контексте – получатель общения.

Понимание текста зависит от многих факторов, большую роль из которых играют именно психологические. При этом не важно, кем является человек – отправителем или получателем, в любом случае психологические факторы будут влиять на то, насколько хорошо поймет машина кодирующего сообщение, либо декодирующий сообщение, исходящее от машины. Понимание будет тем успешнее осуществляться, чем более похожие и общие буду языковые нормы обоих участников процесса коммуникации: «чем более сходны их система семантических и грамматических навыков, тем более точно они должны уметь антиципировать или прогнозировать, что именно породит каждый из них в каждый отдельный момент».[3, с.317]



Коммуникация с помощью изображений

Человек обладает абстрактным мышлением, то есть мысли возникают в голове не только в качестве фраз, слов, предложений, а чаще в виде образов. К сожалению, коммуникация «человек-человек» с помощью образов довольно редкое явление, так как «читать» мысли большинство из нас не способно, а рисовать и создавать образы вручную будет отнимать много времени и сил. Такая коммуникация просто не нужна, когда люди вполне могут общаться и понимать друг друга на естественном языке. Впрочем, для людей, говорящих на разных языках, такой способ вполне актуален и, возможно, скоро станет доступен с помощью компьютерных программ.

Более 90% информации человек получает с помощью зрения. Так было, так есть, и, очевидно, так будет. И поэтому не удивительно, что технический прогресс затрагивает в первую очередь средства сбора и обработки визуальной информации.

При всей сложности и чувствительности человеческого глаза, его возможности ограничены, и человек издавна стремился их расширить. Прежде всего, к таким "средствам расширения" относятся уже давно изобретенные микроскоп и телескоп. Долгое время предоставленные ими возможности визуального наблюдения вполне удовлетворяли исследователей, позволяя делать выдающиеся открытия как в области микромира (особенно биологии), так и в макромире, а именно, астрономии.

Но прогресс не стоит на месте. Появление компьютеров неизбежно вызвало желание подключить такой компьютер к микроскопу и телескопу, освободив человека от нудного и чреватого ошибками процесса анализа и подсчета различных объектов, попавших в поле зрения.

Однако, возникла неожиданная проблема: компьютер - не человек, он не видит и не понимает введенное в него изображение, для него это просто набор данных, никак не связанных между собой. В то же время человек, глядя на любое изображение, практически всегда может выделить на нем какие-то характерные особенности, причем происходит это почти мгновенно.

Взаимодействие человека и компьютера в зрительной области стало очень тесным, но разделилось на два направления: интерактивный режим работы и автоматический.

В интерактивном режиме компьютерные программы преобразуют изображение в соответствии с желанием человека, что позволяет ему лучше увидеть какие-то части или особенности изображения, выделить нужные элементы и подсчитать их количество или геометрические параметры. При всех плюсах этого варианта очевидны и его минусы: в процессе работы необходимо участие человека, который в целом имеет быстродействие, гораздо меньшее чем у компьютера, который ошибается, и который, наконец, просто устает. И, между прочим, нуждается в оплате своего труда.

Автоматический режим подразумевает автономную работу компьютера, как по сбору информации (что не является проблемой уже давно), так и по ее анализу. И вот тут как раз проблема в том, что на сегодняшний день не существует способов полностью автоматизировать процесс анализа. При всем быстродействии компьютеров и их огромной памяти, никак не удается заставить их делать то, что человек (особенно специалист в конкретной области) может сделать буквально одним взглядом.

Оба эти пути развиваются параллельно, хотя стремление к полной автоматизации является приоритетным.

В области интерактивного анализа основными помощниками человека становятся различные графические пакеты, самыми известными из которых можно считать PhotoFinish (ZSoft), PhotoShop (Adobe), Corel Draw и некоторые другие, менее известных фирм, но зачастую очень удобные и полезные. Среди них много и бесплатных систем, например, очень удачный продукт "ImageJ" ("http://rsb.info.nih.gov/ij/").

Эти программы позволяют проводить с изображением поистине чудесные преобразования, от имитации письма маслом в стиле определенной художественной школы, до анимационных эффектов, превращающих одну картину в другую через ряд промежуточных. О выводе всевозможных статистических характеристик изображения и говорить нечего, это само собой разумеется. Кроме того, заложенные в эти программы алгоритмы позволяют менять яркость, контрастность, резкость, насыщенность и многие другие параметры, а также выделять области и проводить различные математические операции с изображениями.

Человек, комбинируя различные преобразования, добивается эффекта визуального выделения на изображении необходимой ему информации. Потребность в подобных преобразованиях связана с тем, что изображения, получаемые с помощью различных видеокамер и других детекторов, далеко не всегда являются качественными и подчас содержат шума не меньше, чем полезного сигнала. Кроме того, получаемые изображения часто несут информацию из очень непривычных человеку мест и условий, в результате он просто не может корректно анализировать такое изображение. Тут можно упомянуть не только электронно-микроскопические изображения горных пород или внутренностей клетки, но и переданные из космоса изображения далеких планет. Для человека эти картины по сути чужды и непривычны, поэтому ему крайне трудно правильно их интерпретировать.

Получается, что проводить качественный и количественный анализ изображений даже с помощью столь замечательных программ может только специалист очень высокой квалификации, имеющий большие знания в данной конкретной области, а также большой практический опыт. Но таких специалистов мало, стоят они очень дорого, и не всегда они есть там, где нужны.

В этой ситуации очень заманчиво построить такую систему автоматического анализа, которая бы не зависила от характера самого изображения, а желательно, и не была бы очень чувствительной к его качеству. И при этом могла бы сама "видеть" на изображении то и так, что и как видит этот специалист-человек.

Автоматический анализ изображений необходим и тогда, когда требуется в реальном времени обработать тысячи кадров видеосъемки, пытаясь найти там изображение, например, конкретного человека. Это особенно актуально сейчас, когда в мире растет глобальная преступность и терроризм, а мир обрастает паутиной видеокамер, круглосуточно следящих за многими тысячами финансовых и правительственных объектов.

Использование человека тут невозможно хотя бы по причине огромного количества таких камер.

Попытки создания систем автоматического анализа предпринимаются во всем мире уже давно, собственно, с тех пор, как люди научились вводить изображения в компьютер. Из математических способов обработки изображений широкое распространение получил метод быстрых преобразований Фурье (БПФ). Его применение позволяет получить спектр изображения (спектр этот не предназначен для человеческого восприятия), применить к нему различные фильтры, а потом обратным преобразованием получить снова изображение, но уже откорректированное, по которому уже человек и проводит визуальный анализ. И вся задача исследователей сводится практически к выбору нужного фильтра, а часто и созданию своего собственного в соответствии с конкретной задачей.

Эта методика демонстрирует свою успешность во многих практических применениях, однако она требует огромных вычислительных ресурсов, даже сейчас доступных не везде и не всем, а самое главное, на 100% исходит из самого факта применения компьютеров. Иными словами, эта методика явно не имеет ничего общего с тем, как мозг самого человека проводит анализ этого же изображения.

Имеет ли это значение? Бесспорно, имеет. Прежде всего, разработка фильтров для БПФ сама по себе является крайне трудной задачей, ибо мозг человека вынужден выполнять чуждую ему работу и фактически моделировать в себе компьютерное восприятие. Напрашивается вопрос, а не правильней ли было бы наоборот, на компьютере моделировать работу и восприятие мозга?

Ведь как уже говорилось выше, человек способен проводить анализ почти мгновенно, при этом в зависимости от конкретной задачи выделять на изображении те или иные характерные особенности. Разумеется, такая рутинная работа, как подсчет числа элементов или определение их формы (например, в ходе анализа крови), у компьютера всегда будет получаться лучше, чем у человека. И быстрее, и надежнее. Но анализ изображения, его осмысление - тут пока ни один компьютер не может сравниться с человеком.

Исследования мозговой деятельности проводятся во всем мире уже много лет. В области этой достигнуты значительные успехи, хотя в сущности человек еще очень далек от понимания принципов работы его собственного мозга. Попытки моделирования человеческого восприятия визуальных образов предпринимаются в различных научных центрах мира, но пока что нигде и никем не было объявлено, что такое понимание достигнуто. Очевидно, что восприятие это основано на комбинации многих факторов и критериев, понимание хотя бы некоторых из них может существенно продвинуть человечество вперед.

Когда в 97 году одна исследовательская группа занялась созданием программы анализа изображений, были испробованы различные подходы. Прежде всего они попытались обратиться к общеизвестным методикам, анализируя гистограмму изображения и применяя к ней различные математические операции. Наряду с этим для всего изображения также применялись стандартные алгоритмы выделения областей, наращивания и удаления точек и т.д. Все эти способы давали некоторый результат, но ни о какой автоматизации и речи быть не могло, не говоря уже о том, что такой подход выглядел явно искусственным.

Сама задача состояла в анализе изображений горных пород, полученных в сканирующем электронном микроскопе, в результате такого анализа нужно было получить различные петрофизические характеристики исследуемого образца (пористость, проницаемость и т.д.). На сегодняшний день такие задачи решаются в мире многими, но все они исследуют не грубую поверхность (скол породы), а гладкий и тонкий специально приготовленный шлиф (срез). При изготовлении такого шлифа не только нарушается целостность породы на микроуровне, но и искажается само восприятие анализируемого объекта с потерей трехмерности информации. Но самое главное, что все существующие методики и программы рассчитаны на интерактивный режим работы со всеми его указанными выше недостатками.

Все это довольно быстро натолкнуло ученых на мысль отказаться от стандартных подходов и подойти к решению задачи именно со стороны моделирования человеческого восприятия, что позволит работать не в интерактивном, а именно в автоматическом режиме.

Изображения, получаемые с электронного микроскопа, являются серыми, т.е. там присутствуют только компоненты яркости и контрастности. В то же время, например, космические фотографии содержат в себе и цвет, причем его роль не менее значима, чем роль яркости.

За прошедшее время учеными была проведена очень большая работа как в области экспериментов, так и в вопросах теоретических. В результате создана единая методика и разработан комплекс алгоритмов, которые позволяют проводить анализ и обработку изображения полностью в автоматическом режиме. Пока это применимо непосредственно только к серым изображениям, хотя и в области цветных изображений также имеется много перспективных идей и наработок. Проблемы, как обычно, находятся в плоскости финансирования и технического обеспечения.

Практической реализацией разработанного нами метода стала программа, которая не требует для своей работы ни сотен мегабайтов памяти, ни еще каких-либо суперресурсов. По этой программе были выполнены (и далеко не на современных компьютерах) сотни анализов как для тестовых образцов породы, так и непосредственно исследовательских анализов керна (и даже шлама), с получением подробных и достоверных данных о поровой системе изучаемых объектов.

Результаты анализов были использованы различными нефтяными компаниями в практических целях и никаких нареканий с их стороны высказано не было.

Разумеется, методика нуждается в дальнейшем совершенствовании и расширении на другие области исследования, однако лежащие в ее основе алгоритмы обработки изображения являются по своей сути универсальными и отражают именно человеческое восприятие, во всяком случае, в данной области. А применение ее возможно не только в геологии, металлургии, медицине или астрономии, но и в такой сфере, как, например, техническое зрение роботов, тем более, что и эта сфера сейчас бурно развивается. [http://erichware.com/litvor/zrenie/analizob.htm]



Речевая коммуникация

Наше общение с людьми при помощи устного языка, не важно, происходит ли оно при личном контакте с человеком, по телефону или при помощи интернета, можно назвать термином «речевая коммуникация». При этом мы обмениваемся мыслями, информацией при помощи звуковых волн. При помощи речи мы можем хорошо выражать свои мысли и достигать наилучшего взаимопонимания с собеседником, конечно, если тот способен адекватно воспринимать нашу речь и понимает язык. В достижении взаимопонимания между людьми важную роль играет эмоциональный аспект. Через речь мы передаем собеседнику свое эмоциональное состояние.

Речь имеет массу преимуществ перед другими средствами коммуникаций. Во-первых это самая быстрая форма общения, человек говорит по меньшей пере вдвое быстрее, чем печатает на клавиатуре. Кроме того, эксперименты в области человеческого общения показали, что самые сложные проблемы решаются вдвое быстрее при использовании речевого общения по сравнению с другими формами общения. Речь позволяет вести общение одновременно в различных формах, например, вы можете общаться с человеком, нажимая пульт телевизора, указывая на какую-нибудь графическую схему, текст и т.п. Можно общаться одновременно с машиной и другими людьми. При коммуникации с помощью речи вас не затруднит ни темнота, ни какое-либо затрудненное положение вашего тела, вы можете общаться, повернувшись спиной к человеку, и совершая при этом какие-либо другие действия.

С точки зрения науки, «речевая коммуникация представляет собой процесс, в котором участники должны совершать сложные действия. С точки зрения этого подхода речевая коммуникация наитеснейшим образом связана с практическими и умственными действиями индивидуума».[1, c. 28] Минимальной единицей речевой коммуникации является речевой знак или звук. Он является достаточно сложным образованием. Для его воспроизводства требуется движение определенных органов, а центр их управления находится в головном мозгу. При этом говорящий преследует определенное коммуникативное намерение. Сочетания элементарных единиц языка образуют различные типы сложных единиц: сочетания звуков – конкретные фонетические синтагмы, словоформ – лексикограмматические синтагмы, сем – сематические синтагмы. [1, c.122] Таким образом, процесс продуцирования речевых значительно сложнее, чем кажется на первый взгляд. В целом речевая деятельность – один из сложнейших видов деятельности человека и довольно сложный процесс с точки зрения науки. Ее природа стала понятной сравнительно недавно.

Речевой диалог является одной из форм взаимодействия человека и машины, считающейся перспективной и усиленно разрабатываемой в последнее время. Диалог – это основная форма общения, поэтому в последнее время ей уделяется много внимания. Наука стремится к реализации успешного общения на устном диалоге между человеком и компьютером, и для этого ей необходимо учитывать особенности взаимодействия «человек-человек». В результате сравнительно недавно выделилась такая область исследования, как речеведение.[1, c.125]

Преимуществами устной речи перед всеми другими способами общения являются то, что руки остаются свободными, никакие инструменты не требуются, освещение также не имеет значение, легко осуществляется сопряжение с телефонными системами. При диалоговом общении человек не нуждается в клавиатуре или дисплее. Кроме того, в систему «человек-компьютер» могут быть включены люди с физическими недостатками. Развитие же теории цифровой обработки речевого общения, увеличение возможностей и снижение себестоимости современных систем на основе ЭВМ способствовало развитию этой отрасли в современной науке. Кроме того, автоматическое распознавание речи несомненно является важным шагом на пути упрощения общения между человеком и машиной.

Когда взаимодействие человека и компьютера осуществлялось в кодах, для управления вычислительными машинами человеку требовалось знать язык машины или освоить манипуляции с клавиатурой, чтобы набирать коды в нужной последовательности и в нужном формате. Любое же отклонение от искусственного языка приводило к ошибке и таким образом трудностям общению с ЭВМ. [1, с.303-304]

Речевая коммуникация с машиной обладает следующими достоинствами:

  • у человека, работающего с речевым устройством, глаза и руки свободны;

  • речевое устройство представляет собой наиболее естественную форму общения;

  • для работы с устройством не требуется значительной подготовки;

  • устройство позволяет человеку быстро общаться в различных сферах его деятельности;

  • она дает возможность одновременно общаться с машиной и другими людьми;

  • устройство обеспечивает свободу движений и ориентировку;

  • не требует значительного пространства для пульта управления или другой сложной аппаратуры;

  • может конкурировать с радио и телефоном. [1, с. 505]

Поэтому в целях упрощения взаимодействия между человеком и компьютером ученые разрабатывают систему распознавание речи компьютером, что является достаточно непростой задачей.



Система распознавания речи

Самым сложным для машины является автоматическое распознавание слитной речи. Разработка систем автоматического распознавания речи ведет к тому, что не человек приспосабливается к машине, а машина к человеку. Это значительно упрощает коммуникацию в системе «человек-компьютер», так как она ведется на естественном для человека языке. Люди получают возможность наговаривать информацию в компьютер, не прибегая к клавиатуре или другим устройствам, и управлять механическоми устройствами с помощью речевых команд. [1, с.304]

В начале 40-х годов ХХ века инженеры впервые попытались распознать с помощью машины отдельные звуки речи, однако оказалось не так просто найти соответствие между конкретными звуками речи человека и акустическими характеристиками речевого сигнала. Компьютер учился считывать буквы, но еще не мог распознать человеческую речь. И не смотря на то, что изначально люди предполагали, что научиться «разговаривать» с машиной не окажется сложной задачей, проблема взаимодействия с компьютером посредством речи до сих пор стоит перед учеными. «Можно представить себе, перед решением каких трудных задач стоит машина, которой нужно из безбрежного океана звучаний «выловить» определенные смысловые ориентиры». [2, с.88]

Что касается гласных, если компьютер уловит частотные колебания в области 1000 ГЦ, то велика вероятность того, что бы произнесен гласный «а», если же он обнаруживает сильные колебания в зоне 2000-3000 Гц, есть вероятность присутствия звука «и». Однако с согласными дело обстоит хуже. Машине сложно уловить смычные взрывные согласные «г», «к», «б», «п», «д», «т». Они не уловимы сами по себе, так как образуются при смыкании тех или иных органов артикуляции. Распознать их в речи легче по соседним гласным. Машина также часто путает такие сонорные звуки, как «м» и «н». Легче дело обстоит с распознаванием шипящих звуков «ш» и «с», их частоты колеблются в районе высоких частот спектра: 8000-10000 Гц.

К лингвистическим трудностям добавляются и такие, которые возникают вследствие большой вариативности звуков речи при их произнесении. Кроме того, звуки в процессе включения в речевой поток попадают в разное окружение, разный фонетический контекст, что усложняет способность распознования речи машиной.

Для того чтобы машина смогла распознать не только звуки, но и целые слова, фразы, она должна включать в себя несколько блоков рецепторов, классификаторов, эффекторов. Рецептор измеряет некоторые параметры речевого сигнала. Затем классификатор выносит решение о том, что это за слог. Другой классификатор определяет, принадлежит ли этот слог произнесенному слову, образец которого находится у него в памяти, и т.д. Таким образом, распознающая машина решает следующие задачи:

  1. Какие элементы набора признаков она должна распознать?

  2. На какие признаки следует обратить внимание?

  3. По каким правилам надо принять решение о том, к какому элементу набора признаков относится речевой сигнал?

  4. Какие дополнительные сведения, знания следует привлечь для более правильного решеия задачи?

Чтобы машина распознавала слова, ее вначале обучали, как они произносятся и что обозначают. Для этого слова произносились в магнитофон или записывались на пленку. Машина тем временем сравнивает произнесенные слова с образцами слов, хранящимися у нее в памяти, а также характеристики голоса человека, произносящего слово, с образцами голосов, хранящимися у нее в памяти. При этом различают адаптивные и неадаптивные машины. Адаптивные предназначены для какого-то узкого круга лиц, голос которых они распознают, другого человека машина не сможет распознать. Неадаптивные предназначены непосредственно для любого пользователя.

Иногда возникают такие помехи как различного рода шумы (дыхания, разговоров на заднем плане и т.п.). Для их подавления используются специальные шумоподавляющие, шумостойкие микрофоны либо акустически изолированные камеры.[2, с.88-95]

Системы распознания отдельных слов, т.е. речи, в которой слова разделены паузами, появились уже в 90-е гг. прошлого века. Распознать же слитную речь было намного труднее, так как в ней сложно определить, где кончается одно слово и начинается другое. Наиболее трудной задачей из всех задач распознавания была я является проблема распознания речи без ограничений словарного запаса.

«Говорящий в процессе речевой коммуникации использует свое знание языка, знание об окружающей обстановке и ситуации при производстве и понимании сообщения. Эти источники знаний включают в себя характеристики звуков речи, произносительную вариативность, ударение и интонационный контур речи, звуковые образы слов, грамматическую структуру языка, , значение слов и предложения и контекст общения. Для того, чтобы походить в своих действиях на человека, машина должна так же эффективно использовать все доступные источники знаний».[1, с.305] Конечно, ответственность за то, чтобы машина полностью понимала человека, лежала и лежит на самом человеке. Ученые проводили и проводят массу исследований в этой области, а результаты экспериментов часто лежат в основе функционирования той или иной системы. «Современные системы распознавания включают различные уровни, каждый из них несет свою функциональную нагрузку: акустический, параметрический, лексический, синтаксический, семантический и прагматический»[1, с. 505]



Трудности и проблемы при распознавании речи ЭВМ

Распознавание живого языка требует огромных знаний системы об окружающем мире и возможности с ним взаимодействовать. Само определение смысла слова «понимать» — одна из главных задач искусственного интеллекта. Качество понимания зависит от множества факторов: от языка, от национальной культуры, от самого собеседника и т. д. Вот основные проблемы, с которыми сталкиваются разработчики систем распознавания речи.

1. Проблема анализа и распознавания слитной речи. В слитном потоке речи отсутствуют объективные границы. Кроме того фонемы слов, т.е. звуки, в них входящие, часто зависят от контекста, число же их огромно.

2. Проблема увеличения объема словаря: это влечет за собой рост ошибок распознавания и увеличение времени принятия решения. При большом объеме словаря появляется слишком много схожих слов, что альтернативный подбор слова в случае его нераспознания машиной, вряд ли решит проблему.

3. Проблема использования синтаксиса: сколько допустимых ограничений может наложить искусственный синтаксис языка, и как эти ограничения могут быть использованы. Связь синтаксического и фонетического уровней необходима и полезна для распознавания слитной речи. Роль синтаксического анализа сводится к тому, чтобы сформировать грамматическую цепочку, свободную от ошибок.

Вот пример сложностей, с которыми сталкиваются системы понимания текстов: предложения «Мы отдали бананы обезьянам, потому что они были голодные» и «Мы отдали бананы обезьянам, потому что они были перезрелыми» похожи по синтаксической структуре. В одном из них местоимение «они» относится к обезьянам, а в другом — к бананам. Правильное понимание зависит от знаний компьютера, какими могут быть бананы и обезьяны. По нормам русского языка второе предложение некорректно, потому что в нем местоимение ссылается не на последнее подходящее слово, однако в живой речи такое предложение очень даже может встретиться.

Свободный порядок слов может привести к совершенно иному толкованию фразы: «Бытие определяет сознание», кто здесь кого определяет, будет непросто понять машине. В русском языке свободный порядок компенсируется развитой морфологией, служебными словами и знаками препинания, но в большинстве случаев для компьютера это представляет дополнительную проблему.

4. Проблема неоднозначности языка, распознавания омонимов и неологизмов.

В речи могут встретиться неологизмы, например, глагол «Пятидесятирублируй» — то есть высылай 50 рублей. Система должна уметь отличать такие случаи от опечаток и правильно их понимать.

Правильное понимание омонимов – нелегкая задача для компьютера. Во фразе «Серый волк в глухом лесу встретил рыжую лису» выделенные слова слышатся одинаково, и без знания, кто глухой, а кто рыжий, не обойтись (Кроме того, что лиса может быть рыжей, а лес — глухим, лес также может быть рыжим (характеристика, в данном случае обозначающая преобладающий цвет листвы в лесу), в то время как лиса может быть глухой, что порождает дополнительную проблему, вытекающую из предыдущей.)

5. Проблема распознавания речи пользователей. Системы распознавания речи настраивают, как правило, небольшое количество дикторов, в итоге расширить круг пользователей является непростой задачей. Проблемами являются: пол, диалект, степень владения языком, т.е. языковой опыт диктора, и другие индивидуальные характеристики диктора. Кроме того, даже голос одного человека может звучать по-разному, в зависимости от того, чем он занят в конкретный момент, влияет также эмоциональное состояние человека, и его здоровье (каждый, наверное, сталкивался с явлением появления хрипоты в горле). Современные же системы требуют четкого и ясного произнесения слов.

6. Проблема подстройки: зачастую требуется серьезная предварительная настройка систем (например, неоднократное повторение слова диктором). При увеличении словаря скорее всего придется отказаться от солидной настройки систем.

7. Проблема обучения пользователя синтаксису и словарю систем, что не намного легче, чем обучение языкам программирования. Диктор не может без большого напряжения приобрести новые навыки в произношении и артикуляции.

8. Проблема шумов в окружающей обстановке. Современные системы распознавания достаточно чувствительны к шумам, которые могут исказить звуковой сигнал и препятствовать тем саамы распознанию речи.

9. Проблема машинного перевода текстов с одного языка на другой. В современном мире большую роль играет разработка методов информационного поиска. [1, с.506-507; 4, с. 93-104; http://ru.wikipedia.org/wiki/Обработка_естественного_языка]



Заключение

Общество меняется, вместе с ним меняется техника. И бессмысленно в наше время, я считаю, говорить об отрицательном влиянии техники на человека. Техника стала уже частью нас, кроме того она управляема и полностью подчинена человеку. За все ее сбои и неполадки ответственен лишь человек, как и за ее прогресс. Она наш помощник, без которого мы практически бессильны. Она помогает человеку развиваться, в то же время человек постоянно вносит какой-либо вклад в развитие самой техники.

Взаимодействие человека с компьютером радикально преобразовало сознание первого. Человек видит мир глазами компьютера, работая с формальными понятиями и объектами, создавая алгоритмы процессов, или изучая основы искусственного интеллекта.

С точки зрения социологии, техника и здесь вносит свой вклад. Она позволяет людям взаимодействовать друг с другом, и не зависеть при этом от времени и расстояния. Телекоммуникации становятся нашим спутником по жизни, позволяя общаться с людьми, которые отдалены от нас на тысячи километров.

Кроме того, совершенствуя коммуникацию «человек-компьютер», человек лучше научился понимать самого себя. Он глубже исследует психологию, пытаясь понять, что движет теми или иными его поступками, что является причиной тех или иных действий, реакций человека. Ведь без этих знаний он не сможет построить механизм, понимающий человека. Ученые, совершенствуя методы коммуникаций между человеком и машиной пытаются приблизить взаимодействие «человек-компьютер» к взаимодействию «человек-человек».

Таким образом, взаимодействие человека и компьютера представляет собой не просто общение человека с техникой, а двустороннюю взаимообогащающую коммуникацию, активный процесс взаимодействия человека с информационным богатством накопленного веками человеческого опыта.

Современные компьютерные средства, по сравнению с программами пяти- или десятилетней давности, позволяют лучше визуализировать представление информации, отображать процессы и явления в динамике, использовать во время диалога «человек – компьютер» не только текст, но и графические изображения, анимацию, звук, использовать информацию, созданную в других программах. Все это позволяет улучшить диалог обучающей программы с пользователем, расширить сферы применения программы.

Тем не менее компьютерные устройства еще во многом уступают человеку. Но прогресс в развитии техники продолжает набирать скорость. Наука делает упор на создание интеллектуальных роботов. Их появление значительно облегчит и усовершенствует деятельность людей в различных сферах. Роботы смогут заменить человека там, где его труд сопряжен с опасными условиями, либо с тяжелыми физическими нагрузками. Для их создания человеку просто необходимо изучить тщательнейшим образом наиболее эффективные способы коммуникации человека и компьютера и особенности их взаимодействия.

Список литературы:

  1. Р.К. Потапова. Речь: коммуникация, информация, кибернетика. М., Изд-во «Радио и связь», 1997.

  2. Р.К. Потапова. Тайны современного кентавра. М., Изд-во «Радио и связь», 1992.

  3. «Искусственный интеллект» и психология. М., Изд-во «Наука», 1976.

  4. Р.К. Потапова. Введение в лингвокибернетику. М., МГЛУ, 1990

  5. Социальные и методологические проблемы информатики // Вопросы философии. 1986. № 11

  6. Смолян Г.Л., Шошников К.Б. Феномен персональной ЭВМ: Философско-методологический аспект // Вопросы философии. 1986. № 6

  7. Тыщенко О.Б. Диалоговое взаимодействие в системе "человек - компьютер" // Компьютерная хроника, 1999, № 9, стр. 33-36.

  8. Материалы с сайтов http://ru.wikipedia.org/wiki/, http://erichware.com/litvor/zrenie/analizob.htm.

© Рефератбанк, 2002 - 2024