Реферат: Нейросетевые методы распознавания изображений - текст реферата. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Реферат

Нейросетевые методы распознавания изображений

Банк рефератов / Компьютерные сети

Рубрики  Рубрики реферат банка

закрыть
Категория: Реферат
Язык реферата: Русский
Дата добавления:   
 
Скачать
Microsoft Word, 232 kb, скачать бесплатно
Заказать
Узнать стоимость написания уникального реферата

Узнайте стоимость написания уникальной работы

НЕЙРОСЕТЕВЫЕ МЕТОДЫ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИ Й Выполнен обзор нейросетевых методов , используемых при распознава нии изображений . Нейросетевые методы - это мето ды , базирующиеся на применении различных ти пов нейронных сетей (НС ). Основные напр авления применения различных НС для распознав ания образов и изображений : · применение для извлечение ключевых ха рактеристик или признаков заданных образов , · классификация самих образов или уже извлечённых из них хар актеристик (в первом случае извлечение ключевых характеристик происходит неявно внутр и сети ), · решение оптимизационных задач . Архитектура искусст венных НС имеет некоторое сходство с есте ственными нейронными сетями . НС , предназначенные для решения различ ных задач , могут существенно различаться алгоритмами функционирования , но их главные свойства следующие [1-3]. НС состоит из элементов , называемых фо рмальными нейронами , которые сами по себе очень просты и связаны с другими нейронам и . Каждый нейрон прео бразует набор сиг налов , поступающих к нему на вход в вы ходной сигнал . Именно связи между нейронами , кодируемые весами , играют ключевую роль . Од но из преимуществ НС (а так же недоста ток при реализации их на последовательной архитектуре ) это то , что все эле м енты могут функционировать параллельно , т ем самым существенно повышая эффективность ре шения задачи , особенно в обработке изображени й . Кроме того , что НС позволяют эффективно решать многие задачи , они предоставляют м ощные гибкие и универсальные механизмы о б учения , что является их главным преимуществом перед другими методами [4,5] (вероя тностные методы , линейные разделители , решающие деревья и т.п .). Обучение избавляет от не обходимости выбирать ключевые признаки , их зн ачимость и отношения между признаками . Н о тем не менее выбор исходного представления входных данных (вектор в n-м ерном пространстве , частотные характеристики , вэйв леты и т.п .), существенно влияет на качество решения и является отдельной темой . НС обладают хорошей обобщающей способностью (лучше ч е м у решающих деревьев [5]), т.е . могут успешно распространять опыт , полученны й на конечном обучающем наборе , на всё множество образов. Опишем применение НС для распознавания изображений , отмечая возможности применения для распознавания человека по изображе нию лица. 1. Многослойные нейронные сети Архитектура многосл ойной нейронной сети (МНС ) состоит из посл едовательно соединённых слоёв , где нейрон каж дого слоя своими входами связан со всеми нейронами предыдущего слоя , а выходами - с ледующего . НС с двумя реша ющими слоями может с любой точностью аппроксимировать любую многомерную функцию . НС с одним р ешающим слоем способна формировать линейные р азделяющие поверхности , что сильно сужает кру г задач ими решаемых , в частности такая сеть не сможет решить задачу тип а “исключающее или” . НС с нелинейной функцией активации и двумя решающими слоями позволяет формировать любые выпуклые области в пространстве решений , а с тремя реш ающими слоями - области любой сложности , в том числе и невыпуклой . При этом МНС н е теряет сво е й обобщающей способн ости . Обучаются МНС при помощи алгоритма о братного распространения ошибки , являющегося мето дом градиентного спуска в пространстве весов с целью минимизации суммарной ошибки сет и . При этом ошибки (точнее величины коррек ции весов ) распро с траняется в обра тном направлении от входов к выходам , скво зь веса , соединяющие нейроны. Простейшее применение однослойной НС [6] (на зываемой автоассоциативной памятью ) заключается в обучении сети восстанавливать подаваемые изо бражения . Подавая на вход тест овое изо бражение и вычисляя качество реконструированного изображения , можно оценить насколько сеть распознала входное изображение . Положительные с войства этого метода заключаются в том , чт о сеть может восстанавливать искажённые и зашумленные изображения , н о для б олее серьёзных целей он не подходит. Рис . 1. Многослойная нейронная се ть для классификации изображений . Нейрон с максимальной активностью (здесь первый ) указыва ет принадлежность к распознанному классу. МНС так же используется для непосредс твенной классификации изображений – на вход по даётся или само изображение в каком-либо виде , или набор ранее извлечённых ключевых характеристик изображения , на выходе нейрон с максимальной активностью указывает принадлежность к распознанному классу (рис . 1). Если эта активность ниже некоторого порог а, то считается , что поданный образ н е относится ни к одному из известных классов . Процесс обучения устанавливает соответст вие подаваемых на вход образов с принадле жностью к определённому классу . Это называетс я обучением с учителем . В применении к распознав а нию человека по изображе нию лица , такой подход хорош для задач контроля доступа небольшой группы лиц . Тако й подход обеспечивает непосредственное сравнение сетью самих образов , но с увеличением числа классов время обучения и работы сети возрастает экспонен ц иально . Поэт ому для таких задач , как поиск похожего человека в большой базе данных , требует извлечения компактного набора ключевых характе ристик , на основе которых можно производить поиск. Подход к классификации с использованием частотных характеристик все го изображени я , описан в [7]. Применялась однослойная НС , о снованная на многозначных нейронах . Отмечено 100% распознавание на базе данных MIT, но при эт ом осуществлялось распознавание среди изображени й , которым сеть была обучена. Применение МНС для классиф икации изображений лиц на основе таких характеристик , как расстояния между некоторыми специфическ ими частями лица (нос , рот , глаза ), описано в [8]. В этом случае на вход НС пода вались эти расстояния . Использовались так же гибридные методы – в первом на вх о д НС подавались результаты обраб отки скрытой марковской моделью , а во втор ом – результат работы НС подавался на вход марковской модели . Во втором случае преимуществ не наблюдалось , что говорит о том , что результат классификации НС достато чен. В [9] показан о применение НС для классификации изображений , когда на вход се ти поступают результаты декомпозиции изображения по методу главных компонент. В классической МНС межслойные нейронные соединения полносвязны , и изображение предст авлено в виде одномерного векто ра , хот я оно двумерно . Архитектура свёрточной НС [10] направлена на преодоление этих недостатков . В ней использовались локальные рецепторные по ля (обеспечивают локальную двумерную связность нейронов ), общие веса (обеспечивают детектирован ие некоторых черт в любом месте изображения ) и иерархическая организация с пространственными подвыборками (spatial subsampling). Свёрточная НС (СНС ) обеспечивает частичную устойчивость к изменениям масштаба , смещениям , поворотам , искажени ям . Архитектура СНС состоит из мног и х слоёв , каждый из которых имеет н есколько плоскостей , причём нейроны следующего слоя связаны только с небольшим числом нейронов предыдущего слоя из окрестности лок альной области (как в зрительной коре чело века ). Веса в каждой точке одной плоскости одинак о вы (свёрточные слоя ). За свёрточным слоем следует слой , уменьшающий его размерность путём локального усреднения . Затем опять свёрточный слой , и так далее . Таким образом , достигается иерархическая орг анизация . Более поздние слои извлекают более общие харак т еристики , меньше зави сящие от искажений изображения . Обучается СНС стандартным методом обратного распространения ошибки . Сравнение МНС и СНС [10] показало с ущественные преимущества последней как по ско рости , так и по надёжности классификации . Полезным сво й ством СНС является и то , что характеристики , формируемые на вы ходах верхних слоёв иерархии , могут быть п рименимы для классификации по методу ближайше го соседа (например , вычисляя евклидово рассто яние ), причём СНС может успешно извлекать такие характеристи к и и для образо в , отсутствующих в обучающем наборе . Для С НС характерны быстрая скорость обучения и работы . Тестировании СНС на базе данных ORL, содержащей изображения лиц с небольшими и зменениями освещения , масштаба , пространственных п оворотов , положения и различными эмоци ями , показало приблизительно 98% точность распознава ния , причём для известных лиц , предъявлялись варианты их изображений , отсутствующие в об учающем наборе . Такой результат делает эту архитектуру перспективной для дальнейших разра боток в об л асти распознавания изо бражений пространственных объектов. МНС применяются и для обнаружения объ ектов определённого типа . Кроме того , что любая обученная МНС в некоторой мере може т определять принадлежность образов к “своим” классам , её можно специально обу чить надёжному детектированию определённых классов . В этом случае выходными классами будут классы принадлежащие и не принадлежащие к заданному типу образов . В [11] применялся не йросетевой детектор для обнаружения изображения лица во входном изображении . И з ображение сканировалось окном 20х 20 пикселей , которое подавалось на вход сети , решающе й принадлежит ли данный участок к классу лиц . Обучение производилось как с использ ованием положительных примеров (различных изображ ений лиц ), так и отрицательных (изобра ж ений , не являющихся лицами ). Для повыше ния надёжности детектирования использовался колл ектив НС , обученных с различными начальными весами , вследствие чего НС ошибались по разному , а окончательное решение принималось голосованием всего коллектива. Рис . 2. Главные компоненты (собств енные лица ) и разложение изображения на гл авные компонен ты. НС применяется так же для извлечения ключевых характеристик изображения , которые затем используются для последующей классификации . В [1,6], показан способ нейросетевой реализации метода анализа главных компонент . Суть ме тода анализа главных компоне нт заключаетс я в получении максимально декореллированных к оэффициентов , характеризующих входные образы . Эти коэффициенты называются главными компонентами и используются для статистического сжатия изображений , в котором небольшое число коэффи циентов исполь з уется для представлени я всего образа . НС с одним скрытым сло ем содержащим N нейронов (которое много меньше чем размерность изображения ), обученная по методу обратного распространения ошибки восста навливать на выходе изображение , поданное на вход , формируе т на выходе скрыт ых нейронов коэффициенты первых N главных комп онент , которые и используются для сравнения . Обычно используется от 10 до 200 главных компон ент . С увеличением номера компоненты её ре презентативность сильно понижается , и использоват ь компонен т ы с большими номерами не имеет смысла . При использовании нелине йных активационных функций нейронных элементов возможна нелинейная декомпозиция на главные компоненты . Нелинейность позволяет более точно отразить вариации входных данных . Применяя анализ глав н ых компонент к дек омпозиции изображений лиц , получим главные ко мпоненты , называемые собственными лицами (holons в работе [6]), которым так же присуще полезное свойство – существуют компоненты , которые в основном отражают такие существенные характе ристики л ица как пол , раса , эмоци и . При восстановлении компоненты имеют вид , похожий на лицо , причём первые отражают наиболее общую форму лица , последние – различные мелкие отличия между лицами (рис . 2). Такой метод хорошо применим для поиска похожих изображений л и ц в бо льших базах данных . Показана так же возмож ность дальнейшего уменьшения размерности главных компонент при помощи НС [6]. Оценивая качест во реконструкции входного изображения можно о чень точно определять его принадлежность к классу лиц. 2. Нейронные се ти высокого порядка Нейронные сети высокого порядка (НСВП ) отличаются от МНС тем , что у них только один слой , но на входы нейронов поступают так же тер мы высокого порядка , являющиеся произведением двух или более компонент входного вектора [1]. Такие сети т ак же могут формирова ть сложные разделяющие поверхности. В [12] показано применение НСВП строго тр етьего порядка для распознавания изображений лиц , имеющих произвольные масштабы и двумерны е повороты . Приведены методы обучения таких сетей . Особенность такой сети заключаются в том , что для обучения некоторому кл ассу достаточно предъявить его образ без вариаций масштабов и поворотов – после о бучения сеть будет распознавать известные кла ссы инвариантно к масштабу и поворотам . Та кая сеть не является полносвязно й , быстро обучается и работает . Отмечено сущес твенное повышение точности классификации такой сетью повёрнутых и масштабированных изображени й по сравнению с МНС. 3. Нейронные се ти Хопфилда НС Хопфилда (НСХ ) является однослойной и полносвязной (связи нейронов на самих себя отсутствуют ), е ё выходы связаны со входами . В отличие от МНС , НСХ является релаксационной – т.е . будучи установленной в начальное состояни е , функционирует до тех пор , пока не до стигнет стабильного состояния , которое и буде т являться её выхо д ным значением . НСХ применяются в качестве ассоциативной памяти и для решения оптимизационных задач . В первом случае НСХ обучается без уч ителя (например , по правилу Хебба ), во второ м случае веса между нейронами изначально кодируют решаемую задачу . НСХ быва ю т синхронными , когда одновременно пересчи тываются все нейроны и асинхронными , когда пересчитывается случайно выбранный нейрон . Для исследования динамики функционирования НСХ и спользуются методы Ляпунова . Показано [1], что ас инхронная НСХ всегда сходится к ус тойчивым точкам , а аттракторами синхронной НС Х являются устойчивые стационарные точки и предельные циклы длины два . Таким образом НСХ из начального состояния сходится к ближайшему локальному минимуму энергии сети , состояние нейронов в котором и будет во с становленным образом для задач р аспознавания , и решением – для оптимизационн ых задач . Для поиска глобального минимума применительно к оптимизационным задачам использу ют стохастические модификации НСХ [1]. Применение НСХ в качестве ассоциативной памяти позв оляет точно восстанавливать образы , которым сеть обучена , при подаче на вход искажённого образа . При этом сеть “вспомнит” наиболее близкий (в смысле локального минимума энергии ) образ , и таким образом распознает его . Такое функционирован ие так же можно пр е дставить к ак последовательное применение автоассоциативной памяти , описанной выше . В отличие от автоа ссоциативной памяти НСХ идеально точно восста новит образ . Для избежания интерференционных минимумов и повышения ёмкости сети используют различные методы [ 1 ,13]. В работе [13] описано применение НСХ , где распознаваемое и зображение лица сначала подавалось на НСХ , выход которой затем сравнивался с хранимым и изображениями . Отмечено , что предварительная обработка входного изображения при помощи НСХ существенно п о вышает точность распознавания. Применение НСХ в качестве оптимизационног о метода для восстановления пространственной формы лица по двумерному полутоновому изображ ению (а так же для детектирования граней ) описано в [14]. Здесь используется вариация НСХ – яч еистая нейронная сеть (ЯНС ), в которой нейроны связаны только с бли жайшими соседями из двумерной области . Матриц а связей одинакова для всех нейронов и определяется характером задачи . Отмечаются хоро шие результаты восстановления трёхмерной формы (в частнос т и для изображений ли ц ) и высокая скорость работы. 4. Самоорганизующие ся нейронные сети Кохонена Самоорганизующиеся нейронные сети Кохонена (СНСК ) обеспечивают то пологическое упорядочивание входного пространства образов . Они позволяют топологически непрерыв но отображать входное n-мерное пространств о в выходное m-мерное , m<

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, реферат по компьютерным сетям "Нейросетевые методы распознавания изображений", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2016
Рейтинг@Mail.ru