Реферат: Гомоморфная обработка речи - текст реферата. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Реферат

Гомоморфная обработка речи

Банк рефератов / Информатика, информационные технологии

Рубрики  Рубрики реферат банка

закрыть
Категория: Реферат
Язык реферата: Русский
Дата добавления:   
 
Скачать
Архив Zip, 308 kb, скачать бесплатно
Заказать
Узнать стоимость написания уникального реферата

Узнайте стоимость написания уникальной работы

17 БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ факультет телекоммуникаций кафедра Сетей и устройств телекоммуникаций РЕФЕРАТ На тему: «Гомоморфная обработка речи» МИНСК, 2008 1 Структурные схемы гомоморфной обработки и анализа речевых сигналов Одно из основных предположений состоит в том, что речевой сигнал трактуется как сигнал на выходе линейной системы с мед ленно изменяющимися параметрами. Это предположение позволяет считать, что на коротких сегментах речевой сигнал можно рассматривать как сигнал на вы ходе линейной системы с постоянными параметрами, возбуждаемой либо последовательностью импульсов, либо случайным шумом.. Поскольку сигнал возбуждения и импульсная характеристика фильтра взаимодействуют через операцию свертки, задача анализа речи может рассматриваться как задача разделения компонент, участвующих в операции свертки. Такая задача иногда называется задачей обратной свертки. Гомоморфные относительно свертки системы . Гомоморфные относительно свертки системы удовлетворяют обобщенному принципу суперпозиции. Принцип суперпозиции для линейных систем можно представить в виде следующих соотношений ( 1 ) ( 2 ) где L – линейный оператор. Принцип суперпозиции устанавливает, что если сигнал на входе является линейной комбинацией элементарных сигналов, то и сигнал на выходе будет представлен в виде линейной комбинации соответствующих сигналов. Прямым следствием принципа суперпозиции является тот факт, что сигнал на выходе линейной системы может быть представлен в виде дискретной свертки: ( 3 ) где – импульсн ый отклик линейн ой системы. Этот принцип иллюстрируется на рис. 1, где символ « + » на входе и выходе означает, что аддитивная комбинация сигналов на входе приво дит к аддитивной комбинации выходных сигналов. а) б) Рис. 1. Представление линейной системы, для которой выполняется п ринцип суперпозиции (а) и гомо мо рфной относительно свертки (б) Символ « * » означает свертку в дискретном времени. По аналогии с принципом суперпозиции для обычных линейных систем определим класс систем, удовлетворяющих обобщенному принципу суперпозиции, в котором сложение заменяется сверткой (легко показать, что свертка обладает такими же алгебраичес кими свойствами, как и сложение: (4) Системы, обладающие свойством ( 4 ), названы гомо морфными относительно свертки системами. Эта терминология объясняется тем, что данные преобразования оказываются гомоморфными преобразованиями линейного векторного пространства. При изображении таких систем (рис. 1, б ) операцию свертки представляют в явном виде на входе и выходе системы. Гомоморфный фильтр является гомоморфной системой, обладающей тем свойством, что одна компонента (выделяемая) проходит через эту систему без изменений, а другая – устраняется. В соотношении ( 4 ), например, если – нежелательная компонента, то необходимо потребовать, чтобы выход, соответствующий , представлял собой единичный отсчет, в то время как выход, соответствующий , близко совпадал бы с . Важным аспектом теории гомоморфных систем является то, что любая из них может быть представлена в виде каскадного соединения трех гомоморфных систем ( 2 ) для случая систем, гомоморфных относительно свертки. Первый блок преобразует компоненты на входе, представленные в виде свертки, в аддитивную сумму на выходе. Второй блок – обычная линейная система, удовлетворяющая принципам суперпозиции в соответствии с (1). Рис. 2 . Каноническая форма системы, гомоморфной относительно свертки Третий блок является обратным первому, т. е. преобразует сигналы, представленные в виде суммы, в сигналы, представл енные в виде свертки. Важность данного канонического представления заключается в том, что разработка гомоморфной системы сводится к разработке линейной системы. Блок , обозначаемый и называемый х арактеристическим блоком гомоморфной относительно свертки системы, фиксирован при каноническом представлении ( рис. 2 ) . Очевидно, что обратное преобразование также фиксировано. Характеристическая система для гомоморфной обратной свертки подчиняется обобщенному принципу суперпозиции, в котором операция на входе – свертка, а на выходе – обычное сложение. Свойства характеристической системы определяются выражением ( 5 ) Аналогично обратная характеристическая система удовлетворяет соотношению (6) Математическое описание характеристической системы определяется требованиями к выходному сигналу. Если на входе имеется сигнал свертки, то ( 7 ) и z -преобразование входного сигнала имеет вид . ( 8 ) Из ( 5 ) очевидно, что z -преобразование сигнала на выходе системы должно представлять собой сумму z -преобразований компонент. Таким образом, в частотной области характеристическая система для свертки должна обладать следующим свойством: если на входе имеется произведение компонент, то на выходе должна возникнуть их сумма. Один из подходов к синтезу такой системы представлен на рис. 3 . Рис. 3 . П редставление системы, гомоморфной относительно свертки в частотной области Этот подход основан на том, что логарифм произведения равен сумме логарифмов сомножителей, т. е. ( 9 ) Если необходимо представлять сигналы во временной, а не в частотной области, то характеристическая система примет вид, представленный на рис. 4 . Рис. 4 . Представление характеристической системы, гомоморфной относительно свертки Аналогичное обратное преобразование показано на рис. 5 . Рис.5. Представление характеристической системы, обратной гомоморфной системе Представление прямой и обратной характеристических систем зависит от справедливости соотношения ( 9 ). Таким образом, логарифм должен быть определен так, чтобы логарифм произвеления равнялся сумме логарифмов сомножителей. Это тривиально для действительных положительных величин. Однако в общем случае z -преобразование имеет комплексный характер и вопрос единственности логарифма комплексной случайной величины чрезвычайно важен. С точки зрения вычислений целесообразно рассмотреть случай, когда ( 9 ) справедливо на единичной окружности, т. е. для . Для решаемых задач цифровой обработки вполне подходит определение логарифма в виде ( 10 ) В этом соотношении действительная часть не вызы в ает трудностей. Проблема единственности возникает при определении мнимой части (т.е. ), которая представляет собой фазовый угол z -преобразования, вычисленного на единичной окружности. О дним из подходов к решению проблемы единственности является предположение, что фазовый угол представляет собой непрерывную нечетную функцию. В этих условиях уравнение ( 9 ) справедливо. С учетом возможности вычисления комплексного логарифма, удовлетворяющего ( 9 ), обратное преобразование комплексного логарифма преобразования Фурье входного сигнала, являющееся выходом характеристической системы для свертки, имеет вид ( 1 1 ) Выход характеристической системы назван «комплексным кепстром» (термин «кепстр» я вляется в настоящее время общепринятым для обозначения обратного преобразования Фурье логарифма спектра мощности сигнала; термин «комплексный кепстр» означает, что применяется комплексный логарифм). Термин «кепстр» используется для величины ( 1 2 ) П оследовательность с(п) представляет собой четную часть комплексного кепстра : . Таким образом, определена характеристическая система для го моморфной свертки и каноническая форма всех гомоморфных систем относительно свертки. Все системы этого класса отличаются только линейной частью. Выбор линейной системы определяется свойствами входного сигнала. Следовательно, для правильного построения линейной системы необходимо прежде всего определить вид и структуру сигнала на выходе характеристической системы, т.е. рассмотреть свойства комплексного кепстра для типичных входных сигналов. 2. Комплексный кепстр речи Модели сигналов, с одной стороны, и методы анализа во временной области – с другой, можно объединить и эффективно использовать в теории гомоморфной фильтрации речи. Вспомним, что модель речеобразования обязательно состоит из линейной системы с медленно изменяющимися во времени параметрами и сигнала возбуждения в виде последовательности импульсов или белого шума. Поэтому короткий сегмент вокализованного речевого сигнала целесообразно рассматривать как результат воздействия сигнала возбуждения в виде последовательности импульсов на линейную систему с постоянными параметрами. Аналогично короткий сегмент невокализованного сигнала можно представить как результат возбуждения линейной системы с постоянными параметрами случайным шумом. Короткий сегмент вокализованной речи можно представить в виде ( 13 ) г де – периодическая импульсная последовательность с периодом N p отсчетов ; – импульсная характеристика линей ной системы, отражающая эффект формы источника возбуждения g ( n ), импульсную характеристику речевого тракта и импульсную характеристику Короткий сегмент невокализованной речи можно представить в виде ( 14 ) где – сигнал возбуждения в виде случайного шума; – импульсная реакция системы, объединяющая воздействие речевого тракта и излучения. Для случая вокализованной речи передаточная функция линейной системы имеет вид ( 15 ) Для невокал и зованной речи получаем ( 16 ) К омплексный кепстр быстро затухает с ростом п. Кроме того, отметим, что вклад в комплексный кепстр от периодического возбуждения проявится в наличии импульсов в точках, кратных периоду во збуждения. Пример анализа (рис. 6 ) иллюстрирует основные особенности вокализованного речевого сигнала. а) б) в) г) д) е) Рис. 6. Гоморфный анализ вокализованный речи: а) взвешенный речевой сигнал; б) логарифм модуля кратковременного Фурье; в) значение фазы; г) «развернутая» фаза; д) комплексный кепстр; е) кепстр На рис. 6 , а показан сегмент вокализованного сигнала, взвешенный с окном Хемминга. На рис. 6,б представлен логарифм модуля дискретного преобразования Фурье. В этой функции имеется периодическая компонента, обусловленная периодическим характером входного сигнала. На рис. 6 , в представлен разрывной характер главного значения фазы, а на рис. 6 , г – фазовая кривая, лишенная разрывов. Результат преобразования Фурье в комплексный кепстр кривых на рис. 6 ,б и 6 , г представлен на рис. 6 ,д. Отметим наличие пиков в положительном и отрицательном времени и быстрое затухание компонент в области малых времен, что обусловлено совместным воздействием речевого тракта, источника возбуждения и излучением. Кепстр, являющийся обратным преобразованием Фурье логарифма амплитуды модуля спек тра, показан на рис.6 , е. В данном случае сохранены все основные о собенности комплексного кепстра , поскольку он является четной частью комплексного кепстра. Последовательность графиков на рис. 6 показывает, как можно использовать гомоморфную фильтрацию для анализа речевого сигнала. Прежде всего отметим, что импульс в кепстре, обусловленный квазипериодическим возбуждением, оказывается отделенным от остальных компонент. Это приводит к соответствующей системе гомоморфной фильтрации речевого сигнала, представленной на рис. 7 . Рис. 7. Реализация системы гомоморфной фильтрации речи Сегмент речевого сигнала взвешивается с некоторым окном и требуемые компоненты кепстра выделяются с ис пользованием «окна по кепстру» . Если выбрать в соответствии ссотношением (17) где выбрано меньшим, чем период основного тона , то выходной сигнал аппроксимирует импульсную реакцию, определяемую (13). Этот вид фильтрации иногда называют «частотно-инвариантной линейной фильтрацией». Если выбрать 1 п) таким образом, чтобы восстановить компоненты возбуждения, т. е. (18). то выходной сигнал аппроксимирует импульсную последовательность возбуждения, амплитуды которой затухают в соответствии с весами окна Хемминга, примененного при взвешивании входного сигнала. В результате взвешенный комплексный кепстр подвергается обратному преобразованию для получения требуемых компонент. Таким образом, с помощью гомоморфной фильтрации можно выделить ряд важных компонент речевого сигнала. Чаще сталкиваются с необходимостью оценки таких параметров, как период основного тона и частоты формант. Для этих целей кепстральный анализ весьма эффективен. Для вокализованного сегмента речи пик в кепстре возникает при задержке, соответствующей периоду основного тона. Для невокализованного сегмента такие пики в кепстре не возникают. Это свойство кепстра может быть использовано для классификации вокализованный/невокализованный и для периода основного тона на вокализованной речи. Частоты формант также можно определить с использованием логарифма модуля передаточной функции речевого тракта, ко торая вычисляется по кепстру с помощью кепстрального окна ( 17 ). 3. Оценивание основного тона на основе кепстра Метод оценивания основного тона на основе кепстрального анализа достаточно прост. Вычисленный к епстр исследуется с целью отыскания пика в области возможных значений основного тона. Если пик в кепстре превышает порог, то сегмент классифицируется как вокализованный, а координата пика дает хорошую оценку периоду основного тона. Если максимум кепст pa н e пре вышает -порога, то сегмент к лассифицируется как невокал и зованный. Изменение во времени типа возбуждения и периода ос н о вн ого тона можно оценить с использованием зависяще го от времени кепстра, что достигается на основе вычисления зависящего от времени преобразования Фурье. Обычно кепстр вычисляется 1 раз через каждые 10 – 20 мс, поскольку в нормальной речи параметры возбуждения не изменяются быстрее. Г омоморф ный анализ позволяет по строить очень простой и эффективный алгоритм выделения основного тона и классификации речи на вокализованную/невокализованную. К сожалению, имеется ряд практических вопросов и трудностей, которые возникают при построении кепстральных анализаторов основного тона. Во-первых, наличие выброса в кепстре в диапазоне 3— 20 мс очень точно указывает на то, что данный сегмент является вокализованным. Однако отсутствие пика или наличие слабого пика не означает, что данный сегмент является невокализованным. Амплитуда или даже просто существование пика в кепстре зависит от целого ряда факторов, включая длину окна, используемого для взвешивания входного сигнала, и формантной структуры самого сигна ла. Заметим, , что наибольшая амплитуда пика в кепстре равна единице. Это достигается только в случае абсолютного совпадения периодов основного тона. Это, конечно, совершенно не достижимо в реальном случае, даже если использовать прямоугольное временное окно, включающее целое число периодов. Прямоугольные временные окна применяются весьма редко вследствие худших результатов, даваемых ими при оценивании спектра. В случае, например, окна Хемминга очевидно, что как протяженность окна, так и его относительное расположение по отношению к речевому сигналу будут оказывать значительное влияние на величину наибольшего пика в кепстре. Как крайний случай предположим, что окно имеет протяженность менее двух периодов основного тона. Очевидно, что при этом трудно ожидать точного оценивания периодичности по спектру или кепстру сигнала. Таким образом, протяженность окна может оказаться такой, что с учетом уменьшения амплитуды данных к границам выборки, по крайней мере, два периода основного тона пропадут во взвешенных данных. Для мужской речи с низкой частотой основного тона требуется окно порядка 40 мс. Для голосов с более высокой частотой основного тона требуются пропорционально меньшие окна. Желательно, конечно, выбирать окно настолько малым, насколько это возможно, чтобы избежать значительных изменений параметров сигнала на протяжении используемого сегмента. Чем длиннее окно, тем значительнее изменения параметров в пределах окна и тем больше отклонение от принятой модели анализа. Один из способов выбора окна, при котором оно было и не слишком длинным и не слишком коротким, состоит в адаптации длины окна с учетом предшествующих (или возможно среднего значения) оценок периодов основного тона . Другая причина, по которой сигнал может сильно отличаться от описываемого моделью, заключается в чрезмерном ограничении полосы. Ярким примером подобной неадекватности может служить синусоидальный сигнал. В логарифме спектра такой сигнал даст только один пик. Поскольку в спектре нет периодических колебаний, в кепстре не будет пиков. В речевом сигнале вокализованные сегменты обычно очень узкополосны с плохо выра женной гармонической структурой на частотах выше нескольких сотен герц. В этом случае пики в кепстре отсутствуют. К счастью, для любых значений периода, за исключением самых коротких, область, в которой возникают пики в кепстре, не содержит других компонент, кроме основного тона. Таким образом, для определения положения импульса основного тона можно использовать достаточно низкий порог (порядка 0,1). При правильно подобранной протяженности окна на входе положение и амплитуда импульса кепстра обеспечивают в большинстве случаев хорошую оценку периода основного тона и классификации тон/шум. В тех случаях, когда кепстральный анализ не позволяет точно ответить на вопрос о наличии импульсов основного тона и значении периода, для вынесения окончательного решения можно привлечь дополнительную информацию о виде функции среднего числа переходов через нуль, энергии сигнала . 4 . Гомоморфный вокодер Г омоморфная обработка речевого сигнала приводит к весьма удобному описанию, где основные параметры сигнала отделены друг от друга, т. е. информация о сигнале возбуждения расположена в области больших времен, а информация о речевом тракте и форме импульса возбуждения – в области малых времен кепстра. Зависящий от времени комплексный спектр фактически содержит ту же информацию, что и текущий спектр с игнала, который, в свою очередь , является точным описанием речевого сигнала. Кепстральное представление, однако, не использует информации о фазе сигнала, содержащейся в преобразовании Фурье, и поэтому кратковременный кепстр не позволяет единственным образом описать речевое колебание. Тем не менее на основе кепстра можно оценить формантные-частоты, период основного тона и классифицировать сигнал как вокализованный или невокализованный. Кепстр ис пользуется также для непосредственного описания речи в системах, называемых гомоморфными вокодерами. В гомоморфном вокодере кепстр вычисляется 1 раз через каждые 10 – 20 мс. Период основного тона и признак тон/шум оцениваются по кепстру, а компоненты кепстра в области малых времен (примерно первые 30 отсчетов) квантуются и кодируются для передачи или хранения. По квантованным отсчетам кепстра в области малых времен в синтезаторе восстанавливается импульсная реакция h v ( n ) или h u ( n ) и вычисляется свертка с функцией возбуждения, восстановленной в синтезаторе по информации об основном тоне, признаке тон/шум и соответствующих амплитудах. Этот а лгоритм представлен на рис. 8 . Рис. 8 . Структурная схема гомоморфного вокодера: а) анализатор; б) синтезатор На рис. 8 , а показан анализатор. Сначала вычисляется к епстр , а затем с помощью кепстрального окна выделяется область малых времен. Для этого использ уется обычно первые 26 отсчетов кепстра. Полный кепстр использовался также для выделения информации и об основном тоне и признаке тон/шум . Информация о сигнале возбуждения совместно с квантованными значениями кепстра использовалась для цифрового представления сигнала и передавалась по каналу 50 – 100 раз в секунду. Для синтеза входного сигнала по кепстральному описанию вычислялась импульсная реакция. Поскольку кепстр – это четная функция времени , то для построения кепстра достаточно з нать лишь его часть, локализованную в области положительного времени. Преобразование Фурье части кепстра в области малых времен приводит к логарифму передаточной функции, описывающей совместное влияние речевого тракта, формы импульса возбуждения и излучения. Однако фаза в данном случае равна нулю. В схеме на рис. 8 ,б преобразование Фурье изменяется для получения действительного четного преобразования, обратное преобразован которого представляет собой «импульсную характеристику». являющуюся четной функцией. Импульсн ую характеристику , полученн ую таким образом по кепстру , можно свернуть с последовательностью импульсов, отстоящих друг от друга на период основного тона для вокализованной речи, и с равноотстояще й последовательностью импульсов случайной полярности для невокализованных сегментов. По логарифмическому спектру можно получить и минимально-фазовую импульсную характеристику, для чего следует использовать ке п стральное окно вида ( 1 9 Тесты на слуховое восприятие показали, что минимально-фазовое описание является наиболее предпочтительным. Это вполне естественно вследствие того, что минимально фазовый сигнал наиболее соответствует речевому сигналу. Гомоморфный вокодер, как и любые вокодерные системы, в которых пытаются разделить параметры речи на сигнал возбуждения и параметры речевого тракта, позволяет достигнуть малой скорости передачи и дополнительной гибкости при обработке речи ценой усложнения в описании и потерь в качестве. Данная система обладает тем преимуществом, что кепстр, требующий для. своего вычисления наибольших затрат, позволяет оценить как параметры речевого тракта, так и параметры возбуждения. Данный метод наиболее привлекателен, если имеется возможность использования БИС для вычисления ДПФ. ЛИТЕРАТУРА 1 . Блейхут Р. Быстрые алгоритмы цифровой обработки сигналов: Пер. с англ.-М.: Мир, 2002 . 2 . Гольденберг Л.М. и др. Цифровая обработка сигналов: Справочник.- М.: Радио и связь, 2007 . 3 . Рабинер Д., Гоулд Б. Теория и применение цифровой обработки сигналов.-М.: Мир, 2005 . 4 . Ахмед Н., Рао К.Р. Ортогональные преобразования при обработке цифровых сигналов.-М.: Связь, 2003 .
1Архитектура и строительство
2Астрономия, авиация, космонавтика
 
3Безопасность жизнедеятельности
4Биология
 
5Военная кафедра, гражданская оборона
 
6География, экономическая география
7Геология и геодезия
8Государственное регулирование и налоги
 
9Естествознание
 
10Журналистика
 
11Законодательство и право
12Адвокатура
13Административное право
14Арбитражное процессуальное право
15Банковское право
16Государство и право
17Гражданское право и процесс
18Жилищное право
19Законодательство зарубежных стран
20Земельное право
21Конституционное право
22Конституционное право зарубежных стран
23Международное право
24Муниципальное право
25Налоговое право
26Римское право
27Семейное право
28Таможенное право
29Трудовое право
30Уголовное право и процесс
31Финансовое право
32Хозяйственное право
33Экологическое право
34Юриспруденция
 
35Иностранные языки
36Информатика, информационные технологии
37Базы данных
38Компьютерные сети
39Программирование
40Искусство и культура
41Краеведение
42Культурология
43Музыка
44История
45Биографии
46Историческая личность
47Литература
 
48Маркетинг и реклама
49Математика
50Медицина и здоровье
51Менеджмент
52Антикризисное управление
53Делопроизводство и документооборот
54Логистика
 
55Педагогика
56Политология
57Правоохранительные органы
58Криминалистика и криминология
59Прочее
60Психология
61Юридическая психология
 
62Радиоэлектроника
63Религия
 
64Сельское хозяйство и землепользование
65Социология
66Страхование
 
67Технологии
68Материаловедение
69Машиностроение
70Металлургия
71Транспорт
72Туризм
 
73Физика
74Физкультура и спорт
75Философия
 
76Химия
 
77Экология, охрана природы
78Экономика и финансы
79Анализ хозяйственной деятельности
80Банковское дело и кредитование
81Биржевое дело
82Бухгалтерский учет и аудит
83История экономических учений
84Международные отношения
85Предпринимательство, бизнес, микроэкономика
86Финансы
87Ценные бумаги и фондовый рынок
88Экономика предприятия
89Экономико-математическое моделирование
90Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
Разговор жены и мужа.
Ж: У тебя гель для бритья закончился.
М: Как закончился?
Ж: Понятия не имею как, просто взял и закончился.
М: А как ты узнала, что закончился?
Ж: Ну, я ноги брила и случайно заметила, что закончился...
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, реферат по информатике и информационным технологиям "Гомоморфная обработка речи", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2016
Рейтинг@Mail.ru