Продеус А.Н., Климков В. О влиянии реверберационной помехи на точность измерений функции распределения уровней речевого сигнала - файл n1.doc

Продеус А.Н., Климков В. О влиянии реверберационной помехи на точность измерений функции распределения уровней речевого сигнала
скачать (1233 kb.)
Доступные файлы (1):
n1.doc1233kb.03.11.2012 10:50скачать

n1.doc


Вісник Національного університету "Львівська Політехніка". Комп'ютерні системи проектування. Теорія і практика. - №685. – 2010. - С.102-108

УДК 534.782.001:621.39

Продеус А.Н., канд. техн. наук, Климков В.

О влиянии реверберационной помехи на точность измерений функции распределения уровней речевого сигнала

Произведены аналитические и экспериментальные исследования влияния реверберационной помехи на точность измерений функции распределения уровней речевого сигнала.

Analytical and experimental investigations of influence of reverberation disturbances on measuring exactness of speech signal levels distributing function has been made.

Введение

В настоящее время среди методов акустической экспертизы помещений и линий связи наиболее популярны два объективных (инструментальных) метода – формантный и модуляционный [1]. Каждый из этих методов обладает определенными достоинствами и недостатками.

Важным достоинством форматного метода является выбор показателя качества в виде средней вероятности восприятия формант:

, (1)

где - вероятность пребывания формант в -той полосе частот:

, (2)

- функция распределения формант по частоте; - коэффициент восприятия речи; - отношение сигнал-шум в -той частотной полосе. Поскольку формантную разборчивость можно пересчитать в вероятность правильного распознавания звуков, слогов, слов и даже фраз, такой выбор чрезвычайно удобен, поскольку при использовании субъективных методов оценки разборчивости речи показателем качества также служит вероятность правильного распознавания звукосочетаний, слогов, слов или фраз.

Вместе с тем, формантному методу свойственен ряд недостатков, главными среди которых являются неоднозначность определения коэффициента восприятия для русской речи и тесно связанные с этим обстоятельством проблемы определения коэффициента восприятия для украинской речи, а также принципиальная трудность учета реверберационной помехи [1].

Замечательным свойством модуляционного метода является возможность одновременного учета влияния шумовой и реверберационной помех. Достигается это путем использования специального тестового сигнала в виде модулированного шума, с последующим измерением коэффициента модуляции и пересчете его в так называемое «эффективное» отношение сигнал-шум, учитывающее влияние не только шумовой, но и реверберационной помехи.

К недостатку модуляционного метода следует отнести то обстоятельство, что мерой разборчивости является не вероятность правильного восприятия речи, а некий индекс STI (Speech Transmition Index), так что для сопоставления результатов модуляционного и субъективного методов необходимо использовать специальные вспомогательные графики [1].

В работах [2, 3] предложено объединить достоинства обоих методов, а именно: измерять формантную разборчивость в соответствии с соотношением (1) с тем лишь отличием, что в качестве отношения сигнал-шум использовать «эффективное» отношение сигнал-шум, измеренное в соответствии с технологией модуляционного метода.

Эффективность нового «формантно-модуляционного» метода, как, впрочем, и классического форматного метода, в значительной степени зависит от качества предварительных исследований функцией и параметров, входящих в соотношение (1). В частности, эффективность нового метода зависит от точности предварительных измерений функции распределения уровней речевого сигнала , поскольку коэффициент восприятия связан с функцией простым соотношением [1]:

.

В работе [4] получены предварительные оценки характера и степени влияния шумовой и реверберационной помех на точность измерений функции . Цель данной работы состоит в более углубленном исследовании влияния реверберационной помехи на точность измерений функции .

2. Аналитическое описание влияния реверберационной помехи

Как указывалось в работе [4], в качестве математической модели сигнала, искаженного реверберационной помехой, обычно выбирают соотношение свертки речевого сигнала с импульсной характеристикой (ИХ) помещения :

. (3)

Однако для аналитических исследований статистических свойств уровня речевого сигнала вместо модели (3) удобнее модель в виде аддитивной смеси

(4)

речевого сигнала («прямой сигнал») и реверберационной помехи (совокупность отраженных сигналов).

Процессы и , вообще говоря, коррелированны. Вместе с тем, для достаточно больших помещений, когда интервал времени между приходом в точку приема прямого и первого отраженного сигналов превышает среднюю длительность фонемы, т.е. >0,1…0,2 с, процессы и можно считать практически некоррелированными в каждый момент времени . В этом случае оценку уровня сигнала можно приближенно представить в виде:

, (5)

где и - оценки дисперсий сигнала и реверберационной помехи, соответственно.

В силу некоррелированности, в каждый момент времени , процессов и , плотность распределения процесса представляет собой свертку [5]:

, (6)

где и - плотности распределения оценок и , соответственно. Штрихи при символах переменных и символах функций означают, что в соотношении (6) фигурируют распределения нормированных, по среднему значению уровня речевого сигнала, уровней сигнала и помехи.

Для функции распределения процесса из (6) нетрудно получить:

. (7)

Если ограничиться рассмотрением только первого отражения (что соответствует реверберации в помещениях с достаточно большим фондом звукопоглощения), тогда

, (8)

где - отношение средних значений уровня сигнала и помехи (отношение сигнал-шум в разах по мощности), и соотношение (7) приобретает вид:

. (9)

Значение можно связать с индексом четкости , характеризующим отношение энергий прямого и отраженного звука речевого сигнала [3]:

, (10)

где - давление; 0,05 – значение фиксированного момента времени, выраженное в секундах; - отношение сигнал-помеха, выраженное в дБ.

Полагая , получим:

. (11)

Поскольку , где - время реверберации, из (10) с учетом (11) получаем:

. (12)

В табл. 1 приведены несколько значений зависимости , описываемой соотношением (12), позволяющих прийти к предварительному выводу, что при времени реверберации реверберационная помеха не должна существенно сказаться на форме функции распределения уровня речевого сигнала.

Таблица 1



0,1

0,3

0,7

1

2

3



991,27

8,97

1,67

0,99

0,41

0,26



30

9,53

2,23

0

-3,87

-5,85


Для проверки справедливости этого вывода произведем вычисления в соответствии с соотношениями (9)-(12), полагая, что распределение уровня речевого сигнала модели может быть аппроксимировано гамма-распределением [6]:

(13)

Действительно, полагая в соотношении (12) (МО СВ X в этом случае равно ), получим график (рис. 1а), мало отличающийся от оценки функции реального речевого сигнала (рис. 1б) [1].



а б

Рис. 1. Гамма-распределение для (а) и оценка функции для реального речевого сигнала (б)

Результаты вычислений в соответствии с соотношениями (9)-(13) приведены на рис. 2. Очевидно, для влиянием реверберации действительно можно практически пренебречь (рис. 2а, 2б), поскольку вызванное этим влиянием изменение функции распределения не превышает 0,03. При изменение функции распределения, вызванное влиянием реверберации, достигает 0,1 (рис. 2в). С дальнейшим ростом функция распределения уровней речевого сигнала все сильнее сдвигается вправо, причем сдвиг в большей степени выражен в области малых уровней сигнала (рис. 2г,д). При изменение функции распределения уровней речевого сигнала достигает 0,5 (рис. 2е).



а б в



г д е

Рис. 2. Результаты расчета для различных

Следует учесть, что представленные на рис. 2 результаты носят приближенный характер в силу допущений, предшествовавших выводу соотношений (4) и (9), а также из-за приближенности аппроксимации функции распределения речевого сигнала соотношением (13).

3. Экспериментальные исследования

Для более точной оценки степени влияния реверберационной помехи на вид функции используем соотношение (3), свернув речевой сигнал с экспериментально полученными импульсными характеристиками помещений с различным временем реверберации .

Для более детального анализа исходный речевой сигнал и речевой сигнал , искаженный реверберационной помехой, подвергался фильтрации гребенкой из семи октавных фильтров с центральными частотами 125, 250, 500, 1000, 2000, 4000 и 8000 Гц (алгоритм фильтрации описан в [1]). Это дало возможность оценить функцию распределения речевого сигнала для каждой из перечисленных октавных полос частот и, таким образом, учесть частотные свойства реверберационной помехи.

Говоря о частотных свойствах реверберационной помехи, следует отметить, что весьма типичной является тенденция к уменьшению времени реверберации с ростом частоты (рис. 3).



а б в

Рис. 3. Зависимость времени реверберации от частоты

Оценивание функции распределения речевого сигнала производилось по алгоритмам, описанным в работе [1]. Результаты оценивания представлены на рис. 4-10, где сплошной линией показана оценка для речевого сигнала в отсутствие реверберационной помехи (), а пунктирной и штрихпунктирной линиями – оценки для речевого сигнала, искаженного реверберационной помехой.



а б в

Рис. 4. Функция распределения для



а б в

Рис. 5. Функция распределения для



а б в

Рис. 6. Функция распределения для



а б в

Рис. 7. Функция распределения для



а б в

Рис. 8. Функция распределения для



а б в

Рис. 9. Функция распределения для



а б в

Рис. 10. Функция распределения для

Сравнивая результаты аналитических и экспериментальных исследований, отметим, что качественно их результаты согласуются неплохо. Практически во всех 21 случаях, рассмотренных на рис. 4-10, за исключением рис. 4,б и 5,а, выполняется правило: оценка смещается вправо тем сильнее, чем больше время реверберации, т.е. чем меньше отношение сигнал-шум для реверберационной помехи. Кроме того, экспериментальные исследования подтверждают результат аналитических исследований, согласно которым для влиянием реверберации можно практически пренебречь.

Вместе с тем, проведенные нами экспериментальные исследования свидетельствуют, что «правая» ветвь оценки функции практически не подвержена влиянию реверберационной помехи. Иными словами, для времени реверберации 0,1…3 с влияние реверберационной помехи сказывается преимущественно на уровнях речевого сигнала, находящихся ниже среднего уровня речевого сигнала.

Выводы

Произведены аналитические, и экспериментальные исследования влияния реверберационной помехи на точность измерений функции распределения уровней речевого сигнала.

Показано, что оценка смещается вправо (в сторону больших уровней сигнала) тем сильнее, чем больше время реверберации, т.е. чем меньше отношение сигнал-шум для реверберационной помехи. При этом для времени реверберации смещение оценки столь незначительно, что влиянием реверберационной помехи можно практически пренебречь.

Показано также, что для помещений с временем реверберации более 0,3 с влияние реверберационной помехи проявляется в появлении заметной отрицательной смещенности оценки функции для отрицательных значений аргумента функции , и незначительной положительной смещенности в области положительных значений аргумента функции . Иными словами, «правая» ветвь оценки функции мало подвержена влиянию реверберационной помехи.

Полученные результаты весьма важны как для теории, так и для практики акустической экспертизы помещений и каналов связи, позволяя выносить обоснованные суждения как о качестве специальных заглушенных помещений («акустических комнат»), так и о достоверности оценок коэффициента восприятия , сформированных с использованием таких помещений.

Литература

  1. Дидковский В.С., Дидковская М.В., Продеус А.Н. Акустическая экспертиза каналов речевой коммуникации. Монография. – К: Имэкс-ЛТД, 2008. – 420 с.

  2. Продеус А.Н. О некоторых особенностях развития объективных методов измерений разборчивости речи. //Электроника и связь, тематический выпуск "Электроника и нанотехнологии ", 2010. №2. - С.217-223.

  3. Prodeus A. On Possibility of Advantages Join of Formant and Modulation Methods of Speech Intelligibility Evaluation. - Proceedings of the VI International Conference MEMSTECH 2010. - Lviv, Polyana, 2010. - Pp.254-259.

  4. Дидковский В.С., Продеус А.Н., Рудь Д.П. О точности измерений функции распределения уровней речевого сигнала. // Электроника и связь, тематический выпуск "Электроника и нанотехнологии ", 2010. №3. - С.152-159.

  5. Вентцель Е.С. Теория вероятностей. – М.: Наука, 1969. – 575 с.

  6. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. – М.: Наука, 1970. – 720 с.

  7. Дідковський В.С., Луньова С.А. Основи архітектурної та фізіологічної акустики. – К.: 2001. – 422 с.

  8. Продеус А.Н. Об измерениях вероятностных свойств формант украинской и русской речи. - Сб.трудов Акустического симпозиума "Консонанс-2007", К., 2007, с.285-291.

  9. Дидковский В.С., Продеус А.Н., Сопоставление формантных свойств украинской и русской речи. // Электроника и связь, тематический выпуск "Электроника и нанотехнологии ", ч.2, 2009. №4-5. - С.88-94.


Учебный материал
© bib.convdocs.org
При копировании укажите ссылку.
обратиться к администрации