음성 명료도는 범위에 따라 다릅니다. 음성 명료도 및 측정 방법

10장 .
10.1. 소개
모든 음성 전송 채널의 주요 특징은 음성의 명료도입니다. 이 특성을 결정하기 위해 많은 수의 청취자와 화자가 참여하는 통계적 방법이 사용됩니다. 음성 명료도- 음성 전송 경로의 정의 특성, 경로가 완전한 명료도를 제공하지 않으면 다른 이점이 중요하지 않기 때문에 작동에 적합하지 않습니다.

이 질적 특성을 직접 결정하려면 많은 수의 운영자 (청취자 및 연사)가 참여하는 통계적 방법 만 있습니다. 음성의 명료도를 통해 음성의 명료도를 결정하기 위한 간접적인 정량적 방법이 개발되었습니다.

음성 명료도 그들은 경로를 따라 전송된 총 수에서 수신된 음성 요소의 상대 또는 백분율을 호출합니다. 말의 요소는 음절, 소리, 단어, 구(명령), 숫자입니다. 따라서 음절, 소리, 구두, 의미 및 디지털 명료성이 있습니다. 실제로, 그들은 주로 음절, 소리 및 구두 명료도를 사용합니다. 명료도를 측정하기 위해 러시아어 음성에서의 발생을 고려하여 음절, 소리 조합 및 단어의 특수 표가 개발되었습니다(다른 언어에 대한 유사한 표가 있음). 모음 이외의 소리는 따로 발음하지 않기 때문에 음표가 없고 음의 명료도를 측정하기 위해 음절표나 음조합표를 사용한다. 이 모든 테이블을 관절이라고 합니다.

그들은 조음 팀이라고 하는 훈련된 청취자와 화자 그룹의 도움을 받아 명료도를 측정하므로 측정 방법을 조음 . 팀 훈련이 필요합니다. 그렇지 않으면 교합기가 훈련될 때 일정한 조건에서 측정 결과가 일정 시간 동안 증가하기 때문입니다. 교합자는 주어진 측정 조건에서 안정적인 결과를 얻을 때까지 훈련을 수행합니다. 교합기는 음절표에서 가장 오랫동안 훈련합니다. 이 팀은 청각 및 언어 장애가 없는 젊은이들로 구성되어 있습니다.

교합제주어진 경로 조건에서 가능한 가장 높은 음성 명료도 값을 제공하십시오. 따라서 측정된 명료도 사이의 관계를 확인하기 위해 교합기, 동일한 조건에서 일반 가입자에 대한 음성 명료도에 대해 대량 테스트를 수행했습니다. 이 테스트에는 총 2000명 이상의 잠재 가입자 중에서 다양한 사람들이 참여했습니다. 그들의 작업 조건이 다른 다양한 전도지를 가져갔습니다. 대화는 전화 ​​대화에서와 같이 양방향으로 특수 숙어집으로 진행되었습니다. 동시에 가입자 상호간의 이해도를 통제했다. 평가는 5점 시스템을 기반으로 했습니다. 추가 질문 없이 이해도가 완벽하면 우수합니다. 글쎄요, 뜻에서 유추할 수 없는 드물게 나오는 단어나 모르는 이름, 성 등의 별도 재질의가 있었다면; 자주 후속 조치가 필요하고 청취자가 말하기 어렵다고 보고한 경우 만족합니다. 완전한 청력으로 개별 단어를 문자로 전송하기 위해 동일한 자료의 반복 질문이 필요한 경우 최대 허용; 가입자가 서로를 이해하지 못하고 대화를 거부하는 경우 의사 소통 실패. 동시에 각 테스트 조건 및 각 트랙에 대해 훈련된 팀을 사용하여 음성 명료도 값을 측정했습니다.

표 10.1

테이블에서. 10.1은 음성 명료도의 계조와 해당 명료도 값을 보여줍니다. 이러한 테스트와 동시에 러시아어 음성에 대한 음절, 언어, 소리 및 의미 명료도 간의 통계적 관계가 측정되었습니다.

또한, 개발된 음성 명료도 측정을 위한 가속화된 방법 - 선택 방법. 다음을 기반으로 합니다. 각 테이블은 여러 단어 그룹으로 구성됩니다. 각 그룹에서 서로 소리가 비슷한 단어를 선택합니다. 아나운서는 각 그룹에서 한 단어만 전송합니다. 청취자는 앞에 테이블이 있으며 자신의 의견으로는 전송 된 단어를 표시해야합니다. 단어의 교체는 무작위로 변경됩니다. 올바르게 수신된 단어의 백분율이 결정됩니다. 이에 따라 허용된 단어의 수와 조음 방법 사이에 통계적 관계가 설정되었습니다. 이 방법은 청취자에 대한 오랜 훈련이 필요하지 않지만 정확도가 조음보다 낮습니다.

음성의 명료도와 명료도 사이의 관계는 표에 나와 있습니다. 10.1은 다양한 정보를 수신할 때 유효합니다. 훨씬 적은 양의 정보 교환이 있는 경우(즉, 제한된 어휘로), 음성의 명료성은 동일한 명료도의 음성을 갖는 일반적인 경우보다 더 높을 것입니다. 예를 들어, 디스패처 통신의 경우 음절 명료도가 약 40%로 완전한 음성 명료도가 얻어지며 이는 일반적인 경우에 만족스러운 명료도에 해당합니다. 따라서 디스패처 통신과 같은 장치를 계산할 때 광범위한 적용 시스템을 계산할 때보다 낮은 음성 명료도 값으로 안내됩니다. 그러나 각각의 경우에, 전송된 정보의 완전한 명료성이 있을 명료성의 가치를 미리 알아야 합니다.
^ 10.2. 음성 명료도를 결정하기 위한 포먼트 방법.
한편으로는 음성 명료도와 음성 전송 경로의 특성, 다른 한편으로는 수신 및 전송 조건 간의 직접적인 관계를 찾으려는 많은 시도가 있었지만 수용 가능한 결과를 얻지 못했습니다. Fletcher와 Collard가 개발한 포만트 이론을 통해서만 이러한 연결을 설정할 수 있었습니다.

음성 포먼트는 150~7000Hz의 전체 주파수 범위를 채웁니다. 각 언어 범위의 한 부분 또는 다른 부분에서 포먼트가 발생할 평균 확률은 매우 명확합니다. 우리는 전체 주파수 범위를 20개의 그러한 대역으로 나누어 각 대역에서 포먼트가 나타날 확률이 같도록 하기로 동의했습니다. 해당 밴드는 동일한 가독성의 줄무늬.러시아어를 비롯한 여러 언어에 대해 정의됩니다. 충분히 많은 양의 전송 된 재료로 포먼트가 나타날 확률은 가산성 규칙을 따르는 것으로 나타났습니다. 결과적으로 동일한 명료도의 각 대역에서 포먼트가 나타날 확률은 0.05입니다.

소음 및 간섭 조건에서 연설을 들으면 그 명료도가 없을 때보다 적습니다. 사실 포먼트는 강도 수준이 다릅니다. 큰 소리는 귀머거리보다 높습니다. 따라서 노이즈 레벨이 증가함에 따라 낮은 레벨의 포먼트가 먼저 마스킹되고 높은 레벨과 높은 레벨이 차례로 마스킹됩니다. 그 결과 잡음과 간섭의 정도가 높을수록 포먼트를 인지할 확률은 점차 낮아진다. 이 감소를 결정하는 계수를 지각 계수 또는 가독성 요소. 따라서 동일한 명료도의 각 대역에서 포먼트를 수신할 확률은 Δ 하지만 = 0,05 .

기본적으로 어음의 모든 에너지는 포먼트에 집중되어 있기 때문에 포먼트의 레벨은 실제로 어음의 레벨과 일치합니다. 무화과에. 10.1은 어음 수준의 분포, 즉 장기간에 걸쳐 결정된 평균 어음 수준과 주어진 수준의 차이에 따라 주어진 수준 이상의 수준이 나타날 적분 확률을 나타냅니다. 이 확률은 실질적으로 포만트 분포의 확률과 일치합니다. 이 분포는 빈도와 거의 무관합니다.

소음의 청력 임계값(§ 2.7 참조)은 소음의 스펙트럼 수준에 의해 결정됩니다. 변동 소음의 경우 청력 역치 값은 시간과 거의 무관합니다. 결과적으로 음성의 평균 스펙트럼 수준과 소음의 스펙트럼 수준 간의 차이는 소음 수준 이상에서 포먼트가 나타날 확률을 결정합니다. 하지만 신호 레벨과 청력 역치 레벨의 차이~라고 불리는 감각의 수준. 따라서 명료도 계수 w는 포만트의 감각 수준에 의해 결정됩니다.

어디 p는 음성의 평균 스펙트럼 수준입니다. w - 스펙트럼 노이즈 레벨.

가독성 계수는 ​​그림 1의 그래프를 사용하여 결정할 수 있습니다. 10.1. 예를 들어, 이 그림은 감각 수준을 보여줍니다. 이자형해당하는 명료도 계수 .

포만트와 다른 유형의 명료도 사이의 관계는 실험적으로 발견되었습니다. 음절 명료도를 위해 이러한 의존성은 그림 1에 나와 있습니다. 10.2. 포먼트 명료도가 0.5인 경우(모든 포먼트의 절반만 허용됨) 음절 명료도는 80%입니다. 즉, 거의 완전한 음성 명료도를 얻을 수 있습니다.

이것은 언어의 중복성과 인간 두뇌의 조합 능력을 특징으로 합니다.


쌀. 10.1. 음성 수준의 통합 분포: 1 - 변환되지 않은 신호의 경우 2 - 진폭이 극히 제한된 경우


쌀. 10.2. 포만트에 대한 음절 명료도의 의존성

사운드 유닛은 다양한 고려 요소에 따라 다른 속성을 특징으로 합니다. 소리 단위의 형성은 해부학적 및 생리학적이라고 하는 조음 요인에 해당합니다. 음향 요인은 발음 기관의 작업 결과로 소리 단위의 특성을 말하며 화음을 결정합니다. 사람에 의한 소리의 지각은 지각 요인을 말합니다.

처음에 사운드 시스템에 대한 설명은 다음을 기반으로 수행되었습니다.

관절 분석. 그러나 소리의 음향 분석 기술의 발전으로 연구자들은 음성의 음향적 특성이 가장 중요하다는 결론에 도달했습니다. 현대의 음성학은 말의 조음 특성과 음향 특성 사이의 긴밀한 연결과 상호 의존성을 고려합니다.

언어 단위의 지각에 대한 연구는 다른 소리와 다르게 지각되는 것으로 나타났습니다. 이것은 적절한 조음으로 변환하는 사람의 능력과 음성 사운드 단위의 기능적 속성으로 설명됩니다.

어음은 주로 어음 생성 과정에 공명 현상이 수반된다는 사실 때문에 복잡한 소리입니다. 그 이유는 현재 어떤 소리가 발음되는지에 따라 고유 주파수가 변경됩니다.

음원은 발성 기관의 공진기 시스템에서 자연스러운 진동을 유도합니다. 공진기의 고유 주파수에서 소리가 가장 증폭됩니다. 공진기의 고유 주파수는 모음과 자음의 특징적인 소리를 형성하기 때문에 소리 포먼트라고 합니다.

포먼트 주파수는 성대의 구성에 따라 결정되며 음원의 특성에 영향을 받지 않습니다. 이것은 음성 생성의 음향 이론의 가장 중요한 조항 중 하나입니다. 이 조항은 포먼트 주파수를 조음의 세부 사항과만 연관시키고 포먼트 주파수에 의해 조음 기관의 위치를 ​​판단하는 것을 가능하게 합니다.

어떤 말소리를 본질적으로 특징짓는 포만트의 수는 연구자에 의해 다양한 방식으로 결정되지만 대부분의 경우 연구자들은 4개의 포만트가 특정 소리의 형성에 관여한다고 믿고 있습니다.
^ 음장의 기본 매개변수. SZO(음향 지원 시스템)에 의해 생성된 음장의 매개변수를 특성화하는 다음과 같은 최소 기준 세트가 설정됩니다.

음성 명료도 지수

효과적으로 재생된 사운드 주파수의 범위;

· 소리가 나는 표면의 레벨 필드의 불균일성;

· 공칭 음압 레벨(SPL).
전기음향 계산은 소리가 나는 표면 전체에 대해 수행됩니다. 소리가 나는 표면은 방의 바닥과 평행 한 평면을 의미하며 열린 공간의 소리가 나는 경우지면과 평행합니다. 앉아있는 관중석이있는 경우 바닥 높이에 대한이 표면의 높이는 1.2m, 서있는 청중의 경우 1.6m로 가정합니다.
말의 명료성을 평가하는 마지막 기준은 명료성이다. 표 1의 1열에 5단계로 표시된 주관적인 범주이다. 이해 가능성은 계산된(또는 측정된) 기준과의 관계 측면에서 정의되어야 합니다. 표의 2열과 3열에 있습니다. 1. 이 관계는 러시아어 음성의 음절 명료도와 빠른 음성 전달 지수(RASTI)에 대해 표시됩니다.

1 번 테이블


명쾌함

훌륭한

나야


호로

역마차


풀다

신체


나쁜

용납할 수 없는 나쁜

음절 명료도 S,%

/ 디렉토리 ./


80-100

55-80

44-55

25-40

>25

^ RASTI /IEC 268-16/

0.75-1.00

0.60-0.75

0.45-0.60

0.30-0.45

>0.30

설계된 SZO의 경우 음성 명료도가 보장되어야 하며 명료도에 따라 "좋음"보다 나쁘지 않습니다.

어떤 경우에는 디자인에 대한 TOR에 지정되어 "만족스러운" 음성 명료도를 제공할 수 있습니다. 이 접근 방식은 매우 시끄러운 방의 특징으로 인해 중간 주파수에서 잔향 시간 값을 2.0-2.5초 미만으로 줄이는 것을 허용하지 않는 경우에만 허용됩니다. 그러한 건물의 전형적인 예는 예배당뿐만 아니라 건축물의 홀 기념물입니다.

음성 명료도 계산은 모든 소리가 나는 표면에 대해 이루어집니다. SZO의 전기음향 및 기하학적 매개변수 외에도 음성 명료도를 계산하기 위한 초기 데이터에는 소리가 나는 방의 잔향 시간(RT60, s)과 예상되는 소음 수준(LN, dB)이 포함됩니다. 이 두 표시기는 모두 효과적으로 재현 가능한 주파수 범위 내에서 표준 옥타브 범위의 주파수에서 일련의 값으로 설정됩니다. RT60 및 LN의 값은 건물의 음향 솔루션 및 소음으로부터 보호 전용 프로젝트의 관련 섹션에서 가져옵니다. 프로젝트의 표시된 섹션에 이러한 데이터가 없으면 RT60 값을 별도로 계산해야 하며 LN 값은 이 유형의 건물에 대한 규정 문서(예: MGSN 2.04-97에 따름). RT60을 계산할 때 전통적인 방법을 사용할 수 있습니다.

효과적으로 재현할 수 있는 주파수의 범위는 옥타브 대역에서 ±3dB 이하의 불균일이 있는 진폭-주파수 특성의 한 부분으로 정의됩니다.

dB 단위의 소리가 나는 표면 DL의 레벨 필드의 불균일성은 다음 식에 의해 이 유형에 대해 지정된 SZO의 옥타브 밴드에서 별도로 결정됩니다.

여기서 LMAX 및 LMIN은 각각 SPS가 개별 음향 이미 터에 대해 설정된 입력 전력 값은 이러한 유형의 음향 이미 터에 대한 사양에 지정된 정격 전력 값을 초과해서는 안됩니다.

^ 연설 SZO.

음성 SZO의 주요 요구 사항은 전체 소리 표면에 대해 충분한 음성 명료도를 보장하는 것입니다.

기하 평균 주파수가 500, 1000 및 2000Hz인 옥타브 대역에 대해 전기음향 매개변수 계산을 수행해야 합니다.

이 가이드에서 규정하는 음성 SZO 필드의 최소 허용 매개변수는 표에 나와 있습니다. 2

표 2.


^ 음장 매개변수

편안함 수준



II

이해할 수 있음

전.

성가대.


200 - 4000Hz

200 - 6300Hz


2dB

3dB

음압 레벨

5.2.11절 참조(최소 허용값 - 80dB)

^ 번역 뮤지컬 및 스피치 SZO.

뮤지컬 및 음성 SZO 방송에 대한 주요 요구 사항은 사람들의 영구 또는 임시 거주 장소에 해당하는 소리가 나는 표면에서 음성의 충분한 명료성을 보장하고 고품질 음악 청취 가능성을 제공하는 것입니다.

전기음향 매개변수의 계산은 공식 (1)에 따라 기하학적 평균 주파수가 250, 500, 1000, 2000 및 4000Hz인 옥타브 대역에 대해 수행되어야 합니다.

테이블 삼.

표 3


^ 음장 매개변수

편안함 수준



II

이해할 수 있음

전.

성가대.

유효 주파수 범위

60 - 16000Hz

100 - 12500Hz

소리가 나는 영역의 레벨 필드의 불균일

2dB

3dB

음압 레벨

5.2.11절 참조(최소 허용값 - 90dB)

^ 콘서트 뮤지컬 및 연설 SZO.

콘서트 뮤지컬 및 스피치 시스템 범주에는 콘서트 공연, 연극 공연, 뮤지컬 및 스피치 쇼 프로그램, 영화 및 비디오 상영, 특히 높은 음질을 요구하는 기타 작업의 사운드 지원을 위해 설계된 시스템이 포함됩니다.

전기 음향 매개변수의 계산은 기하학적 평균 주파수가 125, 250, 500, 1000, 2000, 4000, 8000Hz인 옥타브 밴드에 대해 수행해야 합니다.

이 가이드에서 규정하는 음성 SZO 필드의 최소 허용 매개변수는 표에 나와 있습니다. 4

표 4


^ 음장 매개변수

편안함 수준



II

이해할 수 있음

전.

성가대.

유효 주파수 범위

45 - 18000Hz

80 - 12500Hz

소리가 나는 영역의 레벨 필드의 불균일

2dB

3dB

음압 레벨

5.2.11절 참조(최소 허용 값 - 100dB)

^ 10.3. 말 명료도를 높이는 방법.
소개. 음성 명료도를 향상시키는 한 가지 방법은 소음과 간섭 수준을 줄이는 것입니다. 그러나 대부분의 경우 그들은 제공되고 우리에게 의존하지 않습니다. 때로는 확산 소리 (음향 비율을 줄임으로써), 플러그 아래로 침투하는 소음 등으로 인한 간섭을 줄이는 것이 가능합니다. 청취자의 연설을 조작하는 것은 여전히 ​​​​가능합니다 다이렉트 사운드로 레벨. 이것은 다음과 같은 방법으로 가능합니다. 화자의 목소리 레벨을 높이고, 마이크를 입에 더 가까이 가져오고, 고르지 않은 소리를 줄임으로써(최소 직접음 레벨을 최대에 가깝게), 트랙 인덱스를 증가시킵니다. . 후자의 방법은 음향 증폭 시스템에서는 경로의 한계 지수에 도달하지 않고 다른 시스템에서는 합리적인 조건에서만 가능합니다. 그리고 마지막으로 음성 명료도를 향상시키는 또 다른 방법이 있습니다. 즉, 음성 신호의 동적 범위를 압축하여 약한 음성 수준은 증가하고 큰 음성 수준은 유지하는 방법입니다. 음향 피드백이 있는 시스템의 경우 이 방법은 시스템의 자체 여기가 발생하기 때문에 적합하지 않습니다. 그리고 다른 시스템에서 약한 음성 레벨은 동적 범위 압축의 양만큼 증가합니다.

컴프레서 중에서 레벨 리미터가 가장 적합하며, 그 동작은 큰 소리의 피크 레벨을 균등화하는 반면 약한 소리 레벨 간의 비율은 변하지 않습니다. 이것은 "방송" 과정에서 더 자세히 논의될 것입니다.

^ 진폭 제한. 음성 압축의 제한적인 경우를 고려하십시오. 진폭 제한, 음성 신호가 일정한 진폭의 직사각형 펄스 시퀀스로 바뀌지만 0 전환 사이의 간격은 다양합니다. 송신기 신호가 이러한 음성 신호에 의해 변조되면 전신 동작 모드가 획득됩니다. 그리고 이것은 모든 음성 사운드가 동일하고 또한 리셉션에서 최대 레벨을 갖는다는 것을 의미합니다. 무제한 음성을 전송하는 동안 약한 소리가 간섭으로 가려진 경우이 전송 방법을 사용하면 간섭 수준보다 높고 제한되지 않은 음성을 수신할 때보다 명료도가 높아집니다. 사실, 간섭이 없을 때의 음질과 음성 명료도는 무제한 음성보다 낮지만 여전히 허용 가능한 한도 내에 있습니다. 청각을 위한 극히 제한된 어음 신호는 무제한 어음의 분포와 별로 다르지 않은 주파수 및 레벨 분포를 갖는다는 것이 밝혀졌습니다. 무화과에. 10.1은 언어 제한을 제한하는 수준의 평균 분포를 보여줍니다(곡선 2 ) 및 없이(곡선 1 ), 곡선의 급경사는 두 번만 변경되며 그림 4에서. 10.3은 두 조건 모두에 대한 음성 사운드의 스펙트럼 포락선을 보여줍니다(약간 부드러운 포먼트가 얻어짐). 이것은 청력에 협대역 필터의 "세트"가 있으며, 하나 또는 여러 필터의 레벨이 현재 증가하고 있으면 다른 필터에서는 감소하고 그 반대도 마찬가지라는 사실에 의해 설명됩니다. 각각은 가변 수준에서 발생합니다.

무제한 클리핑 또는 압축의 경우 결과는 제한 클리핑과 제한되지 않은 압축되지 않은 음성 전송 사이의 중간입니다.

^ 보코더 통신 . 보코더는 음성의 정보 내용을 결정하는 매개변수가 음성 신호에서 추출되는 송신 부분의 장치입니다. 이러한 매개변수에는 어음의 스펙트럼 포락선과 어음의 매개변수, 즉 시간이 지남에 따라 천천히 변하는 어음의 신호가 포함됩니다. 피치 파라미터는 보코더의 수신단에 위치한 피치 제너레이터의 주파수를 제어합니다.

쌀. 10.3. 제한 전(실선) 및 후(점선) 음성 사운드의 스펙트럼 엔벨로프: ) 소리 "e"; ) 소리 "m"
후두의 펄스와 유사한 펄스를 생성하는 이 생성기의 전압은 유성 음성을 위해 성대의 음향 시스템을 시뮬레이션하는 복잡한 필터에 적용됩니다. 무성음 음성을 합성할 때 생성기는 무성음에 대한 시스템을 시뮬레이션하는 필터에 적용되는 노이즈 전압을 생성합니다. 이러한 필터의 매개변수와 음성 사운드의 레벨은 송신단에서 선택된 매개변수에 의해 제어되며, 그 결과 음성 신호의 스펙트럼 포락선이 복원됩니다. 복원된 신호의 품질과 명료도는 상당히 높습니다.

추출된 음성 신호 매개변수의 유형에 따라 대역 보코더, 고조파 보코더, 포먼트 보코더 및 음소 보코더가 있습니다. 대역 대역에서 스펙트럼의 복잡한 좌표는 고조파 대역의 좁은 대역에서 구별됩니다 - 스펙트럼 포락선의 확장에서 고조파의 합으로의 푸리에 계수, 포먼트 대역 - 포먼트의 주파수 및 진폭, 음소 밴드 - 발음되는 소리. 이러한 매개변수는 음성을 발음하는 속도(초당 8-10음)에 따라 시간에 따라 변하기 때문에 각 매개변수의 주파수 범위는 20-25Hz를 초과하지 않습니다. 또한, 나열된 각 유형의 보코더에는 음성의 주요 톤의 매개변수(주파수)가 할당됩니다.

밴드 보코더는 12-18개의 밴드를 사용합니다. 각 매개변수의 동적 범위는 25dB를 초과하지 않으므로 매개변수를 임펄스 형식으로 변환할 때 4자리 코드(각각 1.5dB의 16개 값)이면 충분하고 시간상으로는 초당 50개 샘플이면 충분합니다. 스펙트럼 매개변수에 필요한 대역폭은 18x4x50=3600 imps/s입니다. 기본 톤을 전송하려면 1200 imps/s와 총 4800 imps/s가 필요합니다. 현재, 음성 명료도와 품질의 높은 가치는 이미 2400 imp/s의 속도로 달성되었습니다. 고조파 보코더에서 필요한 비트 전송률은 다소 낮습니다.

가장 일반적인 형태의 포만트 보코더에는 4개의 포만트 주파수와 4개의 포만트 레벨이 있습니다. 이 매개변수의 동적 범위는 20dB 이하이므로 3자리 코드(각각 2.5dB의 8개 값)와 초당 40개 샘플이면 충분합니다. 전체적으로 8x3x40 = 960 imp/s이고 피치 멜로디의 전송을 위해 240 imp/s가 할당됩니다. 필요한 매개변수 전송 속도는 1200펄스/초입니다.

음소 보코더의 경우 필요한 비트 전송률은 아직 초당 300펄스 이상이며 화자의 성격에 대한 정보는 손실됩니다.

보코더를 사용하면 신호가 특수 잡음 면역 코딩으로 전신 모드에서 전송되기 때문에 무선 간섭 조건에서 음성의 명료도가 향상됩니다. 보코더 통신을 사용하여 전송된 음성은 높은 수준이며 강한 간섭 및 페이딩이 있는 경우에도 우수한 명료도로 전달됩니다. 좋은 잡음 면역 무선 통신은 포먼트 코딩으로 얻을 수 있습니다. KB 통신 회선에서 사용됩니다.

펄스 파형은 전신 전송 코딩과 유사한 방식으로 음성 코딩을 가능하게 합니다. 이러한 인코딩된 음성은 현대적인 방법으로 들을 수 없습니다. 또한 보코더 통신을 사용하면 펄스 통신 시스템에서 채널 수를 크게 늘릴 수 있습니다. 일반적인 음성 신호에는 약 50,000펄스/초의 대역폭이 필요합니다. 밴드 보코더를 사용할 때 약 10개의 전송을 이 채널에 배치할 수 있고 포먼트 보코더를 사용할 때 약 40개의 전송을 배치할 수 있습니다.

우리는 전화로 이야기하고 콘서트 홀에서 공연과 연설을 듣습니다. 우리 중 일부는 다른 사람의 대화를 도청하려고 하고, 다른 일부는 도청을 불가능하게 만들려고 합니다. 그러나 위에 언급된 모든 경우에 외부 소음이 필요한 것을 듣는 데 너무 방해가 되어 단어를 읽을 수 없게 된 상황이 있었습니다. 이러한 문제를 피하기 위해 경로를 작동하기 전에 음성 통신 채널의 음향 검사가 수행됩니다.

채널 또는 음성 통신 경로(또는 음성 정보를 전송하기 위한 채널)는 소리가 전송에서 수신으로 전달되는 경로인 물리적 매체입니다. 공기, 전기 음향, 진동, 매개 변수, 광전자 채널이 될 수 있지만 우리의 목표는 경로의 품질에 대한 가장 중요한 기준인 음성 명료도를 측정하는 것이기 때문에 이에 대해서는 언급하지 않겠습니다.

음성 명료도를 측정하는 방법은 다음 목록으로 요약할 수 있습니다.

  • 주걱:
    • 순전히 주관적인 방법;
    • 객관화;
    • 음색의;
  • 목적:
    • 포만트:
      • AI(조음 지수);
      • SII(음성 명료도 지수);
    • 조정:
      • STI(음성 전송 지수 - 음성 전송 지수);
      • RASTI(급속 STI);
      • STIPA(음향 강화 시스템용 STI);
      • STITEL(통신 시스템용 STI);
    • %ALcons(자음의 조음 손실 평가);
물론 Pokrovsky, Bykov, Sapozhkov의 소비에트 방법이 여전히 있지만 위의 방법이 최상의 결과를 제공하기 때문에 적어도 지금은 만지지 않을 것입니다.

물론 한 번에 모든 것을 다룰 수는 없으므로 먼저 객관적인 방법과 주관적인 방법의 차이점을 고려하고 후자에 대해 더 자세히 설명합니다.

순수한 주관주의

순수 주관적 방법에 의한 음성 명료도 평가에는 한 쌍의 화자-청중이 포함됩니다. CCIR(International Advisory Committee for Radio Communications)의 권장 사항에 따라 라디오 방송국을 테스트하는 예에 대한 그들의 작업을 고려하는 것이 편리합니다. 라디오 채널의 송신 측에서 아나운서는 텍스트를 읽고 감사자는 받는 쪽은 5점(또는 다른) 척도로 경로를 평가합니다. 이 접근 방식의 명백한 큰 결점, 즉 피험자의 언어 및 청력 특성의 결과에 대한 불가피한 영향을 알아차리지 않는 것은 어렵습니다.

이 문제에 대한 해결책은 문제 자체만큼이나 분명합니다.

객관성

가장 일반적인 객관화 방법은 조음 방법입니다. 측정 시작 전에 테스트 채널에서 정상적인 음향 조건(소음 레벨)이 생성된다는 사실로 구성됩니다. 여러 심사원이 참여하고 아나운서는 일반 텍스트 대신 특별히 컴파일된 음절표(조음표)를 읽습니다. 오디터는 들은 내용을 기록하고 전송 세션이 끝나면 자신의 테이블을 아나운서와 비교합니다. 총 수에 대한 올바르게 들은 음절의 비율은 음성 명료도의 평가이며 백분율 또는 단위의 분수로 표시됩니다.

더 많은 수의 받아 들여지고 그에 따라 허용되는 음절이 있으면 다양한 요인의 영향이 평균화됩니다. 여러 그룹의 아나운서와 감사자가 테스트에 참여하면 요인의 영향이 훨씬 더 평균화됩니다. 이것은 조음 방법의 객관화입니다. 그러나 이것 뿐만이 아닙니다. 객관적인 결과를 얻는 데 도움이되는 의미 론적 부하가없는 소리 조합을 읽는 것이 단어 나 구를받을 때 경로에 의해 왜곡 된 요소를 생각하고 복원 할 수 있기 때문입니다.

감사관은 특별히 훈련된 팀이 필요하다는 의견이 있지만 GOST R 50840-95에서는 그 반대가 필요합니다. 개인적으로 저는 후자에 더 가깝습니다.

장점:

  • 보편성(방법은 모든 유형의 경로에 적용 가능)
  • 단순성(이 방법은 운영자의 특별한 기술 지식이 필요하지 않음)
단점:
  • 번거로운 측정 절차(상당한 시간, 자재 및 인적 자원이 필요함);
  • 관절 테이블 생성(측정 결과는 새로운 유형의 테이블마다 다름);
  • 운영자의 교육 정도에 대한 결과의 의존성;
  • 인적 요소(말과 청각의 특징 결과에 대한 영향)

객관성. 2 부

아나운서가 순수한 음색의 생성기로 대체되는 또 다른 객관적인 주관적인 방법인 음색을 고려하십시오. 이 인공 음성은 실제로 원뿔이 없는 일반 스피커로, 서로 다른 주파수에서 생성된 음압 레벨이 포만트 스펙트럼 곡선에 해당하는 방식으로 신호를 생성합니다. 감사원은 아무데도 가지 않습니다. 이제 그들의 임무는 주어진 주파수에서 신호가 들리는지 여부를 결정하는 것입니다.
측정이 수행되는 주파수
250 500 650 800 990 1125 1300 1500 1700 1875
2050 2225 2425 2725 3100 3500 3850 4550 6150 8600

포만트 감각의 수준은 소리가 더 이상 들리지 않을 때까지 감쇄를 천천히 도입하여 측정한 다음 소리가 나타날 때까지 감쇄를 줄여야 합니다. 두 감쇠 값을 평균화한 것입니다. 이것이 측정 결과입니다.

포먼트 음성 명료도는 다음 표에 의해 결정됩니다.

dB % dB % dB % dB % dB % dB %
1 0.04 10 0.65 19 1.92 28 3.22 37 4.28 46 4.75
2 0.09 11 0.76 20 2.07 29 3.37 38 4.37 47 4.78
3 0.14 12 0.89 21 2.2 30 3.51 39 4.46 48 4.8
4 0.19 13 1.03 22 2.36 31 3.64 40 4.52 49 4.82
5 0.24 14 1.18 23 2.5 32 3.75 41 4.57 50 4.85
6 0.3 15 1.32 24 2.65 33 3.87 42 4.62 51 4.88
7 0.37 16 1.47 25 2.79 34 3.97 43 4.66 52 4.95
8 0.46 17 1.62 26 2.93 35 4.08 44 4.69
9 0.55 18 1.77 27 3.08 36 4.18 45 4.72
dB - 톤 감각 수준; % - 포먼트 음성 명료도

전체 포먼트 명료도는 구성 요소의 합으로 정의됩니다.
음성 명료도 측정을 완료하려면 음절 명료도를 결정하는 것으로 충분합니다.

장점:
  • 아나운서 팀이 필요하지 않습니다.
  • 측정 시간이 크게 단축됩니다.
  • 관절 테이블이 필요하지 않음
단점:
  • 측정 인력의 기술 교육 요구 사항 증가;
  • 프로세스 자동화의 불가능성;
  • 인적 요인

어때요...

... 객관적인 방법과 주관적인 방법의 차이점은 무엇입니까? 인공 음성, 입 및 귀가 측정에 사용되기 때문에 모든 것이 인적 요소 또는 오히려 부재에 있다고 이미 추측했다고 생각합니다.

가장 간단한 객관적인 방법을 고려하십시오.

먼저 테스트 대상 경로의 수신단에서 작동 조건에 해당하는 노이즈 레벨이 생성됩니다. 다음으로 임계 가청 주파수 대역에서 인공 귀의 출력에서 ​​잡음 레벨을 측정하는데, 이 대역의 평균 주파수는 측정 톤의 주파수와 같습니다. 이 소음 수준은 고정되어야 하며 여전히 필요합니다. 그 후, 노이즈 대신 톤 신호가 경로의 입력으로 공급됩니다. 마이크의 사운드 강도 레벨은 감쇠 컨트롤러의 조건부 0에서 음압 분포가 포만트 스펙트럼 곡선에 해당하도록 취해집니다. 또한 감쇠 제어의 도움으로 경로 출력의 톤 신호 레벨이 이전에 녹음한 노이즈 레벨과 같아집니다. 댐핑 컨트롤러 판독값은 측정 결과입니다.

포먼트 및 음절 명료도를 결정하려면 성조 방법과 동일한 방법을 사용하십시오.

장점:

  • 정확도와 속도;
  • 연사 및 감사는 필요하지 않습니다.
  • 측정 절차의 완전 자동화 가능성
단점:
  • 측정 인력의 기술 교육 요구 사항 증가

일반적으로 이 단어 뒤에는 크레딧을 제외하고는 아무 것도 없어야 하므로 매우 간략하게 설명하겠습니다. "nickname_below"였습니다. 편하신 시간에 시청하세요. 관심을 가져주셔서 감사합니다! 우리는 전화로 이야기하고 콘서트 홀에서 공연과 연설을 듣습니다. 우리 중 일부는 다른 사람의 대화를 도청하려고 하고, 다른 일부는 도청을 불가능하게 만들려고 합니다. 그러나 위에 언급된 모든 경우에 외부 소음이 필요한 것을 듣는 데 너무 방해가 되어 단어를 읽을 수 없게 된 상황이 있었습니다. 이러한 문제를 피하기 위해 경로를 작동하기 전에 음성 통신 채널의 음향 검사가 수행됩니다.

채널 또는 음성 통신 경로(또는 음성 정보를 전송하기 위한 채널)는 소리가 전송에서 수신으로 전달되는 경로인 물리적 매체입니다. 공기, 전기 음향, 진동, 매개 변수, 광전자 채널이 될 수 있지만 우리의 목표는 경로의 품질에 대한 가장 중요한 기준인 음성 명료도를 측정하는 것이기 때문에 이에 대해서는 언급하지 않겠습니다.

음성 명료도를 측정하는 방법은 다음 목록으로 요약할 수 있습니다.

  • 주걱:
    • 순전히 주관적인 방법;
    • 객관화;
    • 음색의;
  • 목적:
    • 포만트:
      • AI(조음 지수);
      • SII(음성 명료도 지수);
    • 조정:
      • STI(음성 전송 지수 - 음성 전송 지수);
      • RASTI(급속 STI);
      • STIPA(음향 강화 시스템용 STI);
      • STITEL(통신 시스템용 STI);
    • %ALcons(자음의 조음 손실 평가);
물론 Pokrovsky, Bykov, Sapozhkov의 소비에트 방법이 여전히 있지만 위의 방법이 최상의 결과를 제공하기 때문에 적어도 지금은 만지지 않을 것입니다.

물론 한 번에 모든 것을 다룰 수는 없으므로 먼저 객관적인 방법과 주관적인 방법의 차이점을 고려하고 후자에 대해 더 자세히 설명합니다.

순수한 주관주의

순수 주관적 방법에 의한 음성 명료도 평가에는 한 쌍의 화자-청중이 포함됩니다. CCIR(International Advisory Committee for Radio Communications)의 권장 사항에 따라 라디오 방송국을 테스트하는 예에 대한 그들의 작업을 고려하는 것이 편리합니다. 라디오 채널의 송신 측에서 아나운서는 텍스트를 읽고 감사자는 받는 쪽은 5점(또는 다른) 척도로 경로를 평가합니다. 이 접근 방식의 명백한 큰 결점, 즉 피험자의 언어 및 청력 특성의 결과에 대한 불가피한 영향을 알아차리지 않는 것은 어렵습니다.

이 문제에 대한 해결책은 문제 자체만큼이나 분명합니다.

객관성

가장 일반적인 객관화 방법은 조음 방법입니다. 측정 시작 전에 테스트 채널에서 정상적인 음향 조건(소음 레벨)이 생성된다는 사실로 구성됩니다. 여러 심사원이 참여하고 아나운서는 일반 텍스트 대신 특별히 컴파일된 음절표(조음표)를 읽습니다. 오디터는 들은 내용을 기록하고 전송 세션이 끝나면 자신의 테이블을 아나운서와 비교합니다. 총 수에 대한 올바르게 들은 음절의 비율은 음성 명료도의 평가이며 백분율 또는 단위의 분수로 표시됩니다.

더 많은 수의 받아 들여지고 그에 따라 허용되는 음절이 있으면 다양한 요인의 영향이 평균화됩니다. 여러 그룹의 아나운서와 감사자가 테스트에 참여하면 요인의 영향이 훨씬 더 평균화됩니다. 이것은 조음 방법의 객관화입니다. 그러나 이것 뿐만이 아닙니다. 객관적인 결과를 얻는 데 도움이되는 의미 론적 부하가없는 소리 조합을 읽는 것이 단어 나 구를받을 때 경로에 의해 왜곡 된 요소를 생각하고 복원 할 수 있기 때문입니다.

감사관은 특별히 훈련된 팀이 필요하다는 의견이 있지만 GOST R 50840-95에서는 그 반대가 필요합니다. 개인적으로 저는 후자에 더 가깝습니다.

장점:

  • 보편성(방법은 모든 유형의 경로에 적용 가능)
  • 단순성(이 방법은 운영자의 특별한 기술 지식이 필요하지 않음)
단점:
  • 번거로운 측정 절차(상당한 시간, 자재 및 인적 자원이 필요함);
  • 관절 테이블 생성(측정 결과는 새로운 유형의 테이블마다 다름);
  • 운영자의 교육 정도에 대한 결과의 의존성;
  • 인적 요소(말과 청각의 특징 결과에 대한 영향)

객관성. 2 부

아나운서가 순수한 음색의 생성기로 대체되는 또 다른 객관적인 주관적인 방법인 음색을 고려하십시오. 이 인공 음성은 실제로 원뿔이 없는 일반 스피커로, 서로 다른 주파수에서 생성된 음압 레벨이 포만트 스펙트럼 곡선에 해당하는 방식으로 신호를 생성합니다. 감사원은 아무데도 가지 않습니다. 이제 그들의 임무는 주어진 주파수에서 신호가 들리는지 여부를 결정하는 것입니다.
측정이 수행되는 주파수
250 500 650 800 990 1125 1300 1500 1700 1875
2050 2225 2425 2725 3100 3500 3850 4550 6150 8600

포만트 감각의 수준은 소리가 더 이상 들리지 않을 때까지 감쇄를 천천히 도입하여 측정한 다음 소리가 나타날 때까지 감쇄를 줄여야 합니다. 두 감쇠 값을 평균화한 것입니다. 이것이 측정 결과입니다.

포먼트 음성 명료도는 다음 표에 의해 결정됩니다.

dB % dB % dB % dB % dB % dB %
1 0.04 10 0.65 19 1.92 28 3.22 37 4.28 46 4.75
2 0.09 11 0.76 20 2.07 29 3.37 38 4.37 47 4.78
3 0.14 12 0.89 21 2.2 30 3.51 39 4.46 48 4.8
4 0.19 13 1.03 22 2.36 31 3.64 40 4.52 49 4.82
5 0.24 14 1.18 23 2.5 32 3.75 41 4.57 50 4.85
6 0.3 15 1.32 24 2.65 33 3.87 42 4.62 51 4.88
7 0.37 16 1.47 25 2.79 34 3.97 43 4.66 52 4.95
8 0.46 17 1.62 26 2.93 35 4.08 44 4.69
9 0.55 18 1.77 27 3.08 36 4.18 45 4.72
dB - 톤 감각 수준; % - 포먼트 음성 명료도

전체 포먼트 명료도는 구성 요소의 합으로 정의됩니다.
음성 명료도 측정을 완료하려면 음절 명료도를 결정하는 것으로 충분합니다.

장점:
  • 아나운서 팀이 필요하지 않습니다.
  • 측정 시간이 크게 단축됩니다.
  • 관절 테이블이 필요하지 않음
단점:
  • 측정 인력의 기술 교육 요구 사항 증가;
  • 프로세스 자동화의 불가능성;
  • 인적 요인

어때요...

... 객관적인 방법과 주관적인 방법의 차이점은 무엇입니까? 인공 음성, 입 및 귀가 측정에 사용되기 때문에 모든 것이 인적 요소 또는 오히려 부재에 있다고 이미 추측했다고 생각합니다.

가장 간단한 객관적인 방법을 고려하십시오.

먼저 테스트 대상 경로의 수신단에서 작동 조건에 해당하는 노이즈 레벨이 생성됩니다. 다음으로 임계 가청 주파수 대역에서 인공 귀의 출력에서 ​​잡음 레벨을 측정하는데, 이 대역의 평균 주파수는 측정 톤의 주파수와 같습니다. 이 소음 수준은 고정되어야 하며 여전히 필요합니다. 그 후, 노이즈 대신 톤 신호가 경로의 입력으로 공급됩니다. 마이크의 사운드 강도 레벨은 감쇠 컨트롤러의 조건부 0에서 음압 분포가 포만트 스펙트럼 곡선에 해당하도록 취해집니다. 또한 감쇠 제어의 도움으로 경로 출력의 톤 신호 레벨이 이전에 녹음한 노이즈 레벨과 같아집니다. 댐핑 컨트롤러 판독값은 측정 결과입니다.

포먼트 및 음절 명료도를 결정하려면 성조 방법과 동일한 방법을 사용하십시오.

장점:

  • 정확도와 속도;
  • 연사 및 감사는 필요하지 않습니다.
  • 측정 절차의 완전 자동화 가능성
단점:
  • 측정 인력의 기술 교육 요구 사항 증가

일반적으로 이 단어 뒤에는 크레딧을 제외하고는 아무 것도 없어야 하므로 매우 간략하게 설명하겠습니다. "nickname_below"였습니다. 편하신 시간에 시청하세요. 관심을 가져주셔서 감사합니다!

말의 이해도와 명료도

명쾌함 연설 - 음성 전송 경로의 적합성을 결정하는 주요 특성. 이 특성의 직접적인 결정은 많은 수의 청취자와 화자를 포함하는 통계적 방법에 의해 수행될 수 있습니다. 음성 명료도 정량화 - 이해할 수 있음.

읽기 쉬움 연설 경로를 따라 전송된 총 수 중 올바르게 수신된 음성 요소의 상대 또는 백분율 수를 호출합니다. 말의 요소는 복잡한 소리, 단어, 구, 숫자입니다. 따라서 그들은 구별합니다. 음절, 소리, 언어 적, 의미론적 그리고 디지털 이해할 수 있음. 그들 사이에는 통계적 관계가 있습니다. 실제로는 음절, 언어 및 의미의 명료도가 주로 사용됩니다.

명료도를 측정하기 위해 러시아어 연설에서의 발생을 고려하여 특수 음절 표가 개발되었습니다. 이러한 테이블을 조음. 청력 및 언어 장애가 없는 훈련된 청취자 팀이 주관적 통계적 검사를 수행하여 명료도를 측정합니다. 이 경우 측정은 채점 방식, 정확하게 입력된 단어의 비율을 결정하는 방식 등 다양한 방식으로 수행될 수 있다.

음성 명료도와 명료도 사이의 관계는 표에 나와 있습니다. 16.1. 이 표에서 음성 명료도는 4가지 등급으로 평가됩니다.

1) 질문하지 않고 명료성이 완전한 경우 우수합니다.

2) 청취자가 희귀 단어 또는 개인 이름에 대해 별도의 질문을 해야 하는 경우 좋습니다.

3) 청취자가 이해하기 어렵다고 보고한 경우, 자주 반복되는 질문이 있었다.

4) 최대 허용치, 동일한 내용의 반복적인 심문이 완전한 청력에서 문자로 개별 단어를 전송하는 데 필요한 경우.

표 16.1

명료도 감소의 원인은 실내 음향 잡음, 잔향 및 확산 사운드의 간섭, 기본 음원의 신호 증폭 부족입니다.

음향 및 음향 증폭 시스템은 요구되는 음성 명료도를 제공해야 합니다. 정보 프로그램을 전송할 때, 집회 및 회의를 개최할 때 80%의 음절 및 98%의 구두 명료도로 제공되는 우수한 음성 명료도가 요구됩니다. 디스패처 통신의 경우 전체 음성 명료도(만족스러운 명료도)는 40 ... 50% 음절 및 87 ... 93% 구두 명료도로 획득됩니다. 따라서 디스패치 통신을 계산할 때 광범위한 적용 시스템을 계산할 때보다 더 작은 명료도 값으로 안내됩니다.

Fletcher와 Collard가 개발한 포만트 이론을 사용하여 설정한 음성 명료도, 수신 조건 및 전송 경로 특성 사이에는 관계가 있습니다.

주파수 범위의 특정 부분에서 에너지 집중 영역은 포먼트. 위치는 단어나 구에서 소리의 위치와 인간 조음 장치의 개별 특성에 따라 다릅니다. 각 소리에는 여러 포먼트가 있습니다. 음성 포먼트는 150~7000Hz의 주파수 범위를 채웁니다.

이 주파수 범위를 20개 대역으로 나누는 데 동의했으며, 각 대역에서 포먼트가 나타날 확률은 동일합니다. 이러한 주파수 대역을 동일한 이해할 수 있음. 러시아어를 비롯한 여러 언어에 대해 정의됩니다. 우리는 포만트의 출현 확률이 가산법칙을 따른다는 것을 확인했습니다. 충분한 양의 사운드 재료로 각 밴드에서 포먼트가 나타날 확률은 0.05입니다.

포먼트는 강도 수준이 다릅니다. 청각 장애보다 유성음이 더 높습니다. 음향 잡음의 수준이 증가함에 따라 낮은 수준의 포먼트가 먼저 마스킹된 다음 높은 수준의 포먼트가 마스킹됩니다. 마스킹의 결과 포만트 지각의 확률이 감소합니다. 이 감소를 결정하는 계수 에게- th 밴드는 지각 또는 명료도 계수라고 합니다. 에게 에프 . 다시 말해 에서 에게-오 포먼트 수신 확률 대역

포만트 지각 계수는 어디에 있습니까? 에게 에프 감각의 수준에 따라 달라지며, 이는 다시 말의 평균 스펙트럼 수준의 차이에 의해 결정됩니다. 아르 자형 동일한 명료도의 대역과 동일한 대역의 잡음 및 간섭 스펙트럼 수준 :

이자형 에프 = 아르 자형 - . (16.2)

지각 계수(명확도)는 그림 1에 표시된 그래프에서 결정할 수 있습니다. 16.1. 이 그래프는 감각의 수준을 보여줍니다 이자형 에프 및 해당 인식 계수 에게 에프 .

감각 수준 0-18dB용 에게 에프 공식에 의해 대략적으로 결정될 수 있다 케이 에프 =(E+ 6)/30.

그림 16.1 음성 수준의 적분 분포.

일반적으로 동일한 명료도의 각 대역에 대해 인식 계수가 다릅니다. 음성 주파수 범위의 전체 포먼트 명료도는 다음과 같이 결정됩니다.

(16.3)

그림 16.2 포만트에 대한 음절 명료도의 의존성.

포만트와 다른 유형의 명료도 사이의 관계는 실험적으로 발견되었습니다. 음절 명료도에 대한 이러한 의존성은 그림 1에 나와 있습니다. 16.2. 이 그림은 전체 포먼트의 절반(포먼트 명료도는 0.5)만 수신하여 거의 완전한 음성 명료도(음절 명료도 80%)를 얻었으며, 이는 음성의 중복성과 뇌의 조합 능력을 나타냅니다.

소리가 나는 방에 대한 음성 명료도의 정의는 주로 최소 수준의 직접음과 최대 수준의 음향 잡음을 갖는 소리가 나는 표면의 지점에 대해 수행됩니다. 그러한 지점에 위치한 청취자로부터의 직접음의 스펙트럼 레벨,

, (16.4)

어디 RM - 마이크의 음성 스펙트럼 수준(테이블에서 결정)

,

어디 아르 자형 - 스피커에서 마이크를 제거하는 단계; - 1m 거리에서 음성의 스펙트럼 수준(참조 표에서 결정)
- 게인 인덱스(경로 인덱스 는 청취자의 귀에 있는 사운드 강화 시스템의 확성기에 의해 생성되는 사운드 레벨과 마이크 입력에 있는 기본 음원 간의 차이입니다.

이 데이터는 동일한 명료도의 각 대역에 대해 결정됩니다. 동일한 대역에 대해 청취 위치에서 노이즈 및 간섭의 스펙트럼 수준

어디 금연 건강 증진 협회 - 음향 잡음의 스펙트럼 수준(참조 표에서 결정) - 음성 간섭의 스펙트럼 수준(음성 자체 마스킹),

어디
- 확산음 간섭 보정 (아르 자형 - 설계 시점에서의 음향비); N - 회절 보정, 청취자의 머리에서 반사 보정(참조 표에서 결정)
- 잔향 간섭 보정 ( 아르 자형 - 잔향 시간).

음향 잡음의 수준은 tract index에 의존하지 않는 반면, 음성 간섭 수준은 tract index(16.4), (16.6)이 증가함에 따라 증가합니다. 따라서 감각 수준을 높이려면 tract index를 높이는 것이 좋습니다. 조건에 도달한 후

= 나 금연 건강 증진 협회 + 6 (16.7)

한계의 감각 수준이 1dB 만 증가 할 수 있기 때문에 tract index의 추가 증가는 합리적이지 않습니다. 이 조건은 (16.4), (16.6), (16.7)을 고려하여 경로 인덱스를 결정합니다.

이 경로 인덱스는 합리적인. 주로 음향비의 최대값에 의해 결정됩니다.
계산된 지점과 잔향 시간에서.

합리적 증폭으로 (16.5)에서 다음과 같이 나옵니다.

= 나 + 1, (16.9)

저것들. 음향 소음 기여 금연 건강 증진 협회 소음과 간섭의 전반적인 수준은 무시할 수 있습니다.

결과 표현을 통해 음성의 명료도와 명료도를 결정할 수 있습니다. 이를 위해 공식 (16.4), (16.6), (16.9)에 따라 어음, 소음 및 간섭의 수준을 찾은 다음 공식 (16.2)에 따라 포만트의 감각 수준을 결정합니다. 이자형 에프 가독성이 동일한 각 밴드에 대해 그림에 표시된 그래픽 종속성. 16.1, 명료도 계수를 찾을 수 있습니다. 에게 에프 , 수신된 값에 해당 이자형 에프 . 일반적인 포먼트 명료도 하지만 음성 주파수 범위에서 식 (16.3)에서 찾을 수 있으며 해당 음절 명료도는 그림에서 결정됩니다. 16.2. 말의 명료도는 표에 의해 결정됩니다. 16.1.

행동 양식 올리다 이해할 수 있음 연설

    간섭 수준 감소. (실제로 이것은 항상 달성되는 것은 아닙니다). 늘리려고 노력 중 청취자에게(마이크 접근, 화자의 음성 레벨 증가).

    직접음에 의한 청취자의 음압 레벨 증가, 음원에 마이크 접근, 화자의 음성 레벨 증가, 트랙 인덱스 증가.

    압축 음성 신호 - 최대 음압 수준을 유지하면서 약한 소리의 음압 수준을 높입니다.

압축의 제한적인 경우 진폭 제한 - 깎는. 이 음성 신호가 일정한 진폭의 펄스 시퀀스로 변환되지만 0 전환 사이의 간격은 다양합니다(전신 모드). 결과적으로 모든 말소리는 수신 시 동일한(최대) 레벨을 갖습니다. 이 경우 음질은 저하되지만 잡음으로 가려진 잘리지 않은 음성의 약한 소리가 이 전송 방법을 사용하면 잡음 수준보다 높기 때문에 명료도가 극적으로 증가합니다.

    보코더의 사용.

보코더는 음성의 정보 내용을 결정하는 매개변수가 음성 신호에서 추출되는 전송 부분의 장치입니다. 시간이 지남에 따라 음성 소리의 천천히 변화하는 신호.

보코더의 수신 부분에는 유성 음성 및 청각 장애인용 성대의 음향 시스템을 시뮬레이션하는 복잡한 필터가 있습니다. 합성된 사운드의 레벨과 필터의 매개변수는 보코더의 송신단에서 추출된 신호에 의해 제어되며, 그 결과 음성 신호의 스펙트럼 포락선이 복원됩니다. 복원된 신호의 품질과 명료도는 상당히 높습니다.

    신호를 엔벨로프 및 순시 위상과 특수 처리로 분리하여 평균 신호 전력 및 이에 따른 명료도를 높입니다.

음성 명료도 계산

    마이크로부터의 거리에 맞게 수정된 음성의 스펙트럼 수준을 계산합니다.

, (16.10)

어디 에' – 1m 거리에서 음성의 스펙트럼 수준(참조 표에서 결정).

2. 주어진 스펙트럼과 음향 잡음 수준을 기반으로 스펙트럼 수준을 찾습니다. (참조 표에서 결정됨).

3. 전체 보정 결정 ΣΔ .

4. 실제 경로 인덱스 결정 ms .

5. 모든 데이터가 테이블에 입력됩니다.

6. 청취자의 음성 스펙트럼 수준을 계산합니다.

(16.11)

7. 간섭의 스펙트럼 수준 계산

. (16.12)

8. 음향 잡음의 스펙트럼 수준과 간섭 스펙트럼 수준 요약

9. 음성의 스펙트럼 수준에서 총 간섭 및 소음의 스펙트럼 수준을 빼서 포만트의 감각 수준을 얻습니다.

. (16.14)

10. 발견된 감각 수준에 따라 명료도 계수 k f를 찾습니다.

0에 대한 . (16.15)

또는 표에서 정확한 값을 찾으십시오. 계산된 모든 값은 피벗 테이블에 입력됩니다.

11. 얻은 명료도 계수 값을 요약하고 포먼트 명료도를 찾습니다.

. (16.16)

포먼트 명료도를 통해 음절을 결정합니다. 에스그리고 구두 말의 명료도와 명료도.

명료도 계수 데이터의 분석에서 낮은 주파수가 높은 주파수보다 훨씬 더 나쁘게 전송된다는 것을 알 수 있습니다. 이러한 주파수에서 경로 인덱스를 제한하는 마진이 있으므로 약 4dB로 설계할 수 있습니다. 이것의 명료도는 실질적으로 변하지 않지만 음질은 향상될 것입니다.

음성 명료도의 대략적인 결정을 위해 축약된 계산 방법을 사용할 수 있습니다. 음성 및 소음의 스펙트럼이 주파수에서 매우 급격하게 변경되지 않으면 동일한 명료도의 모든 대역에 대해 계산하는 것이 의미가 없지만 옥타브 주파수에서 계산하는 것으로 충분합니다.

옥타브 173-350Hz는 동일한 명료도(200-350Hz)의 한 대역에 해당합니다.

350-700Hz 옥타브는 3개의 밴드(330-465)에 걸쳐 있습니다.

옥타브 700-1400Hz에는 4개 대역(750-900)이 포함됩니다.

옥타브 1400-2800Hz → 6밴드(1410-2840).

옥타브 2800-5600Hz → 5밴드(2840-5640).

5600-7000Hz 범위의 섹션은 동일한 명료도(5640-7000)의 마지막 대역에 해당합니다.

이를 염두에 두고 포만트 명료도는 공식에 의해 결정됩니다.

어디 케이 f1 - 케이 f6옥타브 주파수에서 명료도 계수입니다.

음성 명료도를 측정하는 모든 방법은 조건부로 다음과 같이 나뉩니다. 주걱그리고 목적. "조건부" - 방법의 "주관성-객관성"에 대한 해석이 두 가지 이상 있기 때문입니다.

첫 번째 해석.첫 번째 해석에 따르면 주관적인 방법은 단일 실험의 결과에 따라 음성 명료도를 평가하므로 테스트에 참여하는 사람들의 언어 및 청력 특성 측정 결과에 불가피한 영향을 미칩니다. 에게 객관화하다방법은 다양한 화자 및 구독자를 대상으로 많은 실험을 수행한 다음 측정 결과를 평균화해야 합니다.

전송된 음성의 명료도는 CCIR(International Advisory Committee for Radiocommunications)의 5점 척도로 평가됩니다.

· 읽을 수 없는;

· 때때로 읽을 수 있음;

어렵게 읽을 수 있음;

읽기 쉬운;

꽤 읽을 수 있습니다.

음성 명료도 측정의 객관화의 예는 통신 경로를 통한 음성 전송 품질을 평가하는 현대적인 방법으로, 러시아 연방 국가 표준에 따라 최소 3명의 연사와 4-5명의 감사자가 참여해야 합니다. 여러 조건을 충족하는 테스트 (발음 및 청력 결함 없음, 훈련 부족). 예를 들어, 구 명료도를 평가할 때 화자는 정상적인 발음 속도로 한 표의 구를 읽고(2.4초에 한 구) 두 번째 표를 빠른 속도로(1.5-1.6초에 한 구) 읽습니다. 프레이즈 사이의 멈춤은 5-6초여야 합니다. 오디터는 먼저 화자가 읽는 표를 정상적인 속도로 들은 다음 같은 화자가 읽는 표를 빠른 속도로 듣습니다. 문구 수신의 정확성은 전화 채널을 통해 전송된 수신에 의해 결정됩니다. 측정 주기는 각 10개 테이블의 모든 발표자가 전송하고 전송된 모든 테이블의 모든 감사자가 수락하는 것으로 구성됩니다. 하나 이상의 단어가 잘못 수신되거나 생략되거나 추가된 경우 구는 잘못 수신된 것으로 간주됩니다. 구문 명료도는 공식에 따라 정상 및 가속 발음 비율에 대해 올바르게 수신된 구문의 백분율을 계산하여 결정됩니다.

어디서 j i - 구 명료도의 단일 측정 결과, %; N은 단일 측정 횟수입니다. J H - 정상적인 발음 비율에서 구 명료도, %; J Y - 발음의 가속화된 속도로 구의 명료도, %.

위에서 설명한 것과 같은 메소드를 호출합니다. 조음. 그것들을 사용할 때 특별한 관절 테이블이 필요하며 그 편집은 독립적으로 어려운 작업입니다. 관절 방식의 또 다른 단점은 테스트 시간이 몇 주라는 긴 시간입니다.

관절 방식의 명백한 이점은 상대적으로 낮은 수준의 기술을 가진 작업자가 테스트에 참여할 수 있도록 하는 단순성입니다.

두 번째 해석.방법의 "주관성 - 객관성"에 대한 두 번째 해석에서 모든 방법을 주관적이라고하며 사람이 측정 경로의 필수적인 부분이고 객관적인 방법은 전체 측정 프로세스가 도구에 의해 수행되는 방법입니다. 인간의 감각의 참여 없이. 이를 위해 송신 및 수신 오퍼레이터는 인공 등가물("인공 음성", "인공 귀")로 대체되어야 합니다.

톤 방식.이러한 객관성 해석을 기반으로 음성 명료도를 측정하는 두 가지 방법이 설명됩니다. 이른바 "음조 방법"여러 아나운서가 순수한 음색을 생성하는 단일 인공 음성으로 대체됩니다. 인공 음성은 원뿔이 없는 기존의 확성기이며 톤 생성기에 의해 다음과 같은 방식으로 여기됩니다. 다른 주파수에서 생성된 음압 레벨은 포만트 스펙트럼 곡선에 해당합니다.. 음성 신호의 전송실과 수신실은 인위적으로 잡음이 있어 테스트 중인 시스템이 정상적으로 작동하는 데 필요한 신호 대 잡음비를 제공합니다. 정보 수신은 여전히 ​​감사팀에 의해 수행됩니다. 어디에서 감사인의 업무가 간소화됩니다.: 들은 소리 조합을 이해하고 녹음하는 대신 신호가 주어진 주파수에서 들리는지 여부를 결정하기만 하면 됩니다. 또한 오퍼레이터는 포먼트의 느낌을 측정해야 합니다. 이는 통신 경로에 포지티브 또는 네거티브 감쇠를 도입하여 아주 간단하게 수행됩니다. 신호가 들리면 신호가 더 이상 들리지 않을 때까지 감쇠가 양수로 설정됩니다. 반대로 신호가 들리지 않으면 신호가 들릴 때까지 감쇠가 음수로 설정됩니다. 음성 명료도 값의 추가 결정은 그래프와 간단한 공식을 사용하여 분석적으로 수행됩니다.

따라서 음조 방법은 조음 방법과 달리 간접 방법가독성 측정.

음조 방법의 장점:

1) 관절 테이블은 사용되지 않습니다.

2) 측정 시간의 상당한 감소.

음조 방식의 단점:

1) 테스트를 조직하는 직원의 기술 능력에 대한 요구 사항 증가;

2) 그 사람은 아직 측정 시스템에서 물러나지 않았습니다.

에 표시된 대로 색조 방법은 GOST No. 8031-56에 의해 규제됩니다. 지금쯤이면 이 GOST가 더 발전된 것으로 대체되었을 것입니다.

객관적인 방법.라는 다른 방법에서 "목적"인공 목소리와 인공 귀를 모두 사용합니다. 이 방법에서는 우리가 보는 바와 같이, 사람이 측정 시스템에서 완전히 제거되었습니다.. 인공 귀는 음향 측정 기술에서 일반적으로 사용되는 장치로, 전화기 테스트에 사용되며 자연 귀에 의해 전화기에 생성된 음향 부하를 재현할 수 있습니다. 따라서, 귀에 울리는 전화기에 의해 생성된 음압을 측정하는 것이 가능합니다.

이 경우의 일반적인 측정 순서는 다음과 같습니다.

1) 노이즈 발생기와 확성기의 도움으로 테스트 중인 경로의 수신단 작동 조건에 해당하는 노이즈 레벨이 생성됩니다. 가청 임계 주파수 대역에서 인공 귀의 출력에서 ​​잡음 레벨을 측정하고 이 대역의 평균 주파수는 측정 톤의 주파수와 동일합니다.

2) 노이즈 발생기가 꺼지고 대신 "인공 음성 - 전송 채널 - 인공 귀" 경로의 입력에 톤 신호가 공급됩니다. 마이크의 사운드 강도 레벨은 감쇠 컨트롤러의 조건부 0에서 음압 분포가 포만트 스펙트럼 곡선에 해당하도록 취해집니다.

3) 감쇠 제어의 도움으로 인공 귀의 출력에서 ​​신호 레벨은 노이즈 레벨과 동일합니다. 댐핑 컨트롤러 판독값은 감각의 정도를 측정한 결과.

객관적인 방법은 음조 방법보다 정확하고 빠르며 운영자 (아나운서 및 감사자)가 필요하지 않습니다. 마지막으로 객관적인 방법은 근본적으로 현대 컴퓨터를 기반으로 측정 절차를 완전히 자동화하는 것을 가능하게 합니다.

음조 방법과 마찬가지로 객관적인 방법은 간접적입니다. 음성 명료도는 올바르게 인식된 음성 단위를 세는 것이 아니라 톤 및 밴드 노이즈 형태의 사운드 신호를 사용하여 여러 주파수 대역의 감각 수준을 측정하는 특수 측정 실험을 수행하여 평가됩니다. 음성 명료도는 실험 측정 결과를 기반으로 계산됩니다.

객관적인 방법의 부인할 수 없는 장점과 위에서 언급한 TPR과 TKUI 간의 근본적인 유사성으로 인해 현재 하나 또는 다른 수정의 객관적인 방법은 통신 채널의 품질을 평가하는 데 사용됩니다. 음성 정보 보호의 효과 평가. 따라서 위에서 논의한 음성 명료도를 측정하는 간접적인 방법의 기초가 되는 아이디어를 자세히 고려하는 것이 좋습니다. 동시에 간접적 인 방법을 사용하는 언어 및 청력의 정신 생리학 일부 조항을 상기하는 것이 좋습니다.


비슷한 정보입니다.