오디오 코덱을 갖는 보청기 및 방법

申请号 KR1020127011572 申请日 2009-10-15 公开(公告)号 KR1020120064720A 公开(公告)日 2012-06-19
申请人 와이덱스 에이/에스; 发明人 랭크마이크린드; 키드모세프레벤; 엉스트럽미하엘; 젠슨모르텐홀름;
摘要 보청기(1a, 1b)는 시간 도메인 코덱을 포함한다. 상기 코덱은 입력 정량화 지수를 기초로 디코딩된 출력 신호를 생성하도록 되어 있고 예측기(4)와 예측기 적응 요소(11)를 포함하는 디코더와, 입력 신호를 기초로 출력 정량화 지수를 생성하는 인코더를 포함하고, 상기 인코더는 상기 디코더와 여기 신호를 수신하고 예측 신호를 출력하는 예측기(4)를 포함한다. 출력 정량화 지수는 입력 신호와 예측 신호 사이의 에러를 최소화하도록 정량화 지수들을 반복적으로 디코딩하는 것에 의해 결정되고, 예측기 적응 요소(11)는 예측기(4)의 갱신을 위해 재귀적 자기 상관 추정을 이용한다. 본 발명은 오디오 신호의 인코딩 방법도 제공한다.
权利要求
  • 오디오 코덱을 포함하는 보청기로서,
    상기 코덱은,
    입력 정량화 지수를 기초로 디코딩된 출력 신호를 생성하도록 되어 있고 예측기와 예측기 적응 요소를 포함하는 디코더와,
    입력 신호를 기초로 출력 정량화 지수를 생성하는 인코더로서, 상기 디코더와 여기 신호를 수신하고 예측 신호를 출력하는 예측기를 구비하는 인코더
    를 포함하는 시간 도메인 코덱이며,
    상기 출력 정량화 지수는 상기 입력 신호와 상기 예측 신호 사이의 에러를 최소화하기 위해 상기 정량화 지수들의 반복된 디코딩에 의해 결정되며,
    상기 예측기 적응 요소는 상기 예측기의 갱신을 위해 재귀적 자기 상관 추정을 이용하는 것인 보청기.
  • 제1항에 있어서, 상기 코덱은 스칼라 정량화 모드와 벡터 정량화 모드 사이를 선택적으로 전환하는 수단을 포함하는 보청기.
  • 제1항 또는 제2항에 있어서, 정량화 지수의 적어도 하나의 미리 정해진 시퀀스를 저장하도록 된 메모리와, 상기 적어도 하나의 시퀀스를 상기 코덱에 제공하는 수단을 포함하는 것인 보청기.
  • 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 인코더는 복수의 정량화 지수를 포함하는 코드북을 포함하며, 상기 정량화 지수는 다수의 정량화 지수가 상이한 분기에 배열되는 트리 구조로 검색 가능한 방식으로 배열되며, 각각의 개별 정량화 지수는 특정 분기에 고유한 것인 보청기.
  • 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 인코더는 복수의 정량화 지수를 포함하는 코드북을 포함하며, 상기 정량화 지수는 다수의 정량화 지수가 상이한 분기에 배열되는 트리 구조로 검색 가능한 방식으로 배열되며, 적어도 하나의 개별 정량화 지수는 두 개 이상의 분기에서 발견되는 것인 보청기.
  • 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 인코더는 상기 입력 신호와 상기 예측 신호로부터 직접 정량화 지수를 계산하도록 된 컴퓨팅 장치를 포함하는 것인 보청기.
  • 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 디코더는 형태 값과 이득 값 각각을 나타내는 정량화 벡터를 각각 제공하는 형태 코드북과 이득 코드북을 포함하는 것인 보청기.
  • 제7항에 있어서, 상기 이득 어댑터는 역방향-적응적 이득 어댑터인 보청기.
  • 제1항에 있어서, 상기 예측기는 2차 이상의 자기 상관 모델을 기초로 재귀적 자기 상관 추정을 이용하여 적합되는 것인 보청기.
  • 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 보청기는 상기 코덱에 의해 인코딩되기 전에 오디오 신호의 샘플링 비율을 변경하는 샘플링 비율 변환기를 포함하는 것인 보청기.
  • 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 보청기는 송신된 신호에서 송신기와 수신기 사이의 디지털 클록 주파수의 차이를 검출하는 수단과 상기 검출된 차이를 보상하기 위해 디코딩된 오디오 신호를 수정하는 수단을 포함하는 보청기.
  • 제11항에 있어서, 상기 클록 신호 주파수 차이를 검출하는 수단은 디지털 위상 동기 루프(phase-locked loop; PLL)인 보청기.
  • 제1항에 있어서,
    데이터 스트림이 스트리밍 채널을 통해 수신되는 상기 코덱의 스트리밍 모드에서 상기 데이터 스트림의 비트 에러를 검출하는 수단과,
    상기 데이터 스트림의 비트 에러율을 추정하는 수단과,
    상기 코덱으로부터의 오디오 출력을 페이딩하는 수단을 포함하는 보청기.
  • 제13항에 있어서, 상기 코덱 디코더는 채널 디코더로부터 검출된 에러의 수를 수신하는 수단과, 수정 불가 에러의 검출시 예측기로의 여기 신호를 제로 또는 널-벡터로 설정하는 수단을 포함하는 것인 보청기.
  • 보청기에서 오디오 신호를 인코딩하는 방법으로서,
    디지털 오디오 신호를 제공하는 단계와,
    입력 정량화 지수를 기초로 디코딩된 출력 신호를 생성하도록 되어 있고 예측기 및 예측기 적응 요소를 포함하는 디코더를 제공하는 단계와,
    상기 디코더와 여기 신호를 수신하고 예측 신호를 출력하도록 된 상기 예측기를 포함하는 인코더를 제공하는 단계와,
    상기 인코더를 사용하여, 입력 신호를 기초로 출력 정량화 지수를 생성하는 단계와,
    입력 신호와 예측 신호 사이의 에러를 최소화하도록 정량화 지수의 디코딩을 반복하는 것에 의해 상기 출력 정량화 지수를 결정하는 단계와,
    재귀적 자기 상관 추정을 이용하여 상기 예측기를 갱신하는 단계
    를 포함하는 보청기에서의 오디오 신호 인코딩 방법.
  • 제15항에 있어서, 상기 반복되는 디코딩은 복수의 정량화 지수를 포함하는 코드북의 검색을 포함하며, 상기 정량화 지수는 다수의 정량화 지수가 상이한 분기에 배열되는 트리 구조로 검색 가능한 방식으로 배열되며, 각각의 개별 정량화 지수는 특정 분기에 고유한 것인 보청기에서의 오디오 신호 인코딩 방법.
  • 제15항에 있어서, 상기 반복되는 디코딩은 복수의 정량화 지수를 포함하는 코드북의 검색을 포함하며, 상기 정량화 지수는 다수의 정량화 지수가 상이한 분기에 배열되는 트리 구조로 검색 가능한 방식으로 배열되며, 적어도 하나의 개별 정량화 지수는 두 개 이상의 분기에서 발견되는 것인 보청기에서의 오디오 신호 인코딩 방법.
  • 제15항에 있어서, 상기 반복되는 디코딩은 컴퓨팅 장치를 사용하여 상기 입력 신호와 상기 예측 신호로부터 직접 정량화 지수를 계산하는 것을 포함하는 것인 보청기에서의 오디오 신호 인코딩 방법.
  • 제15항 내지 제18항 중 어느 한 항에 있어서, 형태 코드북과 이득 코드북을 각각 사용하여 형태 값과 이득 값을 나타내는 정량화 벡터가 제공되는 것인 보청기에서의 오디오 신호 인코딩 방법.
  • 제15항 내지 제19항 중 어느 한 항에 있어서, 상기 예측기는 2차 이상의 자기 상관 모델을 기초로 한 재귀적 자기 상관 추정을 이용하여 적합화되는 것인 역방향-적응적 이득 어댑터인 보청기에서의 오디오 신호 인코딩 방법.
  • 제15항에 있어서, 스트리밍 채널을 통해 데이터 스트림이 수신되고, 상기 데이터 스트림 내의 비트 에러가 검출되고, 비트 에러의 검출시 코덱으로부터의 상기 오디오 출력이 페이딩되는 것인 보청기에서의 오디오 신호 인코딩 방법.
  • 제21항에 있어서, 채널 디코더로부터 검출된 에러의 수가 상기 코덱에 제공되고, 수정 불가 에러의 검출시 예측기로의 여기 신호가 제로 또는 널-벡터로 설정되는 것인 보청기에서의 오디오 신호 인코딩 방법.
  • 说明书全文

    오디오 코덱을 갖는 보청기 및 방법{HEARING AID WITH AUDIO CODEC AND METHOD}

    본 발명은 보청기에 관한 것이다. 보다 상세하게, 본 발명은 디지털 오디오 신호를 디코딩 및 인코딩하기 위한 시간-도메인 오디오 코덱을 갖는 보청기에 관한 것이다. 또한, 본 발명은 오디오 신호를 디코딩 및 인코딩하는 방법에 관한 것이다.

    보청기는 하나 이상의 마이크로폰, 신호 프로세서, 및 음향 신호를 음향적으로 재생하기 위한 수단을 포함하는 작고 착용 가능한 유닛으로 형성된다. 보청기는 텔레코일(telecoil) 또는 FM 수신기와 같은 다른 소스로부터 음향 신호를 수신, 처리 및 재생하기 위한 수단을 추가로 포함할 수 있다. 사용자의 청력 손실을 줄이기 위해, 보청기의 신호 프로세서는 사용자의 청력 손실의 미리 기록된 청력도를 기초로 선택된 주파수 대역을 증폭하도록 구성된다. 적응성의 이유로 인해, 신호 프로세서는 디지털 신호 프로세서인 것이 바람직하다.

    현대의 보청기는 통상적으로 일방향 또는 2방향 무선 통신, 즉 무선 통신을 위한 수단을 장착하고 있다. 이러한 무선 통신은 예컨대 2개의 보청기 사이 또는 보청기와 다른 장치 사이에서 디지털 형태로 보청기에 대해 전송되기에 적합한 음성과 같은 음향 신호를 전달할 수 있다. 이러한 무선 통신에서는 여러 가지 이유 중 하나의 이유로서 무선 통신의 대역폭의 증가가 전력 소비를 증가시켜 결국 보청기에 바람직하지 않기 때문에 비트 전송률을 가능한 낮게 유지하는 것에 대한 요구가 존재한다.

    디지털 오디오 신호에서 비트 전송률을 감소시키는 하나의 방법은 소프트웨어와 다소간의 전용 하드웨어의 조합으로서 실시되는 통상 코덱으로 지칭되는 인코더/디코더 유닛 또는 프로세서를 사용하여 해당 신호를 인코딩 및 디코딩하는 것이다. 그러나, 이러한 비트 전송률의 감소는 오디오 대역폭, 재생 품질, 계산적 복잡성 및 지연의 측면에서 비용이 유발된다.

    대역폭과 지연 시간을 줄이기 위한 하나의 시도가 Juin-Hwey Chen 등에 의해 1992년 6월 IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS 제10권 5호에 기고된 논문 'A Low-Delay CELP Coder for the CCITT 16 kb/s Speech Coding Standard'에 기술되어 있다. 그러나, 이 논문에 기재된 오디오 대역, 재생 품질 및 계산적 복잡성은 보청기에서의 요구 사항을 만족시키지 못한다.

    본 발명의 목적은 계산적 복잡성을 낮게 유지하고 허용 가능한 재생 품질을 여전히 달성하면서도 전술한 대역폭 문제를 극복하는 코덱을 갖는 보청기를 제공하는 것이다.

    본 발명에 따르면, 상기 목적은 오디오 코덱을 포함하는 보청기에 의해 달성되며, 해당 오디오 코덱은 입력 정량화 지수를 기초로 디코딩된 출력 신호를 생성하도록 되어 있고 예측기와 예측기 적응 요소를 포함하는 디코더와, 입력 신호를 기초로 출력 정량화 지수를 생성하는 인코더로서 상기 디코더와 여기 신호를 수신하고 예측 신호를 출력하는 상기 예측기를 구비하는 인코더를 포함하는 시간 도메인 코덱이며, 상기 출력 정량화 지수는 상기 입력 신호와 상기 예측 신호 사이의 에러를 감소시키도록 상기 정량화 지수들의 반복된 디코딩에 의해 결정되며, 상기 예측기는 에러 감소를 위해 재귀적 자기 상관 추정을 이용하는 것을 특징으로 한다.

    보청기에 이러한 코덱을 구현하는 것에 의해, 대역폭과 신호 품질에 관한 상기 기준이 만족되는 한편, 디코딩에 필요한 연산이 인코딩에 필요한 연산과 유사하다는 점에서 복잡성이 상대적으로 낮게 유지된다. 따라서, 처리 회로 칩에 구현된 하드웨어의 상당 부분, 즉 경우에 따라 인코딩 또는 디코딩에 사용되는 칩의 전용 처리 부분을 재사용할 수 있다. 이것은 다시 전용 인코딩 유닛과 디코딩 유닛을 가지는 설계에 비해 칩에 대한 물리적 공간을 절약함으로써 보청기 내의 공간을 전체적으로 절약할 수 있게 한다.

    본 발명의 바람직한 실시예에 따르면, 상기 코덱은 스칼라 정량화 모드와 벡터 정량화 모드 사이를 선택적으로 전환하는 수단을 포함한다.

    상기 스칼라 정량화 모드에서 신호는 신호 형태를 나타내는 코드북 내의 스칼라로부터 합성된다. 벡터 정량화 모드에서 신호는 예컨대, 신호 형태, 신호 이득 및 신호 부호를 나타내는 코드북 내의 벡터로부터 합성된다.

    두 개의 다른 정량화 모드 사이를 선택적으로 전환하는 수단을 포함하여, 상기 모드 중 하나의 모드로 동작하는 수단을 포함하는 것에 의해, 예컨대, 스칼라 정량화 모드에서 모노 신호의 전송을 위한 유효한 대역폭의 사용 또는 예컨대, 벡터 정량화 모드에서 스테레오 인코딩된 신호의 전송을 위한 유효한 대역폭의 사용 등과 같이 사용 중의 대역폭의 적응적인 활용이 가능해진다.

    본 발명의 추가의 바람직한 실시예에 따르면, 보청기는 정량화 지수의 적어도 하나의 미리 정해진 시퀀스를 저장하도록 된 메모리와, 이러한 적어도 하나의 시퀀스를 상기 코덱에 제공하는 수단을 포함한다.

    이러한 특징은 대응하는 보청기 또는 전용 스트리밍 기기와 같은 외부 기기로부터 수신되는 데이터 스트림으로부터 오디오 신호를 재생하는 것은 물론, 보청기 내의 메모리에 저장된 정량화 지수의 시퀀스를 기초로 미리 정해진 메시지와 같은 음향을 재생하기 위해 스트리밍 모드와 재생 모드 사이에서 상기 코덱을 선택적으로 전환하는데 상기 코덱을 사용할 수 있게 한다. 샘플링된 신호 대신에 정량화 지수의 시퀀스를 저장하는 것은 코덱에서 판독시 정량화 지수의 시퀀스로부터 신호가 재구성될 수 있게 함으로써 보청기 메모리 내의 유용한 공간을 절약할 수 있다.

    본 발명의 추가의 바람직한 실시예에서, 인코더는 복수의 정량화 지수를 포함하는 코드북을 포함하며, 상기 정량화 지수는 다수의 정량화 지수가 상이한 분기에 배열되는 트리 구조로 검색 가능한 방식으로 배열되며, 각각의 개별 정량화 지수는 특정 분기에 고유하다. 이것은 최적의 정량화 지수의 검색을 위해 코드북을 반복 검색시, 분류된 정량화 지수를 기초로 신속하고 효율적인 방식으로 코드북을 검색할 수 있도록 할 수 있다.

    본 발명의 다른 바람직한 실시예에서, 인코더는 복수의 정량화 지수를 포함하는 코드북을 포함하며, 상기 정량화 지수는 다수의 정량화 지수가 상이한 분기에 배열되는 트리 구조로 검색 가능한 방식으로 배열되며, 적어도 하나의 정량화 지수는 두 개 이상의 분기에서 발견된다. 검색 분기를, 다른 분기로부터, 즉 다른 분류로부터 정량화 지수로 과밀화하는 것에 의해, 최적의 정량화 지수의 검색의 정확성이 계산적 복잡성을 거의 증가시키지 않고 크게 향상될 수 있다.

    대안적인 실시예에서, 인코더는 입력 신호와 예측 신호로부터 직접 정량화 지수를 계산하도록 된 컴퓨팅 장치를 포함한다. 정량화 지수를 테이블화하여 해당 지수들을 룩업하는 대신에 코드북 내의 정량화 지수를 계산하는 것은 보청기 내의 코드북에 대한 메모리 용량의 요구를 제거한다.

    본 발명의 또 다른 바람직한 실시예에 따르면, 상기 디코더는 형태 값과 이득 값 각각을 나타내는 정량화 벡터를 각각 제공하는 형태 코드북과 이득 코드북을 포함한다. 본 실시예는 코드북 내의 형태 값이 정규화될 수 있게 하며, 이득 코드북으로부터의 이득 값을 활용하여 상기 정규화되고 합성된 출력 신호를 적절히 기준화한다.

    본 발명의 특히 바람직한 실시예에서, 상기 이득 어댑터는 역방향-적응적(backward-adaptive) 이득 어댑터이다. 이것은 이득 어댑터가 음향 신호의 전체 동태(dynamics)에 적응하도록 한다.

    본 발명의 다른 바람직한 실시예에서, 상기 예측기는 2차 이상의 자기 상관 모델을 기초로 재귀적 자기 상관 추정을 이용하여 적합화된다. 이것이 갖는 장점은 비-재귀적 부분을 포함하는 상관 모델에 비해 히스토리 값(historical values)의 저장에 적은 메모리 용량이 필요하다는 것이다. 더욱이, 계산적 복잡성이 크게 감소된다.

    본 발명의 특별한 실시예에서, 보청기는 코덱에 의해 인코딩되기 전에 오디오 신호의 샘플링 비율을 변경하는 샘플링 비율 변환기를 포함한다. 이것은 코덱의 인코더가 보청기 신호 프로세서에 채용된 샘플링 비율과 다른 샘플링 비율의 신호에 작용하도록 할 수 있다. 따라서, 코딩된 신호의 샘플링 비율이 보청기 프로세서의 샘플링 비율보다 작은 경우, 무선 링크에 요구되는 대역폭의 추가적 감소를 얻을 수 있다. 보청기의 샘플링 비율을 코덱의 샘플링 비율로 전환하는 것은 예비 처리의 일부로서 신호를 인코딩하기 이전에 행해지며, 코덱의 샘플링 비율을 보청기의 샘플링 비율로 전환하는 것은 디코딩된 신호가 다시 오디오 신호로 변환되기 전에 포스트-처리의 일부로서 디코딩 이후에 수행된다.

    본 발명의 바람직한 실시예에서, 보청기는 송신된 신호에서 송신기와 수신기 사이의 클록 주파수의 차이를 검출하는 수단과 검출된 차이를 보상하기 위해 디코딩된 오디오 신호를 수정하는 수단을 포함한다. 이 특징은 수신 보청기가 수신 신호와 보청기 사이의 클록 주파수의 차이를 보청기 착용자가 들을 수 없는 방식으로 수용하고 보상하도록 할 수 있다.

    본 발명의 추가의 바람직한 실시예에서, 클록 신호 주파수 차이를 검출하는 상기 수단은 디지털 위상 동기 루프(PLL)이다. 본 실시예는 샘플링 비율 전환 인자가 상기 디지털 PLL에 의해 제어되는 샘플링 비율의 비동기 전환을 가능케 한다. 이것은 샘플링 비율 전환을 위해 적절히 보상된 클록 주파수를 얻기 위해 어떤 동기 신호도 전송될 필요가 없으므로 신호의 수신을 간단하게 한다.

    본 발명의 추가의 바람직한 실시예에서, 보청기는 데이터 스트림이 스트리밍 채널을 통해 수신되는 상기 코덱의 스트리밍 모드에서 상기 데이터 스트림의 비트 에러를 검출하는 수단과, 상기 데이터 스트림의 비트 에러율을 추정하는 수단과, 코덱으로부터 출력된 오디오 신호를 페이딩하는(fading) 수단을 포함한다. 이것은 코덱으로부터의 출력 신호가 갑작스럽게 두절되어 보청기의 사용자에 혼란을 주기보다는 페이딩될 수 있게 한다.

    특히 바람직한 실시예에서, 코덱 디코더는 채널 디코더로부터 검출된 에러의 수를 수신하는 수단과, 에러 검출시 예측기로의 여기 신호를 1차원 널-벡터(null-vector)의 특정 경우를 나타내는 제로 또는 널-벡터로 설정하는 수단을 포함한다. 이것은 예측기에 대한 전송 에러의 영향을 최소화한다.

    본 발명은 또한 오디오 신호를 인코딩 및 디코딩하는 하는 방법을 제공한다. 해방 방법은 디지털 오디오 신호를 제공하는 단계와, 입력 정량화 지수를 기초로 디코딩된 출력 신호를 생성하도록 되어 있고 예측기 및 예측기 적응 요소를 포함하는 디코더를 제공하는 단계와, 디코더와 여기 신호를 수신하고 예측 신호를 출력하도록 된 예측기를 포함하는 인코더를 제공하는 단계와, 상기 인코더를 사용하여, 입력 신호를 기초로 출력 정량화 지수를 생성하는 단계와, 상기 입력 신호와 예측 신호 사이의 에러를 최소화하도록 정량화 지수의 디코딩을 반복하는 것에 의해 출력 정량화 지수를 결정하는 단계와, 재귀적 자기 상관 추정을 이용하여 상기 예측기를 갱신하는 단계를 포함한다.

    상기 방법의 바람직한 실시예는 종속 청구항에서 볼 수 있으며, 전술한 것에 대응하는 장점을 제공한다.

    본 발명은 비제한적이고 예시적인 실시예를 기초로 도면을 참조로 하여 설명된다.

    도 1은 본 발명에 따른 2개의 보청기와 외부 장치를 개략적으로 도시하고,
    도 2a 및 도 2b는 도 1의 어느 한 보청기에서의 코덱의 기능성의 블록도를 나타내며,
    도 3은 미리 기록된 지수를 보유하는 메모리의 개략도이고,
    도 4a는 트리 검색의 제1 예를 나타내며,
    도 4b는 트리 검색의 제2 예를 나타내며,
    도 5는 비트 에러율의 함수로서 이득 페이딩을 나타내며,
    도 6은 자기 상관 추정에 사용되는 2차 회귀 윈도우를 보여준다.

    도 1은 제1 보청기(1a), 제2 보청기(1b) 및 외부 장치(2)를 예시한다. 제1 보청기(1a)는 개략적 형태로 예시되며, 보청기(1b)는 물리적 외형으로 나타낸다. 양측의 보청기(1a, 1b)는 단파 무선 라디오 통신 링크(3)를 통해 서로 통신하도록 적용된다. 마찬가지로, 이들 보청기는 단파 무선 라디오 통신 링크(3)를 통해 외부 장치(2)와 통신하도록 적용된다.

    보청기(1a)는 안테나(51), 무선 송수신기(52), 보청기 프로세서(50), 마이크로폰(54) 및 음향 출력 변환기(55)를 포함한다. 무선 송수신기(52)는 디지털적으로 인코딩된 신호를 수신 및 송신할 수 있다. 보청기 프로세서(50)는 오디오 신호 프로세서(53), 입력 채널 디코더(56), 오디오 디코더(57), 포스트-처리 블록(58), 오디오 예비 처리 블록(59), 오디오 인코더(60) 및 출력 채널 인코더(61)를 포함한다.

    수신 모드에서, 오디오 신호 프로세서(53)는 마이크로폰(54)으로부터 입력 신호를 수신하고, 보청기 지시에 따라 음향 출력 변환기(55)에 의해 재생을 위해 해당 신호를 조절 및 증폭한다. 안테나(51)가 무선 신호를 수신하면, 송수신기(52)는 보청기 프로세서(50)에 의한 추가의 처리를 위해 수신된 신호를 채널 스트림으로 복조한다.

    복조된 채널 스트림은 채널 스트림이 디코딩되는 보청기 프로세서(50)의 입력 채널 디코더(56)를 위한 입력으로서 사용된다. 디코딩된 채널 스트림은 오디오 디코더(57)를 위한 입력 비트 스트림으로서 사용된다. 오디오 디코더(57)는 비트 스트림으로부터 획득된 코드북 지수를 사용하여 대응하는 오디오 신호를 합성하고 디지털 오디오 신호를 상대적으로 낮은 샘플링 비율로 출력하는 것에 의해 비트 스트림을 디코딩한다. 디지털 오디오 신호는 해당 디지털 오디오 신호에 포스트 처리를 행하는 포스트 처리 블록(58)을 위한 입력으로서 사용된다. 포스트 처리는 수신된 신호가 오디오 신호 프로세서(53)에서의 오디오 신호 처리에 적합하도록 하기 위해 샘플링 비율의 필터링, 조절 및 상대적으로 높은 샘플링 비율의 디지털 오디오 신호로의 비동기적 샘플링 비율 변환을 포함한다. 이렇게 수신된 오디오 신호의 샘플링 비율은 보청기(1a)의 샘플링 비율보다 낮기 때문에 보다 적은 비트가 무선 송수신기(52)를 통해 전송되어야 하므로 보다 효율적인 전송이 이루어질 수 있다.

    송신 모드에서, 오디오 프로세서(53)는 무선 송수신기(52)에 의한 송신을 위해 다음의 방식으로 디지털 오디오 신호를 제공한다: 디지털 오디오 신호는 오디오 예비 처리 블록(59)으로 공급되어 디지털 오디오 신호가 재 샘플링되고 낮은 샘플링 비율의 디지털 오디오 스트림으로 변환된다. 디지털 오디오 스트림은 인코더(60)에서 비트 스트림으로 인코딩된다. 이러한 비트 스트림은 디지털 오디오 신호를 나타내는 일조의 코드북 정량화 지수를 포함한다. 비트 스트림은 채널 스트림이 생성되는 출력 채널 인코더(61)를 위한 입력으로서 사용된다. 출력 채널 인코더(61)로부터의 채널 스트림은 안테나(51)를 통한 변조 및 무선 전송을 위해 무선 송수신기(52)의 입력으로 공급된다.

    단파 무선 라디오 통신 링크(3)의 대역폭은 보청기(1)의 라디오 회로의 전력 소비가 보청기에서의 제한된 전원에 기인하여 낮게 유지되어야 하므로 제한적이다. 전형적인 무선 신호 대역폭은 100 kbit/s ~ 400 kbit/s이다.

    단파 무선 라디오 통신 링크(3)의 하나의 사용 목적은 오디오 신호의 스트리밍인데, 즉 오디오 신호는 하나의 보청기로부터 다른 보청기로, 즉 머리의 일측에서 타측으로, 소위 신호의 대칭적 라우팅(Contralateral Routing of Signals: CROS) 방식으로 스트리밍될 수 있다. 신호는 예컨대, 외부 장치(2)를 통해 TV-세트, 라디오 등과 같은 다른 소스로부터의 오디오를 송신하기 위해 외부 장치(2)로부터 보청기로 스트리밍될 수 있다.

    그러나, 단파 무선 라디오 통신 링크(3)의 제한된 대역폭 때문에, 전송되는 오디오 신호를 압축하는 것이 필요하다. 그러므로, 보청기(1)는 본 발명에 따른 코덱을 포함한다. 코덱은 도 2a 및 도 2b 각각에 인코더와 디코더로서 예시된다. 그러나, 도 2a와 도 2b의 비교를 통해 그리고 하기에 보다 상세히 설명되는 바와 같이, 인코더는 디코더를 포함한다. 따라서, 코덱의 하드웨어, 즉 코덱의 모든 기능이 실시되는 회로 칩의 부품은 두 가지 목적으로 사용될 수 있다. 이것은 다시 말해 하드웨어의 동일 부품이 인코딩 및 디코딩 기능으로 사용되는 하드웨어를 구성할 수 있고 칩의 이러한 부품의 과잉이 방지됨을 의미한다. 따라서, 보청기에서 유효한 회로 칩 공간이 절약된다.

    도 2a는 본 발명에 따른 인코더를 보여주는 블록 구성도이다. 인코더는 제1 디퍼런스 노드(difference node)(5), 필터 적응 블록(6), 지각 가중 블록(perceptual weighing block)(7), 벡터 정량화 블록(8a), 스칼라 정량화 블록(8b), 코드북 블록(9), 및 디코딩 서브-블록(20)을 포함한다. 디코딩 서브-블록(20)은 이득 적응 블록(10), 증폭기(12), 예측기 블록(4) 및 예측기 적응 블록(11)을 포함한다.

    디지털 오디오 입력 신호는 필터 적응 블록(6)과 제1 디퍼런스 노드(5)로 들어가고, 디퍼런스 블록(5)으로부터의 출력은 지각 가중 함수에 따른 조절을 위해 스칼라 정량화 블록(8b) 또는 지각 가중 블록(7)의 입력으로 제공된다. 지각적으로 가중된 신호는 이후 벡터 정량화 블록(8a)에서 벡터로 정량화된다.

    스칼라 정량화 또는 벡터 정량화의 사용 여부에 따라, 정량화된 벡터 또는 스칼라 지수가 대응하는 코드북 블록(9)의 입력으로 제공된다. 코드북 블록(9)은 지수들로부터 디코딩 서브-블록(20)으로 형태 지수 근사치와 이득 지수 근사치를 출력한다. 디코딩 서브-블록(20)에서는 통합 신호의 이득과 형태를 실제 입력 신호에 반복 적용하는 것에 의해 순간 입력 신호의 통합 근사치가 생성된다. 이러한 근사는 제1 디퍼런스 노드(5)로부터의 에러 신호를 최소화하는 것에 의해 수행된다. 일단 에러 신호가 최소화되면, 경우에 따라 벡터 정량화 지수 또는 스칼라 정량화 지수가 송신을 위해 인코더로부터 출력된다.

    전술한 바와 같이, 에러 최소화는 다수의 상이한 정량화 지수를 출력으로서 생성하는 시행착오 프로세스를 사용하여 입력 신호를 통합 신호에 반복 비교하는 것에 의해 행해진다. 이들 상이한 정량화 지수 각각은 코드북(9)으로 제공된다. 디코더 서브-블록(20)으로부터의 출력 신호는 예측기용 여기 신호로서 기능한다. 시행착오 프로세스의 말단에서, 디퍼런스 노드(5)에서 최소 에러를 내는 정량화 지수가 출력 정량화 지수로서 선택된다. 상기 프로세스는 이후 반복적으로 수행되어 단파 무선 라디오 통신 링크를 통한 송신에 적합한 종국적인 출력 데이터 스트림을 제공한다. 이 데이터 스트림은 코드북(9)을 위한 정량화 지수의 송신만이 필요하므로 초기 샘플링된 입력 신호에 비해 압축된다. 이득 어댑터(10)는 코드북(9)으로부터의 신호를 조정하고 증폭기(12)를 제어하여 예측기(4)를 위한 증폭되고 디코딩된 출력 신호를 제공한다.

    예측기(4)는 예측기 적응 블록(11)에 의해 제어된다. 예측기 적응 블록(11)은 자기 재귀적(autorecursive)이어서, 즉 이전의 출력 정량화 지수에 대응하는 이전의 여기 신호에 대한 자기 예측을 기초로 한다. 도 6은 본 발명에 따라 사용되는 윈도우 함수의 시간에 대한 신호 샘플에 적용되는 가중을 예시한다. 윈도우 함수(Wm(n))는 다음과 같이 정의된다:

    따라서, 시간(m)에서 윈도우-가중된 신호(Sm)는:

    시간 경과(τ)에 대한 시간(m)에서의 자기 상관은:

    여기서, Rm은 예측기 적응 계수를 산출하는 Levinson-Durbin 알고리즘을 위한 입력으로서 사용된다.

    m보다 큰 값의 경우, Wm(n)=0 이고, 따라서 Sm(n)=0 이다. 시간 경과(τ)에 대한 시간(m)에서의 임시 자기 상관(casual autocorrelation)은 다음의 공식에 의해 주어진다:

    2차 재귀적 윈도우의 특정 경우, 상기 공식은 다음과 같이 변형된다:

    자기 재귀적 윈도우가 단일의 샘플보다는 프레임에 기초하면, 2차 자기 상관 윈도우는 다음과 같이 주어진다:

    여기서,

    이고,

    L은 프레임 길이이다. 예측기(4)는 오직 매 프레임마다 한번 갱신되므로, 시간을 절약할 수 있다.

    코드북에 유지되어 유용한 시간 프레임 내에서 검색되어야 할 벡터의 수를 제한하기 위해, 벡터 정량화 코드북은 오직 정규화된 벡터만을, 즉 단위 길이의 벡터만을 보유하는 것이 바람직하다. 정규화된 벡터는 이후 적절히 조정된 벡터를 제공하기 위해 적절한 이득 인자로 곱셈 연산되어야 한다. 이득 곱셈 노드(12)에서는 인코딩 코드북(9)으로부터 출력되는 정규화된 벡터가 예측기(4)를 위한 여기 신호의 산출을 위해 이득 적응 블록(10)으로부터의 이득 인자에 의해 곱셈 연산된다.

    이득 인자 유도는 별도의 이득 코드북을 기초로 함으로써 출력 정량화 지수에 포함되는 별개의 이득 지수를 얻는 것이 바람직하다.

    예측기(4)에 제공되는 여기 신호(X(t))는 다음의 공식을 따른다:

    여기서, s는 형태 코드북으로부터의 정규화된 형태 벡터이고, g는 별개의 이득 코드북으로부터의 순간 이득이고, G는 글로벌 이득 인자이다.

    도 2a 및 도 2b로부터 알 수 있는 바와 같이, 이득 인자는 이득 적응 블록(10)에 의해 적응적으로 제어되기도 한다. 정규화 이득 지수가 사용될 때, 이득 적응은 예컨대, 다음의 재귀적 공식을 따른다:

    여기서, G는 이득 코드북에서 이득 값, t는 현재 샘플, t-1은 이전 샘플, α는 붕괴 인자(decay factor), Tg(gcbi)는 이득 값의 매핑 및/또는 함수이다. α의 적절한 선택에 의해, 이득 적응의 히스토리적 강조(historical emphasis)가 조정될 수 있다. 함수 Tg는 3의 파워와 같은 비선형 함수인 것이 바람직하다. 이것은 이득 코드북의 이득 값이 단지 수 비트로 저장될지라도 광범위한 동적 범위를 포괄하도록 함으로써, 3비트는 0~7 또는 26dB의 범위보다는 0~343 또는 72dB의 범위를 포함한다.

    전술한 바와 같이, 코드북을 검색하고 결과적인 여기 신호의 시험을 위한 유효 시간은 제한된다. 그러므로, 주어진 시간 프레임 내에서 인코더 코드북에 있는 모든 정량화 벡터를 검색하는 것은 어렵거나 불가능할 수도 있다. 따라서, 벡터를 트리 구조로 분류하고, 1차적으로 등급에 대해, 2차적으로 해당 등급 내의 최적의 정량화 벡터에 대해 행하는 트리 검색을 수행하는 것이 바람직하다. 도 4a에 예시된 바와 같이, M?N 정량화 벡터(V 11 -V MN )는 등급(C 1 -C M )으로 배열되어 있다. 수행될 최대 검색은 이에 따라 M?N~M+N으로 감소된다.

    그러나, 이러한 방식으로 벡터를 분류하는 것은 잠재적으로 최적의 벡터를 배제할 수 있는데, 이는 해당 벡터가 실제 다른 등급에 있을 수 있기 때문이다. 충분한 시간이 적용 가능하면, 이러한 단점은, 등급에 어느 정도의 중복을 도입하는 경우, 즉 일부의 등급이 다른 등급으로부터의 벡터의 카피를 포함하는 경우, 완화될 수 있다. 이것은 등급(C 1 )이 등급(C 2 )로부터의 요소(V 21 )의 카피를 가지는 도 4b에 예시된다. 따라서, 각각의 개별 정량화 지수가 검색 트리의 특정 분기에 고유한 도 4a에 도시된 코드북과 달리, V 21 과 같은 적어도 하나의 개별 정량화 지수는 검색 트리의 두 개 이상의 분기에서 찾을 수 있다.

    보청기 또는 코덱 하드웨어가 구현된 칩이 충분한 프로세싱 파워를 가지는 경우, 코드북에서 벡터를 룩업하는 하나의 대안으로서 정량화 벡터를 분석적으로 계산하는 것이 가능하다. 따라서, 테이블화된 형태로 벡터를 포함하는 대신에, 코드북(9)은 입력 정량화 지수를 기초로 벡터를 계산하는 함수를 저장한다. 이것은 코드북의 저장에 필요한 메모리 용량을 줄여준다.

    분명히, 당업자는 구조화된 검색 트리 코드북 구조를 갖는 실시예와, 중복 검색 트리 코드북 구조를 갖는 실시예와, 정량화 벡터를 분석적으로 계산하는 수단을 갖는 실시예가 바람직한 실시예들이지만, 인코딩 코드북(9)에서의 완전 검색을 포함하는 실시예도 배제되지 않음을 이해할 것이다.

    도 1로부터 알 수 있는 바와 같이, 보청기(1b)는 포스트 처리 스테이지(58)를 포함할 수 있다. 포스트 처리 스테이지는 보청기(1b)의 경우이지만, 도면에서는 볼 수 없다. 포스트 처리 스테이지(58)는 샘플링 비율 변환, 출력 페이딩, 및 기타 포스트 필터링 동작과 같은 다양한 종류의 포스트 처리를 포함할 수 있다.

    스트리밍 모드에서의 동작시, 수신된 지수의 출력 데이터 스트림의 품질은 단파 무선 라디오 통신 링크의 대상 신호 품질에 의존한다. 수신 신호가 너무 약하거나 간섭 라디오 신호 등에 의해 불안해지면, 지수의 데이터 스트림은 신호가 열화될수록 더 많은 에러를 포함할 것이다. 출력 데이터 스트림으로부터의 데이터에 존재하는 너무 많은 에러 때문에 장애를 받는 방식으로 재생된 출력 신호가 붕괴되는 것을 방지하기 위해, 보청기는 단파 무선 라디오 통신 링크(3)를 통해 수신된 출력 데이터 스트림 내의 에러를 검출하는 수단을 포함한다. 에러율이 미리 정해진 에러율보다 높아지면, 포스트 처리 블록(58)이 해당 신호를 점진적 방식으로 페이드-아웃시키는데, 다시 말해 짧은 시간 주기에 걸쳐 출력 신호 레벨을 낮춰준다. 따라서, 에러율이 너무 높아질 때 다른 디지털 스트리밍 신호 시스템에 의해 생성되는 잠재적으로 보다 방해가 되는 노이즈가 방지된다. 도 5에 예시된 바와 같이, 이러한 페이딩은 데이터 스트림에서의 비트 에러율(BER)을 일정하게 측정하고 해당 BER을 사용하여 히스테리시스를 기초로 이득 감소를 제어하는 것에 의해 수행되는 것이 바람직하다. BER이 말하자면 0.01 에러/비트 이상일 때마다, 즉 신호 품질이 열악할 때마다 출력 이득은 G 0 의 낮은 값으로 감소된다. BER이 0.001 에러/비트 미만으로 떨어지면, 즉 신호 품질이 양호하면, 출력 이득은 Gn의 공칭값으로 증가된다.

    스트리밍을 위한 채널 인코더(61)는 순방향 에러 정정(Forward Error Correction(FEC) 코드인 것이 바람직하다. FEC 코드 에러 정정(ec) 및 검지 능력(dc)은 해밍 거리(Hamming distance)(d min )에 의해 결정되는데, 이때 2*ec + dc < d min 이다. 이러한 관계로부터 검지는 간단한 방식임을 알 수 있다. 본 발명에서는 여기 신호, 즉 예측기(4)로의 입력은 에러 검출시마다 제로 또는 널-벡터로 설정될 수 있다. 이것은 에러 입력이 도입되지 않으므로 전송 에러가 예측기(4)에 대해 최소 영향을 미치는 효과를 나타낸다. 또한, 이득은 이득 적응 블록(10)에서 제로로 갱신되고, 이는 연속 송신 에러의 경우, 이득의 페이딩을 가져온다.

    계산적 복잡성을 매우 낮게 하기 위해, 바람직한 실시예에 해밍 코드가 적용된다. 따라서, 예컨대, 4의 해밍 거리를 갖는 해밍(Ham)(24, 18)을 사용하는 것에 의해, 단 하나의 에러인 경우는 수정이 허용되고, 두 개까지의 에러의 검출이 허용된다.

    QQ群二维码
    意见反馈