首页 / 专利库 / 信号处理 / 信号处理 / 音频信号处理 / 오디오 신호를 처리하기 위한 방법 및 장치

오디오 신호를 처리하기 위한 방법 및 장치

阅读:435发布:2024-01-12

专利汇可以提供오디오 신호를 처리하기 위한 방법 및 장치专利检索,专利查询,专利分析的服务。并且본 발명은 오디오 신호를 처리하는 방법 및 장치에 관한 것으로서, 방법은, 오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하는 단계; 및 각각의 주파수 대역 신호들에 대해, 복수의 서브대역 신호들을 생성하는 단계를 포함하고, 적어도 하나의 주파수 대역 신호에 대해, 상기 복수의 서브대역 신호들이 시간-주파수 도메인 변환을 이용하여 생성되고, 적어도 하나의 다른 주파수 대역에 대해 상기 하나의 다른 주파수 대역에 대한 상기 복수의 서브대역 신호들이 서브대역 필터 뱅크를 이용하여 생성되며, 장치는 적어도 하나의 프로세서와, 컴퓨터 프로그램 ㅋE드를 포함하는 적어도 하나의 메모리를 포함하며, 적어도 하나의 메모리 및 컴퓨터 프로그램 코드는, 적어도 하나의 프로세서와 함께, 장치로 하여금 방법을 수행하게 하도록 구성된다.,下面是오디오 신호를 처리하기 위한 방법 및 장치专利的具体信息内容。

  • 오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하는 단계와,
    각각의 주파수 대역 신호들에 대해, 복수의 서브대역 신호들을 생성하는 단계 - 적어도 하나의 주파수 대역 신호에 대해, 복수의 서브대역 신호들이 시간-주파수 도메인 변환을 이용하여 생성되고, 적어도 하나의 다른 주파수 대역에 대해, 상기 적어도 하나의 다른 주파수 대역에 대한 복수의 서브대역 신호들이 서브대역 필터 뱅크를 이용하여 생성됨 - 와,
    상기 시간-주파수 도메인 변환을 이용하여 생성된 적어도 하나의 서브대역 신호에 대해 잡음 억압과 반향 억압 중 적어도 하나를 적용하는 단계와,
    상기 서브대역 필터 뱅크를 이용하여 생성된 적어도 하나의 서브대역 신호에 대해 잡음 억압과 반향 억압 중 적어도 하나를 적용하는 단계와,
    상기 시간-주파수 도메인 변환을 이용하여 생성되고 상기 잡음 억압된 서브대역 신호와 상기 반향 억압된 서브대역 신호 중 적어도 하나를 포함하는 서브대역 신호들을 조합하여, 적어도 2개의 처리된 주파수 대역 오디오 신호 중 제 1 처리된 주파수 대역 오디오 신호를 형성하는 단계와,
    상기 서브대역 필터 뱅크를 이용하여 생성되고 상기 잡음 억압된 서브대역 신호와 상기 반향 억압된 서브대역 신호 중 적어도 하나를 포함하는 서브대역 신호들을 조합하여, 적어도 2개의 처리된 주파수 대역 오디오 신호 중 제 2 처리된 주파수 대역 오디오 신호를 형성하는 단계와,
    상기 제 1 처리된 주파수 대역 오디오 신호와 상기 제 2 처리된 주파수 대역 오디오 신호를 포함하는 적어도 2개의 처리된 주파수 대역 오디오 신호를 조합하여, 처리된 오디오 신호를 생성하는 단계를 포함하는
    방법.
  • 제 1 항에 있어서,
    상기 시간-주파수 도메인 변환은,
    고속 푸리에 변환과,
    이산 푸리에 변환과,
    이산 코사인 변환
    중 적어도 하나를 포함하는
    방법.
  • 제 1 항 또는 제 2 항에 있어서,
    상기 서브대역 필터뱅크는 코사인 기반 변조된 필터뱅크를 포함하는
    방법.
  • 제 1 항 또는 제 2 항에 있어서,
    상기 오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하는 단계는,
    상기 오디오 신호를 상기 적어도 2개의 주파수 대역 신호들 중 제 1 주파수 대역 신호로 고역 필터링하는 단계와,
    상기 오디오 신호를 저역 필터링된 오디오 신호로 저역 필터링하는 단계와,
    상기 저역 필터링된 오디오 신호를 다운샘플링하여 상기 적어도 2개의 주파수 대역 신호들 중 제 2 주파수 대역 신호를 생성하는 단계를 포함하는
    방법.
  • 제 4 항에 있어서,
    상기 저역 필터링된 오디오 신호를 다운샘플링하여 상기 적어도 2개의 주파수 대역 신호들 중 제 2 주파수 대역 신호를 생성하는 단계는 2의 인자에 의한 것인
    방법.
  • 삭제
  • 삭제
  • 제 1 항에 있어서,
    상기 시간-주파수 도메인 변환을 이용하여 생성된 서브대역 신호들을 조합하여 적어도 2개의 처리된 주파수 대역 오디오 신호 중 제 1 처리된 주파수 대역 오디오 신호를 형성하는 단계는, 주파수-시간 도메인 변환을 이용하여 상기 적어도 2개의 처리된 주파수 대역 오디오 신호 중 상기 제 1 처리된 주파수 대역 오디오 신호를 생성하는 단계를 포함하고,
    상기 서브대역 필터 뱅크를 이용하여 생성된 서브대역 신호들을 조합하여 상기 적어도 2개의 처리된 주파수 대역 오디오 신호 중 상기 제 2 처리된 주파수 대역 오디오 신호를 형성하는 단계는, 상기 서브대역 필터 뱅크를 이용하여 생성된 상기 서브대역 신호들을 합산하는 단계를 포함하는
    방법.
  • 삭제
  • 제 1 항에 있어서,
    상기 적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여, 처리된 오디오 신호를 생성하는 단계는,
    상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 하나를 업샘플링하는 단계와,
    상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 상기 업샘플링된 하나를 저역 필터링하는 단계와,
    상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 상기 저역 필터링되고 업샘플링된 하나를 상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 다른 하나와 조합하여, 상기 처리된 오디오 신호를 생성하는 단계를 더 포함하는
    방법.
  • 제 10 항에 있어서,
    적어도 2개의 처리된 주파수 대역 오디오 신호들 중 하나를 업샘플링하는 단계는 2의 인자에 의한 것인
    방법.
  • 제 10 항에 있어서,
    상기 적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하는 단계는, 상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 다른 하나와 상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 상기 저역 필터링되고 업샘플링된 하나를 동기화시키기 위해 상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 다른 하나를 지연시키는 단계를 더 포함하는
    방법.
  • 제 1 항에 있어서,
    상기 적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하는 단계 이전에, 상기 서브대역 신호들을 처리하는 단계를 더 포함하고,
    상기 서브대역 신호들을 처리하는 단계는 상기 서브대역 신호들에 대한 신호 레벨 제어를 포함하는
    방법.
  • 제 10 항에 있어서,
    상기 오디오 신호를 적어도 2개의 주파수 대역 신호들 중 제 1 주파수 대역 신호로 고역 필터링하는 제 1 필터와,
    상기 오디오 신호를 저역 필터링된 오디오 신호로 저역 필터링하는 제 2 필터와,
    상기 처리된 주파수 대역 오디오 신호들 중 상기 업샘플링된 하나를 저역 필터링하는 제 3 필터
    를 포함하는 필터들을 구성하는 단계를 더 포함하는
    방법.
  • 제 14 항에 있어서,
    필터들을 구성하는 단계는,
    오직 하나의 왜곡만을 갖는 상기 제 1 필터 및 상기 제 2 필터에 대한 저지 대역 에너지(a stop band energy)를 최소화함으로써 상기 제 1 필터 및 상기 제 2 필터에 대한 적어도 하나의 필터 파라미터를 구성하는 단계를 포함하는
    방법.
  • 제 15 항에 있어서,
    상기 필터들을 구성하는 단계는,
    상기 제 1 필터에 대한 필터 파라미터들을 고정 상태로 유지하면서 상기 제 2 필터 및 상기 제 3 필터에 대한 적어도 하나의 필터 파라미터를 구성하는 동작 및 상기 제 3 필터에 대한 필터 파라미터들을 고정 상태로 유지하면서 상기 제 1 필터 및 상기 제 2 필터에 대한 적어도 하나의 필터 파라미터를 구성하는 동작의 반복을 적어도 1회 동안 실행하는 단계를 포함하는
    방법.
  • 제 1 항 또는 제 2 항에 있어서,
    각각의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하는 단계 전에, 상기 적어도 2개의 주파수 대역 신호들을 처리하는 단계를 더 포함하고,
    상기 적어도 2개의 주파수 대역 신호들을 처리하는 단계는,
    오디오 빔형성 처리와,
    적응적 필터링
    중 적어도 하나를 포함하는
    방법.
  • 적어도 하나의 프로세서와, 컴퓨터 프로그램 코드를 포함하는 적어도 하나의 메모리를 포함하는 장치로서,
    상기 적어도 하나의 메모리 및 상기 컴퓨터 프로그램은 상기 적어도 하나의 프로세서와 함께, 상기 장치로 하여금, 적어도
    오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하는 것과,
    각각의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하는 것 - 적어도 하나의 주파수 대역 신호에 대해, 상기 복수의 서브대역 신호들은 시간-주파수 도메인 변환을 이용하여 생성되고, 적어도 하나의 다른 주파수 대역에 대해, 상기 적어도 하나의 다른 주파수 대역에 대한 복수의 서브대역 신호들이 서브대역 필터뱅크를 이용하여 생성됨 - 과,
    상기 시간-주파수 도메인 변환을 이용하여 생성된 적어도 하나의 서브대역 신호에 대해 잡음 억압과 반향 억압 중 적어도 하나를 적용하는 것과,
    상기 서브대역 필터 뱅크를 이용하여 생성된 적어도 하나의 서브대역 신호에 대해 잡음 억압과 반향 억압 중 적어도 하나를 적용하는 것과,
    상기 시간-주파수 도메인 변환을 이용하여 생성되고 상기 잡음 억압된 서브대역 신호와 상기 반향 억압된 서브대역 신호 중 적어도 하나를 포함하는 서브대역 신호들을 조합하여, 적어도 2개의 처리된 주파수 대역 오디오 신호 중 제 1 처리된 주파수 대역 오디오 신호를 형성하는 것과,
    상기 서브대역 필터 뱅크를 이용하여 생성되고 상기 잡음 억압된 서브대역 신호와 상기 반향 억압된 서브대역 신호 중 적어도 하나를 포함하는 서브대역 신호들을 조합하여, 적어도 2개의 처리된 주파수 대역 오디오 신호 중 제 2 처리된 주파수 대역 오디오 신호를 형성하는 것과,
    상기 제 1 처리된 주파수 대역 오디오 신호와 상기 제 2 처리된 주파수 대역 오디오 신호를 포함하는 적어도 2개의 처리된 주파수 대역 오디오 신호를 조합하여, 처리된 오디오 신호를 생성하는 것을 수행하게 하도록 구성되는
    장치.
  • 제 18 항에 있어서,
    상기 시간-주파수 도메인 변환은:
    고속 푸리에 변환과,
    이산 푸리에 변환과,
    이산 코사인 변환
    중 적어도 하나를 포함하는
    장치.
  • 제 18 항 또는 제 19 항에 있어서,
    상기 서브대역 필터뱅크는 코사인 기반 변조된 필터뱅크를 포함하는
    장치.
  • 제 18 항 또는 제 19 항에 있어서,
    상기 장치로 하여금, 오디오 신호를 적어도 2 개의 주파수 대역 신호들로 필터링을 수행하게 하는 것은, 상기 장치로 하여금,
    상기 오디오 신호를 적어도 2개의 주파수 대역 신호들 중 제 1 주파수 대역 신호로 고역 필터링하는 것과,
    상기 오디오 신호를 저역 필터링된 오디오 신호로 저역 필터링하는 것과,
    상기 저역 필터링된 오디오 신호를 다운샘플링하여 적어도 2개의 주파수 대역 신호들 중 제 2 주파수 대역 신호를 생성하는 것을 수행하게 하는 것을 더 포함하는
    장치.
  • 제 21 항에 있어서,
    상기 장치로 하여금, 상기 저역 필터링된 오디오 신호를 다운샘플링하여 적어도 2개의 주파수 대역 신호들 중 제 2 주파수 대역 신호를 생성하는 것을 수행하게 하는 것은, 상기 장치로 하여금 2의 인자에 의해 상기 다운샘플링을 수행하게 하는 것을 더 포함하는
    장치.
  • 삭제
  • 삭제
  • 제 18 항에 있어서,
    상기 장치로 하여금, 상기 시간-주파수 도메인 변환을 이용하여 생성된 서브대역 신호들을 조합하여, 적어도 2개의 처리된 주파수 대역 오디오 신호 중 제 1 처리된 주파수 대역 오디오 신호를 형성하는 것은, 상기 장치로 하여금, 주파수-시간 도메인 변환을 이용하여, 상기 적어도 2개의 처리된 주파수 대역 오디오 신호 중 상기 제 1 처리된 주파수 대역 오디오 신호를 생성하는 것을 수행하게 하는 것을 포함하고,
    상기 장치로 하여금, 상기 서브대역 필터 뱅크를 이용하여 생성된 서브대역 신호들을 조합하여, 상기 적어도 2개의 처리된 주파수 대역 오디오 신호 중 상기 제 2 처리된 주파수 대역 오디오 신호를 형성하는 것은, 상기 장치로 하여금, 상기 서브대역 필터 뱅크를 이용하여 생성된 상기 서브대역 신호들을 합산하는 것을 수행하게 하는 것을 포함하는
    장치.
  • 삭제
  • 제 18 항에 있어서,
    상기 장치로 하여금, 상기 적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하는 것을 수행하게 할 때, 상기 장치로 하여금,
    상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 하나를 업샘플링하는 것과,
    상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 상기 업샘플링된 하나를 저역 필터링하는 것과,
    상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 상기 저역 필터링되고 업샘플링된 하나를 상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 다른 하나와 조합하여 상기 처리된 오디오 신호를 생성하는 것을 수행하게 하는 것을 더 포함하는
    장치.
  • 제 27 항에 있어서,
    상기 장치로 하여금, 상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 하나를 업샘플링하는 것을 수행하게 할 때, 상기 장치로 하여금, 2의 인자에 의해 상기 업샘플링을 수행하게 하는 것을 더 포함하는
    장치.
  • 제 27 항에 있어서,
    상기 장치로 하여금, 상기 적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하는 것을 수행하게 할 때, 상기 장치로 하여금, 상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 상기 저역 필터링되고 업샘플링된 하나와 상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 다른 하나를 동기화시키기 위해 상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 다른 하나를 지연시키는 것을 수행하게 하는 것을 더 포함하는
    장치.
  • 제 18 항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 장치로 하여금, 적어도, 상기 적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하기 전에, 상기 서브대역 신호들을 처리하는 것을 더 수행하게 하되, 상기 서브대역 신호들의 처리는 상기 서브대역 신호들에 대한 신호 레벨 제어를 포함하는
    장치.
  • 제 27 항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 장치로 하여금, 적어도,
    상기 오디오 신호를 적어도 2개의 주파수 대역 신호들 중 제 1 주파수 대역 신호로 고역 필터링하는 제 1 필터와,
    상기 오디오 신호를 저역 필터링된 오디오 신호로 저역 필터링하는 제 2 필터와,
    상기 적어도 2개의 처리된 주파수 대역 오디오 신호들 중 상기 업샘플링된 하나를 저역 필터링하는 제 3 필터
    를 포함하는 필터들을 구성하는 것을 더 수행하게 하는
    장치.
  • 제 31 항에 있어서,
    상기 장치로 하여금, 필터들을 구성하게 할 때, 상기 장치로 하여금, 오직 하나의 왜곡을 갖는 상기 제 1 필터 및 상기 제 2 필터에 대한 저지 대역 에너지를 최소화함으로써 상기 제 1 필터 및 상기 제 2 필터에 대한 적어도 하나의 필터 파라미터를 구성하는 것을 수행하게 하는 것을 포함하는
    장치.
  • 제 32 항에 있어서,
    상기 장치로 하여금, 필터들을 구성하는 것을 수행하게 할 때, 상기 장치로 하여금,
    상기 제 1 필터에 대한 필터 파라미터들을 고정 상태로 유지하면서 상기 제 2 필터 및 상기 제 3 필터에 대한 적어도 하나의 필터 파라미터를 구성하는 동작 및 상기 제 3 필터에 대한 필터 파라미터들을 고정 상태로 유지하면서 상기 제 1 필터 및 상기 제 2 필터에 대한 적어도 하나의 필터 파라미터를 구성하는 동작의 반복을 적어도 1회 동안 실행하는 것을 수행하게 하는 것을 포함하는
    장치.
  • 제 18 항 또는 제 19 항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 장치로 하여금, 적어도,
    각각의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하기 전에, 상기 적어도 2개의 주파수 대역 신호들을 처리하는 것을 더 수행하게 하고,
    상기 적어도 2개의 주파수 대역 신호들의 처리는,
    오디오 빔형성 처리와,
    적응적 필터링
    중 적어도 하나를 포함하는
    장치.
  • 오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하도록 구성된 필터링 수단과,
    각각의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하는 처리 수단 - 적어도 하나의 주파수 대역 신호에 대해, 상기 복수의 서브대역 신호들은 시간-주파수 도메인 변환을 이용하여 생성되고, 적어도 하나의 다른 주파수 대역에 대해, 상기 적어도 하나의 다른 주파수 대역에 대한 복수의 서브대역 신호들은 서브대역 필터뱅크를 이용하여 생성됨 - 과,
    상기 시간-주파수 도메인 변환을 이용하여 생성된 적어도 하나의 서브대역 신호에 대해 잡음 억압과 반향 억압 중 적어도 하나를 적용하는 처리 수단과,
    상기 서브대역 필터 뱅크를 이용하여 생성된 적어도 하나의 서브대역 신호에 대해 잡음 억압과 반향 억압 중 적어도 하나를 적용하는 처리 수단과,
    상기 시간-주파수 도메인 변환을 이용하여 생성되고 상기 잡음 억압된 서브대역 신호와 상기 반향 억압된 서브대역 신호 중 적어도 하나를 포함하는 서브대역 신호들을 조합하여, 적어도 2개의 처리된 주파수 대역 오디오 신호 중 제 1 처리된 주파수 대역 오디오 신호를 형성하는 조합 수단과,
    상기 서브대역 필터 뱅크를 이용하여 생성되고 상기 잡음 억압된 서브대역 신호와 상기 반향 억압된 서브대역 신호 중 적어도 하나를 포함하는 서브대역 신호들을 조합하여, 적어도 2개의 처리된 주파수 대역 오디오 신호 중 제 2 처리된 주파수 대역 오디오 신호를 형성하는 조합 수단과,
    상기 제 1 처리된 주파수 대역 오디오 신호와 상기 제 2 처리된 주파수 대역 오디오 신호를 포함하는 적어도 2개의 처리된 주파수 대역 오디오 신호를 조합하여, 처리된 오디오 신호를 생성하는 조합 수단을 포함하는
    장치.
  • 오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하도록 구성된 필터와,
    적어도 하나의 주파수 대역 신호에 대해, 복수의 서브대역 신호들을 생성하도록 구성된 시간-주파수 도메인 변환기와,
    적어도 하나의 다른 주파수 대역에 대해, 복수의 서브대역 신호들을 생성하도록 구성된 서브대역 필터뱅크와,
    상기 시간-주파수 도메인 변환을 이용하여 생성된 적어도 하나의 서브대역 신호에 대해 잡음 억압과 반향 억압 중 적어도 하나를 적용하고, 상기 서브대역 필터 뱅크를 이용하여 생성된 적어도 하나의 서브대역 신호에 대해 잡음 억압과 반향 억압 중 적어도 하나를 적용하는 처리 블록과,
    상기 시간-주파수 도메인 변환을 이용하여 생성되고 상기 잡음 억압된 서브대역 신호와 상기 반향 억압된 서브대역 신호 중 적어도 하나를 포함하는 서브대역 신호들을 조합하여, 적어도 2개의 처리된 주파수 대역 오디오 신호 중 제 1 처리된 주파수 대역 오디오 신호를 형성하고, 상기 서브대역 필터 뱅크를 이용하여 생성되고 상기 잡음 억압된 서브대역 신호와 상기 반향 억압된 서브대역 신호 중 적어도 하나를 포함하는 서브대역 신호들을 조합하여, 적어도 2개의 처리된 주파수 대역 오디오 신호 중 제 2 처리된 주파수 대역 오디오 신호를 형성하는 조합기와,
    상기 제 1 처리된 주파수 대역 오디오 신호와 상기 제 2 처리된 주파수 대역 오디오 신호를 포함하는 적어도 2개의 처리된 주파수 대역 오디오 신호를 조합하여, 처리된 오디오 신호를 생성하는 합성 필터 섹션을 포함하는
    를 포함하는
    장치.
  • 컴퓨터에 의해 실행될 때,
    오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하는 것; 및
    각각의 주파수 대역 신호에 대해, 복수의 서브대역 신호들을 생성하는 것
    을 수행하는 명령어들로 인코딩되고,
    적어도 하나의 주파수 대역 신호에 대해, 상기 복수의 서브대역 신호들은 시간-주파수 도메인 변환을 이용하여 생성되고,
    적어도 하나의 다른 주파수 대역에 대해, 상기 적어도 하나의 다른 주파수 대역에 대한 복수의 서브대역 신호들은 서브대역 필터뱅크를 이용하여 생성되는
    컴퓨터 판독가능 매체.
  • 제 18 항, 제 19항, 제 35 항 또는 제 36 항 중 어느 한 항에 있어서,
    인코더를 포함하는
    장치.
  • 제 18 항, 제 19 항, 제 35 항 또는 제 36 항 중 어느 한 항의 장치를 포함하는
    전자 디바이스.
  • 제 18 항, 제 19항, 제 35 항 또는 제 36 항 중 어느 한 항의 장치를 포함하는
    칩셋.
  • 说明书全文

    오디오 신호를 처리하기 위한 방법 및 장치{A METHOD AND AN APPARATUS FOR PROCESSING AN AUDIO SIGNAL}

    본 출원은 오디오 신호의 처리를 위한 장치에 관한 것이다. 본 출원은, 또한, 모바일 디바이스에서 오디오 신호를 처리하기 위한 장치에 관한 것이지만, 이로 국한되지 않는다.

    전자 장치, 및 특히 모바일 또는 휴대용 전자 장치에는 마이크로폰 신호를 수신하는 통합형 마이크로폰 장치 또는 적합한 오디오 입력들이 장착될 수도 있다. 이것은, 처리, 인코딩, 저장 또는 추가 디바이스들로의 송신에 적합한 오디오 신호들의 캡처 또는 처리를 허용한다. 예를 들어, 셀룰러폰들은 오디오 신호를 처리하여 셀룰러 통신 네트워크를 통해 추가 디바이스로 송신하는 데 적합한 포맷으로 생성하도록 구성된 마이크로폰 장치를 가질 수도 있으며, 이후에 이 신호는 그 추가 디바이스에서 디코딩되어 헤드폰 또는 스피커와 같은 적합한 청취 장치로 전달될 수도 있다. 마찬가지로, 일부 멀티미디어 디바이스들에는 추후의 플레이백 또는 송신을 위한 오디오 캡처 이벤트들을 위해 모노 또는 스테레오 마이크로폰 장치가 장착된다.

    전자 장치는 하나 이상의 마이크로폰들로부터 오디오 신호들을 수신하는 마이크로폰 장치 또는 입력들을 더 포함할 수 있고, 잡음을 감소시키기 위해 일부의 사전-인코딩 처리를 수행할 수도 있다. 예를 들어, 아날로그 신호는 추후 처리를 위해 디지털 포맷으로 전환될 수도 있다.

    이 사전-처리는 멀리 떨어진 오디오 소스로부터의 전 스펙트럼 대역 오디오 신호들을 기록하고자 하는 동안 요구될 수도 있고, 바람직한 신호들은 배경 또는 간섭 잡음들에 비해 약할 수도 있다. 일부 잡음은 녹음기에 대해 외적이고, 비유동적인 음향학적 배경 또는 환경 잡음으로 알려진 것일 수도 있다.

    비유동적인 음향학적 배경 잡음의 이러한 소스들은 에어컨 장치, 영사기 팬, 컴퓨터 팬, 또는 그 밖의 기계류와 같은 팬들이다. 기계 잡음의 예시들로는, 예를 들어 세탁기 및 식기 세척기와 같은 가정용 기계류, 교통 소음과 같은 차량 소음이 있다. 또한, 간섭 소스들은 주변 환경의 타인들로부터의 것, 예를 들어 콘서트에서 녹음기 인근에 있는 사람들로부터의 허밍, 또는 나무들을 지나치는 바람과 같은 자연의 잡음으로부터의 것들일 수도 있다.

    다른 간섭 잡음은 시스템 내부의 것일 수도 있다. 잡음 억압 회로는 충분한 주파수 분해능을 획득하기 위해서 일반적으로 고속 푸리에 변환(FFT)을 이용하는 주파수 도메인에서 동작한다. 광대역 신호들은 협대역 신호들(일반적으로 모바일 디바이스의 스피치 애플리케이션들의 경우, 8 kHz 샘플링 주파수가 협대역으로 정의되고, 16 kHz 샘플링 주파수가 광대역으로 정의됨)에 비해 샘플의 수를 두 배로 갖기 때문에, FFT 길이는 두 배로 되어야 한다. 이것은 광대역 오디오 신호들을 처리하는 데 요구되는 계산 및 메모리의 필요량을 두 배로 하지만, 고정점 처리로 인해, 협대역 처리에서 제공되는 바와 동일한 레벨의 FFT 정확도가 제공될 수는 없다.

    명확한 정확도의 오디오 신호들은 또한 양자화 잡음을 생성한다. 양자화 잡음은, 두드러지는 경우, 잘 들리게 되고, 신호의 청취를 곤란하게 하고 짜증스럽게 만든다. 스피치 시스템들에서, 이것은, 예를 들어 오디오 신호들이 광대역 신호들로서 (즉, 16 kHz 샘플링 주파수를 갖는 신호들로서) 처리되지만, 협대역 콘텐츠(즉, 4 kHz 이하의 중요치 않은 콘텐츠)만을 가질 때 발생한다. 이러한 상황은 그것이 빈번하지 않게 발생하였을 것이라고 상정되었기 때문에 일반적으로 무시되어 왔지만, 구현된 시스템들은 이 상황이 매우 빈번하게 발생할 수도 있다는 것을 보여준다. 예를 들어, 광대역 호를 전달하는 전화가 오직 협대역 전용인 블루투스 액세서리에 부착된다면, 협대역 콘텐츠만이 광대역 호에 의해 전달된다. 또한, 양자화 잡음은 처리된 신호들이 진실된 광대역 신호들인 경우라 하더라도 잘 들릴 수 있다는 것이 관찰되었다.

    우수한 품질을 갖는 FFT 를 이용하여 부분적인 솔루션을 생성하는 것이 가능할 수 있다 하더라도, 상당량의 메모리 및 처리 전력을 이용하지 않고 그에 따라 모바일 디바이스들에 대한 배터리 전력 및 비용에 현저한 영향을 미치지 않고 FFT만을 이용하여 문제를 해결하는 것은 불가능하다는 것이 관찰되었다.

    광대역 신호를 2개의 신호들, 즉 저대역 신호 및 고대역 신호로 분리하는 2개의 채널 분석-합성 필터뱅크들의 사용이 처리의 기초로서 고려되어 왔다. 그러나, 일반적으로, 앨리어싱 보상을 갖는 고대역 및 저대역 데시메이션이 존재한다.

    이러한 오디오 신호들의 오디오 신호 처리는 다음의 기준을 따라야 한다:

    1. 오디오 품질(오디오 신호는 왜곡되어서는 안 된다.);

    2. 메모리(필터뱅크는 필터 뱅크 구성을 저장하기 위한 다량의 메모리를 필요로 해서는 안 된다. 다시 말해, 필터는 다수의 값들을 저장해서는 안 된다.);

    3. 계산 복잡도(필터뱅크는 상당한 프로세서 능력을 요구할 정도로 충분히 복잡해서는 안 되며, 그에 따라 모바일 디바이스 등에 대한 배터리에 대해 전력 드레인을 증가시켜서는 안 된다.); 및,

    4. 지연(통신 경로에 영향을 미칠 수도 있으므로, 처리 시에 상당히 큰 지연이 존재해서는 안 된다.

    공지된 기법들은 일반적으로 상당량의 양자화 잡음 또는 적합한 계산 복잡도를 생성하며, 메모리는 광대역 스피치 목적을 위해 충분한 품질을 생성할 수 없다. 다른 접근방안들은 초협대역들이 저주파용 필터 상에서 설정될 것을 요구하는 것으로 알려져 있다. 저주파에 대해 충분한 주파수 분해능을 생성하기 위해, 메모리 및 계산 용량 양측 모두에서 비용이 많이 드는 많은 필터들이 요구될 것이다. 다른 접근방안들은 현저히 긴 지연을 생성하고, 고대역 신호들에 대해 불충분한 주파수 분해능을 갖는다.

    본 출원은, 개선된 필터 뱅크 구조가 오디오 품질을 희생하는 일 없이 허용 가능한 지연, 메모리 요건들 및 계산 복잡도를 갖도록 구성될 수도 있다. 또한, 그 구조 및 장치는, 잡음 억압 이외에도, 다른 오디오 처리가 필터뱅크 구조를 이용할 수도 있고, 그에 따라 프로세서 시스템 상에서 계산 및 메모리 용량을 절감할 수도 있도록 설계된다.

    본 발명의 일 양태에 따르면, 오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하는 단계; 및 각각의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하는 단계를 포함하되, 적어도 하나의 주파수 대역 신호에 대해, 시간-주파수 도메인 변환을 이용하여 복수의 서브대역 신호들이 생성되고, 적어도 하나의 다른 주파수 대역 신호에 대해 복수의 서브대역 신호들이 서브대역 필터뱅크를 이용하여 생성되는, 방법이 제공된다.

    시간-주파수 도메인 변환은, 고속 푸리에 변환; 이산 푸리에 변환; 및 이산 코사인 변환 중 적어도 하나를 포함할 수도 있다.

    서브대역 필터뱅크는 코사인 기반 변조 필터뱅크를 포함할 수도 있다.

    오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하는 것은: 오디오 신호 제 1의 적어도 2개의 주파수 대역 신호들로 고역 필터링하는 것; 오디오 신호를 저역 필터링된 신호로 저역 필터링하는 것; 및 저역 필터링된 오디오 신호를 다운샘플링하여 제 2의 적어도 2개의 주파수 대역 신호들을 생성하는 것을 포함할 수도 있다.

    저역 필터링된 오디오 신호를 다운샘플링하여 제 2의 적어도 2개의 주파수 대역 신호들로 생성하는 것은 2의 인자에 의한 것이 바람직하다.

    이 방법은, 적어도 하나의 주파수 대역으로부터의 적어도 하나의 서브대역 신호를 처리하는 단계; 서브대역 신호들을 조합하여 적어도 2개의 처리된 주파수 대역 오디오 신호들을 형성하는 단계; 및 적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하는 단계를 더 포함할 수도 있다.

    적어도 하나의 주파수 대역으로부터의 적어도 하나의 서브대역 신호를 처리하는 것은, 적어도 하나의 주파수 신호로부터의 적어도 하나의 서브대역 신호에 잡음 억압을 적용하는 것을 포함할 수도 있다.

    서브대역 신호들을 조합하여 적어도 2개의 처리된 주파수 신호들을 형성하는 것은: 주파수-시간 도메인 변환을 이용하여, 제 1 세트의 서브대역 신호들로부터 제 1의 적어도 2개의 처리된 주파수 대역들을 생성하는 것; 및 제 2 세트의 서브대역 신호들을 합산하여 제 2의 적어도 2개의 처리된 주파수 대역들을 형성하는 것을 포함할 수도 있다.

    제 1 세트의 서브대역 신호들은 시간-주파수 도메인 변환을 이용하여 생성된 복수의 서브대역 신호들과 연계되는 것이 바람직하며, 제 2 세트의 서브대역 신호들은 서브대역 필터뱅크를 이용하여 생성된 복수의 서브대역 신호들과 연계되는 것이 바람직하다.

    적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하는 것은: 제 1의 적어도 2개의 처리된 주파수 대역 신호들을 업샘플링하는 것; 업샘플링된 제 1의 적어도 2개의 처리된 주파수 대역 신호들을 저역 필터링하는 것; 및 저역 필터링되고 업샘플링된 제 1의 적어도 2개의 처리된 주파수 대역 신호들을 제 2의 적어도 2개의 처리된 주파수 대역 신호들과 조합하여 처리된 오디오 신호를 생성하는 것을 더 포함할 수도 있다.

    제 1의 적어도 2개의 처리된 주파수 대역 신호들을 업샘플링하는 것은 2의 인자에 의한 것이 바람직하다.

    적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하는 것은, 저역 필터링되고 업샘플링된 제 1의 적어도 2개의 처리된 주파수 대역 신호들을 제 2의 적어도 2개의 처리된 주파수 대역 신호들과 동기화시키기 위해 제 2의 적어도 2개의 처리된 주파수 대역 신호들을 지연하는 것을 더 포함할 수도 있다.

    이 방법은, 적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하기 전에, 서브대역 신호들을 처리하는 단계를 더 포함할 수도 있으며, 서브대역 신호들의 처리는 서브대역 신호들에 대한 신호 레벨 제어를 포함한다.

    이 방법은, 오디오 신호를 제 1의 적어도 2개의 주파수 대역 신호들로 고역 필터링하기 위한 제 1 필터; 오디오 신호를 저역 필터링된 신호로 저역 필터링하기 위한 제 2 필터; 및 업샘플링된 제 1의 처리된 주파수 대역 신호들을 저역 필터링하기 위한 제 3 필터를 포함하는 것이 바람직한 필터들을 구성하는 단계를 더 포함할 수도 있다.

    제 1 세트의 필터들을 구성하는 것은 오로지 하나의 왜곡만을 갖는 제 1 및 제 2 필터들에 대한 저지 대역 에너지를 최소화함으로써 제 1 및 제 2 필터들에 대한 적어도 하나의 필터 파라미터를 구성하는 것을 포함할 수도 있다.

    제 1 세트의 필터들을 구성하는 것은 상기 제 1 필터에 대한 필터 파라미터들을 고정 상태로 유지하면서 상기 제 2 및 제 3 필터들에 대한 적어도 하나의 필터 파라미터를 구성하는 동작 및 상기 제 3 필터에 대한 필터 파라미터들을 고정 상태로 유지하면서 상기 제 1 및 상기 제 2 필터들에 대한 적어도 하나의 필터 파라미터를 구성하는 동작의 반복을 적어도 1회 동안 실행하는 것을 포함할 수도 있다.

    이 방법은: 각각의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하기 전에, 적어도 2개의 주파수 대역 신호들을 처리하는 단계로서, 적어도 2개의 주파수 대역 신호들이 오디오 빔형성 처리 및 적응적 필터링 중 적어도 하나를 포함하는 것이 바람직한 처리 단계를 더 포함할 수도 있다.

    본원의 제 2 양태에 따르면, 적어도 하나의 프로세서와, 컴퓨터 프로그램 코드를 포함하는 적어도 하나의 메모리를 포함하는 장치로서, 적어도 하나의 메모리 및 컴퓨터 프로그램 코드는, 적어도 하나의 프로세서와 함께, 이 장치로 하여금: 오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하게 하고, 그리고, 각각의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하게 하도록 구성되며, 적어도 하나의 주파수 대역 신호에 대해, 복수의 서브대역 신호들이 시간-주파수 도메인 변환을 이용하여 생성되고, 적어도 하나의 다른 주파수 대역에 대해, 하나의 다른 주파수 대역에 대한 복수의 서브대역 신호들을 서브대역 필터뱅크를 이용하여 생성되는 장치가 제공된다.

    시간-주파수 도메인 변환은: 고속 푸리에 변환; 이산 푸리에 변환; 및 이산 코사인 변환 중 적어도 하나를 포함할 수도 있다.

    서브대역 필터뱅크를 코사인 기반 변조된 필터뱅크를 포함할 수도 있다.

    오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하는 것은, 장치로 하여금, 오디오 신호를 제 1의 적어도 2개의 주파수 대역 신호들로 고역 필터링하는 것; 오디오 신호를 저역 필터링된 신호로 저역 필터링하는 것; 및 저역 필터링된 오디오 신호를 다운샘플링하여 제 2의 적어도 2개의 주파수 대역 신호들을 생성하는 것을 수행하게 하는 것을 더 포함할 수도 있다.

    저역 필터링된 오디오 신호를 다운샘플링하여 제 2의 적어도 2개의 주파수 대역 신호들을 생성하는 것은, 장치로 하여금, 2의 인자에 의한 다운샘플링을 수행하게 하는 것을 더 포함할 수도 있다.

    적어도 하나의 프로세서는, 장치로 하여금, 적어도, 적어도 하나의 주파수 대역으로부터의 적어도 하나의 서브대역 신호를 처리하는 것; 서브대역 신호들을 조합하여 적어도 2개의 처리된 주파수 대역 오디오 신호들을 형성하는 것; 적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하는 것을 더 수행하게 할 수도 있다.

    적어도 하나의 주파수 대역으로부터의 적어도 하나의 서브대역 신호를 처리하는 것은, 장치로 하여금, 적어도 하나의 주파수 신호로부터의 적어도 하나의 서브대역 신호에 잡음 억압을 적용하는 것을 수행하게 하는 것을 더 포함할 수도 있다.

    장치로 하여금, 서브대역 신호들을 조합하여 적어도 2개의 처리된 주파수 신호들을 형성하게 하는 것은, 장치로 하여금, 주파수-시간 도메인 변환을 이용하여 제 1 세트의 서브대역 신호들로부터의 제 1의 적어도 2개의 처리된 주파수 대역들을 생성하는 것; 및 제 2 세트의 서브대역 신호들을 합산하여 제 2의 적어도 2개의 처리된 주파수 대역들을 형성하는 것을 수행하게 하는 것을 더 포함할 수도 있다.

    제 1 세트의 서브대역 신호들은 시간-주파수 도메인 변환을 이용하여 생성된 복수의 서브대역 신호들과 연계되는 것이 바람직하고, 제 2 세트의 서브대역 신호들은 서브대역 필터뱅크를 이용하여 생성된 복수의 서브대역 신호들과 연계되는 것이 바람직하다.

    장치로 하여금, 적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하게 하는 것은, 장치로 하여금, 제 1의 적어도 2개의 처리된 주파수 대역 신호들을 업샘플링하는 것; 업샘플링된 제 1의 적어도 2개의 처리된 주파수 대역 신호들을 저역 필터링하는 것; 및 저역 필터링되고 업샘플링된 제 1의 적어도 2개의 처리된 주파수 대역 신호들을 제 2의 적어도 2개의 처리된 주파수 대역 신호들과 조합하여 처리된 오디오 신호를 생성하는 것을 수행하게 하는 것을 더 포함할 수도 있다.

    장치로 하여금, 제 1의 적어도 2개의 처리된 주파수 대역 신호들을 업샘플링하게 하는 것은, 장치로 하여금, 2의 인자에 의한 업샘플링을 수행하게 하는 것을 더 포함할 수도 있다.

    장치로 하여금, 적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하게 하는 것은, 장치로 하여금, 저역 필터링되고 업샘플링된 제 1의 적어도 2개의 처리된 주파수 대역 신호들을 제 2의 적어도 2개의 처리된 주파수 대역 신호들과 동기화시키기 위해 제 2의 적어도 2개의 처리된 주파수 대역 신호들을 지연시키는 것을 수행하게 하는 것을 더 포함할 수도 있다.

    적어도 하나의 프로세서는, 장치로 하여금, 적어도 2개의 처리된 주파수 대역 오디오 신호들을 조합하여 처리된 오디오 신호를 생성하기 전에, 서브대역 신호들을 처리하는 것을 수행하게 할 수도 있으며, 서브대역 신호들의 처리는 서브대역 신호들에 대한 신호 레벨 제어를 포함한다.

    적어도 하나의 프로세서는, 장치로 하여금, 적어도, 필터들을 구성하는 것을 더 수행하게 할 수도 있으며, 필터들은: 오디오 신호를 제 1의 적어도 2개의 주파수 대역 신호들로 고역 필터링하는 제 1 필터; 오디오 신호를 저역 필터링된 신호로 저역 필터링하는 제 2 필터; 및 업샘플링된 제 1의 처리된 주파수 대역 신호들을 저역 필터링하는 제 3 필터를 포함할 수도 있다.

    제 1 세트의 필터들을 구성하는 것은, 장치로 하여금, 오로지 하나의 왜곡만을 갖는 제 1 및 제 2 필터들에 대한 저지 대역 에너지를 최소화함으로써 제 1 및 제 2 필터들에 대해 적어도 하나의 필터 파라미터를 구성하는 것을 수행하게 하는 것을 포함할 수도 있다.

    제 1 세트의 필터들을 구성하는 것은, 장치로 하여금, 각각의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하기 전에, 적어도 2개의 주파수 대역 신호들을 처리하는 것을 더 수행하게 할 수도 있고, 적어도 2개의 주파수 대역 신호들의 처리는, 오디오 빔형성 처리, 및 적응적 필터링 중 적어도 하나를 포함할 수도 있다.

    적어도 하나의 프로세서는, 장치로 하여금, 적어도, 각각의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하기 전에, 적어도 2개의 주파수 대역 신호들을 처리하는 것을 더 수행하게 할 수도 있으며, 적어도 2개의 주파수 대역 신호들의 처리는: 오디오 빔형성 처리 및 적응적 필터링 중 적어도 하나를 포함할 수도 있다.

    본 발명의 제 3 양태에 따르면, 오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하도록 구성된 필터링 수단; 및 각각의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하는 처리 수단을 포함하는 장치로서, 적어도 하나의 주파수 대역 신호에 대해 복수의 신호들이 시간-주파수 도메인 변환을 이용하여 생성되고, 적어도 하나의 다른 주파수 대역에 대해, 하나의 다른 주파수 대역에 대한 복수의 서브대역 신호들이 서브대역 필터뱅크를 이용하여 생성되는 장치가 제공된다.

    본 발명의 제 4 양태에 따르면, 오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하도록 구성된 필터; 적어도 하나의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하도록 구성된 시간-주파수 도메인 변환기; 및 적어도 하나의 다른 주파수 대역에 대해 복수의 서브대역 신호들을 생성하도록 구성된 서브대역 필터뱅크를 포함하는 장치가 제공된다.

    본 발명의 제 5 양태에 따르면, 컴퓨터에 의해 실행될 때, 오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하는 것; 및 각각의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하는 것을 수행하는 명령들로 인코딩되고, 적어도 하나의 주파수 대역 신호에 대해 복수의 서브대역 신호들이 시간-주파수 도메인 변환을 이용하여 생성되고, 적어도 하나의 다른 주파수 대역에 대해 하나의 다른 주파수 대역에 대한 복수의 서브대역 신호들이 서브대역 필터뱅크를 이용하여 생성되는 컴퓨터 판독가능 매체가 제공된다.

    전술된 바와 같은 장치는 인코더를 포함할 수도 있다.

    전자 디바이스는 전술된 바와 같은 장치를 포함할 수도 있다.

    칩셋은 전술된 바와 같은 장치를 포함할 수도 있다.

    본 발명의 실시형태들은 상기 문제를 해결하는 데 목적이 있다.

    본 발명의 보다 우수한 이해를 위해, 이제, 첨부한 도면들이 예를 들어 참조될 것이다.
    도 1은 본 발명의 실시형태들을 채용한 전자 디바이스를 개략적으로 도시한다;
    도 2는 본 발명의 몇몇 실시형태들을 채용한 오디오 향상 시스템을 개략적으로 도시한다;
    도 3은 본 발명의 몇몇 실시형태들에 따른 오디오 향상 디지털 프로세서를 개략적으로 도시한다;
    도 4는 도 2 및 도 3에 도시된 바와 같은 오디오 향상 시스템의 동작을 설명하는 흐름도를 도시한다;
    도 5는 본 발명의 몇몇 실시형태들에 따른 오디오 향상 디지털 프로세서 필터 파라마터들의 결정을 설명하는 흐름도를 도시한다;
    도 6은 본 발명의 몇몇 실시형태들에 따른 오디오 향상 디지털 프로세서 필터 응답들을 설명하는 일반적인 주파수 응답들을 개략적으로 도시한다;
    도 7은 본 발명의 몇몇 실시형태들에 따른 서브대역 필터 뱅크 응답들을 설명하는 일반적인 주파수 응답들을 개략적으로 도시한다; 그리고,
    도 8은 본 발명의 몇몇 실시형태들에 따른 프로토타입 서브대역 필터의 크기 응답을 설명하는 일반적인 주파수 응답을 개략적으로 도시한다.

    다음은 오디오 향상 알고리즘들을 동작시키는 데 적합한 개선된 오디오 향상 프로세서들의 제공을 위한 장치 및 방법들을 설명한다. 이와 관련하여, 먼저, 본원의 몇몇 실시형태들에 따른 오디오 향상 알고리즘들을 포함한, 도 1의 예시적인 전자 디바이스(10) 또는 장치의 개략적인 블록도가 참조된다.

    전자 디바이스(10)는, 몇몇 실시형태들에서, 무선 통신 시스템에서의 동작을 위한 모바일 단말, 모바일 폰 또는 사용자 장비이다.

    전자 디바이스(10)는, 아날로그-디지털 컨버터(14)를 거쳐서 프로세서(21)에 링크되는 마이크로폰(11)을 포함한다. 프로세서(21)는 또한 디지털-아날로그 컨버터(32)를 거쳐서 스피커(33)에 링크된다. 프로세서(21)는 또한 송수신기(TX/RX; 13), 사용자 인터페이스(UI; 15) 및 메모리(22)에 링크된다.

    프로세서(21)는 다양한 프로그램 코드들(23)을 실행시키도록 구성될 수도 있다. 몇몇 실시형태들에서, 구현된 프로그램 코드들(23)은 오디오 캡처 디지털 처리 또는 구성 코드를 포함한다. 몇몇 실시형태들에서, 구현된 프로그램 코드들(23)은 오디오 신호의 추가 처리를 위한 추가 코드를 더 포함한다. 몇몇 실시형태들에서, 구현된 프로그램 코드들(23)은, 필요할 때마다, 예를 들어 프로세서(21)에 의한 검색을 위해 메모리(22)에 저장될 수도 있다. 몇몇 실시형태들에서, 메모리(22)는 데이터, 예컨대 본원에 따라 처리된 데이터를 저장하기 위한 섹션(23)을 더 제공할 수도 있다.

    몇몇 실시형태들에서, 오디오 향상 알고리즘들을 구현할 수 있는 장치는 적어도 부분적으로 소프트웨어 또는 펌웨어를 필요로 하지 않고 구현될 수도 있다.

    몇몇 실시형태들에서, 사용자 인터페이스(15)는 사용자가, 예를 들어 키패드를 거쳐서 전자 디바이스(10)에 입력 명령들을 입력할 수 있고 및/또는 예를 들어 디스플레이를 거쳐서 전자 디바이스(10)로부터 정보를 획득할 수 있게 한다. 송수신기(13)는, 예를 들어 무선 통신 네트워크를 거쳐서 다른 전자 디바이스들과의 통신을 가능하게 한다.

    또한, 전자 디바이스(10)의 구조는 다양한 방식들로 보충되고 변형될 수 있다는 것이 이해될 것이다.

    전자 디바이스(10)의 사용자는 몇몇 다른 전자 디바이스로 송신되거나 메모리(22)의 데이터 섹션(24)에 저장될 스피치를 입력하기 위한 마이크로폰(11)을 사용할 수도 있다. 몇몇 실시형태들에서, 대응하는 애플리케이션은 이러한 목적을 위해 사용자 인터페이스(15)를 거쳐서 사용자에 의해 활성화될 수도 있다. 몇몇 실시형태들에서 프로세서(21)에 의해 구동될 수도 있는 이러한 애플리케이션은 프로세서(21)로 하여금 메모리(22)에 저장된 코드를 실행시키게 한다.

    몇몇 실시형태에서, 아날로그-디지털 컨버터(14)는 입력된 아날로그 오디오 신호를 디지털 오디오 신호로 변환하도록 구성될 수도 있고, 디지털 오디오 신호를 프로세서(21)로 제공할 수도 있다.

    이후, 프로세서(21)는 도 2 및 도 3을 참조하여 설명되는 바와 동일한 방식으로 디지털 오디오 신호를 처리할 수도 있다.

    몇몇 실시형태들에서, 생성된 비트 스트림은 다른 전자 디바이스로의 송신을 위한 송수신기(13)로 제공될 수도 있다. 대안으로, 코딩된 데이터는, 예를 들어 동일한 전자 디바이스(10)에 의한 추후 송신 또는 프레젠테이션을 위해 메모리(22)의 데이터 섹션(24)에 저장될 수 있다.

    몇몇 실시형태들에서, 전자 디바이스(10)는 또한 그것의 송수신기(13)를 거쳐서 오디오 신호 데이터를 갖는 비트 스트림을 다른 전자 디바이스로부터 수신할 수도 있다. 이러한 실시형태들에서, 프로세서(21)는 메모리(22)에 저장된 처리 프로그램 코드를 실행시킨다. 이러한 실시형태들에서, 이후, 프로세서(21)는 수신된 데이터를 처리할 수도 있고, 디코딩된 데이터를 디지털-아날로그 컨버터(32)로 제공할 수도 있다. 몇몇 실시형태들에서, 디지털-아날로그 컨버터(32)는 디지털 데이터를 아날로그 오디오 데이터로 변환할 수도 있고, 스피커(33)를 거쳐서 오디오 데이터를 출력할 수도 있다. 몇몇 실시형태들에서, 수신된 오디오 처리 프로그램 코드의 실행은 사용자 인터페이스(15)를 거쳐서 사용자에 의해 호출된 애플리케이션에 의해 마찬가지로 트리거될 수도 있다.

    일부 실시형태들에서, 수신된 신호는, 마이크로폰(11) 및 아날로그-디지털 컨버터(14)로부터 수신된 오디오 신호의 처리와 유사한 방식으로, 또한 도 2 및 도 3을 참조하여, 기록된 오디오 신호로부터 잡음을 제거하도록 처리될 수도 있다.

    몇몇 실시형태들에서, 수신되는 처리된 오디오 데이터는 또한, 예를 들어 추후 프레젠테이션 또는 또 다른 전자 디바이스로의 포워딩을 위해, 즉각적인 프레젠테이션 대신, 스피커(22)를 거쳐서 메모리(22)의 데이터 섹션(24)에 저장될 수도 있다.

    도 2 및 도 3에서 설명되는 개략적인 구조들과 도 4 및 도 5에서의 방법 단계들은 도 1에 도시된 전자 디바이스에서 구현되는 것으로 도시되는 애플리케이션의 몇몇 실시형태들을 포함하는 전체 시스템의 동작 중 일부분만을 나타낸다는 것이 이해될 것이다.

    도 2는 마이크로폰(11), 아날로그-디지털 컨버터(14), 디지털 오디오 프로세서(101), 디지털 오디오 제어기(105) 및 디지털 오디오 인코더(103)를 포함하는 스피치용 오디오 향상 장치에 대한 개략적인 구성을 도시한다. 본원의 몇몇 실시형태들에서, 오디오 향상 장치는 위의 부품들 중 모든 부분이 아닌 일부분을 포함할 수도 있다. 예를 들어, 몇몇 실시형태들에서, 상기 장치는 디지털 오디오 프로세서(101)만을 포함할 수도 있는데, 여기서 외부 소스로부터의 디지털 신호는 사전 구성된 구조 및 필터 파라미터들을 갖는 디지털 오디오 프로세서(101)에 입력되고, 디지털 오디오 프로세서(101)는 또한 오디오 처리된 신호를 외부 인코더로 출력한다. 본 발명의 다른 실시형태들에서, 디지털 오디오 프로세서(101)는 오디오 향상 장치의 '핵심' 소자일 수도 있고, 다른 부품들은 애플리케이션에 따라 추가될 수도 있고 또는 제거될 수도 있다.

    도 1에 도시된 것들과 유사한 소자들이 설명되는 경우, 동일한 참조부호들이 사용된다. 마이크로폰(11)은 오디오 파장들을 수신하고, 이들을 아날로그 전기 신호들로 변환한다. 마이크로폰(11)은 임의의 적합한 음향-전기 트랜스듀서일 수도 있다. 가능한 마이크로폰들의 실시예들은 커패시터 마이크로폰, 전기 마이크로폰, 동적 마이크로폰, 탄소 마이크로폰, 압전 마이크로폰, 광섬유 마이크로폰, 액체 마이크로폰, 및 마이크로-전기-기계적 시스템(MEMS) 마이크로폰일 수도 있다.

    오디오 사운드 파장들로부터의 아날로그 오디오 신호 포착은 도 4와 관련하여 단계 301에서 나타내어진다.

    전기 신호는 아날로그-디지털 컨버터(ADC; 14)로 전달될 수도 있다.

    아날로그-디지털 컨버터(14)는 마이크로폰으로부터의 아날로그 전기 신호들을 변환하여 디지털 신호를 출력하는 임의의 적합한 아날로그-디지털 컨버터일 수도 있다. 아날로그-디지털 컨버터는 임의의 적합한 형태로 디지털 신호를 출력할 수도 있다. 또한, 아날로그-디지털 컨버터(14)는 실시형태에 따라 선형 아날로그-디지털 컨버터일 수도 있고, 또는 비선형 아날로그-디지털 컨버터일 수도 있다. 예를 들어, 아날로그-디지털 컨버터는, 몇몇 실시형태들에서, 대수 응답 아날로그-디지털 컨버터일 수도 있다. 디지털 출력은 디지털 오디오 프로세서(101)로 전달될 수도 있다.

    디지털 신호로의 아날로그 오디오 신호 변환은 도 4의 단계 303에 도시되어 있다.

    디지털 오디오 프로세서(101)는 다양한 잡음 또는 간섭 소스들에 대한 오디오 소스의 신호 대 잡음 및 간섭 비를 개선하고자 디지털 신호를 처리하도록 구성될 수도 있다.

    몇몇 실시형태들에서, 디지털 오디오 프로세서(101)는 FFT 기반 처리를 필터 뱅크 기반 처리와 조합시킬 수도 있다. 이러한 실시형태들에서, 디지털 오디오 신호는 먼저 제 1의 데시메이트된 저주파 대역 신호 및 제 2의 데시메이트되지 않은 고주파 대역 신호가 존재하도록 2개의 채널들 또는 주파수 대역들로 분할된다. 또한, 이러한 실시형태들에서, FFT 기반 처리는 오로지 고해상도(high frequency resolution)가 필요한 저주파 대역 신호, 즉 오디오/스피치 신호의 저주파 성분들에 대해서만 사용된다. 이러한 실시형태들에서, 고주파 대역은 데시메이트되지 않은 필터 뱅크를 이용하여 서브대역들로 더 분할된다. 몇몇 실시형태들에서, 대역 및 서브대역 분할은 불균일하며, 음향심리학적으로 동기 부여된다. 다시 말해, 몇몇 실시형태들에서, 고주파 대역들과 저주파 대역들 사이의 이격, 및 고주파 및 저주파 대역들 각각으로부터의 대역 주파수 성분 이격은 음향 심리적 원리들을 이용하여 결정될 수도 있다.

    디지털 오디오 신호로부터 2개의 채널/주파수 대역을 생성하는 것과, 처리된 2개 채널들을 단일의 처리된 디지털 오디오 신호로 재조합하는 것은, 몇몇 실시형태들에서, 필터 뱅크 필터들이 배직교(biorthogonal)하고 전체적인 필터 뱅크가 작은 지연을 생성하도록 설계된 분석-합성 필터 뱅크 구조물에 의해 실행될 수도 있다. 이러한 실시형태들에서, 고주파 대역은 합성 필터를 요구하지 않는데, 이는 채널/주파수 대역이 데시메이트되지 않기 때문이다. 또한, 이러한 실시형태들에서는, 저주파 채널/대역 합성 필터로 인해 저주파 대역에만 지연이 존재함에 따라, 이러한 '지연'은 전체 구조에 임의의 추가 지연을 부가하는 일 없이 고주파 대역의 서브대역 분할에 의해 활용될 수 있다.

    또한, 이러한 실시형태들에서는, 고주파 대역/채널이 데시메이트되지 않음에 따라, 고주파 대역을 서브대역 성분들로 더 분할하는 서브대역 필터 뱅크는 비교적 작은 저지 대역 감쇄 레벨들만을 요구한다. 이것은, 몇몇 실시형태들에서, 짧은 지연 및 낮은 계산 복잡도 양자 모두를 갖는 효율적인 구조를 가져온다.

    하기에 도시되는 바와 같이, 몇몇 실시형태들에서, 전체적인 구조는 스피치 처리를 위해 설계된 코덱인 적응적 다중 속도 (adaptive multi-rate: AMR) 코덱과 함께 사용되는, 잡음 억압을 위한 최소 요건들을 충족시키는 5ms의 지연을 가질 수도 있다. 또한, 5ms 요건이 협대역 처리에 대해서만 정의되고 있지만, 이 애플리케이션은 또한 그들을 광대역 처리를 위한 우수한 가이드라인으로 간주한다.

    몇몇 실시형태들에서, 디지털 오디오 프로세서의 구조의 개략적인 표현이 도 3에 더욱 상세히 도시되어 있다.

    디지털 오디오 프로세서(101)는, 디지털 오디오 신호들을 수신하여 이들을 주파수 대역들로 분할하는 분석 필터 섹션(281), 대역들을 수신하고 주파수 대역 성분들에 대해 예비 처리를 수행하는 제 1 처리 블록(211), 처리된 주파수 대역들을 수신하고 그 신호들을 서브대역들로 더 분할하는 서브대역 생성기 섹션(285), 서브대역 성분들을 수신하고 추가 처리를 수행하는 제 2 처리 블록(231), 처리된 서브대역 성분들을 수신하여 이들을 주파수 대역 성분들로 역 조합시키는 서브대역 조합기 섹션(287), 주파수 대역들을 수신하고 주파수 대역 성분들에 대해 일부 후처리 프로세싱을 수행하는 제 3 처리 블록(251), 및 후처리된 주파수 대역 성분들을 재조합하여 처리된 오디오 신호를 출력하는 합성 필터 섹션(283)을 포함할 수도 있다.

    몇몇 실시형태들에서, 분석 필터 섹션(281)은 아날로그-디지털 컨버터(14)로부터 디지털 신호를 수신하며, 도 3에 도시된 바와 같이, 디지털 신호를 2개의 주파수 대역들 또는 채널들로 분할한다. 도 3에 도시된 2개의 주파수 대역들 또는 채널들은 제 1 (저주파) 대역 또는 채널(291) 및 제 2 (고주파) 대역 또는 채널(293)이다. 몇몇 실시형태들에서, 저주파 채널은 최대 4 kHz(그에 따라 8 kHz의 샘플링 주파수를 요구함)일 수도 있고, 협대역 신호들의 주파수 성분들을 나타낼 수도 있으며, 고주파 채널(293)은 4 kHz 내지 8 kHz(및 그에 따라 16 kHz의 샘플링 주파수를 가짐)일 수도 있고, 추가 광대역 신호들을 나타낼 수도 있다.

    분석 필터 섹션(281)은, 몇몇 실시형태들에서, 전술된 바와 같이, 주파수 대역들을 생성할 수도 있다. 분석 필터 섹션(281)은, 몇몇 실시형태들에서, 디지털 신호를 수신하고 필터링된 신호를 다운-샘플러(203)로 출력하도록 구성된 제 1 분석 필터 H o (201)를 포함한다. 제 1 분석 필터 H o (201)의 구성 및 설계는 이후에 더 상세히 설명될 것이지만, 몇몇 실시형태들에서는 저주파 대역/고주파 대역 임계치에서 정의된 임계 주파수를 갖는 저역 필터인 것으로 간주될 수도 있다.

    다운-샘플러(203)는 임의의 적합한 다운-샘플러일 수도 있다. 몇몇 실시형태들에서, 다운-샘플러(203)는 값 2의 정수 다운-샘플러이다. 이후, 다운-샘플러(203)는 다운-샘플링된 출력 신호를 제 1 처리 블록(211)로 출력할 수도 있다. 즉, 몇몇 실시형태들에서, 다운-샘플러(203)는 필터링된 입력 샘플들로부터 매 두 번째 샘플을 선택하고 출력하여, 샘플링 주파수를 8 kHz(또는 협대역 샘플링 주파수)까지 '감소'시키고 이 필터링되고 다운-샘플링된 신호를 제 1 처리 블록(211)으로 출력한다.

    몇몇 실시형태들에서, 조합 시의 제 1 분석 필터 H o (201) 및 다운-샘플러(203)는 샘플링 속도를 16 kHz로부터 8 kHz로 감소시키는 데시메이터인 것으로 간주될 수도 있다.

    분석 필터 섹션(281)은, 몇몇 실시형태들에서, 디지털 신호를 수신하고 필터링된 신호를 제 1 처리 블록(211)으로 출력하는 제 2 분석 필터 H i (205)를 더 포함할 수도 있다. 제 2 분석 필터 H i (205)의 구성 및 설계는 또한 이후에 더 상세히 설명될 것이지만, 몇몇 실시형태들에서는 저주파 대역/고주파 대역에서 정의된 임계 주파수를 갖는 고역 필터인 것으로 간주될 수도 있다.

    분석 필터들 및 다운-샘플러들을 사용하여 신호를 주파수 대역들/채널들로 분할하는 것은 도 4의 단계 305에 도시되어 있다.

    제 1 처리 블록(211)은 고주파 채널(293) 및 저주파 채널(291)을 수신할 수도 있고, 몇몇 실시형태들에서는, 이러한 신호들에 대해 비형성 처리 및/또는 적응적 필터링을 수행할 수도 있다. 제 1 처리 블록은 각각의 주파수 채널로부터의 신호 성분들에 대해 반향음 제어(acoustic echo control: AEC) 및 멀티-마이크로폰 처리와 같은 애플리케이션들을 구현하기 위해 임의의 적합한 빔형성 및/또는 적응적 필터링을 적용할 수도 있다. 몇몇 실시형태들에서는, 오디오 신호의 다운-샘플링에 앞선 저역 필터링이 적응적 필터 길이의 이등분을 허용하기 때문에, 저주파 채널(291)에 대한 적응적 필터링에서 보다 짧은 적응적 필터링이 가능하다. 따라서, 이것은, 이러한 타입의 애플리케이션들 중에서 보다 긴 적응적 필터들보다는 보다 짧은 적응적 필터들이 보다 우수하게 작동하는 것으로 알려져 있기 때문에, 필터링 프로세스를 개선할 수 있다. 또한, 보다 높은 주파수 상에서는 지향성이 이용될 수 없기 때문에, 제 1 처리 블록에 의해 실행되는 반향음 제어(AEC) 및 멀티-마이크로폰 처리 애플리케이션들 양측 모두는 이러한 애플리케이션에 대한 빔형성 및 적응적 필터링이 저주파 대역 또는 채널 신호들에서만 실행될 수 있도록 구현될 수도 있다. 이러한 실시형태들에서, 고주파 대역/채널 신호들은 제 2 처리 블록(231)에서 서브 대역 주파수 도메인 처리를 이용하여 AEC 및 멀티-마이크로폰 처리를 구현할 수도 있다. 이것은, 멀티-마이크로폰 또는 마이크로폰 어레이 처리가 가장 효율적인 주파수 대역이 마이크로폰들 사이의 거리에 의존하기 때문이다. 모바일 디바이스들에서의 거리는 보다 낮은 주파수들만이 처리에 합당하도록 하는 것이 가장 흔하다. 또한, 일반적으로, 인간의 청력은 대수적인 주파수 이해를 갖고 있으므로, 보다 우수한 주파수 분해능 및 보다 높은 처리 충실도는 보다 낮은 주파수들에 대해 보다 우수한 결과들을 생성하는 데 이용될 수도 있다.

    제 1 프로세서(211)는, 몇몇 실시형태들에서, 저주파 대역/채널 성분들에 대해 시간 도메인 처리를 실행할 수도 있다. 예를 들어, 제 1 프로세서는 음성 활성 검출(voice activity detection: VAD) 및 구체적으로 일부 시간 도메인 피처 추출 대한 시간 도메인 처리를 이용할 수도 있다. VAD는 일반적 레벨 또는 고레벨 제어 정보로서 고려될 수 있으며, 대부분의 스피치/음성 처리 알고리즘들은, 신호가 음성이든 다른 것이든, 그 정보로부터 이득을 얻는다. 예를 들어, 가장 보편적으로, VAD는 잡음 억압자(noise suppressor: NS) 애플리케이션들에 의해 사용되어, 잡음 특성들이 추정될 수 있는 때(어떠한 음성도 존재하지 않는 때)를 나타낸다. 제 1 프로세서(211)는, 스피치 신호들이 일반적으로 저주파 대역들 상의 그들의 정보 및 에너지의 대부분을 전달하므로, 저주파 대역/채널 신호들에 대해 시간 도메인 처리를 수행할 수도 있다.

    주파수 대역들/채널들 중 적어도 하나의 주파수 대역/채널의 사전 처리, 예를 들어 제 1 처리 블록에 의한 빔형성 및/또는 적응적 필터링의 적용이 도 4의 단계 307에 도시되어 있다.

    서브 대역 생성기(285)는 제 1 처리 블록으로부터의 출력을 수신할 수도 있다. 다시 말해, 서브 대역 생성기는, 몇몇 실시형태들에 있어서, 처리된 고주파 대역/채널을 필터뱅크(223)에서 수신할 수도 있고, 처리된 저주파 대역/채널을 고속 푸리에 변환기(FFT)에서 수신할 수도 있다.

    고속 푸리에 변환기(221)는 처리된 저주파 대역/채널 신호들, 즉 협대역 샘플링 주파수로 제한된 시간 도메인 신호 대역을 수신하며, 고속 푸리에 변환을 수행하여 대역 제한 처리된 오디오 신호의 주파수 도메인 표현을 생성한다. 몇몇 실시형태들의 제 1 실시예에서, 저주파 대역/채널 신호는 80개의 샘플들을 포함하는 프레임으로서 샘플링될 수도 있는 것으로, 다시 말해 8 kHz에서 샘플링된 10 ms 주기로 샘플링될 수도 있다. 몇몇 다른 실시형태들에서, 저주파 주파수 대역/채널 신호는 160개 샘플들의 프레임 길이를 갖는 프레임 또는 20 ms로서 샘플링될 수도 있다.

    프레임은, 몇몇 실시형태들에서, 윈도잉된다, 즉 윈도우 함수에 의해 승산된다. 이러한 실시형태들에서, 그리고 윈도잉이 프레임들 사이를 부분적으로 중첩시키기 때문에, 중첩 샘플들은 다음 프레임을 위해 메모리에 저장된다. 이러한 실시형태들에서, 고속 푸리에 변환기는 이 프레임에 대한 그 80개의 샘플들을 이전 프레임으로부터 저장된 16개의 샘플들과 조합시켜, 총 96개의 샘플들을 생성한다. 이러한 실시형태들에서, 이 프레임의 최종 16개의 샘플들은 다음 프레임 주파수 계수들을 계산하기 위해 저장될 수도 있다. FFT는, 이러한 실시형태들에서, 96개의 샘플들을 취하며, 윈도우의 처음 8개의 값들이 상승 스트립을 형성하고 마지막 8개의 값들이 하강 스트립을 형성하는 96개의 샘플 값들을 포함하는 윈도우에 의해 그 샘플들을 승산한다. 윈도우 함수 I는 임의의 적합한 함수일 수도 있지만, 몇몇 실시형태들에서는 다음과 같이 정의될 수도 있다.

    몇몇 실시형태들에서, 중간의 80개의 샘플 값들(n=8, ..., 87)에 대한 윈도우 함수 I(n)는 =1이며, 그에 따라 이러한 함수 샘플 값들에 의한 승산은 오디오 신호 샘플 값들을 변화시키지 않기 때문에, 승산은 생략될 수 있다. 다시 말해, 이러한 실시형태들에서는, 윈도우에서 오로지 처음 8개의 샘플들 및 마지막 8개의 샘플들만이 승산될 필요가 있다.

    또한, FFT(221)는, FFT의 길이가 2의 멱이어야 하기 때문에, 블록(11)으로부터 획득된 96개의 샘플들의 종단에서 32개의 제로(0)들을 더하여, 128개의 샘플들을 포함하는 스피치 프레임을 생성한다.

    프레임의 샘플들 x(0), x(1), ... , x(n); n=127(또는 상기 128개의 샘플들)은 FFT(221)에 의해 실제 FFT(고속 푸리에 변환)를 채용하는 주파수 도메인으로 변환되어, 주파수 도메인 샘플들 X(0), X(1), ... ,X(f); f=64(보다 일반적으로 f=(n+1)/2))를 제공하게 하되, 여기서 각각의 샘플은 실수 성분 X r (f) 및 허수 성분 X i (f)를 포함한다:

    몇몇 실시형태들에서, FFT(221)는 실수 및 허수 성분들을 쌍으로 크기 제곱하고 서로 합산하여, 스피치 프레임의 파워 스펙트럼을 생성할 수도 있다.

    이후, FFT는 신호들의 주파수 성분 표현을 제 2 처리 블록(231)으로 출력할 수도 있다.

    필터뱅크(223)는 고주파 대역/채널 신호들을 수신하고, 제 2 처리 블록에서 잡음 억압 및 기타 애플리케이션들에 대해 충분한 주파수 분해능을 갖는 일련의 신호들을 생성한다. 필터뱅크(223)는, 몇몇 실시형태들에서, 디지털 오디오 제어기(105)의 제어 하에 구현 및/또는 설계될 수도 있다. 본 발명의 몇몇 실시형태들에서, 디지털 오디오 제어기(105)는 필터뱅크(223)를 코사인 기반 변조 필터뱅크로 구성할 수도 있다. 이 구조는 재조합 프로세스를 단순화시키기 위해 선택될 수도 있다.

    몇몇 실시형태들에서, 디지털 오디오 제어기(105)는 필터뱅크(223)를 M번째 대역 필터로서 이 M번째 대역 필터와 이상적인 필터 사이의 오차의 최소 자승 값을 최소화시키는 기준에 따라 구현할 수도 있다. 다시 말해, 서브대역 필터들은 다음의 수학식을 최소화시키기 위해 선택될 수도 있다.

    여기서, λ(ω)는 가중치를 나타내고, H d (ω)는 이상적인 필터를 지칭하며, Ω는 주파수들의 그리드 또는 범위를 지칭하고,

    는 M번째 대역 필터이다. 필터뱅크(223)는, 실시형태들에서, 및 이 되도록 중간 탭 l을 중심으로 대칭적일 수도 있다. 디지털 오디오 제어기(105)는, 몇몇 실시형태들에서, 코사인 기반 변조 필터 뱅크의 서브대역들의 수 및 폭에 따라 M에 대한 적합한 값을 선택할 수도 있다. 디지털 오디오 제어기(105)는, 몇몇 실시형태들에서, 입력 신호가 오로지 특정 주파수들 상에서만 '의미 있는' 콘텐츠를 갖고 있기 때문에, 필터 뱅크에 의해 생성된 서브대역들을 조합시킬 수도 있다. 디지털 오디오 제어기(105)는 이러한 실시형태들에서 대응하는 필터 뱅크 필터 계수들을 증가시킴으로써 이웃하는 서브대역들을 병합하여 그 구성을 구현할 수도 있다.

    도 7은 필터뱅크(223)의 주파수 응답의 실시예를 도시하고 있다. 모든 필터들은 H 1 (z)로 컨볼루션되며, 가장 낮은 4개의 대역들 및 가장 높은 2개의 대역들은 대응하는 필터뱅크 계수들을 증가시킴으로써 병합된다. 4개의 서브대역들에 대한 필터뱅크 출력은 약 3.4 kHz로부터 4 kHz까지의 제 1 서브대역 영역(701), 약 4 kHz로부터 5.1 kHz까지의 제 2 서브대역(703), 약 5.1 kHz로부터 6.3 kHz까지의 제 3 서브대역 영역(705), 및 약 6.3 kHz로부터 8 kHz까지의 제 4 서브대역 영역(707)에 의해 하이라이트된다. 몇몇 실시형태들에서, 디지털 오디오 제어기는, 어떠한 데시메이션 또는 보간도 없고 그에 따라 방지해야 할 어떠한 추가 앨리어싱도 없기 때문에, 필터뱅크 필터들의 중간 저지대역 감쇄를 갖는 필터 뱅크 필터들을 설계할 수도 있다.

    또한, 도 4는 상기 필터뱅크 필터들에 대한 시작점으로서 사용되는, 프로토타입 M번째 대역 필터(이 실시예에서 M=14)에 대한 크기 응답을 도시하고 있다.

    필터뱅크가 필터뱅크에 대한 비교적 짧은 지연을 갖고 있더라도, 그것은 여전히 지연을 생성한다는 것이 인식될 수도 있다. 그러나, 필터뱅크로부터의 이러한 지연은 사소하며, 일반적으로 FFT(221)로부터 생성된 지연이 더 클 것이기 때문에 시스템의 총 지연을 결정하지 않을 수도 있다. 따라서, 몇몇 실시형태들에서는, FFT(221)의 지연을 보상하기 위해 합성 필터 섹션에서 여분의 지연 필터 z -D (265)가 필요할 수도 있다.

    대역들을 서브대역들로 분할하는 것은 도 5의 단계 309에 도시되어 있다.

    이러한 서브대역 분할의 출력은 제 2 처리 블록(231)에 전달된다.

    제 2 처리 블록(231)은 서브대역 신호들을 처리하여 잡음 억압 및 잔여 반향 감쇄를 수행하도록 구성된다. 제 2 처리 블록은, 몇몇 실시형태들에서, 고주파 대역 신호들에 대한 각각의 서브대역 상에서의 신호 전력들을 계산할 수도 있고, 이들을 각각의 저주파 대역의 서브대역에 대한 파워 스펙트럼 밀도 성분들과 함께 사용할 수도 있다.

    제 2 처리 블록(231)은, 몇몇 실시형태들에서, US5839101 또는 US-2007/078645에 나타내어진 기법들과 같은 임의의 적합한 잡음 억압 기법을 이용하여 잡음 억압을 수행하도록 구성될 수도 있다.

    제 2 처리 블록(231)은, 몇몇 실시형태들에서, FFT(221) 및 필터뱅크(223)로부터의 서브대역 성분들에 임의의 적합한 잔여 반향 억압 처리를 적용할 수도 있다.

    적어도 하나의 서브대역에 잡음 억압 및/또는 반향 억압을 위한 처리를 적용하기 위한 제 2 처리 블록(231)의 적용은 도 4의 단계 311에 도시되어 있다.

    서브대역 조합기(287)는 고속 푸리에 역변환기(241) 및 합산 섹션(243)을 포함한다.

    고속 푸리에 역변환기(IFFT, 241)는 저주파 대역의 처리된 서브대역들을 수신하며, 고속 푸리에 역변환을 수행하여 시간 도메인 저주파 대역 표현을 생성한다. 고속 푸리에 역변환은 임의의 적합한 고속 푸리에 역변환일 수도 있다. IFFT(241)는 저주파 대역 신호 정보를 제 3 처리 블록(251)에 출력한다.

    합산 섹션(243)은 고주파 대역의 처리된 서브대역들을 수신하고, 그 성분들을 함께 합산하여 고주파 대역/채널 신호를 생성한다. 합산 섹션은 고주파 대역 신호 정보를 제 3 처리 블록(251)에 출력한다.

    처리된 대역들을 생성하도록 하는 처리된 서브대역들의 재조합은 도 4의 단계 313에 도시되어 있다.

    제 3 처리 블록은 IFFT(241)로부터 저주파 대역/채널 정보를 수신하고, 합산 섹션(243)으로부터 고주파 대역/채널 정보를 수신하며, 그 신호들에 대해 후처리를 수행한다. 몇몇 실시형태들에서, 제 3 처리 블록(251)은 신호 레벨 제어를 수행한다. 몇몇 실시형태들에서 레벨 제어에 대한 구현은, 먼저, 신호들을 합산하거나 조합시키는 경우, 고정된 점의 표현이 사용될 때 오버플로우가 있을 수도 있다. 이 오버플로우 조건은 이러한 실시형태들에서 추정될 수도 있고, 그에 따라 신호 레벨들이 제 3 처리 블록에 의해 감소할 수도 있다. 두 번째로, 이러한 실시형태들에서, 신호 레벨들은, 예를 들어 마이크로폰 및 스피커 거리에 따라 변할 수 있고, 청취자가 항상 최적의 안정적인 볼륨 레벨을 갖는 방식으로 제 3 처리 블록(251)에 의해 제어될 수 있다.

    제 3 처리 블록(251)의 출력은 합성 필터 섹션(283)으로 전달된다.

    제 3 처리 블록(251)의 애플리케이션은 도 4의 단계 315에 도시되어 있다.

    몇몇 실시형태들에서, 합성 필터 섹션(283)은 주파수 대역들로 분할된 처리된 디지털 오디오 신호를 수신하고, 그 대역들을 필터링 및 조합하여 단일의 처리된 디지털 오디오 신호를 생성한다.

    도 3에 도시된 바와 같이, 몇몇 실시형태들에서, 합성 필터 섹션(283)은 처리 블록의 저주파 대역/채널 신호 출력을 수신하고 고주파 대역/채널 신호들과의 조합에 적합한 업샘플링된 버전을 출력하도록 구성된 업샘플러(261)를 포함한다. 몇몇 실시형태들에서, 업샘플러(261)는 값 2의 정수 업샘플러이다. 다시 말해, 업샘플러(261)는 샘플 쌍 사이에 새로운 샘플을 추가하여, 샘플링 주파수를 8 kHz로부터 16 kHz로 '증가'시킨다. 그 후, 업샘플러(261)는 업샘플링된 출력 신호를 제 1 합성 필터 F 0 (263)로 출력할 수도 있다.

    제 1 합성 필터 F 0 (263)은 업샘플러(261)로부터 업샘플링된 신호를 수신하고, 필터링된 신호를 조합기(267)의 제 1 입력으로 출력한다. 제 1 합성 필터 F 0 (263)의 구성 및 설계는 또한 이후에 상세히 설명될 것이지만, 몇몇 실시형태들에서는 저주파 대역/고주파 대역 경계에 있는 정의된 임계 주파수를 갖는 저역 필터인 것으로 간주될 수도 있다.

    일부 실시형태들에서, 조합 시의 제 1 합성 필터 F 0 (263) 및 업샘플러(261)는 샘플링 속도를 8 kHz로부터 16 kHz로 증가시키는 보간기인 것으로 간주될 수도 있다.

    제 2 합성 필터 F 1 (265)(일부 실시형태들에서는 Z -D 로 지정된 순수 지역 필터일 수도 있음)은, 제 3 처리 블록(251)으로부터 출력된 고주파 대역으로부터 출력을 수신하고, 필터링된 신호를 조합기(267)의 제 2 입력으로 출력하도록 구성된다. 제 2 합성 필터 F 1 (265)의 구성 및 설계는 추후에 상세히 설명될 것이지만, 몇몇 실시형태들에서는 제 1 합성 필터 F 0 (263)의 출력과 동기화하기에 충분한 정의된 지연을 갖는 순수 지연 필터인 것으로 간주될 수도 있다.

    조합기(267)는 필터링된 처리된 고주파 대역 신호들 및 필터링된 처리된 저주파 대역 신호들을 수신하여, 조합 신호를 출력한다. 몇몇 실시형태들에서, 이 출력은 저장 또는 송신 이전의 추가 인코딩을 위해 디지털 오디오 인코더(130)로의 것이다.

    처리된 대역을 조합하는 동작은 도 4의 단계 317에 도시되어 있다.

    디지털 오디오 인코더(103)는 처리된 디지털 오디오 신호를 임의의 적합한 인코딩 과정에 따라 더 인코딩할 수도 있다. 예를 들어, 디지털 오디오 인코더(103)는 국제 전기 통신 연합 기술 위원회(International Telecommunications Union Technical board: ITU-T) G.722 또는 G729 코딩 계열들 중 임의의 것과 같은 임의의 적합한 무손실 또는 손실 인코딩 과정을 적용할 수도 있다. 몇몇 실시형태들에서, 디지털 오디오 인코더(103)는 최적의 것이고, 구현되지 않을 수도 있다.

    오디오 신호의 추가 인코딩 동작은 도 4의 단계 319에 도시되어 있다.

    본 발명의 실시형태에 따른 디지털 오디오 제어기는 필터들 H 0 , H 1 i, F 0 및 F 1 을 구현하는 파라미터들을 선택하도록 구성될 수도 있다. 오디오 신호들에 있어서, 최저 주파수들에는 전반적으로 매우 강한 성분들이 존재할 수도 있다. 이러한 성분들은, 임의의 보간 과정 동안에 고대역 주파수들로 미러링될 수도 있다. 다시 말해, 보간 필터들(합성 필터들) F 0 및 F 1 은, 가장 강한 미러 주파수들에 대응하고 이러한 미러링된 성분들을 감쇄시키는 하나 이상의 제로(0)를 갖도록 디지털 오디오 제어기에 의해 구성될 수도 있다. 디지털 오디오 제어기에 의한 필터들의 구성은 전술된 오디오 처리 전에 수행될 수도 있고, 실시형태들에 따라 1회 이상 수행될 수도 있다.

    예를 들어, 몇몇 실시형태들에서, 디지털 오디오 제어기(105)는 디지털 오디오 프로세서에 대한 별도의 디바이스일 수도 있고, 공장 초기화(factory initialization) 및 검사 절차 시, 디지털 오디오 제어기(105)는 장치로부터 제거되기 전에 디지털 오디오 프로세서의 파라미터들을 구성한다. 다른 실시형태들에서, 디지털 오디오 제어기는, 장치 또는 사용자에 의해 요구되는 정도로 흔하게 디지털 오디오 프로세서를 재구성할 수 있다. 예를 들어, 장치가 초기에 낮은 잡음 환경에서 높은 충실도의 스피치 캡처를 위해 구성된다면, 제어기는 반향 풍부 환경과 함께 고잡음 환경에서 스피치 오디오 캡처를 위해 그 장치 및 디지털 오디오 프로세서를 재구성하는 데 사용될 수도 있다.

    디지털 오디오 제어기(105)에 의한 필터들의 구성 및 설정은 도 5를 참조하면 알 수 있는데, 여기서 필터들 H 0 (201), H 1 (205), F 0 (263) 및 F 1 (265)에 대한 구현 파라미터들이 결정된다.

    도 3에 도시된 장치와 관련하여, Z 도메인, 이산 라플라스 도메인에서, 디지털 오디오 프로세서(101)로의 입력이 X(z)로서 정의되고, 디지털 오디오 프로세서로부터의 출력이 Y(z)로서 정의되면, 필터뱅크들의 출력 부분들에 대한 입력-출력 관계(처리 블록 및 내부 필터뱅크 내에서 어떠한 처리도 없는 것으로 상정함)는 다음의 수학식으로 표현될 수도 있다.

    제어기는, 몇몇 실시형태들에서, 출력에 낮은 왜곡을 갖는 입력의 지연된 버전을 제공하고자 한다. 즉,

    여기서, L은 필터들에 의해 생성된 지연을 지칭한다.

    디지털 오디오 제어기(105)는 분석 필터들 H 1 (205) 및 H 0 (201)의 시간 반전 버전이 되는 합성 필터들 F 1 (265) 및 F 0 (263)을 각각 구성한다.

    이 초기의 상정 동작은 도 5의 단계 501에서 알 수 있다.

    이러한 상정을 이용한 디지털 오디오 제어기(105)는, 현재, 다음의 수학식을 이용하여 분석 필터들 H 0 및 H 1 에 대한 파라미터들을 초기에 계산하고자 한다.

    여기서, Ω는 주파수들의 그리드를 지칭하고, δ(ω)는 이러한 주파수들 각각에서 허용되는 왜곡을 정의하며, ω 0 및 ω 1 은 각각 저주파 및 고주파 대역들의 저지대역 에지들을 지칭하고, λ 0 및 λ 1 은 가중 함수 값들을 나타낸다.

    디지털 오디오 제어기(105)는 현재 이러한 최소화를, 유일한 솔루션이 임의의 공지된 반한정 프로그래밍 솔루션을 이용하여 발견될 수도 있는, 반한정 프로그래밍(SDP) 문제로서 표현되는 것으로 간주할 수도 있다.

    따라서, 몇몇 실시형태들에서, 제어기는 오직 하나의 작은 전체적 왜곡만의 제약을 갖는 저지대역 에너지를 최소화하고, 또한 통과 대역 값을 1에 가깝게 만드하는 초기 필터 파라미터들을 결정할 수도 있다.

    오직 하나의 작은 전체 왜곡 기준만을 갖는 저지대역 에너지를 최소화함으로써 H 0 및 H 1 필터 파라미터들을 결정하는 동작은 도 5의 단계 503에서 알 수 있다.

    그 후, 디지털 오디오 제어기(105)는, 합성 필터들 F 1 (265) 및 F 0 (263)이 분석 필터들 H 1 (205) 및 H 0 (201)의 시간 반적 버전들이라는 상정을 제거할 수도 있다.

    디지털 오디오 제어기는, 몇몇 실시형태들에서, 반복 단계 과정을 초기화할 수도 있다.

    디지털 오디오 제어기는, 다음의 수학식

    을 이용하여, 고정된 H 0 (ω)로, 고정된 제 1 분석 필터 H 0 (201)로 제 1 합성 필터 F 0 (263) 및 제 2 분석 필터 H 1 (205)에 대한 파라미터들을 결정할 수도 있다.

    F 0 및 H 1 에 대한 필터 파라미터들이 고정된 H 0 에 대해 선택되는 반복의 제 1 부분 동작은 도 5의 단계 505에 도시되어 있다.

    그 후, 반복의 제 2 부분에서, 제어기(105)는 다음의 수학식

    과 관련하여, 고정된 F 0 (ω)가 존재하는 경우, 고정된 제 1 합성 필터 F 0 (263)을 이용하여 제 2 분석 필터 H 1 (205) 및 제 1 분석 필터 H 0 (201)에 대한 파라미터들을 결정하고자 한다.

    F 0 (ω)을 이용하여 제 1 및 제 2 분석 필터들 H 1 (205) 및 H 0 (201)에 대한 파라미터들을 결정하는 동작은 도 5의 단계 507에 의해 도시된다.

    상기의 반복 과정 동작들 양측 모두는 2차 콘(second order cone: SOC) 문제로서 표현될 수도 있고, 제어기(105)에 의해 반복적으로 해결될 수도 있다. 이전과 같이, Ω는 주파수들의 그리드를 지칭하고, δ(ω)는 얼마나 많은 왜곡이 각각의 주파수들에서 허용되는지를 제어하는 파라미터를 정의하며, ω 0 및 ω 1 은 각각 저주파 및 고주파 대역 에지 주파수들을 지칭하고, λ 0 , λ 1 및 λ 2 는 가중 함수들을 나타낸다.

    따라서, 디지털 오디오 제어기(105)는 오직 하나의 전체적인 작은 왜곡만을 갖도록 하는 제약을 갖는 저지대역 에너지를 최소화하고자 할 수도 있다. 이 과정은 통과 대역을 1에 가깝게 만들 수도 있다.

    그 후, 디지털 오디오 제어기(105)는 전류 파라미터들에 의해 생성된 필터들이 사전 정의된 기준과 관련하여 허용가능한지의 여부를 결정하는 조사 단계를 수행할 수도 있다. 조사 단계는 도 5의 단계 509에 의해 도시된다.

    조사 단계에서 필터들이 허용가능한 것으로 결정된 경우, 동작은 단계 511로 진행한다. 조사 단계에서, 추가 반복이 요구되는 것으로 결정된 경우, 디지털 오디오 제어기(105)는 고정된 H 0 와 관련하여 합성 필터 F 0 및 분석 필터 H 1 에 대한 파라미터들을 결정하는 반복의 제 1 부분으로 되돌아간다.

    반복 과정은 초기화 과정들에 상당히 의존할 수도 있다. 발명자들에 의해 수행된 검사에서는, 보다 짧은 초기 필터들 H 0 및 H 1 이 전반적으로 우수한 솔루션들을 제공한다는 것이 관찰되었다. 또한, 디지털 오디오 제어기(105)는 서브대역들 간의 시간 동기화가 중요한 F 0 필터에 대한 초기 추정치로서 시간 반전된 H 0 (즉, 최대 위상 필터)을 사용할 수도 있다.

    필터들에 의해 생성된 전체적인 지연 L에 관하여, 디지털 오디오 제어기(105)는 임의의 적합한 값에 따라 값을 설정할 수도 있다. 또한, 이전에 나타낸 바와 같이, 디지털 오디오 제어기(105)는 H 1 필터의 길이에 의존하여 제 2 합성 필터 F 1 에 대한 파라미터들을 결정할 수도 있다. F 1 파라미터들의 결정은 도 5에서 단계 511에 도시되어 있다. 몇몇 실시형태들에서, H 1 및 F 1 의 그룹 지연은 대략 L로 정의된 값으로 결정할 것이다. 디지털 오디오 제어기(105)는, 몇몇 실시형태들에서, 제 1 분석 필터 뱅크 외부 필터 H 1 에 대한 파라미터들이 거의 선형의 상태를 갖도록, 다시 말해 일정한 지연을 갖도록 파라미터들을 결정할 수도 있다. 제어기(105)는, 몇몇 실시형태들에서, 필터들 H 0 (201) 및 F 0 (263) 지연이 주파수들 간에 상이할 수도 있지만 모든 주파수들 상에서 거의 일정한 지연 L을 갖는 컨볼루션된 필터 특성 H 0 (z)F 0 (z)을 가질 수도 있도록 필터 파라미터들을 결정할 수도 있다.

    도 6과 관련하여, 제 1 합성 필터 F 0 (263), 제 1 분석 필터 H 1 (205) 및 제 2 합성 필터 H 0 (201)에 대한 적합한 주파수 응답들이 도시되어 있다. 이러한 실시예들에서, 고주파 대역 분석 필터인 제 2 분석 필터 H 1 (205)의 주파수 응답은 파선(601)으로 표시되고 3.2 kHz로부터 상방향으로의 통과 대역을 갖는다. 저주파 대역 분석 필터인 제 1 분석 필터 H 0 (201)의 주파수 응답은 교차부들 +(605)에 의해 표시된 트레이스에 의해 도시되고, 대략 4 kHz로부터의 저지 대역을 갖는 것으로 도시되어 있다. 저주파 대역 합성 필터인 제 2 합성 필터 F 0 (263)의 주파수 응답은 교차부들 x'(705)에 의해 표시된 트레이스에 의해 정의되고, 3.2 kHz로부터의 저지 대역을 갖는 것으로 도시되어 있다.

    몇몇 실시형태들에서, 디지털 오디오 제어기(105)는 보간기 필터인 제 1 합성 필터 F 0 (263)에 중점을 두는데, 이는 일반적인 오디오 신호 저주파 성분들이 비교적 강하기 때문이며, 이러한 실시형태들에서는 제어기가 저주파 성분들의 미러 이미지들을 현저하게 감쇄시키도록 F 0 (263)를 구성할 수도 있다.

    디지털 오디오 제어기(105)는, 몇몇 실시형태들에서, 제 1 합성 필터 F 0 (263)의 저지 대역 감쇄를 순차적으로 증가시킬 수도 있는 방본적인 단계의 제 1 최적화에서 λ 2 에 대한 가중치를 증가시킬 수도 있다.

    분석 필터 뱅크 외부 필터들 및 합성필터 뱅크 외부 필터들에 대한 구현 파라미터들의 결정은 도 5에서 단계 401에 도시되어 있다.

    상기 실시예들이 3개의 개별적인 처리 블록들(211, 231, 251)을 도시하고 있지만, 몇몇 실시형태들에서, 제 2 처리 블록(231)의 동작만이 요구되고, 그에 따라 제 1 처리 블록이나 3 처리 블록은 존재하지 않을 수도 있다는 것이 이해될 것이다. 예를 들어, 전술된 후처리 신호 레벨 제어 동작들은 실행되지 않을 수도 있고, 또는 몇몇 실시형태들에서 제 2 처리 블록(231) 동작들의 일부분으로서 실행될 수도 있다. 마찬가지로, 몇몇 실시형태에서, 전처리 동작들은 제 1 처리 블록(221)에서 실행되는 것이 아니라, 제 2 처리 블록(231)의 일부로서 실행될 수도 있다.

    상기 실시형태들은 다수의 마이크로폰들이 요구되어 스테레오 또는 폴리포닉 신호들이 구현되는 (전술된) 마이크로폰 어레이 처리 또는 빔형성을 이용하여 구현될 수도 있다. 다시 말해, 몇몇 실시형태들은 다중 신호들을 입력으로서 수신하지만, 보다 적은 출력들을 제공한다. 몇몇 실시형태들에서, 보다 적은 출력은 단지 모노 출력일 수도 있다. 또한, 몇몇 실시형태들에서, 이용하고 있는 빔형성을 위한 주파수 범위는 모든 입력들에 대해 유사한 주파수 분할 방법들을 구현한다. 이러한 실시형태들에서, 배경 잡음 추정은 먼저 모든 채널들 또는 채널 쌍들에 대해 계산되고, 그 다음, 각각의 대역에 대해, 보다 작은 값이 배경 잡음 추정으로서 저장된다. 목적이 원거리 잡음 소스들을 감쇄시키는 것인 이러한 실시형태들에서, 제 2 처리 블록(231)에 의해 수행되는 것과 같은 잡음 상쇄 동작은, 녹음 소스 또는 신호의 기원이, 상이한 마이크로폰들 또는 녹음 지점들에서는 오디오 레벨이 현저하게 다른 녹음 디바이스에 가까운 오디오 정보를 억압하지 않는다.

    상기 사항이 특정 구조를 갖는 장치 및 디지털 오디오 프로세서(103)를 설명하고 있지만, 실시형태에 따라서 가능한 많은 대안의 구현물들이 존재할 수도 있다는 것이 이해될 것이다.

    몇몇 실시형태들에서, 고주파 대역 또는 저주파 대역중 임의의 것에 대한 샘플링 속도는 전술된 값들과는 상이할 수도 있다. 예를 들어, 몇몇 실시형태들에서, 고주파 대역은 48 kHz의 샘플링 주파수를 가질 수도 있다.

    또한, 몇몇 실시형태들에서, 입력신호는 44.1 kHz 샘플링된 신호, 다시 말해 컴팩트디스크(CD) 포맷된 디지털 신호일 수도 있다. 이러한 실시형태들에서, 상기 실시형태들에서 설명된 구조화된 것을 사용하는 저대역들은 22.1 kHz (저주파 대역) 샘플링 속도를 갖는 것으로 간주될 수도 있다.

    또한, 메인 대역 상의 서브대역들의 수 및 사이즈가 잡음 억압의 요건들에 의해 영향을 받으므로, 다른 실시형태들은 상이한 수의 서브대역들 및 상이한 서브대역 폭들을 갖는 서브대역을 이용할 수도 있다.

    본 발명의 몇몇 실시형태들에서는, 전술된 실시형태들에 도시된 3개 이상의 대역들이 사용될 수도 있다. 예를 들어, 몇몇 실시형태들에서, 보다 낮은 주파수 성분들에 대해 보다 강한 잡음을 억압하기 위한 충분한 주파수 분해능을 획득하기 위해, 저주파 대역은 더 분할될 수도 있다. 예를 들어, 이러한 실시형태들에서, 저대역 0 내지 4 kHz는 고-저대역 2 kHz 내지 4 kHz과 최대 2 kHz의 저-저대역으로 분할될 수도 있다.

    몇몇 실시형태들에서, 서브대역 필터들에서의 동작을 위해 설명된 코사인 기반 변조된 필터 뱅크들은 프로토타입 필터에 대해 M의 보다 높거나 보다 낮은 값을 이용할 수도 있고, 적합한 필터 계수들을 조합하여 요구되는 서브대역 분배를 생성할 수도 있다.

    따라서, 상기 실시형태들에 따라 디지털 오디오 제어기(105)에 의해 제어될 때의 디지털 오디오 프로세서(101)는 시뮬레이션에 따라서 종래의 접근방안들에 비해 개선된 품질 및 10-20 dB 만큼 강하된 양자화 잡음을 갖는 개선된 광대역 스피치 오디오 신호들을 생성할 수도 있다. 이러한 양자화 잠음 감소는 현재 실질적으로 사라지거나 일반 사용자가 이해하기 어렵다. 또한, 위에 도시된 장치는 보다 낮은 계산 복잡도를 갖는 오디오 개선 시스템이 사용되게 하여, 디바이스들이 더 저렴하고 배터리 용량을 증가시키지 않고도 더 긴 동작 시간들을 갖게 하도록 전력 효율에 대한 꾸준한 요구에 도움이 되게 한다.

    또한, 이러한 실시형태들은 다른 종류의 필터뱅크 구조들에 비해 짧은 지연이 존재하여, 스피치 신호들의 송신 또는 저장을 위한 신호 인코딩에 대해 처리 시간 제약들을 이완시키도록 설계될 수도 있다.

    전술된 실시형태들에서, 적응적 필터링은 데시메이트된 대역 상에서 이미 실행되어 왔고, 그에 따라 외부 2-채널 분석-합성 필터뱅크가 필요하다. 주파수 분할 프레임워크의 특정 레이아웃/구현은 처리 블록들(1, 2, 3)에 의해 상기 실시형태들에서 도시된 바와 같은 많은 분할 가능성들을 제공할 수도 있다. 이러한 분할 가능성들은, 몇몇 실시형태들에서, 대역의 이용 및 계산의 필요성이 최적화되는 방식으로 알고리즘들에 의해 가요적으로 사용될 수도 있다.

    또한, 몇몇 실시형태들은, 이전의 필터뱅크 시스템들에 비해, 예를 들어 2 채널 분석-합성 필터뱅크들이 재합성된 광대역 신호에 대한 FFT-기반 처리를 따르는 구조에 비해 정정 메모리의 필요성을 감소시킬 수도 있다.

    상기 실시예들은 전자 디바이스(10) 또는 장치 내에서 동작하는 본 발명의 실시형태들을 설명하고 있지만, 하기에 설명되는 본 발명은 일련의 오디오 처리단 내에서 임의의 오디오 처리단의 일부분으로서 구현될 수도 있다.

    따라서, 몇몇 실시형태들에서는, 오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하는 동작, 및 각각의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하는 동작을 포함하는 방법이 존재한다. 이러한 실시형태들에서, 적어도 하나의 주파수 대역 신호에 대해, 복수의 서브대역 신호들은 시간-주파수 도메인 변환을 이용하여 생성되고, 적어도 하나의 다른 주파수 대역에 대해서, 그 하나의 다른 주파수 대역에 대한 복수의 서브대역 신호들이 서브대역 필터뱅크를 이용하여 생성된다.

    또한, 몇몇 실시형태들에서는, 적어도 하나의 프로세서와, 컴퓨터 프로그램 코드를 포함하는 적어도 하나의 메모리를 포함한 장치가 제공되며, 적어도 하나의 메모리 및 컴퓨터 프로그램 코드는, 적어도 하나의 프로세서를 이용하여, 장치로 하여금 상기의 동작들을 수행하게 하도록 구성된다.

    몇몇 추가의 실시형태들에서는, 오디오 신호를 적어도 2개의 주파수 대역 신호들로 필터링하도록 구성된 필터; 적어도 하나의 주파수 대역 신호에 대해 복수의 서브대역 신호들을 생성하도록 구성된 시간-주파수 도메인 변환기; 및 적어도 하나의 다른 주파수 대역에 대해 복수의 서브대역 신호들을 생성하도록 구성된 서브대역 필터뱅크를 포함하는 장치가 제공된다.

    또한, 사용자 장비, 범용 직렬 버스(USB) 스틱들, 및 모뎀 데이터 카드들은 상기의 실시형태들에서 설명된 장치와 같은 오디오 개선 장치를 포함할 수도 있다.

    사용자 장비라는 용어는 모바일 폰들, 휴대용 데이터 처리 디바이스들 또는 휴대용 웹브라우저들과 같은 임의의 적합한 타입의 무선 사용자 장치를 포괄하고자 하는 것으로 이해되어야 할 것이다.

    공중 육상 이동 네트워크(public land mobile network: PLMN)의 추가 구성요소들도 또한 전술된 바와 같은 장치를 포함할 수도 있다.

    일반적으로, 전술된 다양한 실시형태들은 하드웨어 또는 특수 목적 회로, 소프트웨어, 로직 또는 이들의 임의의 조합으로 구현될 수도 있다. 예를 들어, 몇몇 양태들은 하드웨어로 구현될 수도 있는 반면, 다른 양태들은 제어기, 마이크로프로세서 또는 그 밖의 컴퓨팅 디바이스에 의해 실행될 수도 있는 펌웨어 또는 소프트웨어로 구현될 수도 있지만, 본 발명은 이러한 것으로 국한되지 않는다. 본 발명의 다양한 양태들이 블록도, 플로우차트로서 또는 일부 다른 도식적 표현으로 도시되고 설명될 수도 있지만, 본원에서 설명되는 이러한 블록, 장치, 시스템, 기법 또는 방법은 비제한적인 실시예들로서 하드웨어, 소프트웨어, 펌웨어, 특수 목적 회로나 로직, 범용 하드웨어나 제어기, 또는 그 밖의 컴퓨팅 디바이스들, 또는 이들의 일부 조합으로 구현될 수도 있다는 것이 잘 이해될 것이다.

    본원의 실시형태들은 프로세서 엔티티에서와 같은 데이터 프로세서에 의해, 또는 하드웨어에 의해, 또는 소프트웨어와 하드웨어의 조합에 의해 실행가능한 컴퓨터 소프트웨어에 의해 구현될 수도 있다. 또한, 이와 관련하여, 도면에서와 같은 노리 흐름의 임의의 블록들은 프로그램 단계들, 상호 접속된 논리 회로들, 블록들 및 기능들, 또는 프로그램 단계들과 논리 회로들, 블록들 및 기능들의 조합을 나타낼 수도 있다는 것에 유의해야 한다. 소프트웨어는 메모리 칩들과 같은 이러한 물리적 매체, 또는 프로세서 내에 구현된 메모리 블록들, 하드디스크나 플로피디스크들과 같은 자기적 매체, 및 예컨대 디지털 다용도 디스크(DVD), 컴팩트디스크(CD) 및 이들의 데이터 변종과 같은 광학 매체 상에 저장될 수도 있다.

    메모리는 국부적인 기술 환경에 적합한 임의의 타입의 것일 수도 있고, 반도체 기반 메모리 디바이스들, 자기 메모리 디바이스들 및 시스템들, 광학 메모리 디바이스들 및 시스템들, 고정 메모리 및 착탈식 메모리와같은 임의의 적합한 데이터 저장 기술을 이용하여 구현될 수도 있다. 데이터 프로세서는 국부적인 기술 환경에 적합한 임의의 타입의 것일 수도 있고, 비제한적인 실시예들로서, 범용 컴퓨터들, 특수 목적 컴퓨터들, 마이크로프로세서들, 디지털 신호 처리기들(DSPs), 주문형 반도체들(ASIC), 게이트 레벨 회로들, 및 멀티코어 프로세서 아키텍처에 기반을 둔 프로세서들 중 하나 이상을 포함할 수도 있다.

    본 발명의 실시형태들은 집적회로 모듈들과 같은 다양한 소자들에서 실형될 수도 있다. 집적회로들의 설계는 고도로 자동화된 공정에 의한 것이다. 복잡하고 강력한 소프트웨어 툴은 로직 레벨 설계를 반도체 기판 상에서 에칭되고 형성될 준비가 된 반도체 회로 설계로 전환하는 데 이용될 수 있다.

    캘리포니아주 마운틴 뷰 소재의 Synopsys, Inc. 및 캘리포니아주 산호세 소재의 Cadence Design에 의해 제공되는 것들과 같은 프로그램들은 컨덕터들을 자동으로 라우팅하고, 우수하게 확립된 설계 규칙 및 사전 저장된 설계 ahebfefm의 라이브러리들을 이용하여 반도체 칩 상에 구성소자들을 위치시킨다. 일단 반도체 회로용 설계가 완성되면, 표준화된 전자 포맷(예컨대, Opus, GDSII, 등)의 결과적인 설계가 반도체 제조 설비 또는 제조를 위한 "패브(fab)"로 전달될 수도 있다.

    전술된 설명은 본 발명의 예시적인 실시형태에 대한 전적이고 정보적인 성격의 기술을 예시적이고 비제한적인 실시예로서 제공했다. 그러나, 다양한 변형물 및 개조물들이 첨부한 도면 및 첨부한 특허청구범위와 결부되어 해독될 때, 전술된 설명의 관점에서 당업자에게는 명백해질 수도 있다. 그러나, 본 발명의 교시사향들에 대한 이러한 변형들 및 유사한 변형들 모두는 여전히 첨부한 특허청구범위에서 정의되는 본 발명의 범주 내에 있을 것이다.

    본원에서 사용된 바와 같이, 회로라는 용어는 다음의 모든 것들, 즉 (a) 하드웨어 전용 회로 구현물들(예컨대, 오로지 아날로그 및/또는 디지털 회로에서의 구현물들) 및 (b) 회로들 및 소프트웨어(및/또는 펌웨어)의 조합들로서, 적용 가능한 경우, (i) 프로세서(들)의 조합, 또는 (ii) 프로세서(들)/소프트웨어(디지털 신호 처리기(들)를 포함함), 소프트웨어, 및 모바일폰 또는 서버와 같은 장치로 하여금 다양한 기능들을 수행하게 하도록 함께 작용하는 메모리(들)의 일부분들, 및 (c) 마이크로프로세서(들) 또는 마이크로프로세서(들)의 일부분과 같은 회로들과 같이, 소프트웨어 또는 펌웨어가 물리적으로 존재하지 않는다 해도 동작을 위한 소프트웨어 또는 펌웨어를 요구하는 회로들을 지칭할 수도 있다.

    회로의 이러한 정의는 임의의 청구범위를 포함한 본원에서 이 용어의 모든 쓰임에 적용된다. 추가 실시예로서, 본원에서 사용되는 바와 같이, 회로라는 용어는 또한 프로세서(또는 다중 프로세서들) 또는 프로세서의 일부분 및 그것의(또는 그들의) 부속 소프트웨어 및/또는 펌웨어의 구현도 포괄할 것이다. 회로라는 용어는, 또한, 예를 들어, 적용 가능하다면, 서버, 셀룰러 네트워크 디바이스, 또는 그 밖의 다른 네트워크 디바이스에서 모바일폰 또는 유사한 집적회로에 대한 애플리케이션 프로세서 집적회로 또는 기저대역 집적회로, 특정 청구항의 구성요소를 포괄할 것이다.

    프로세서 및 메모리라는 용어는, 본원에서, (1) 하나 이상의 마이크로프로세서들, (2) 부속 디지털 신호 프로세서(들)를 구비한 하나 이상의 프로세서(들), (3) 부속 디지털 신호 프로세서(들)를 구비하지 않은 하나 이상의 프로세서(들), (4) 하나 이상의 특수 목적 컴퓨터 칩들, (5) 하나 이상의 필드-프로그래머블 게이트 어레이(FPGAS), (6) 하나 이상의 제어기들, (7) 하나 이상의 주문형 집적회로들(ASICs), 또는 검출기(들), 프로세서(들)(듀얼 코어 및 다중 코어 프로세서들을 포함함), 디지털 신호 프로세서(들), 제어기(들), 수신기, 송신기, 인코더, 디코더, 메모리(및 메모리들), 소프트웨어, 펌웨어, RAM, ROM, 디스플레이, 사용자 인터페이스, 디스플레이 회로, 사용자 인터페이스 회로, 사용자 인터페이스 소프트웨어, 디스플레이 소프트웨어, 회로(들), 안테나, 안� �나 회로, 및 회로를 포함할 수도 있지만, 이들로 국한되지 않는다.

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈