首页 / 专利库 / 广播 / 帧内预测 / Scene change detector, and video recorder

Scene change detector, and video recorder

阅读:1发布:2022-08-17

专利汇可以提供Scene change detector, and video recorder专利检索,专利查询,专利分析的服务。并且PROBLEM TO BE SOLVED: To provide a scene change detector capable of rapidly detecting a scene change from a stream encoded using an encoding method of performing predictive encoding using a decoding pixel.
SOLUTION: An entropy decoding section 31 entropy-decodes a prediction mode from an encoded stream. An intra prediction mode histogram difference generation section 32 generates a histogram by inputting the prediction mode entropy-decoded by a plurality of blocks in one picture, and compares histograms of the prediction mode generated on a picture basis to calculate similarity among the histograms. A scene change determination section 33 determines whether a scene change is present between the pictures based on the similarity obtained by the intra prediction mode histogram difference generation section 32.
COPYRIGHT: (C)2011,JPO&INPIT,下面是Scene change detector, and video recorder专利的具体信息内容。

  • 映像データを所定サイズのブロックに分割して、当該ブロック単位に符号化された符号化ストリームから、前記ブロック単位に予測信号を生成する方法を示す予測モードをエントロピー復号するエントロピー復号手段と、
    エントロピー復号された予測モードを1ピクチャ内の複数ブロック分入力して、ヒストグラムを生成する予測モードヒストグラム生成手段と、
    ピクチャごとに生成された予測モードのヒストグラムを比較してヒストグラム間の類似度を算出する予測モードヒストグラム類似度算出手段と、
    前記類似度に基づいてピクチャ間にシーンチェンジが存在するかを判定するシーンチェンジ判定手段とを備えたことを特徴とするシーンチェンジ検出装置。
  • 予測モードヒストグラム生成手段に入力される予測モードは1ピクチャ分であることを特徴とする請求項1記載のシーンチェンジ検出装置。
  • エントロピー復号手段は、符号化ストリームからブロック単位に色差の予測モードと予測誤差信号の量子化係数データをエントロピー復号すると共に、
    前記エントロピー復号された量子化係数データを逆量子化・逆直交変換して予測誤差信号を復号する予測誤差信号復号手段と、
    前記エントロピー復号された色差の予測モードで示される方法に従って予測信号を生成する予測信号生成手段と、
    前記予測誤差信号と前記予測信号を加算して色差の復号信号を生成する加算手段と、
    前記ブロック単位に生成された色差の復号信号を1ピクチャ内の複数ブロック分入力して、ヒストグラムを生成する色差信号ヒストグラム生成手段と、
    ピクチャごとに生成された色差信号のヒストグラムを比較して類似度を算出する色差信号ヒストグラム類似度算出手段とを備え、
    シーンチェンジ判定手段は、予測モードヒストグラム類似度算出手段から出力された類似度と前記色差信号ヒストグラム類似度算出手段から出力された類似度とに基づいてピクチャ間にシーンチェンジが存在するかを判定することを特徴する請求項1または請求項2記載のシーンチェンジ検出装置。
  • 映像データを所定サイズのブロックに分割して、当該ブロック単位に符号化した符号化ストリームを出力する符号化手段と、
    前記符号化手段から出力された符号化ストリームから、前記ブロック単位に予測信号を生成する方法を示す予測モードをエントロピー復号するエントロピー復号手段と、
    エントロピー復号された予測モードを1ピクチャ内の複数ブロック分入力して、ヒストグラムを生成する予測モードヒストグラム生成手段と、
    ピクチャごとに生成された予測モードのヒストグラムを比較して類似度を算出する予測モードヒストグラム類似度算出手段と、
    前記類似度に基づいてピクチャ間にシーンチェンジが存在するかを判定するシーンチェンジ判定手段と、
    前記シーンチェンジ判定手段において、シーンチェンジが存在すると判定された場合にシーンチェンジの位置情報を出力するシーンチェンジ位置情報出力手段と、
    前記シーンチェンジ位置情報と前記符号化ストリームを記録する記録手段とを備えたことを特徴とする映像記録装置。
  • 前記予測モードヒストグラム生成手段に入力される予測モードは1ピクチャ分であることを特徴とする請求項4記載の映像記録装置。
  • エントロピー復号手段は、符号化ストリームからブロック単位に色差の予測モードと予測誤差信号の量子化係数データをエントロピー復号すると共に、
    前記エントロピー復号された量子化係数データを逆量子化・逆直交変換して予測誤差信号を復号する予測誤差信号復号手段と、
    前記エントロピー復号された色差の予測モードで示される方法に従って予測信号を生成する予測信号生成手段と、
    前記予測誤差信号と前記予測信号を加算して色差の復号信号を生成する加算手段と、
    前記ブロック単位に生成された色差の復号信号を1ピクチャ内の複数ブロック分入力して、ヒストグラムを生成する色差信号ヒストグラム生成手段と、
    ピクチャごとに生成された色差信号のヒストグラムを比較して類似度を算出する色差信号ヒストグラム類似度算出手段とを備え、
    シーンチェンジ判定手段は、予測モードヒストグラム類似度算出手段から出力された類似度と前記色差信号ヒストグラム類似度算出手段から出力された類似度とに基づいてピクチャ間にシーンチェンジが存在するかを判定することを特徴する請求項4または請求項5記載の映像記録装置。
  • 说明书全文

    本発明は、連続した映像から複数のシーン(場面)の変化点(シーンチェンジ)を検出するシーンチェンジ検出装置およびこの装置を用いた映像記録装置に関する。

    デジタルビデオカメラやデジタル放送を記録する映像記録装置などにおいて、連続して記録された1つの映像シーケンスに含まれるシーンチェンジを検出するシーンチェンジ検出装置が用いられている。

    従来のシーンチェンジ検出の方法として、例えば次のような特許文献1,2に示されたような方法があった。
    特許文献1では、あるフレームの画像の輝度あるいは色差のピクセル値の度数分布(ヒストグラム)を求め、例えば2フレームの画像間のヒストグラムの違いを評価値として算出し、評価値を閾値処理することによりシーンチェンジを検出するヒストグラム差分法を用いている。

    特許文献2では、MPEG−2符号化方式により符号化された符号化ストリームを復号して得られる復号画像からヒストグラムを生成する方法が開示されており、シーンチェンジを高速に行うために、符号化ストリームに含まれるDCT係数を復号する際に、全部の係数を復号せずに使用する成分(次数)を削減して復号された画像からヒストグラムを生成する方法が開示されている。

    また、MPEG−2符号化方式により符号化された符号化ストリームを復号せずにシーンチェンジのための特徴量を抽出する方法として、例えば特許文献3に示されたような方法があった。
    特許文献3では、MPEG−2符号化方式のようにDCTを用いたフレーム構造の圧縮方式により符号化された符号化ストリームを復号せずにシーンチェンジを検出する方法として、DCT係数の特定の位置の周波数成分の値を評価値として用いる方法が開示されている。 例えばフレーム内に含まれる2つのフィールド間にシーンチェンジが存在する場合、奇数フィールドと偶数フィールドのデータ値の差が大きくなり、横縞(平方向成分)が多いフレームになる。 横縞が多い画像をブロックに分割してDCT変換した場合に、左端特に左下の成分値の絶対値が大きくなることを利用してシーンチェンジを検出する。

    ところで、デジタルビデオカメラやデジタル放送を記録する映像記録装置などで用いられる映像符号化方式としてMPEG−2の他にAVC/H. 264符号化方式がある。 AVC/H. 264符号化方式は、画像を所定のサイズのブロック(マクロブロック)に分割し、マクロブロック単位の符号化が行われる。 各マクロブロックは、符号化対象フレーム内のデータのみを使って符号化を行うフレーム内符号化モード(イントラモード)か、フレーム間で動き補償予測を行って符号化を行うフレーム間符号化モード(インターモード)のいずれかのモードが選択される。 以下、イントラモードが選択されたマクロブロックの符号化方法について説明する。 マクロブロックは所定サイズのブロックに分割され、ブロック単位に符号化される。 符号化対象のブロック内の画素は周辺の符号化済みブロックの画素を使って予測(イントラ予測)され、イントラ予測によって生成された予測信号との差分信号(予測誤差信号)を得る。 予測誤差信号は直交変換され、変換係数データを得る。 変換係数データは量子化されて量子化係数データを得る。 量子化係数データは算術符号化等のエントロピー符号化が行われ、ビットストリームデータに多重化される。 イントラ予測は、予測信号の生成方法により、複数のモード(イントラ予測モード)が用意されており、ブロック単位に1つのモードを選択することができる。 どのモードが選択されたかは、ブロック単位にビットストリームデータに多重化される。

    特開2008−85540公報

    国際公開第2007/017970号パンフレット

    特開2002−64823公報

    しかしながら、特許文献1に記載されたような方法では、符号化されたストリームを復号して一旦復号画像を生成しなければならず、例えば非なCPU上で処理する場合や、記録時の符号化処理と同時に行う場合などシーンチェンジ検出処理で占有可能な処理時間が限られている場合にはシーンチェンジ検出処理が間に合わないという問題点があった。

    また、特許文献2に記載されたような方法では、DCT係数の処理次数を削減することで処理負荷を低減する工夫がなされているが、例えばAVC/H. 264符号化方式のように符号化済みの画素を用いて予測符号化を行うような符号化方式の場合、DCT係数の次数を削減することで、正しい予測画像が得られずに誤差が伝播して復号画像が崩れていくため、DCT係数の次数を削減して復号された復号画像からシーンチェンジ検出を行うことは困難である。

    更に、特許文献3に記載されたような方法では、シーンチェンジがあった場合に横縞(水平方向成分)が多いフレームになることを利用するが、AVC/H. 264符号化方式のように隣接画素を用いて予測符号化を行う場合、DCT係数は予測画像との誤差信号になり、例えばブロックをまたがって横縞が続いている場合、符号化対象である右側のブロックの画素値を直接DCT変換する場合には左端の係数に絶対値が大きな成分が存在するが、符号化済みのブロックの右端の画素値から予測画像を生成する場合、予測誤差が0になり予測誤差をDCT変換した場合DCT係数も発生しないため、特定成分の値に注目したシーンチェンジ検出は困難である。

    この発明は上記のような課題を解決するためになされたもので、復号画素を使って予測符号化を行うような符号化方式を用いて符号化されたストリームから高速にシーンチェンジ検出を行うことのできるシーンチェンジ検出装置および映像記録装置を得ることを目的とする。

    この発明に係るシーンチェンジ検出装置は、映像データを所定サイズのブロックに分割して、ブロック単位に符号化された符号化ストリームから、ブロック単位に予測信号を生成する方法を示す予測モードをエントロピー復号するエントロピー復号手段と、エントロピー復号された予測モードを1ピクチャ内の複数ブロック分入力して、ヒストグラムを生成する予測モードヒストグラム生成手段と、ピクチャごとに生成された予測モードのヒストグラムを比較してヒストグラム間の類似度を算出する予測モードヒストグラム類似度算出手段と、類似度に基づいてピクチャ間にシーンチェンジが存在するかを判定するシーンチェンジ判定手段とを備えたものである。

    この発明のシーンチェンジ検出装置は、予測モードの複数ブロック分のヒストグラムを生成し、ピクチャごとのヒストグラムを比較してヒストグラムの類似度を求め、この類似度に基づいてピクチャ間にシーンチェンジが存在するかを判定するようにしたので、復号画素を使って予測符号化を行うような符号化方式を用いて符号化されたストリームから高速にシーンチェンジ検出を行うことができる。

    この発明の実施の形態1による映像記録装置を示す構成図である。

    この発明の実施の形態1によるシーンチェンジ検出装置を示す構成図である。

    AVC/H. 264符号化方式における輝度のイントラ予測モードを示す説明図である。

    この発明の実施の形態1によるシーンチェンジ検出装置におけるあるピクチャの輝度のイントラ予測モードのヒストグラムを示す説明図である。

    この発明の実施の形態2によるシーンチェンジ検出装置の構成図である。

    実施の形態1.
    図1は、この発明の実施の形態1による映像記録装置を示す構成図である。
    図1に示す映像記録装置1は、ストリーム制御部2、シーンチェンジ検出部3、ハードディスクドライブ(HDD)4を備えている。 ストリーム制御部2は、外部に設けられた符号化部5にてAVC/H. 264符号化方式で符号化された符号化ストリームを入力し、その符号化ストリームを映像記録信号としてHDD4に出力すると共に、イントラピクチャデータをシーンチェンジ検出部3に出力するよう構成されている。 シーンチェンジ検出部3は、イントラピクチャデータを入力してシーンチェンジ検出処理を行うシーンチェンジ検出装置であり、その詳細については後述する。 HDD4は記録手段を構成するもので、ストリーム制御部2から出力された符号化ストリームと、シーンチェンジ検出部3で検出されたシーンチェンジ位置情報とを記録する。 また、符号化部5は、例えばチューナーといった装置であり、映像信号をAVC/H. 264符号化方式で符号化し、符号化ストリームを出力するものである。 尚、この符号化部5は映像記録装置1内部で備えていてもよい。

    図2は、シーンチェンジ検出部3の内部を示す構成図である。
    シーンチェンジ検出部3は、エントロピー復号部31と、イントラ予測モードヒストグラム差分生成部32と、シーンチェンジ判定部33とを備えている。 エントロピー復号部31は、ストリーム制御部2から出力されるイントラピクチャデータを入力して、エントロピー復号する機能部である。 イントラ予測モードヒストグラム差分生成部32は、エントロピー復号部31でエントロピー復号された符号化パラメータにおける予測モードに基づいて1ピクチャ内の複数ブロック分のヒストグラムを生成し、ピクチャ毎のヒストグラムを比較してヒストグラム間の類似度を算出する機能部である。 シーンチェンジ判定部33は、イントラ予測モードヒストグラム差分生成部32から出力されるヒストグラム同士の類似度に基づいてピクチャ間にシーンチェンジが存在するか否かを判定する機能部である。 また、エントロピー復号部31はエントロピー復号手段を、イントラ予測モードヒストグラム差分生成部32は予測モードヒストグラム生成手段と予測モードヒストグラム類似度算出手段を、シーンチェンジ判定部33はシーンチェンジ判定手段をそれぞれ構成している。

    次に、実施の形態1の映像記録装置の動作について説明する。
    符号化部5にてAVC/H. 264符号化方式で符号化された符号化ストリームはストリーム制御部2へ入力される。 ストリーム制御部2は、シーンチェンジ検出に用いる符号化ストリームをシーンチェンジ検出部3へ出力する。 以下に説明するように、シーンチェンジ検出部3が、映像データの特にフレーム内符号化されたピクチャデータ(イントラピクチャデータ)のみを用いてシーンチェンジ検出を行う場合には、ストリーム制御部2にて、符号化ストリームからイントラピクチャデータのみを抽出してシーンチェンジ検出部3へ出力する。

    シーンチェンジ検出部3は、イントラピクチャデータを入力してシーンチェンジ検出処理を行う。 以下、このシーンチェンジ検出処理について説明する。 ストリーム制御部2より出力されるイントラピクチャデータはエントロピー復号部31へ入力され、ブロック単位に符号化された符号化パラメータと予測誤差信号の量子化係数データを算術復号あるいは可変長復号などのエントロピー復号により復号する。 エントロピー復号された符号化パラメータのうち、輝度のイントラ予測モードがイントラ予測モードヒストグラム差分生成部32へ出力される。

    ここで、AVC/H. 264符号化方式におけるイントラ予測モードについて説明する。 輝度のイントラ予測モードはブロック単位に9つのモードの中から1つのモードを選択することができる。 図3に輝度のイントラ予測モードを示す。 図3において、白丸が符号化対象のブロック内の画素である。 黒丸は予測に用いる画素であり、符号化済みの隣接ブロック内の画素である。 例えばモード0は垂直方向予測であり、上のブロックの隣接画素を垂直方向に繰り返すことにより、予測画像を生成する。 例えば縦縞模様のときにはモード0が選択される。 同様にモード1は水平方向予測であり、左のブロックの隣接画素を水平方向に繰り返すことにより、予測画像を生成する。 例えば横縞模様のときにはモード1が選択される。 このように、イントラ予測モードは画像のもつ構造的な特徴によって決定される。 従ってピクチャ内でイントラ予測モードの分布の変化を見ることで、構造的な特徴が大きく変化したシーンの変化点を検出することができる。

    イントラ予測モードヒストグラム差分生成部32は、ブロック単位にエントロピー復号されたイントラ予測モードを入力し、ピクチャ単位にイントラ予測モードのヒストグラムを生成する。 輝度のイントラ予測モードの場合、9つのモードがあり各々のモードの個数をカウントする。 図4に、あるピクチャの輝度のイントラ予測モードのヒストグラムを示す。 図4において、横軸はイントラ予測モードを表し、縦軸は各モードの個数(頻度)を表している。 生成されたヒストグラムはヒストグラムバッファ(図示せず)へ格納される。 2ピクチャ分のヒストグラムを用いてピクチャ間の類似度を算出する場合にはヒストグラムバッファは2面用意しておけばよい。 3ピクチャ以上のヒストグラムを用いてシーンの類似度を算出する場合にはヒストグラムバッファも3面以上必要である。

    イントラ予測モードヒストグラム差分生成部32は、ヒストグラムバッファに格納されたイントラ予測モードのヒストグラム同士の類似度を算出する。 2つのヒストグラム同士の類似度は、例えばヒストグラムの同じ要素(イントラ予測モード)に対応する頻度(個数)の絶対差分をすべての要素に対して加算した値(絶対差分和)とする(式1)。

    ピクチャiのイントラ予測モードのヒストグラム:H ={h (0),h (1),…,h (N−1)},N=9
    ピクチャi+1のイントラ予測モードのヒストグラム:H i+1 ={h i+1 (0),h i+1 (1),…,h i+1 (N−1)},N=9
    ピクチャiとピクチャi+1のヒストグラム同士の類似度:d

    なお、各要素の絶対差分に対して異なる重み付けを行ってから加えた値(重み付け絶対差分和)をヒストグラム同士の類似度としてもよい。 特に、シーンの構造的な変化に対して敏感に変化するイントラ予測モードがある場合には、そのイントラ予測モードに対する重み付けを大きくすることで、シーンチェンジの精度を上げることができる。

    イントラ予測モードヒストグラム差分生成部32で求められた連続するピクチャのヒストグラム同士の類似度はシーンチェンジ判定部33へ出力される。
    シーンチェンジ判定部33は、ヒストグラム同士の類似度と所定の閾値とを比較し、類似度が閾値を超えている場合にはそのピクチャ間をシーンチェンジと判定し、シーンチェンジと判定されたピクチャの時刻情報をシーンチェンジ位置情報として出力する。 シーンチェンジの判定に用いる閾値は予め定められた固定値であってもよいが、同一シーン内と判定されたピクチャ間の類似度の平均値や分散を元に閾値を動的に決めるようにしてもよい。 同じシーンであっても動きが大きいシーンでは、類似度の平均値や分散は大きくなるため、閾値も大きな値に設定しておく。 これに対し、ほとんど動きがないシーンでは、類似度の平均値や分散は小さくなるため、閾値も小さい値に設定しておく。 このように閾値を決めることで、誤検出を防ぎ、シーンチェンジの精度を上げることができる。
    シーンチェンジ判定部33から出力されたシーンチェンジ位置情報は、HDD4などの記録メディアに記録される。

    なお、上記の説明では、輝度のイントラ予測モードのヒストグラムを使ってシーンチェンジを検出するようにしたが、AVC/H. 264では輝度のイントラ予測モードとは別に色差信号に対するイントラ予測モード(4種類)が用意されている。 このため、輝度と同様に色差のイントラ予測モードのヒストグラムを使ってシーンチェンジを検出するようにしても良い。 また、輝度のイントラ予測モードと色差のイントラ予測モード両方のヒストグラムを使ってシーンチェンジを検出するようにしても良い。

    また、AVC/H. 264では輝度のイントラ予測のブロックサイズとして、水平16画素×垂直16ライン、水平8画素×垂直8ライン、水平4画素×垂直4ラインから選択することができる。 このため、これらのイントラ予測のブロックサイズのヒストグラムを使ってシーンチェンジを検出するようにしても良い。 この場合は、イントラ予測モードヒストグラム差分生成部32は、イントラ予測モードのヒストグラムではなく、イントラ予測のブロックサイズのヒストグラムの類似度を算出することになる。

    尚、本実施の形態では、符号化ストリームはAVC/H. 264符号化方式で符号化されたストリームであることを前提に説明したが、フレーム内符号化を行うときに複数の予測モードを用いて予測画像を生成し、予測モードと予測誤差信号をブロック単位に符号化するような符号化方式であれば、同様にシーンチェンジを検出することができる。
    更に、本実施の形態では、ピクチャ単位に符号化ストリームをシーンチェンジ検出部3へ入力するようにしたが、ピクチャを複数の領域に分割した単位(スライス単位)にシーンチェンジ検出部3へ入力するようにしてもよい。 また、ピクチャ内の部分領域(例えば上半分、あるいは中央のみなど)をシーンチェンジ検出部3へ入力するようにしてもよい。

    以上のように、実施の形態1のシーンチェンジ検出装置によれば、映像データを所定サイズのブロックに分割して、ブロック単位に符号化された符号化ストリームから、ブロック単位に予測信号を生成する方法を示す予測モードをエントロピー復号するエントロピー復号手段と、エントロピー復号された予測モードを1ピクチャ内の複数ブロック分入力して、ヒストグラムを生成する予測モードヒストグラム生成手段と、ピクチャごとに生成された予測モードのヒストグラムを比較してヒストグラム間の類似度を算出する予測モードヒストグラム類似度算出手段と、類似度に基づいてピクチャ間にシーンチェンジが存在するかを判定するシーンチェンジ判定手段とを備えたので、復号画素を使って予測符号化を行うような符号化方式を用いて符号化されたストリームから高速にシーンチェンジ検出を行うことができる。

    また、実施の形態1の映像記録装置によれば、予測モードヒストグラム生成手段に入力される予測モードは1ピクチャ分としたので、ピクチャ間のシーンチェンジを精度良く検出することができる。

    また、実施の形態1の映像記録装置によれば、映像データを所定サイズのブロックに分割して、ブロック単位に符号化した符号化ストリームを出力する符号化手段と、符号化手段から出力された符号化ストリームから、ブロック単位に予測信号を生成する方法を示す予測モードをエントロピー復号するエントロピー復号手段と、エントロピー復号された予測モードを1ピクチャ内の複数ブロック分入力して、ヒストグラムを生成する予測モードヒストグラム生成手段と、ピクチャごとに生成された予測モードのヒストグラムを比較して類似度を算出する予測モードヒストグラム類似度算出手段と、類似度に基づいてピクチャ間にシーンチェンジが存在するかを判定するシーンチェンジ判定手段と、シーンチェンジ判定手段において、シーンチェンジが存在すると判定された場合にシーンチェンジの位置情報を出力するシーンチェンジ位置情報出力手段と、シーンチェンジ位置情報と符号化ストリームを記録する記録手段とを備えたので、復号画素を使って予測符号化を行うような符号化方式を用いて符号化されたストリームから高速にシーンチェンジ検出を行うことができる映像記録装置を実現することができる。

    実施の形態2.
    実施の形態1ではイントラピクチャデータに含まれるイントラ予測モードを使ってシーンチェンジを検出するようにしたが、本実施の形態ではイントラ予測モードに加えて、色差信号を使ってシーンチェンジを検出する。

    図5は、実施の形態2における映像記録装置のシーンチェンジ検出部の内部を示す構成図である。
    実施の形態2におけるシーンチェンジ検出部3aは、エントロピー復号部31a、イントラ予測モードヒストグラム差分生成部32、シーンチェンジ判定部33a、色差信号復号部34、色差信号ヒストグラム差分生成部35、メモリ36を備えている。
    エントロピー復号部31aは、実施の形態1のエントロピー復号部31の機能を有すると共に、イントラピクチャデータから色差量子化係数データと色差のイントラ予測モードとを出力する。 イントラ予測モードヒストグラム差分生成部32は、実施の形態1のイントラ予測モードヒストグラム差分生成部32と同様の機能を有している。 また、シーンチェンジ判定部33aは、イントラ予測モードヒストグラム差分生成部32から出力されるイントラ予測モードのヒストグラム同士の類似度と、色差信号ヒストグラム差分生成部35から出力される色差信号のヒストグラム同士の類似度とに基づいて、シーンチェンジを判定する。

    色差信号復号部34は、逆量子化部341、逆直交変換部342、イントラ予測部343、加算部344を備えており、これらは次のような機能を有している。 逆量子化部341は、色差量子化係数データの逆量子化を行う。 逆直交変換部342は、逆量子化部341から出力された変換係数データの逆直交変換を行い、予測誤差信号を出力する。 イントラ予測部343は、色差のイントラ予測モードとメモリ36に記憶されている復号色差信号とに基づいて予測信号を生成し、加算部344宛に出力する。 加算部344は、逆直交変換部342から出力された予測誤差信号とイントラ予測部343から出力された予測信号とを加算し、復号色差信号として出力する。

    色差信号ヒストグラム差分生成部35は、色差信号復号部34から出力された復号色差信号に基づいて、色差信号のヒストグラム同士の類似度を求め、これをシーンチェンジ判定部33a宛に出力する機能部である。 メモリ36は、色差信号復号部34の加算部344から出力された復号色差信号を保持するための記憶部である。

    なお、色差信号復号部34の逆量子化部341と逆直交変換部342で予測誤差信号復号手段を構成し、イントラ予測部343は予測信号生成手段を構成している。 また、加算部344は加算手段を構成し、色差信号ヒストグラム差分生成部35は、色差信号ヒストグラム生成手段と色差信号ヒストグラム類似度算出手段を構成している。 更に、エントロピー復号部31aはエントロピー復号手段を、シーンチェンジ判定部33aはシーンチェンジ判定手段を構成している。

    次に、実施の形態2のシーンチェンジ検出部3aの動作について説明する。
    イントラピクチャデータはエントロピー復号部31aへ入力され、ブロック単位に符号化された符号化パラメータや量子化係数データを算術復号あるいは可変長復号などのエントロピー復号により復号する。 エントロピー復号された符号化パラメータのうち、輝度または色差のイントラ予測モードがイントラ予測モードヒストグラム差分生成部32へ出力される。 色差のイントラ予測モードは色差信号復号部34のイントラ予測部343へ出力される。 エントロピー復号された色差の量子化係数データは逆量子化部341へ出力される。

    イントラ予測モードヒストグラム差分生成部32の動作は実施の形態1と同じであるため、ここでの説明は省略する。
    イントラ予測部343は、色差のイントラ予測モードを入力とし、それぞれのモードごとに定められる予測方法に従って、メモリ36から隣接ブロックの復号色差信号の画素を参照し予測信号を生成する。 予測信号は加算部344へ出力される。
    逆量子化部341は、入力された色差の量子化係数データを逆量子化して変換係数データを得る。 変換係数データは逆直交変換部342へ出力される。 逆直交変換部342は、入力された変換係数データを逆直交変換して予測誤差信号を得る。 予測誤差信号は加算部344へ出力される。
    加算部344は、入力された予測誤差信号と予測信号を加算して復号色差信号を得る。 復号色差信号は色差信号ヒストグラム差分生成部35へ出力される。 またイントラ予測の際に参照されるため、メモリ36に記録される。
    色差信号ヒストグラム差分生成部35は、1ピクチャ分の復号色差信号からヒストグラムを生成する。 色差信号が8ビットの階調を持つ場合には、0から255の各画素値を要素として、各要素の頻度をカウントしてヒストグラムを生成する。 なお、8ビットの階調を適当に分割した単位に要素を割り当てて、要素数を減らしてもよい。

    色差信号ヒストグラム差分生成部35は、連続するピクチャの復号色差信号のヒストグラム同士の類似度を算出する。 ヒストグラム同士の類似度は、ヒストグラムの同じ要素の頻度(個数)の絶対差分をすべての要素に対して求め、加えた値(絶対差分和)とする。 なお、各要素の絶対差分に対して異なる重み付けを行ってから加えた値(重み付け絶対差分和)をヒストグラム同士の類似度としてもよい。 連続するピクチャの復号色差信号のヒストグラム同士の類似度はシーンチェンジ判定部33aへ出力される。

    シーンチェンジ判定部33aは、入力された連続するピクチャの復号色差信号のヒストグラム同士の差分およびイントラ予測モードのヒストグラム同士の差分を入力とし、復号色差信号のヒストグラム同士の類似度とイントラ予測モードのヒストグラム同士の類似度の和と所定の閾値とを比較し、類似度の和が閾値を超えている場合にはそのピクチャ間をシーンチェンジと判定し、シーンチェンジ位置情報を出力する。 なお、類似度の和を求めるときに、重みを付けて、いずれか一方の類似度の優先度を高くしてもよい。

    なお、本実施の形態では、イントラ予測モードのヒストグラムと復号色差信号のヒストグラムと両方を求めるようにしたが、例えばCPUの処理負荷状況等によって、復号色差信号のヒストグラムを生成するか否かを判断し、復号色差信号のヒストグラムを生成しないと判断した場合には、イントラ予測モードのヒストグラムのみを使ってシーンチェンジの判定を行うようにしてもよい。

    以上のように、実施の形態2のシーンチェンジ検出装置によれば、エントロピー復号手段は、符号化ストリームからブロック単位に色差の予測モードと予測誤差信号の量子化係数データをエントロピー復号すると共に、エントロピー復号された量子化係数データを逆量子化・逆直交変換して予測誤差信号を復号する予測誤差信号復号手段と、エントロピー復号された色差の予測モードで示される方法に従って予測信号を生成する予測信号生成手段と、予測誤差信号と予測信号を加算して色差の復号信号を生成する加算手段と、ブロック単位に生成された色差の復号信号を1ピクチャ内の複数ブロック分入力して、ヒストグラムを生成する色差信号ヒストグラム生成手段と、ピクチャごとに生成された色差信号のヒストグラムを比較して類似度を算出する色差信号ヒストグラム類似度算出手段とを備え、シーンチェンジ判定手段は、予測モードヒストグラム類似度算出手段から出力された類似度と色差信号ヒストグラム類似度算出手段から出力された類似度とに基づいてピクチャ間にシーンチェンジが存在するかを判定するようにしたので、復号画素を使って予測符号化を行うような符号化方式を用いて符号化されたストリームから高速にシーンチェンジ検出を行うことができると共に、確実にシーンチェンジを検出することができる。

    また、実施の形態2の映像記録装置によれば、映像データを所定サイズのブロックに分割して、ブロック単位に符号化した符号化ストリームを出力する符号化手段と、符号化手段から出力された符号化ストリームから、ブロック単位に予測信号を生成する方法を示す予測モードをエントロピー復号するエントロピー復号手段と、エントロピー復号された予測モードを1ピクチャ内の複数ブロック分入力して、ヒストグラムを生成する予測モードヒストグラム生成手段と、ピクチャごとに生成された予測モードのヒストグラムを比較して類似度を算出する予測モードヒストグラム類似度算出手段と、類似度に基づいてピクチャ間にシーンチェンジが存在するかを判定するシーンチェンジ判定手段と、シーンチェンジ判定手段において、シーンチェンジが存在すると判定された場合にシーンチェンジの位置情報を出力するシーンチェンジ位置情報出力手段と、シーンチェンジ位置情報と符号化ストリームを記録する記録手段とを備え、かつ、エントロピー復号手段は、符号化ストリームからブロック単位に色差の予測モードと予測誤差信号の量子化係数データをエントロピー復号すると共に、エントロピー復号された量子化係数データを逆量子化・逆直交変換して予測誤差信号を復号する予測誤差信号復号手段と、エントロピー復号された色差の予測モードで示される方法に従って予測信号を生成する予測信号生成手段と、予測誤差信号と予測信号を加算して色差の復号信号を生成する加算手段と、ブロック単位に生成された色差の復号信号を1ピクチャ内の複数ブロック分入力して、ヒストグラムを生成する色差信号ヒストグラム生成手段と、ピクチャごとに生成された色差信号のヒストグラムを比較して類似度を算出する色差信号ヒストグラム類似度算出手段とを備え、シーンチェンジ判定手段は、予測モードヒストグラム類似度算出手段から出力された類似度と色差信号ヒストグラム類似度算出手段から出力された類似度とに基づいてピクチャ間にシーンチェンジが存在するかを判定するようにしたので、高速かつ確実にシーンチェンジを検出することができる映像記録装置を実現することができる。

    1 映像記録装置、2 ストリーム制御部、3,3a シーンチェンジ検出部、4 HDD、5 符号化部、31,31a エントロピー復号部、32 イントラ予測モードヒストグラム差分生成部、33,33a シーンチェンジ判定部、34 色差信号復号部、35 色差信号ヒストグラム差分生成部、36 メモリ、341 逆量子化部、342 逆直交変換部、343 イントラ予測部、344 加算部。

    高效检索全球专利

    专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

    我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

    申请试用

    分析报告

    专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

    申请试用

    QQ群二维码
    意见反馈