Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
MOTION DETECTION APPARATUS, MOTION DETECTION METHOD, AND MOTION DETECTION PROGRAM
Document Type and Number:
WIPO Patent Application WO/2008/136178
Kind Code:
A1
Abstract:
A motion detection apparatus which detects a motion of a macro block constituting a coding object picture by using pixel data on a reference picture stored in a multi-frame memory (504). The motion detection apparatus comprises a local memory (702) which stores the pixel data included in a first area that is a search area when detecting a first motion among the pixel data on the reference picture read out of the multi-frame memory (504), a normal motion detection unit (704) which detects the first motion by using the pixel data stored in the local memory (702), and a direct prediction device (108) which detects a second motion using a different algorithm from the one used for the first motion detection by using the pixel data on the reference picture included in a second area which includes the first area and is wider than the first area.

Inventors:
OKADA KOHEI
IGUCHI MASAYASU
TAKAHASHI JUN
Application Number:
PCT/JP2008/000855
Publication Date:
November 13, 2008
Filing Date:
April 03, 2008
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
PANASONIC CORP (JP)
OKADA KOHEI
IGUCHI MASAYASU
TAKAHASHI JUN
International Classes:
H04N7/32
Foreign References:
JPH03167984A1991-07-19
JPH0591499A1993-04-09
JPH05260461A1993-10-08
JPH08307875A1996-11-22
JPH11298903A1999-10-29
JPH11308617A1999-11-05
JP2000115806A2000-04-21
JP2000175201A2000-06-23
JP2002218474A2002-08-02
JP2004072301A2004-03-04
JP2004266778A2004-09-24
JP2005354673A2005-12-22
JP2006042364A2006-02-09
JP2006287583A2006-10-19
JP2007020123A2007-01-25
JP2007043421A2007-02-15
JP2006270683A2006-10-05
Other References:
See also references of EP 2141930A4
Attorney, Agent or Firm:
NII, Hiromori (6FTanaka Ito Pia Shin-Osaka Bldg.,3-10, Nishi Nakajima 5-chome,Yodogawa-ku, Osaka-cit, Osaka 11, JP)
Download PDF:
Claims:
 マルチフレームメモリに記憶された参照ピクチャの画素データを用いて、符号化対象ピクチャを構成するマクロブロックの動き検出を行う動き検出装置であって、
 前記マルチフレームメモリから読み出された参照ピクチャの画素データのうち、第1の動き検出時の探索範囲である第1範囲に含まれる画素データを記憶しているローカルメモリと、
 前記ローカルメモリに記憶されている画素データを用いて、前記第1の動き検出を行う第1の動き検出手段と、
 前記第1範囲を含み、かつ当該第1範囲よりも広い第2範囲に含まれる前記参照ピクチャの画素データを用いて、前記第1の動き検出と異なるアルゴリズムを用いた第2の動き検出を行う第2の動き検出手段と
 を備えることを特徴とする動き検出装置。
 前記第2の動き検出手段は、前記マルチフレームメモリに記憶されている前記参照ピクチャの画素データを用いて、前記第2の動き検出を行なう
 ことを特徴とする請求項1に記載の動き検出装置。
 さらに、前記第2の動き検出手段が前記第1範囲内の画素データを使用して前記第2の動き検出を行なう場合には前記ローカルメモリに記憶されている画素データを選択し、前記第2の動き検出手段が前記第2範囲内であり、かつ前記第1範囲外の画素データを使用して前記第2の動き検出を行なう場合には前記マルチフレームメモリに記憶されている画素データを選択する選択手段を備え、
 前記第2の動き検出手段は、前記選択手段によって選択された画素データを用いて前記第2の動き検出を行う
 ことを特徴とする請求項2に記載の動き検出装置。
 さらに、前記第2の動き検出手段による前記第2の動き検出の実行及び非実行を制御する実行制御手段を備える
 ことを特徴とする請求項1に記載の動き検出装置。
 前記実行制御手段は、前記第2の動き検出に用いる画素データの少なくとも一部が前記ローカルメモリに蓄えられている場合に限り、前記第2の動き検出手段に前記第2の動き検出を実行させる
 ことを特徴とする請求項4に記載の動き検出装置。
 さらに、前記マルチフレームメモリから読み出された参照ピクチャの画素データのうち、前記第2範囲に含まれる画素データを記憶しているキャッシュメモリを備え、
 前記ローカルメモリは、前記キャッシュメモリから読み出された前記第1範囲に含まれる画素の画素データを記憶しており、
 前記第2の動き検出手段は、前記キャッシュメモリに記憶されている前記参照ピクチャの画素データを用いて前記第2の動き検出を行なう
 ことを特徴とする請求項1に記載の動き検出装置。
 さらに、前記第2の動き検出手段が前記第1範囲内の画素データを使用して前記第2の動き検出を行なう場合には前記ローカルメモリに記憶されている画素データを選択し、前記第2の動き検出手段が前記第2範囲内であり、かつ前記第1範囲外の画素データを使用して前記第2の動き検出を行なう場合には前記キャッシュメモリに記憶されている画素データを選択する選択手段を備え、
 前記第2の動き検出手段は、前記選択手段によって選択された画素データを用いて前記第2の動き検出を行う
 ことを特徴とする請求項6に記載の動き検出装置。
 さらに、前記第2の動き検出に用いられる画素データが前記キャッシュメモリに記憶されている場合にのみ、前記第2の動き検出が可能と判定する第2の動き検出可否判定手段を備え、
 前記第2の動き検出手段は、前記第2の動き検出可否判定手段において前記第2の動き検出が可能と判定された場合に、前記第2の動き検出を行なう
 ことを特徴とする請求項6に記載の動き検出装置。
 前記第2の動き検出可否判定手段は、前記第2の動き検出に用いられる画素データが、前記キャッシュメモリに含まれている画素データが参照ピクチャ上で占める領域のうちの予め定められた一部の領域に含まれている場合にのみ、前記第2の動き検出が可能と判定する
 ことを特徴とする請求項8に記載の動き検出装置。
 前記予め定められた一部の領域は、前記キャッシュメモリに含まれている画素データが参照ピクチャ上で占める領域のうち、縦方向に制限を加えた領域である
 ことを特徴とする請求項9に記載の動き検出装置。
 前記予め定められた一部の領域は、前記キャッシュメモリに含まれている画素データが参照ピクチャ上で占める領域のうち、右方向に制限を加えた領域である
 ことを特徴とする請求項9に記載の動き検出装置。
 前記予め定められた一部の領域は、前記キャッシュメモリに含まれている画素データが参照ピクチャ上で占める領域のうち、左方向に制限を加えた領域である
 ことを特徴とする請求項9に記載の動き検出装置。
 前記予め定められた一部の領域は、前記キャッシュメモリに含まれている画素データが参照ピクチャ上で占める領域のうち、縦方向及び横方向の双方に制限を加えた領域である
 ことを特徴とする請求項9に記載の動き検出装置。
 前記キャッシュメモリには、1枚の参照ピクチャを構成する画素データのうち所定数のマクロブロックラインに含まれるマクロブロックの画素データのみが記憶されており、当該記憶されているマクロブロックのうち最上行と最下行のマクロブロックの画素データは、前記第1の動き検出の対象となるマクロブロックが更新される毎に更新される
 ことを特徴とする請求項6に記載の動き検出装置。
 さらに、前記第2の動き検出に用いられる画素データが前記キャッシュメモリに記憶されている場合にのみ、前記第2の動き検出が可能と判定する第2の動き検出可否判定手段を備え、
 前記第2の動き検出可否判定手段は、前記キャッシュメモリに記憶されているマクロブロックのうち前記第1の動き検出の対象となるマクロブロックが更新された際に更新されるマクロブロックを除外して前記第2の動き検出の可否を判定する
 ことを特徴とする請求項14に記載の動き検出装置。
 前記第2の動き検出手段は、前記キャッシュメモリに記憶されている前記参照ピクチャの画素データのみを用いて前記第2の動き検出を行なう
 ことを特徴とする請求項6に記載の動き検出装置。
 前記キャッシュメモリの記憶容量は、前記ローカルメモリの記憶容量より大きく、かつ前記マルチフレームメモリの記憶容量より小さい
 ことを特徴とする請求項6に記載の動き検出装置。
 前記第2の動き検出は、予測動きベクトルと動きベクトルとの差分処理を必要としない動き検出である
 ことを特徴とする請求項1に記載の動き検出装置。
 前記第2の動き検出は、ダイレクト予測又はスキップ予測である
 ことを特徴とする請求項18に記載の動き検出装置。
 前記動き検出装置は、1チップで構成されている
 ことを特徴とする請求項1に記載の動き検出装置。
 さらに、前記マルチフレームメモリを備える
 ことを特徴とする請求項1に記載の動き検出装置。
 マルチフレームメモリに記憶された参照ピクチャの画素データを用いて、符号化対象ピクチャを構成するマクロブロックの動き検出を行う動き検出方法であって、
 前記マルチフレームメモリから読み出された参照ピクチャの画素データのうち、ローカルメモリに記憶されている第1の動き検出時の探索範囲である第1範囲に含まれる前記参照ピクチャの画素データを用いて、前記第1の動き検出を行うステップと、
 前記第1範囲を含み、かつ当該第1範囲よりも広い第2範囲に含まれる前記参照ピクチャの画素データを用いて、前記第1の動き検出と異なるアルゴリズムを用いた第2の動き検出を行うステップと
 を含むことを特徴とする動き検出方法。
 マルチフレームメモリに記憶された参照ピクチャの画素データを用いて、符号化対象ピクチャを構成するマクロブロックの動き検出を行う動き検出プログラムであって、
 前記マルチフレームメモリから読み出された参照ピクチャの画素データのうち、ローカルメモリに記憶されている第1の動き検出時の探索範囲である第1範囲に含まれる前記参照ピクチャの画素データを用いて、前記第1の動き検出を行うステップと、
 前記第1範囲を含み、かつ当該第1範囲よりも広い第2範囲に含まれる前記参照ピクチャの画素データを用いて、前記第1の動き検出と異なるアルゴリズムを用いた第2の動き検出を行うステップと
 をコンピュータに実行させるための動き検出プログラム。
 参照ピクチャの画素データを用いて、符号化対象ピクチャを構成するマクロブロックの動き検出を行う動き検出装置であって、
 前記参照ピクチャ内の画素であって動き検出時の探索範囲に含まれる画素の画素データを記憶している第1のメモリと、
 前記第1のメモリより容量が大きく、前記第1のメモリへと転送される画素データを格納する第2のメモリと、
 前記第1のメモリに記憶されている画素データを用いて第1の動き検出を行う第1の動き検出手段と、
 前記第2のメモリに記憶されている画素データを用いて前記第1の動き検出と異なるアルゴリズムを用いて第2の動き検出を行う第2の動き検出手段と、
 を備えることを特徴とする動き検出装置。
 マルチフレームメモリに記憶された参照ピクチャの画素データを用いて、符号化対象ピクチャを構成するマクロブロックの動き検出を行う動き検出装置であって、
 前記マルチフレームメモリから読み出しを行った参照ピクチャ内の画素であって動き検出時の探索範囲及び当該探索範囲に隣接する拡大範囲の画素の画素データを記憶しているローカルメモリと、
 前記ローカルメモリが記憶している画素データのうち前記探索範囲に含まれる画素データを用いて第1の動き検出を行う第1の動き検出手段と、
 前記ローカルメモリが記憶している画素データのうち前記探索範囲及び前記拡大範囲に含まれる画素データを用いて、前記第1の動き検出と異なるアルゴリズムを用いて第2の動き検出を行う第2の動き検出手段と
 を備えることを特徴とする動き検出装置。
 前記拡大範囲は、前記探索範囲の中心の画素を含む複数の行に相当する範囲である
 ことを特徴とする請求項25に記載の動き検出装置。
Description:
動き検出装置、動き検出方法、 び動き検出プログラム

 本発明は、動画像の符号化に関し、特に 動画像の符号化における動き検出処理を行 う動き検出集積装置、動き検出方法、動き 出装置、及び動き検出プログラムに関する

 近年、音声、画像及びその他のデータを 合的に扱うマルチメディア時代を迎え、従 からの情報メディア、つまり新聞、雑誌、 レビ、ラジオ、電話等の情報を人に伝達す 手段がマルチメディアの対象として取り上 られるようになってきた。一般に、マルチ ディアとは、文字だけでなく、図形、音声 特に画像等を同時に関連づけて表すことを うが、上記従来の情報メディアをマルチメ ィアの対象とするには、その情報をディジ ル形式にして表すことが必須条件となる。

 ところが、上記の各情報メディアが持つ 報量をディジタル情報量として見積もって ると、文字の場合の1文字当たりの情報量は 1~2バイトである。これに対し、音声であれば 1秒当たり64Kbits(電話品質)、さらに動画であ ば1秒当たり100Mbits(現行テレビ受信品質)以上 の情報量が必要となる。このため、上記の情 報メディアでその膨大な情報をディジタル形 式でそのまま扱うことは現実的では無い。例 えば、テレビ電話は、64Kbits~1.5Mbitsの伝送速 を持つ総合サービスディジタル網(ISDN: Integr ated Services Digital Network)によって実用化され ているが、テレビカメラで撮影された映像を そのままISDNを介して送ることは不可能であ 。

 そこで、必要となってくるのが情報の圧 技術であり、例えば、テレビ電話の場合、I TU-T(国際電気通信連合 電気通信標準化部門) 勧告されたH.261やH.263規格の動画圧縮技術が 用いられている。また、MPEG-1規格の情報圧縮 技術によると、通常の音楽用CD(コンパクト・ ディスク)に音声情報とともに画像情報を記 することも可能となる。

 ここで、MPEG(Moving Picture Experts Group)とは 、ISO/IEC(国際標準化機構/国際電気標準会議) 標準化された動画像信号圧縮の国際規格で る。MPEG-1は、動画像信号を1.5Mbpsまで、つま テレビ信号の情報を約100分の1にまで圧縮す る規格である。また、MPEG-1規格では対象とす る品質を伝送速度が主として約1.5Mbpsで実現 きる程度の中程度の品質としたことから、 らなる高画質化の要求をみたすべく規格化 れたMPEG-2では、動画像信号の伝送速度を2~15M bpsとしTV放送品質を実現する。さらに最近で 、MPEG-1、MPEG-2と標準化を進めてきた作業グ ープ(ISO/IEC JTC1/SC29/WG11)によって、MPEG-1、MPE G-2を上回る圧縮率を達成し、更に物体単位で 符号化・復号化・操作を可能とし、マルチメ ディア時代に必要な新しい機能を実現するこ とができるMPEG-4が規格化された。MPEG-4では、 当初、低ビットレートの符号化方法の標準化 を目指して規格化が進められたが、現在はイ ンタレース画像の符号化方法や高ビットレー トの符号化方法も含む、より汎用的な符号化 に拡張されている。

 更に、2003年には、ISO/IECとITU-Tが共同で、 より高圧縮率の画像符号化方式として、MPEG-4 AVC及びH.264を開発し、これらの規格が標準化 れている。H.264規格は、現在HD(High Definition) 画像などに適したHigh Profile対応の改正規格 で拡張されている。H.264規格で想定するアプ リケーションは、MPEG-2やMPEG-4と同様にディジ タル放送、DVD(Digital Versatile Disk)プレーヤ/レ コーダ、ハードディスクプレーヤ/レコーダ カムコーダ、テレビ電話などに広がってい 。

 一般に動画像の符号化では、時間方向及 空間方向の冗長性を削減することによって 報量の圧縮を行う。そこで、時間的な冗長 の削減を目的とする画面間予測符号化では 前方または後方のピクチャを参照してブロ ク単位で動きの検出及び予測画像の作成を い、得られた予測画像と符号化対象ピクチ との差分値に対して符号化を行う。ここで ピクチャとは1枚の画面を表す用語であり、 プログレッシブ画像ではフレームを意味し、 インタレース画像ではフレームもしくはフィ ールドを意味する。ここで、インタレース画 像とは、1つのフレームが時刻の異なる2つの ィールドから構成される画像である。イン レース画像の符号化処理及び復号化処理に いては、1つのフレームを、フレームのまま 処理したり、2つのフィールドとして処理し り、フレーム内のブロック毎にフレーム構 またはフィールド構造として処理したりす ことができる。

 参照画像を参照せずに画面内予測符号化 行うピクチャをIピクチャと呼ぶ。また、1 の参照画像のみを参照し画面間予測符号化 行うピクチャをPピクチャと呼ぶ。また、同 に2枚の参照画像を参照して画面間予測符号 化を行うことのできるピクチャをBピクチャ 呼ぶ。Bピクチャにおける画面間予測符号化 は、表示時間が前方もしくは後方から任意 組み合わせとして2枚のピクチャを参照する ことが可能である。参照画像(参照ピクチャ) 符号化の基本単位であるマクロブロック(MB) ごとに指定することができるが、符号化を行 ったビットストリーム中で先に記述される方 の参照ピクチャを第1参照ピクチャ、後に記 される方を第2参照ピクチャとして区別する ただし、これらのピクチャを符号化する場 の条件として、参照するピクチャが既に符 化されている必要がある。

 PピクチャまたはBピクチャの符号化には 動き補償画面間予測符号化が用いられてい 。動き補償画面間予測符号化とは、画面間 測符号化に動き補償を適用した符号化方式 ある。動き補償とは、単純に参照フレーム 画素値から符号化対象ピクチャの画素値を 測するのではなく、ピクチャ内の各部の動 量(以下、「動きベクトル」と呼ぶ)を検出し 、当該動き量を考慮した予測を行うことによ り予測精度を向上すると共に、データ量を減 らす方式である。例えば、符号化対象ピクチ ャの動きベクトルを検出し、その動きベクト ルの分だけシフトした位置における予測値と 符号化対象ピクチャの画素値との差分を符号 化することによりデータ量を減らしている。 この方式では、復号化の際に動きベクトルの 情報が必要になるため、動きベクトルも符号 化されて記録または伝送される。

 動きベクトルはマクロブロック単位で検 されており、具体的には、符号化対象ピク ャ側のマクロブロック(基準ブロック)を固 しておき、参照ピクチャ側のマクロブロッ を探索範囲内で移動させ、基準ブロックと も似通った参照ブロックの位置を見つける とにより、動きベクトルが検出される。

 図1は、従来の動画像符号化装置の構成を 示すブロック図である。

 この動画像符号化装置は、動き検出器506 、マルチフレームメモリ504と、減算器512と 減算器518と、動き補償器508と、符号化器520 、加算器510と、動きベクトルメモリ514と、 きベクトル予測器516とを含む。

 PピクチャもしくはBピクチャなどの画面 予測では、動き検出器506は、マルチフレー メモリ504から出力される参照画像の画素で る参照画素MEpelを、符号化対象画像の画面信 号Vinと比較し、動きベクトルMVと参照フレー 番号RefNoとを出力する。参照フレーム番号Re fNoは、複数の参照画像の中から選択された、 符号化対象画像において参照する参照画像を 特定する識別信号によって示される。動きベ クトルMVは、動きベクトルメモリ514に一時的 記憶されたのちに近傍動きベクトルPrevMVと て出力され、動きベクトル予測器516におい 、予測動きベクトルPredMVを予測するために 照される近傍動きベクトルPrevMVとして使用 れる。減算器518は、動きベクトルMVから予 動きベクトルPredMVを減算し、減算結果を動 ベクトル予測差分DifMVとして出力する。

 一方、マルチフレームメモリ504は、参照 レーム番号RefNo及び動きベクトルMVで特定さ れる画素を、動き補償参照画素MCpel1として出 力する。動き補償器508は、小数画素精度の参 照画素を生成して参照画面画素MCpel2を出力す る。減算器512は画面信号Vinから参照画面画素 MCpel2を減算し、画面予測誤差DifPelを出力する 。

 また、符号化器520は、画面予測誤差DifPel 動きベクトル予測差分DifMVと参照フレーム 号RefNoとを可変長符号化し、符号化信号Strを 出力する。なお、符号化時に画面予測誤差の 復号化結果である復号画面予測誤差RecDifPelも 同時に出力する。復号画面予測誤差RecDifPelは 画面予測誤差DifPelに符号化誤差が重畳された ものであり、画面間予測復号化装置で符号化 信号Strを復号化して得られる画面間予測誤差 と一致する。

 加算器510は、参照画面画素MCpel2に復号画 予測誤差RecDifPelを加算する。加算結果は、 号画面RecPelとしてマルチフレームメモリ504 記憶される。但し、マルチフレームメモリ5 04の容量を有効に利用するため、マルチフレ ムメモリ504に記憶されている画面の領域は 要な場合は開放され、またマルチフレーム モリ504に記憶する必要が無い画面の復号画 RecPelはマルチフレームメモリ504に記憶され い。

 図2は従来の動画像復号化装置の構成を示 すブロック図である。同図において、図1と 一符号の処理部は、同一の機能を有するた 、その説明は適宜省略する。

 図2に示す従来の動画像復号化装置は、図 1に示す従来の動画像予測符号化装置で符号 した符号化信号Strを復号化して復号画面信 Voutを出力する装置であり、マルチフレーム モリ504と、動き補償器508と、加算器510と、 算器614と、動きベクトルメモリ514と、動き クトル予測器516と、復号化器616とを含む。

 復号化器616には符号化信号Strが入力され 。復号化器616は、符号化信号Strを復号化し 復号画面予測誤差RecDifPelと動きベクトル予 差分DifMVと参照フレーム番号RefNoとを出力す る。加算器614は、動きベクトル予測器516から 出力される予測動きベクトルPredMVと、復号化 器616から出力される動きベクトル予測差分Dif MVとを加算し、動きベクトルMVを復号する。

 画面間予測では、マルチフレームメモリ5 04は、参照フレーム番号RefNoと動きベクトルMV とで示される画素を動き補償参照画素MCpel1と して出力し、動き補償器508は、小数画素精度 の参照画素を生成して参照画面画素MCpel2を出 力する。加算器510は、参照画面画素MCpel2に復 号画面予測誤差RecDifPelを加算する。加算結果 は、復号画面RecPelとしてマルチフレームメモ リ504に記憶される。

 但し、マルチフレームメモリ504の容量を 効に利用するため、マルチフレームメモリ5 04に記憶されている画面の領域は不要な場合 開放され、またマルチフレームメモリ504に 憶する必要が無い画面の復号画面RecPelはマ チフレームメモリ504に記憶されない。以上 ように、復号画面信号Vout、すなわち復号画 面RecPelを符号化信号Strから正しく復号化する ことができる。

 ところで、図3は動き検出処理の動作を示 す模式図であり、同図を用いて一般的な動き 検出処理を簡単に説明する。同図において、 フレームF11N-1及びフレームF11Nは、符号化を うピクチャであり、フレームF11N-1は時間的 フレームF11Nよりも過去のピクチャを示して る。例えば、領域P1100は符号化を行うピク ャの一部分を示している。領域P1100中の四角 で示したマクロブロックに対してフレームF11 N-1を用いて画面間予測を行う場合、領域P1101 内、探索範囲である点線で囲んだ領域の中 ら右上向きの矢印の動きを検出し、その結 として楕円の一部分を参照画像として参照 ていることを示している。また、同様に領 P1102は符号化を行うピクチャの一部分を示 ている。領域P1102中の四角で示したマクロブ ロックに対してフレームF11N-1を用いて画面間 予測を行う場合、領域P1103の内、探索範囲で る点線で囲んだ領域の中から左下向きの矢 の動きを検出し、三角形の一部分を参照画 として参照していることを示している。

 また、領域P1104は、マクロブロック毎の 理において、符号化を行うマクロブロック マクロブロック1121、マクロブロック1122、マ クロブロック1123、マクロブロック1124の順で 動させることを示している。また、フレー F11N-1の領域P1105は、動き検出を行なう探索 囲が探索範囲1131、探索範囲1132、探索範囲113 3、探索範囲1134の順に移動していることを示 ている。以上のように、通常の動き検出の 作では検出範囲を、符号化対象のマクロブ ックの切り替わりの動作に合せて探索範囲 更新を行っており、隣り合うマクロブロッ の場合、探索範囲が相当量重なっているこ が分かる。

 図4は、従来の動き検出機能を実現する第 1のブロック図であり、図1の点線で囲んだ範 502におけるマルチフレームメモリ504と動き 出器506の接続の一例を示している。同図に いて、図1と同一符号の処理部は同一の機能 を有するため、その説明を適宜省略する。

 動き検出器506は、ローカルメモリ702と、 常の動き検出部704とを含む。

 ローカルメモリ702は、マルチフレームメ リ504から探索範囲に含まれる画素データを 出し蓄える。これにより、図3における領域 P1105で示した動き検出を行う領域が移動する 態において、領域が重なっている部分の再 送を無くすことを実現し、参照画素MEpelの ータ転送量を削減している。次に、ローカ メモリ702に蓄えられる画素データは、参照 素LMEpelとして通常の動き検出部704に供給さ る。通常の動き検出部704は、動き検出を行 、その結果として動きベクトルMVを出力する 。この構成は、マルチフレームメモリ504が外 部メモリとして外付けされる場合などには、 画素データを転送するバンド幅を削減するた めに非常に有効である。

 また、複数の領域から動きベクトルを探 する必要がある場合には、特許文献1では、 動き検出で用いるためのローカルメモリ702と 同等のメモリを複数用いた構成が開示されて いる。

 しかしながら、たとえローカルメモリ702 実装したとしても、H.264規格を用いた場合 またさらに、対応する画角が大きくなる場 には、参照画素MEpelのデータ転送量が課題と なってくる。図5は、従来の動き検出を行う めのメモリ管理を示す第1の模式図である。 5(a)は、一画面分の画像データを示す図であ り、図5(b)は、図5(a)の一部を拡大した図であ 。図5(b)に示される拡大されている部分は、 ローカルメモリ702に蓄えられている探索範囲 (白地の3×3のマス目、1つのマス目が1マクロ ロックに対応)と、探索範囲を移動させた場 に必要となる転送領域(斜線)とを示してい 。同図に示されているように、1マクロブロ ク単位(=16画素×16画素)で動き検出処理を行 場合、1マクロブロック行分の動き検出を行 うためには、(探索範囲の縦の長さ)×(1画面の 横幅)分のメモリ転送が必要となり、1画面分 動き検出を行う時には、さらに1画面の縦の マクロブロックライン数を乗じた量のメモリ 転送を行う必要がある。つまり、MPEG-2におい てSDサイズ画像(720画素×480画素、45MB×30MB)で 縦横1マクロブロック分ずつ移動した画素範 を探索範囲とした場合、

  (16+16×2)×720×30=1,036,800

 の画素が1画面あたりの動き検出で、マル チフレームメモリ504からローカルメモリ702へ 転送される必要がある。

 ここで、H.264のSDサイズ画像を想定した参 照用ローカルメモリの管理状態を考えると、 小数画素精度の動き補償を行うには6タップ フィルタを用いるため、従来のMPEG-2などよ 周辺画素が多く必要となる(例えば、非特許 献1参照)。つまり、MPEG-2などでは小数精度 素位置を囲む4つの整数画素から小数精度画 を作っていたが、6タップフィルタの場合、 36の整数画素から小数精度画素を作るため、 じ領域で探索を行う場合、MPEG-2と比べ上2行 、下2行、左2列、右2列の画素が必要となる。 従って、H.264などのSDサイズ画像で、縦横1マ ロブロック分ずつ移動した画素範囲を探索 囲とした場合、

  (16+16×2+4)×720×30=1,123,200

 の画素が1画面あたりの動き検出で、マル チフレームメモリ504からローカルメモリ702へ 転送される必要がある。

 さらに、HDサイズ(1920画素×1088画素、120MB 68MB)の画像を扱う場合、特にH.264による符号 を行う場合には、前述の1画面あたりの画素 転送量が大幅に増加してしまい、図4に示す 照画素MEpelの転送能力を超えてしまう可能性 がある。

 例えば、MPEG-2のHDサイズ画像を想定した 照用ローカルメモリの管理状態について考 る。この場合、HDサイズの画像はSDサイズの 像に対して約6倍の画素数を持つため、簡略 のため上下、左右それぞれ2.5倍の参照領域を 探索するものとすれば、縦横の探索範囲は縦 横40画素分ずつ移動した画素範囲となり、同 に、

  (16+40×2)×1,920×68=12,533,760

 の画素が1画面あたりの動き検出で転送さ れることになる。

 さらに、H.264のHDサイズ画像を想定した参 照用ローカルメモリの管理状態を想定した場 合、同様に、

  (16+40×2+4)×1,920×68=13,056,000

 の画素が1画面あたりの動き検出で転送さ れることになり、MPEG-2のSDサイズで必要な画 転送量の約13倍の転送が必要となることが かる。

 以上のような理由により、さらにキャッ ュメモリを備えた動き検出器の構成を考え ことが可能である。図6は従来の動き検出機 能を実現する第2のブロック図を示している 同図において、図4と同一符号の処理部は同 の機能を有するため、その説明を適宜省略 る。

 動き検出器806は、キャッシュメモリ802と ローカルメモリ702と、通常の動き検出部704 を含む。図4に示した動き検出器506との違い は、マルチフレームメモリ504とローカルメモ リ702の間に、さらにキャッシュメモリ802を備 えているところである。

 マルチフレームメモリ504に記憶されてい 画素データは、参照画素MEpelとして転送さ 、キャッシュメモリ802に蓄えられる。さら 当該画素データは参照画素CMEpelとして転送 れ、ローカルメモリ702に蓄えられる。さら 通常の動き検出部704は、その画素データを いて動き検出を行い、その結果として動き クトルMVを出力する。

 この従来構成では、キャッシュメモリ802 マクロブロックライン単位のラインバッフ として画素データを記憶することによって 図5に示しているような同じマクロブロック ラインの画素データの再取得を無くしている 。図7は従来の動き検出を行うためのメモリ 理を示す第2の模式図であり、キャッシュメ リ802におけるメモリ管理の動作を簡単に表 たものである。つまり、キャッシュメモリ8 02は、灰色で塗りつぶした符号化対象マクロ ロックmeCntを含む探索範囲の横ラインに含 れる画素データと、次のマクロブロックラ ンの動き検出のために使用されるマクロブ ックラインaddAreaに含まれる画素データとを える。これによって、マルチフレームメモ 504が外部メモリとして外付けされる場合な において、参照ピクチャから何度も同じマ ロブロックラインの画素データを取得する 要を無くし、参照画素MEpelにおける画素デ タを転送するバンド幅を削減することがで るようになる。このため、バンド幅削減に 非常に有効な実装となる。

 以上のように、使用する画素データの局 性を利用し、マルチフレームメモリ504、キ ッシュメモリ802、ローカルメモリ702のよう 階層的なメモリ構成をとることによって、 装メモリコストを抑制しつつ、外部メモリ のバンド幅を削減し、動き検出のための局 的なアクセス頻度の高さにも対応するとい 実装が考えられている。

 図8は、図7に示したメモリ管理方法より キャッシュメモリ802に蓄えられる画素デー の容量が少ないメモリ管理方法を模式的に す図である。

 同図のキャッシュメモリ802の管理では、 本的に参照領域RefAreaと予備記憶領域SubArea のメモリ管理を行い、次回開放領域RelAreaの 素データが記憶されている物理メモリ位置 次回取得領域NxtAreaの画素データを格納して いくことによって、マクロブロックラインadd Areaの画素データを予め格納することが不要 なり、実装メモリ量を減らすことが可能と る。

 (ダイレクト予測の説明)
 H.264規格には、ダイレクト予測と呼ばれる 面間予測のモードが存在する。このモード 、符号化済みブロックの動き情報を用いて 対象ブロックの動き情報を予測生成する符 化モードであり、動き情報の符号化に必要 ビット数が不要なため圧縮効率が向上する いう効果を持つ。

 ダイレクト予測を利用することで向上す 圧縮率は、符号化済みブロックから対象ブ ックの動き情報を予測する精度に依存する そこで、主として時間方向の動き情報の相 を利用する「時間ダイレクト・モード」と 主として空間方向(ピクチャ内の水平・垂直 の2次元空間)の動き情報の相関を利用する「 間ダイレクト・モード」の2通りが導入され ている。

 時間ダイレクト・モードは、異なる動き 含まれ、かつ動きの速度が一定の画像で効 があり、空間ダイレクト・モードは同じよ な動きが含まれ、かつ動きの速度が変化す 画像で効果がある(例えば、非特許文献1参 )。

 なお、ダイレクト予測した画像と原画像 の差分画像も必要としない場合、差分画素 報も符号化しないスキップ予測となる場合 あるが、以下簡略のため、この場合もダイ クト予測に含めて説明する。

 (ダイレクト予測を含めた画面間予測)
 以上のような技術背景及び従来回路構成に いて、ダイレクト予測を用いた符号化を行 処理フローの一例を説明する。図9は、従来 の動き検出処理を示すフローチャートである 。まず、ローカルメモリ702を用いて動き検出 処理を行い、最適な動きベクトル結果を求め る(S1701)。

 次に、S1701で求めた動きベクトル結果が、 イレクト予測により算出される動きベクト と等しいか、あるいはほぼ等しいかを判定 る(S1702)。S1702の判定結果が真の場合は、ダ レクト予測として符号化処理を行い(S1703)、 とならなければ通常の画面間予測として動 検出結果の符号化処理を行う(S1704)。

特開2006-270683号公報 ITU-T Recomendation H.264, “SERIES H: AUDIOVISU AL AND MULTIMEDIA SYSTEMS Infrastructure of audiovisua l services -Coding of moving video:Advanced video cod ing for generic audiovisual services,”March 2005.

 ところで、図4又は図6に示した動き検出 を用いて、例えば電車の車窓から見える景 や、テレビ番組の固定的なテロップが入る 画像を符号化する場合、ダイレクト予測を うことで符号化効率を非常に向上させるこ ができる。しかし、ローカルメモリ702の中 は探索範囲となるマクロブロックしか蓄え れておらず、ダイレクト予測で用いるべき 素データが存在しないためにダイレクト予 をすることが出来なくなり符号化効率が下 る場合がある。

 上記の一例に関して図10A及び図10Bを用い 説明する。図10A及び図10Bは、車窓からの風 を撮像した画像データから動き検出する処 を説明するための模式図である。同図にお て、図10AのフレームF18N-1と図10BのフレームF 18Nは、符号化を行う電車などの中から窓を通 して外の風景を録画していることを想定した 場合のピクチャであり、フレームF18N-1は時間 的にフレームF18Nよりも過去のピクチャを示 ている。

 電車が右方向に進行している場合、社内 らの風景は相対的に左側に移動する。この め、フレームF18N-1内の外部の風景が、フレ ムF18Nよりも左にずれている。一般的に、画 面間予測を行う時にピクチャの全体的なシフ トがある場合、動き検出を行う探索範囲を全 体的にずらす手法が効果的である。このため 、例えば、範囲P1800内の四角の網掛け部のマ ロブロックP1801をフレームF18N-1から動き検 する場合、範囲P1802で示すように、探索中心 を右にずらした探索範囲P1803の中からマクロ ロックP1801に対応する画素位置を求め、動 ベクトルの探索を行う。同図では、マクロ ロックP1801は、領域P1804との相関が高いとい 判定を行うことが予想される。

 しかしながら、領域P1809は、車内の壁及 手すりの一部を含んだ領域を想定している このため、例えば斜線で示した四角のマク ブロックP1805を符号化する場合、フレームF18 N-1の参照画像において、画面全体の動きに引 きずられてしまい、探索領域P1807の中で、マ ロブロックP1805に対応する位置を探索し、 きベクトル探索を行うようになると考えら る。しかし、マクロブロックP1805に対応する 位置は探索領域P1807の中には存在せず、相関 の高い画像を得ることができない。このた 、結果的に画面間予測のモードではなく画 内予測で参照画像を生成するようになるこ が予想される。

 この場合、領域P1809では、フレームF18N-1 フレームF18Nとで動きがあまり存在しないた 、動きベクトルが0の場合の領域P1808が、マ ロブロックP1805に対応する領域として選択 れていれば効果的に符号化を実現すること できることが予想される。例えば、マクロ ロックP1805に対して、左と上と右上の周辺マ クロブロックを用いて画面内予測を行なうと 仮定すると、マクロブロックP1805に関して空 ダイレクト・モードで予測される動きベク ルは0ベクトルとなり(ダイレクト予測のア ゴリズムに関しては非特許文献1を参照)、ダ イレクト予測が選択されれば非常に効果的に マクロブロックを符号化することができるこ とが理解できる。しかしながら、上述の従来 の技術では、ローカルメモリ702内にはP1808の 域のマクロブロックが蓄えられていないた に、ダイレクト予測を用いることができな ことになる。

 また、特許文献1で示されているように、 動き検出で用いるためのローカルメモリ702と 同等のメモリを複数用いることによってダイ レクト予測に対応することも考えられる。し かし、これまで説明してきたとおり、フルHD 角などの大画角化やH.264規格などのタップ の大きい動き補償が必要となる場合、ロー ルメモリ702やキャッシュメモリ802として実 するメモリは莫大な容量となり、実装コス の増加が課題となる。

 本発明は、上述の課題を解決するために されたものであり、探索範囲分のローカル モリを実装することによってフレームメモ からのデータ転送のバンド幅を削減したシ テムにおいて、メモリ実装のコストを抑え つ、ダイレクト予測に対応した動き検出装 を提供することを目的とする。

 本発明に係る動き検出装置は、マルチフ ームメモリに記憶された参照ピクチャの画 データを用いて、符号化対象ピクチャを構 するマクロブロックの動き検出を行う動き 出装置であって、前記マルチフレームメモ から読み出された参照ピクチャの画素デー のうち、第1の動き検出時の探索範囲である 第1範囲に含まれる画素データを記憶してい ローカルメモリと、前記ローカルメモリに 憶されている画素データを用いて、前記第1 動き検出を行う第1の動き検出手段と、前記 第1範囲を含み、かつ当該第1範囲よりも広い 2範囲に含まれる前記参照ピクチャの画素デ ータを用いて、前記第1の動き検出と異なる ルゴリズムを用いた第2の動き検出を行う第2 の動き検出手段とを備えることを特徴とする 。

 第1の動き検出手段が参照する画素データ をローカルメモリに蓄えている。このため、 動き検出装置とマルチフレームメモリとの間 の平均バンド幅を削減することが可能となる 。また、第1範囲外の画素データを用いて第2 動き検出が行える。このため、第1範囲内の 画素データのみを用いて第2の動き検出を行 う場合に比べて、符号量を削減することが きる。

 好ましくは、前記第2の動き検出手段は、 前記マルチフレームメモリに記憶されている 前記参照ピクチャの画素データを用いて、前 記第2の動き検出を行なうことを特徴とする

 第1の動き検出手段が参照する画素データ をローカルメモリに蓄えている。このため、 動き検出装置とマルチフレームメモリとの間 の平均バンド幅を削減することが可能となる 。また、第2の動き検出をローカルメモリよ 容量の大きなマルチフレームメモリを用い ことにより、第1範囲外の画素データを用い 第2の動き検出が行える。このため、第1範 内の画素データのみを用いて第2の動き検出 行なう場合に比べて、符号量を削減するこ ができる。

 これにより、探索範囲分のローカルメモ を実装することによってフレームメモリか のデータ転送のバンド幅を削減したシステ において、メモリ実装のコストを抑えつつ ダイレクト予測に対応した動き検出装置を 供することができる。

 さらに好ましくは、上述の動き検出装置 、さらに、前記第2の動き検出手段が前記第 1範囲内の画素データを使用して前記第2の動 検出を行なう場合には前記ローカルメモリ 記憶されている画素データを選択し、前記 2の動き検出手段が前記第2範囲内であり、 つ前記第1範囲外の画素データを使用して前 第2の動き検出を行なう場合には前記マルチ フレームメモリに記憶されている画素データ を選択する選択手段を備え、前記第2の動き 出手段は、前記選択手段によって選択され 画素データを用いて前記第2の動き検出を行 ことを特徴とする。

 第1の動き検出手段が参照する画素データ はローカルメモリに蓄えられており、第2の き検出手段が参照する画素データについて ローカルメモリに蓄えられている場合があ ため、動き検出装置とマルチフレームメモ の平均バンド幅を削減することができる。

 さらに好ましくは、上述の動き検出装置 、さらに、前記第2の動き検出手段による前 記第2の動き検出の実行及び非実行を制御す 実行制御手段を備えることを特徴とする。

 実行制御手段によって第2の動き検出手段 によるマルチフレームメモリからの画素デー タの取得を制御できる。このため、マルチフ レームメモリのバンド幅が溢れる等のシステ ム破綻を防止することができる。

 さらに好ましくは、前記実行制御手段は 前記第2の動き検出に用いる画素データの少 なくとも一部が前記ローカルメモリに蓄えら れている場合に限り、前記第2の動き検出手 に前記第2の動き検出を実行させることを特 とする。

 第2の動き検出に用いる画素データの全て をマルチフレームメモリから取得する必要が ない場合に限り第2の動き検出を行う。この め、動き検出装置とマルチフレームメモリ の間の転送の平均バンド幅を削減しつつ、 号量も削減できる。

 さらに好ましくは、上述の動き検出装置 、さらに、前記マルチフレームメモリから み出された参照ピクチャの画素データのう 、前記第2範囲に含まれる画素データを記憶 しているキャッシュメモリを備え、前記ロー カルメモリは、前記キャッシュメモリから読 み出された前記第1範囲に含まれる画素の画 データを記憶しており、前記第2の動き検出 段は、前記キャッシュメモリに記憶されて る前記参照ピクチャの画素データを用いて 記第2の動き検出を行なうことを特徴とする 。

 第1の動き検出手段が参照するローカルメ モリに蓄えられる画素データをキャッシュメ モリから取得し、第2の動き検出手段がキャ シュメモリに蓄えられた画素データを参照 る。このため、動き検出装置とマルチフレ ムメモリとの間の平均バンド幅を削減する とが可能となり、かつローカルメモリに必 となる画素データが格納されていなくとも 2の動き検出を行うことが可能であるので、 号量を削減することもできる。さらに、キ ッシュメモリ自体は第1の動き検出における 転送のバンド幅を確保するためにも寄与して いるので、第2の動き検出を行うためのメモ の実装コストが特に必要ないという効果も る。

 さらに好ましくは、上述の動き検出装置 、さらに、前記第2の動き検出手段が前記第 1範囲内の画素データを使用して前記第2の動 検出を行なう場合には前記ローカルメモリ 記憶されている画素データを選択し、前記 2の動き検出手段が前記第2範囲内であり、 つ前記第1範囲外の画素データを使用して前 第2の動き検出を行なう場合には前記キャッ シュメモリに記憶されている画素データを選 択する選択手段を備え、前記第2の動き検出 段は、前記選択手段によって選択された画 データを用いて前記第2の動き検出を行うこ を特徴とする。

 第1の動き検出手段が参照する画素データ はローカルメモリに蓄えられており、第2の き検出手段が参照する画素データについて ローカルメモリに蓄えられている場合があ 。このため、キャッシュメモリの平均バン 幅を削減することができる。

 さらに好ましくは、上述の動き検出装置 、さらに、前記第2の動き検出に用いられる 画素データが前記キャッシュメモリに記憶さ れている場合にのみ、前記第2の動き検出が 能と判定する第2の動き検出可否判定手段を え、前記第2の動き検出手段は、前記第2の き検出可否判定手段において前記第2の動き 出が可能と判定された場合に、前記第2の動 き検出を行なうことを特徴とする。

 第2の動き検出手段の参照する画素データ がキャッシュメモリに蓄えられていない場合 に、マルチフレームメモリから画素データを 取得する必要がないまたはキャッシュメモリ に蓄えなおす必要がない。このため、マルチ フレームメモリの平均バンド幅を削減するこ とができる。

 さらに好ましくは、前記第2の動き検出可 否判定手段は、前記第2の動き検出に用いら る画素データが、前記キャッシュメモリに まれている画素データが参照ピクチャ上で める領域のうちの予め定められた一部の領 に含まれている場合にのみ、前記第2の動き 出が可能と判定することを特徴とする。

 具体的には、前記予め定められた一部の 域は、前記キャッシュメモリに含まれてい 画素データが参照ピクチャ上で占める領域 うち、縦方向に制限を加えた領域であるこ を特徴とする。

 また、前記予め定められた一部の領域は 前記キャッシュメモリに含まれている画素 ータが参照ピクチャ上で占める領域のうち 右方向に制限を加えた領域であることを特 とする。

 また、前記予め定められた一部の領域は 前記キャッシュメモリに含まれている画素 ータが参照ピクチャ上で占める領域のうち 左方向に制限を加えた領域であることを特 とする。

 また、前記予め定められた一部の領域は 前記キャッシュメモリに含まれている画素 ータが参照ピクチャ上で占める領域のうち 縦方向及び横方向の双方に制限を加えた領 であることを特徴とする。

 キャッシュメモリに蓄えられた画像デー の中で第2の動き検出手段が参照する画素デ ータが存在するかどうか判定を行う領域がキ ャッシュメモリに蓄えられた画像データの形 状によらず単純化できる。このため、第2の き検出可否判定手段における判定を容易化 ることができる。

 さらに好ましくは、前記キャッシュメモ には、1枚の参照ピクチャを構成する画素デ ータのうち所定数のマクロブロックラインに 含まれるマクロブロックの画素データのみが 記憶されており、当該記憶されているマクロ ブロックのうち最上行と最下行のマクロブロ ックの画素データは、前記第1の動き検出の 象となるマクロブロックが更新される毎に 新されることを特徴とする。

 第1の動き検出を行うために必要なマルチ フレームメモリからキャッシュメモリへの画 素データの転送も抑制できるので、さらにマ ルチフレームメモリの平均バンド幅を削減す ることが可能となる。

 さらに好ましくは、上述の動き検出装置 、さらに、前記第2の動き検出に用いられる 画素データが前記キャッシュメモリに記憶さ れている場合にのみ、前記第2の動き検出が 能と判定する第2の動き検出可否判定手段を え、前記第2の動き検出可否判定手段は、前 記キャッシュメモリに記憶されているマクロ ブロックのうち前記第1の動き検出の対象と るマクロブロックが更新された際に更新さ るマクロブロックを除外して前記第2の動き 出の可否を判定することを特徴とする。

 キャッシュメモリの更新のタイミングに らず第2の動き検出が行えるかどうかを判定 できる。このため、第2の動き検出可否判定 段における判定を容易化することが可能と る。

 さらに好ましくは、前記第2の動き検出手 段は、前記キャッシュメモリに記憶されてい る前記参照ピクチャの画素データのみを用い て前記第2の動き検出を行なうことを特徴と る。

 転送のバンド幅を確保することが難しい ルチフレームメモリやローカルメモリの平 バンド幅を一切増加させることなく、第1の 動き検出の探索範囲外からも第2の動き検出 行うことが可能となる。

 さらに好ましくは、前記第2の動き検出は 、予測動きベクトルと動きベクトルとの差分 処理を必要としない動き検出であることを特 徴とする。

 第2の動き検出手段による動き検出結果の 符号化において動きベクトル予想差分を符号 化する必要がないため、平均符号長を短縮す ることが可能となる。

 さらに好ましくは、前記第2の動き検出は 、ダイレクト予測又はスキップ予測であるこ とを特徴とする。

 ダイレクト予測では動きベクトル予想差 を符号化する必要がなく、スキップでは差 画素情報についても符号化する必要がない め、平均符号長を短縮することが可能とな 。

 さらに好ましくは、上述の動き検出装置 、1チップで構成されていることを特徴とす る。

 キャッシュメモリとローカルメモリが動 検出手段と単一のチップに構成されるため これらのメモリのバンド幅が確保しやすく る。

 なお、本発明は、このような特徴的な手 を備える動き検出装置として実現すること できるだけでなく、動き検出装置に含まれ 特徴的な手段をステップとする動き検出方 として実現したり、動き検出方法に含まれ 特徴的なステップをコンピュータに実行さ るためのプログラムとして実現したりする ともできる。そして、そのようなプログラ は、CD-ROM(Compact Disc-Read Only Memory)等の記録 媒体やインターネット等の通信ネットワーク を介して流通させることができるのは言うま でもない。

 本発明によると、探索範囲分のローカル モリを実装することによってフレームメモ からのデータ転送のバンド幅を削減したシ テムにおいて、メモリ実装のコストを抑え つ、ダイレクト予測に対応した動き検出装 を提供することができる。

図1は、従来の動画像符号化装置の構成 を示すブロック図である。 図2は、従来の動画像復号化装置の構成 を示すブロック図である。 図3は、動き検出の動作を示す模式図で ある。 図4は、従来の動き検出機能を実現する 第1のブロック図である。 図5は、従来の動き検出を行うためのメ モリ管理を示す第1の模式図である。 図6は、従来の動き検出機能を実現する 第2のブロック図である。 図7は、従来の動き検出を行うためのメ モリ管理を示す第2の模式図である。 図8は、従来の動き検出を行うためのメ モリ管理を示す第3の模式図である。 図9は、従来の動き検出処理を示すフロ ーチャートである。 図10Aは、車窓からの風景を動き検出 る動作を示す模式図である。 図10Bは、車窓からの風景を動き検出 る動作を示す模式図である。 図11は、本発明を実現する第1の動き検 出装置の構成を示すブロック図である。 図12は、動き検出範囲の拡張を示す模 図である。 図13は、本発明の動き検出処理を示す ローチャートである。 図14は、本発明を実現する第2の動き検 出装置の構成を示すブロック図である。 図15は、動き検出範囲の制限を説明す 模式図である。 図16Aは、本発明において車窓からの 景を動き検出する動作を示す模式図である 図16Bは、本発明において車窓からの 景を動き検出する動作を示す模式図である 図17は、H.264レコーダを実現するAV処理 部のブロック図である。 図18Aは、コンピュータシステムによ 本発明を実施する場合の説明図である。 図18Bは、コンピュータシステムによ 本発明を実施する場合の説明図である。 図18Cは、コンピュータシステムによ 本発明を実施する場合の説明図である。

符号の説明

100、200 動き検出器
106 選択器
108 ダイレクト予測器
110 アクセスフラグ記憶部
112、204 ダイレクト判定器
504 マルチフレームメモリ
702 ローカルメモリ
704 通常の動き検出部
802 キャッシュメモリ

 (実施の形態1)
 以下、本発明の実施の形態1について、図11 ら図13を用いて説明する。

 図11は、本発明を実現する第1の動き検出 置の構成を示すブロック図である。同図に いて、図4と同一符号の処理部は同一の機能 を有するものを示し、その説明を適宜省略す る。

 第1の動き検出装置は、マルチフレームメ モリ504と、動き検出器100とを含む。

 動き検出器100は、図4に示した動き検出器 506の構成に加え、さらに、選択器106、ダイレ クト予測器108、アクセスフラグ記憶部110、及 びダイレクト判定器112を含む。

 動き検出器100は、以下で説明する動作を い、ダイレクト予測を含めた動き検出を行 。なお、通常の動き検出部704は第1の動き検 出手段として、ダイレクト予測器108は第2の き検出手段として、選択器106は選択手段と て、アクセスフラグ記憶部110及びダイレク 判定器112は、実行制御手段として機能する

 まず、通常の動き検出を行う場合は、従 技術で説明した処理の流れと同じであり、 ルチフレームメモリ504に記憶されている画 データが、参照画素MEpelとしてローカルメ リ702に一次蓄積される。ローカルメモリ702 蓄積された画素データは、参照画素LMEpelと て通常の動き検出部704に入力される。通常 動き検出部704は、入力された参照画素LMEpel 用いて通常の動き検出を行う。ローカルメ リ702には、探索範囲に相当する分の画素デ タと符号化の対象とするマクロブロックが 動したときに探索範囲として必要となる程 の画素データが蓄えられている。例えば、 5のような領域を探索する例であれば、縦に3 マクロブロック分と横に4マクロブロック分 画素データがローカルメモリ702に格納され と良い。もちろん、探索範囲の広さ等に応 て蓄えられる領域に増減はあり得る。次に 簡略のため空間ダイレクト・モードに絞っ ダイレクト予測を行う場合の説明を続ける

 ダイレクト予測では、周辺マクロブロッ の動きベクトル情報を用いてダイレクト予 用動きベクトルdirMVが決定され、そのダイ クト予測用動きベクトルdirMVがダイレクト判 定器112に入力される。また、ダイレクト予測 を行うか行わないかの制御情報をアクセスフ ラグとしてアクセスフラグ記憶部110に格納し ておく。アクセスフラグはフラグ信号AFsigと てダイレクト判定器112に入力される。

 ダイレクト判定器112におけるアクセスフ グの意味する制御内容は、例えば、以下の1 )~4)など、動き検出器100の実装の仕方に応じ いくつかの内容が考えられる。

 1).ローカルメモリ702の中に、ダイレクト 測で用いる画素データの全てが含まれてい 場合に限りダイレクト予測を行ない、一部 も含まれていない場合にはダイレクト予測 行なわない。

 2).ローカルメモリ702の中に、ダイレクト 測で使う画素データが一部でも含まれてい 場合にはダイレクト予測を行ない、全く含 れていない場合にはダイレクト予測を行わ い。

 3).ローカルメモリ702に格納されている領 から大きく離れたピクチャ空間にダイレク 予測で使う画素データが存在する場合は、 イレクト予測を行わない。

 4).マルチフレームメモリ504とローカルメ リ702との間のバスに対する割当バンド幅に 裕が無い場合はダイレクト予測を行わない

 アクセスフラグを導入する1つの目的は、 マルチフレームメモリ504とローカルメモリ702 との間のデータ転送のバンド幅の増加を抑え るという点にある。例えば、1)のような制御 法を採用した場合には、マルチフレームメ リ504とローカルメモリ702との間のデータ転 のバンド幅を一切増加させないという効果 ある。但し、この制御のみを行うのでは探 範囲内に参照画素が全て含まれるときに限 ダイレクト予測が行われるので、従来と比 して効果は少ない。2)や3)のような制御方法 を採用した場合には、マルチフレームメモリ 504とローカルメモリ702との間のデータ転送の バンド幅の増加を抑えつつ、ダイレクト予測 も可能になるという効果がある。4)のような 御方法を採用した場合にはシステム全体の 況に応じてダイレクト予測を行うことがで るという効果がある。また、1)から4)の制御 を組み合わせることはもちろん可能である。 例えば、バンド幅に余裕がある場合はダイレ クト予測を行うが、バンド幅に余裕がない場 合はローカルメモリ702内にダイレクト予測で 使うデータが全てある場合に限りダイレクト 予測を行う、というような制御を行っても良 い。また、他の制御方法も考えられる。例え ば、ローカルメモリ702内にダイレクト予測で 使うデータが半分以上存在する場合に限りダ イレクト予測を行う、というような制御も考 えられる。

 ダイレクト判定器112は、ダイレクト予測 動きベクトルdirMVとフラグ信号AFsigとに基づ いて、ダイレクト予測を行うか否か及びダイ レクト予測で用いる画素データを何れのメモ リから取得するかを判定し、判定結果を、判 定結果信号DJsigとして選択器106とダイレクト 測器108とに出力する。選択器106は、判定結 信号DJsigに従って、ダイレクト予測で用い 画素データがローカルメモリ702に存在する 合はローカルメモリ702に記憶されている参 画素LMEpelを選択し、選択された参照画素LMEpe lを参照画素DPpelとしてダイレクト予測器108に 出力する。また、選択器106は、ダイレクト予 測で用いる画素データがローカルメモリ702に 存在しない場合は、マルチフレームメモリ504 に記憶されている参照画素MEpelを選択し、選 された参照画素MEpelを参照画素DPpelとしてダ イレクト予測器108に出力する。ダイレクト予 測器108は、入力画素データの参照画素DPpelを いて動き補償を行い、予測画像を作り出す

 最終的に、動き検出器100では、図示しな 判定器によって、通常の動き検出部704を用 た場合の符号化コストと、ダイレクト予測 108を用いた場合の符号化コストとが比較さ 、符号化コストの小さい方がモード判定結 として採用される。通常の動き検出が採用 れた場合は、図1に示した従来の動画像符号 化装置の処理の流れと同様に、動きベクトル MVが出力され、予測動きベクトルPredMVとの差 である動きベクトル予測差分DifMVが符号化 れる。また、ダイレクト予測が採用された 合には動きベクトル予測差分DifMVを符号化す る必要は無く、符号量の削減を行う事が可能 となる。

 以上のような符号化処理を行うことによ て、マルチフレームメモリ504とローカルメ リ702とのバンド幅を最小限に抑制しつつ、 ーカルメモリ702に存在しない領域をダイレ ト予測することも可能とすることによって 符号量の削減を実現することができる。

 図12は動き検出範囲の拡張を示す模式図 あり、前述の動作を視覚的に説明している また、図13は本発明の動き検出処理を示すフ ローチャートである。以下では、図12及び図1 3を用いて動作を説明する。図12において、フ レームF2N-1とフレームF2Nは、符号化を行うピ チャであり、フレームF2N-1は時間的にフレ ムF2Nよりも過去のピクチャを示している。

 例えば、フレームF2Nのマクロブロックmb2 符号化を行う場合、通常の動き検出部704は フレームF2N-1を参照画像として通常の動き 出を行うためにローカルメモリ702に蓄えら ている動きベクトル探索範囲srchArea内の参照 画素LMEpelを用いて動きベクトルを探索する。 探索の結果、通常の動き検出部704は、マクロ ブロックmb2と楕円の一部が含まれる領域srchBl ockとの相関が高いと判定し、動きベクトルMV 検出する(S301)。

 一方、ダイレクト予測ではローカルメモ 702に含まれる範囲から拡張された領域dirArea までを参照画像として使用することができる 。本発明の実施の形態1では、マルチフレー メモリ504に含まれる範囲を参照することも きるので、フレームF2N-1の全てから参照する ことも可能であるが、ここでは上述の3)のよ な制御を行い、拡張された領域dirAreaをダイ レクト予測で使用できる範囲に制限した場合 を例にとって図示している。

 次に、ダイレクト判定器112は、拡張され 領域dirAreaにダイレクト予測で生成されるダ イレクト予測用動きベクトルdirMVが含まれる どうかを判定する(S302)。ダイレクト予測で 成されるダイレクト予測用動きベクトルdirM Vが拡張された領域dirAreaに含まれると判定さ た場合には(S302でYes)、選択器106は、マルチ レームメモリ504からダイレクト予測参照領 dirBlockの画素データの取得を行う。また、 イレクト予測器108は、符号化コストを算出 る(S303)。

 ダイレクト予測で生成されるダイレクト 測用動きベクトルdirMVが拡張された領域dirAr eaに含まれないと判定された場合には(S302でNo )、ダイレクト予測器108は、ダイレクト予測 符号化モードの候補から除外する(S304)。こ で、S301を含むプロセスP300と、S302~S304を含む プロセスP301とは並列に処理することも可能 ある。

 プロセスP300とプロセスP301が終了すると 動きベクトルMVを採用した場合の符号化コス トとダイレクト予測を行った場合の符号化コ ストとが比較される(S305)。

 ダイレクト予測の符号化コストが優れて ると判定された場合は(S305でYes)、ダイレク 予測として動きベクトル予測差分DifMVを符 化することなく符号化処理が行なわれる(S306 )。また、通常の動き検出の符号化コストが れていると判定された場合は、通常の画面 予測として動きベクトル予測差分DifMVまで含 めて符号化処理が行なわれる(S307)。ただし、 S304においてダイレクト予測が符号化モード 候補から除外されている場合には、S305で符 化コストの判定を行うことなくS307において 通常の画面間予測として符号化処理が行なわ れる。

 なお、実施の形態1ではダイレクト予測器 108に入力する画素データの入力元を選択器106 で切り替えることとしたが、ダイレクト予測 を行う時は常にマルチフレームメモリ504から 画素データを取得するような構成にしても良 い。この構成によると、データ取得経路を簡 単化することができる。また、一般的にロー カルメモリ702と通常の動き検出部704との間の 画素データ転送には定常的に最大限のバス幅 を使用している構成となっている可能性があ る。このため、ダイレクト予測時にマルチフ レームメモリ504より画素データを取得するこ ととしても、ローカルメモリ702と通常の動き 検出部704のバス転送能力に影響を与えない。

 なお、本実施の形態における動き検出器1 00は、内部でのバス転送能力(例えばローカル メモリ702から通常の動き検出部704への画素デ ータ転送)を確保するために1チップで構成す ことが望ましい。一方でマルチフレームメ リ504は大容量が必要であるので別チップと て外付けするのが一般的である。

 (実施の形態2)
 次に、本発明の実施の形態2について、図14 ら図16Bを用いて説明する。

 図14は、本発明を実現する第2の動き検出 置の構成を示すブロック図である。同図に いて、図11と同一符号の処理部は同一の機 を有するものを示し、その説明を適宜省略 る。

 第2の動き検出装置は、マルチフレームメ モリ504と、動き検出器200とを含む。

 動き検出器200は、図11に示した動き検出 100の構成に加え、マルチフレームメモリ504 ローカルメモリ702の間に、さらにキャッシ メモリ802を含む。また、動き検出器200には 動き検出器100に存在したアクセスフラグ記 部110が存在しない。キャッシュメモリ802の 憶容量は、ローカルメモリ702の記憶容量よ 大きく、かつマルチフレームメモリ504の記 容量より小さい。

 動き検出器200は、以下で説明する動作を い、ダイレクト予測を含めた動き検出を行 。なお、通常の動き検出部704は第1の動き検 出手段として、ダイレクト予測器108は第2の き検出手段として、選択器106は選択手段と て、ダイレクト判定器204は第2の動き検出可 判定手段として、機能する。

 まず、通常の動き検出を行う場合は、従 技術で説明した処理の流れと同じであり、 ルチフレームメモリ504に記憶されている画 データが、参照画素MEpelとしてキャッシュ モリ802に一次蓄積される。マルチフレーム モリ504に蓄積された画素データは、参照画 CMEpelとしてローカルメモリ702に二次蓄積さ る。ローカルメモリ702に蓄積された画素デ タは、参照画素LMEpelとして通常の動き検出 704に入力される。通常の動き検出部704は、 力された参照画素LMEpelを用いて通常の動き 出を行う。ローカルメモリ702には、探索範 に相当する分の画素データと符号化の対象 するマクロブロックが移動したときに探索 囲として必要となる程度の画素データが蓄 られている。例えば、図5のような領域を探 する例であれば、縦に3マクロブロック分と 横に4マクロブロック分の画素データがロー ルメモリ702に格納されると良い。もちろん 探索範囲の広さ等に応じて蓄えられ領域に 減はあり得る。一方、ダイレクト予測を行 場合について次に説明するが、実施の形態1 同じく簡略のため空間ダイレクト・モード 絞って説明を続ける。

 ダイレクト予測では、周辺マクロブロッ の動きベクトル情報を用いてダイレクト予 用動きベクトルdirMVが決定され、そのダイ クト予測用動きベクトルdirMVがダイレクト判 定器204に入力される。

 ダイレクト判定器204は、ダイレクト予測 動きベクトルdirMVに基づいて、ダイレクト 測を行うか否か及びダイレクト予測で用い 画素データを何れのメモリから取得するか 判定し、判定結果を、判定結果信号DJsigとし て選択器106とダイレクト予測器108とに出力す る。選択器106は、判定結果信号DJsigに従って ダイレクト予測で用いる画素データがロー ルメモリ702に存在する場合はローカルメモ 702に記憶されている参照画素LMEpelを選択し 選択された参照画素LMEpelを参照画素DPpelと てダイレクト予測器108に出力する。また、 択器106は、ダイレクト予測で用いる画素デ タがローカルメモリ702に存在せず、キャッ ュメモリ802に存在する場合は、キャッシュ モリ802に記憶されている参照画素CMEpelを選 し、参照画素DPpelとしてダイレクト予測器108 に出力する。ダイレクト予測器108は、入力画 素データの参照画素DPpelを用いて動き補償を い、予測画像を作り出す。

 最終的に動き検出器200では、図示しない 定器によって、通常の動き検出部704を用い 場合の符号化コストと、ダイレクト予測器1 08を用いた場合の符号化コストとが比較され 符号化コストの小さい方がモード判定結果 して採用される。通常の動き検出では、従 の動画像符号化装置を表す図1に示している 流れと同様に、動きベクトルMVが出力され、 測動きベクトルPredMVとの差分である動きベ トル予測差分DifMVが符号化される。また、 イレクト予測が選択された場合には動きベ トル予測差分DifMVを符号化する必要は無く、 符号量の削減を行う事が可能となる。

 本実施の形態の1つの特徴はマルチフレー ムメモリ504ではなく、キャッシュメモリ802か らのみダイレクト予測に用いる画素データを 取得する構成としている点にある。マルチフ レームメモリ504は通常は外部メモリとして外 付けされることが多いため、画素データを転 送するバンド幅を確保することが難しい。し かしながら、本実施の形態の構成にすれば外 付けメモリとの間の転送のバンド幅を一切増 加させることなく、探索範囲外からもダイレ クト予測を行うことが可能となる。なお、実 施の形態1と組み合わせてマルチフレームメ リ504からもダイレクト予測が実行できる構 としたときは実施の形態1と同様の効果があ 。

 さらに、キャッシュメモリ自体は通常の き予測における転送のバンド幅を確保する めにも寄与しているので、ダイレクト予測 対応するための追加のメモリの実装コスト 特に必要がないという利点もある。

 以上のような符号化処理を行うことによ て、マルチフレームメモリ504の転送量の増 を行うことなくダイレクト予測の範囲を拡 でき、また、キャッシュメモリ802とローカ メモリ702とのバンド幅を最小限に抑制しつ 、ローカルメモリ702に存在しない領域をダ レクト予測することも可能とする。これら よって、符号量の削減を実現することが可 となる。

 なお、本実施の形態ではダイレクト予測 108に入力する画素データの入力元を選択器1 06で切り替えることとしたが、ダイレクト予 を行う時は常にキャッシュメモリ802から画 データを取得するような構成にしても良い すなわち、ローカルメモリ702から選択器106 のパスが存在しないような構成である。こ 構成にすることにより、データ取得経路の 単化ができる。また、一般的にローカルメ リ702と通常の動き検出部704との間の画素デ タ転送には定常的に最大限のバス幅を使用 ている構成となっている可能性がある。こ ため、このような構成にしても、ローカル モリ702と通常の動き検出部704のバス転送能 に影響を与えない。

 なお、本実施の形態における動き検出器2 00は、内部でのバス転送能力(例えばローカル メモリ702から通常の動き検出部704への画素デ ータ転送)を確保するために1チップで構成す ことが望ましい。一方でマルチフレームメ リ504は大容量が必要であるので別チップと て外付けするのが一般的である。

 なお、本実施の形態では、マルチフレー メモリ504とローカルメモリ702の間に明示的 キャッシュメモリ802を設ける構成を示した 、キャッシュメモリ802が蓄積するラインバ ファに相当する程度の領域に含まれる画素 ータを、ローカルメモリ702が蓄える構成と ても良い。しかし、この場合にローカルメ リ702内に記憶されている画素データの画像 での範囲を探索範囲とすると、通常の動き 出部704とローカルメモリ702との転送のバン 幅が極度に増大してしまう。よって、通常 動き検出部704では、ローカルメモリ702が蓄 る画素データのうち、上述の実施の形態で した程度の特定の探索範囲のみから動き検 を行い(図5の例であれば縦に3マクロブロッ 、横に3マクロブロックに相当する程度の範 囲)、ダイレクト予測器108は、ローカルメモ 702に含まれるラインバッファの全ての領域 らダイレクト予測を行うような構成にして 良い。この場合、ローカルメモリ702の出力 のバンド幅が増加するが、全体的なメモリ を減らしつつ外部メモリのバンド幅の増加 くダイレクト予測の性能を向上することが 能である。なお、この構成においても後述 るようにダイレクト予測を行う範囲を制限 ればダイレクト判定器204の制御を容易にす ことが可能である。

 (探索拡張範囲の制約追加)
 実施の形態2の構成では、キャッシュメモリ 802を用いることでマルチフレームメモリ504と の間の画素データ転送量を最大限に削減しつ つ、ダイレクト予測の予測可能範囲を拡張し ている。ここで、ダイレクト予測の拡張範囲 に制約を追加することにより、ダイレクト判 定器204の制御が容易になり、さらに実装面で 利点がある。以下、ダイレクト予測の予測可 能拡張範囲の制約について説明を続ける。

 図15は動き検出範囲の制限を説明する模 図である。図15(a)~図15(c)は、ローカルメモリ 702の画素制御内容をマクロブロック単位の時 系列で記載したものである。図15(a)では、画 左端のマクロブロック1002を右側にシフトさ せたマクロブロック1004を探索中心とした場 の領域1006(3マクロブロック×3マクロブロッ )が動き検出範囲となっている。また、斜線 示している3マクロブロック分の領域1008が のマクロブロック処理(図15(b))を行うために 事前に取得されていることを示している。 モリ管理状態は、図15(a)から図15(b)、図15(c) 状態に遷移していく。

 図15(d)~図15(f)は、図15(a)~図15(c)と同様にマ クロブロック毎のローカルメモリ702の探索範 囲の管理状態を示しているのに加え、主に横 線をつけた領域1010を含むキャッシュメモリ80 2の状態も追加で記載している。これらの図 、キャッシュメモリ802が、例えば(ピクチャ ×3マクロブロックライン)のメモリ容量を実 装している場合の状態を表している。図15(d) ら図15(e)、図15(f)と探索中心のマクロブロッ ク1004が右側にシフトして行くに従い、上段 チェックで示した論理領域1012が格納されて る物理メモリ領域に、下段のチェックをつ た論理領域1014の画像情報を格納していくこ とによって、メモリ状態を更新していく様子 を表している。

 図15(d)~図15(f)のような管理で、ダイレク 予測の予測可能範囲をキャッシュメモリ802 含まれるもの全てとした場合、前述のメモ 状態を更新している論理領域1012及び1014での 更新タイミングによっては、ダイレクト予測 が難しくなる。また、キャッシュメモリ802に 格納されている領域は矩形では無いため、ダ イレクト判定器204による領域判定が複雑なも のとなる。

 そこで、動き検出のための探索範囲の右 に拡張するダイレクト予測の予測可能拡張 囲を、ローカルメモリ702に格納されている 索範囲から固定マクロブロック列分までの 域拡張に制限する。これによって、画素デ タの更新タイミングやダイレクト予測領域 上下位置を取得可能判定処理に加える必要 なくなる為、ダイレクト判定器204の実装を 易化することが可能となる。例えば、図15(d )~図15(f)において探索範囲から2マクロブロッ 列分1016までの領域にダイレクト予測の右側 の予備拡張範囲を制限すれば、更新のタイミ ングを気にする必要はなくなる。もちろん、 どの範囲にまで制限するべきかについては、 キャッシュメモリ802のメモリ容量や更新のア ルゴリズムに応じて適宜変更すればよい。

 また、図15(g)~図15(i)は、図15(a)~図15(c)と同 様にマクロブロック毎のローカルメモリ702の 探索範囲の管理状態を示しているのに加え、 主に横線をつけた領域1018を含むキャッシュ モリ802の状態も追加記載している。図15(d)~ 15(f)と異なるのは図8で説明したメモリ管理 よってキャッシュメモリ802の実装容量を削 している点である。キャッシュメモリ802が 例えば(ピクチャ幅×3マクロブロックライン- α)のメモリ容量を実装している場合の状態を 表している。図15(g)から図15(h)、図15(i)に探索 中心のマクロブロック1004を右側にシフトし 行くに従い、上段のチェックで示した論理 域1020が格納されている物理メモリ領域に、 段のチェックをつけた論理領域1022の画像情 報を格納していくことで、メモリ状態を更新 していく様子を表している。

 図15(g)~図15(i)のような管理を行う前提で ダイレクト予測の予測可能範囲をキャッシ メモリ802に含まれるもの全てとした場合、 き検出のための探索範囲から左側に関して 、前述のメモリ状態を更新しているチェッ で示した論理領域1020及び1022の更新タイミン グによっては、ダイレクト判定が難しくなる 。また、同様にキャッシュメモリ802に格納さ れている領域が矩形では無いため、ダイレク ト判定器204による領域判定が複雑なものとな る。

 そこで、動き検出のための探索範囲の左 に拡張するダイレクト予測の予測可能拡張 囲を、ローカルメモリ702に格納されている 索範囲から固定マクロブロック列分までの 域拡張に制限する。これによって、画素デ タの更新タイミングやダイレクト予測領域 上下位置を取得可能判定処理に加える必要 なくなる為、ダイレクト判定器204の実装を 易化することが可能となる。例えば、図15(d )~図15(f)において探索範囲から右側に2マクロ ロック列分1024、左側に1マクロブロック列 1026までの領域にダイレクト予測の予備拡張 囲を制限すれば更新のタイミングを気にす 必要はなくなる。もちろん、どの範囲にま 制限するべきかについては、キャッシュメ リ802のメモリ容量や更新のアルゴリズムに じて適宜変更すればよい。

 なお、動き検出のための探索範囲を拡張 たダイレクト予測の予備拡張範囲を縦方向 制限することも可能である。例えば、図15(d )~図15(f)のような管理を考えた場合、キャッ ュメモリ802に蓄えられている領域のうち最 行のマクロブロックと最下行のマクロブロ クは対象マクロブロックが移るにつれて更 されていくが、中央の2マクロブロック行に いては更新されない。そこで、ダイレクト 測の予備拡張範囲を中央の2マクロブロック 行分のマクロブロックに制限することで、ダ イレクト判定器204は容易にダイレクト予測を 行うかどうかを判定することができる。もち ろん、どの範囲にまで制限するべきかについ ては、キャッシュメモリ802のメモリ容量や更 新のアルゴリズムに応じて適宜変更すればよ い。さらに、制限範囲は縦方向のみ、あるい は横方向のみに限られるものではなく、キャ ッシュメモリ802のメモリ容量や更新のアルゴ リズムによっては、縦方向と横方向の双方に 制限をかけることでダイレクト判定器204の判 定をさらに容易にすることが可能である。

 (本実施の形態の車窓の画像への適用)
 図16A及び図16Bは、本発明において車窓から 風景の動き検出する動作を示す模式図であ 。図16Aにおいて、フレームF6N-1は、図10Aに したフレームF18N-1と同一の参照画像を示す 領域P600はキャッシュメモリ802で管理してい 領域を示す。領域P601は前述したダイレクト 判定器204においてダイレクト予測の予測格納 拡張範囲に制限を加えた領域を示す。また、 同図には、探索中心となるマクロブロックP60 2と、動き検出を行なう探索範囲P603と、図10B 示したフレームF18Nの符号化対象のマクロブ ロックP1805と同じ空間上の位置の周辺P604と、 ダイレクト予測で選択される位置P605とが示 れている。ここでは、図10A及び図10Bと同様 、探索中心が右側にシフトしている状態を 定している。

 図16Bは、フレームF18Nにおける符号化対象 マクロブロックcurrMB(マクロブロック1805)と、 その周辺マクロブロックである左隣接マクロ ブロックmb6Aと、上隣接マクロブロックmb6Bと 右上隣接マクロブロックmb6Cとを示している 。説明の簡略のため、例えば、全体の動きに 同期して探索中心がずれてしまっているため 、左隣接マクロブロックmb6A、上隣接マクロ ロックmb6B及び右上隣接マクロブロックmb6Cか らなる周辺マクロブロックは、一致する参照 画像がフレームF6N-1から得られていないとし それぞれ画面内予測が適応されていると仮 する。

 上記仮定のもと、符号化対象マクロブロ クcurrMBに対する処理を行う場合、周辺マク ブロックの符号化モードが全て画面内予測 なっている。このため、空間ダイレクト・ ードにおける予測動きベクトルは0ベクトル となる。ここで、動き検出を行う探索範囲P60 3が、周辺マクロブロックに対する動き検出 囲と同様に右側にずれてしまっていると仮 すると、探索範囲P603の中からは符号化コス が高くなってしまった参照画像が選択され 。

 ここで、ダイレクト予測のために生成す 動きベクトルは0ベクトルであり、ダイレク ト判定器204は、ダイレクト予測で選択される 位置P605がダイレクト予測の予測格納拡張範 に制限を加えた領域P601に含まれるかどうか 判断する。その結果として、位置P605が領域 P601に含まれると判断されれば、ダイレクト 測として符号化を行う。これによって、画 内予測を行うよりも格段に符号化ビット量 削減したダイレクト予測による符号化を行 ことが可能となる。

 なお、ブロック図(図11や図14など)の各機 ブロックは典型的には集積回路であるLSIと て実現される。これらは個別に1チップ化さ れても良いし、一部または全てを含むように 1チップ化されても良い。マルチフレームメ リ504などは大容量となるため、LSIに外付け る大容量のSDRAMなどで実装することもあるが 、1パッケージ化や1チップ化されることも有 得る。

 また、ここではLSIとしたが、集積度の違 により、IC、システムLSI、スーパーLSI、ウ トラLSIと呼称されることもある。また、集 回路化の手法はLSIに限るものではなく、専 回路または汎用プロセッサで実現してもよ 。LSI製造後に、プログラムすることが可能 FPGA(Field Programmable Gate Array)や、LSI内部の回 路セルの接続や設定を動的に再構成可能なリ コンフィギュラブル・プロセッサを利用して も良い。さらには、半導体技術の進歩または 派生する別技術によりLSIに置き換わる集積回 路化の技術が登場すれば、当然、その技術を 用いて機能ブロックの集積化を行ってもよい 。バイオ技術の適応等が可能性としてありえ る。

 (応用例1)
 上記の動き検出装置を含む動画像符号化装 の応用例について説明する。

 図17は、H.264レコーダを実現するAV処理部 ブロック図である。AV処理部400は、ディジ ル圧縮された音声及び画像を再生するDVDレ ーダやハードディスクレコーダなどのAV処理 部を示している。

 AV処理部400は、ストリーム入出力部402と メモリ入出力部404と、AV制御部406と、画像符 号化復号化部408と、音声符号化復号化部410と 、画像処理部412と、画像入出力部414と、音声 処理部416と、音声入出力部418とを含む。

 ストリーム入出力部402は、音声と画像の トリームデータexStrを入出力する処理部で り、ストリームデータや音声・画像の復号 ータなどのデータを転送するバスexBusと、大 容量蓄積デバイス(図示せず)とに接続されて る。

 画像符号化復号化部408は、画像の符号化 び復号化を行う処理部であり、バスexBusに 続されている。

 AV処理部400の外務には、ストリームデー や符号化データや復号化データなどのデー を格納するメモリ390が設けられており、メ リ入出力部404を介して、バスexBusに接続され ている。

 ここで、画像符号化復号化部408は図11と 14に示した動き検出装置を含むものである。 ストリームデータexStrは、符号化信号Strを含 でおり、メモリ390は図11に示しているマル フレームメモリ504が含まれるものである。

 画像処理部412は、画像信号に対してプレ 理及びポスト処理を行う処理部であり、バ exBusに接続されている。画像入出力部414は 画像処理部412で処理したもしくは画像処理 412で処理をせずに通過だけさせた画像デー 信号を画像信号exVSigとして外部に出力する また、画像入出力部414は、外部からの画像 号exVSigを取り込む。

 音声処理部416は、音声信号exASigに対して レ処理及びポスト処理を行う処理部であり バスexBusに接続されている。音声入出力部41 8は、音声処理部416で処理したもしくは音声 理部416で処理をせずに通過だけさせた音声 ータ信号を外部に音声信号exASigとして出力 る、また、音声入出力部418は、外部からの 声信号exASigを取り込む。また、AV制御部406は 、AV処理部400の全体制御を行う処理部である

 符号化処理においては、最初に画像信号e xVSigが画像入出力部414に入力され、音声信号e xASigが音声入出力部418に入力される。

 まず記録処理では、画像入出力部414に入 された画像信号exVSigを用いて、画像処理部4 12においてフィルタ処理や符号化のための特 量抽出などが行なわれる。また、特徴量抽 後の画像信号exVSigは、メモリ入出力部404を してメモリ390に原画像として格納される。 に、再びメモリ入出力部404を介してメモリ3 90から画像符号化復号化部408に、原画像デー と参照画像データの転送が行なわれる。逆 、画像符号化復号化部408からメモリ390には 像符号化復号化部408で符号化された画像ス リームデータと局所復元データとが転送さ る。

 一方、音声入出力部418に入力された音声 号exASigを用いて、音声処理部416においてフ ルタ処理や符号化のための特徴量抽出など 行われ、特徴量抽出された音声信号exASigは メモリ入出力部404を介してメモリ390に原音 データとして格納される。次に、再びメモ 入出力部404を介してメモリ390から原音声デ タを取り出して符号化し、符号化された音 データが、再度、音声ストリームデータと てメモリ390に格納される。

 符号化処理の最後に、画像ストリーム、 声ストリーム及びその他のストリーム情報 一つのストリームデータとして処理し、ス リーム入出力部402を介してストリームデー exStrを出力し、光ディスク(DVD)やハードディ スク(HDD)などの大容量蓄積デバイスに書き込 処理が行なわれる。

 次に、復号化処理では以下のような動作 行う。まず、光ディスクやハードディスク 半導体メモリなどの大容量蓄積デバイスか 、記録処理で蓄積しているデータの読み出 を行うことにより音声及び画像のストリー 信号が、ストリーム入出力部402を介してス リームデータexStrが入力される。そのスト ームデータexStrに含まれる画像ストリームは 画像符号化復号化部408に入力され、音声スト リームは音声符号化復号化部410に入力される 。

 画像符号化復号化部408によって復号化さ た画像データはメモリ入出力部404を介して モリ390に格納される。メモリ390に格納され データは画像処理部412でノイズ除去などの 工処理を行う。また、メモリ390に格納され 画像データは再び画像符号化復号化部408に いて、画面間動き補償予測の参照ピクチャ して使用されることもある。

 また、音声符号化復号化部410によって復 化された音声データはメモリ入出力部404を してメモリ390に格納される。メモリ390に格 されたデータに対して、音声処理部416で音 などの加工処理が施される。

 最後に、音声と画像の時間的な同期をと ながら、画像処理部412で加工処理したデー は画像入出力部414を介して画像信号exVSigと て出力され、テレビ画面などに表示される 音声処理部416で加工処理したデータは音声 出力部418を介して音声信号exASigとして出力 れ、最終的にはスピーカなどから出力され 。

 (応用例2)
 さらに、上記各実施の形態で示した動画像 号化装置をソフトウェアにより実現するた のプログラムを、フレキシブルディスク等 記憶媒体に記録するようにすることにより 上記各実施の形態で示した処理を、独立し コンピュータシステムにおいて簡単に実施 ることが可能となる。

 図18A~図18Cは、上記実施の形態1から実施 形態2の動画像復号化装置を実現するプログ ムを格納したフレキシブルディスクを用い 、コンピュータシステムにより実施する場 の説明図である。

 図18Aは、フレキシブルディスクの正面か みた外観、断面構造、及びフレキシブルデ スクを示し、図18Bは、記録媒体本体である レキシブルディスクの物理フォーマットの を示している。フレキシブルディスクFDは ースF内に内蔵され、該ディスクの表面には 同心円状に外周からは内周に向かって複数 トラックTrが形成され、各トラックは角度 向に16のセクタSeに分割されている。従って 上記プログラムを格納したフレキシブルデ スクでは、上記フレキシブルディスクFD上 割り当てられた領域に、上記プログラムと ての動画像復号化装置が記録されている。

 また、図18Cは、フレキシブルディスクFD 上記プログラムの記録再生を行うための構 を示す。上記プログラムをフレキシブルデ スクFDに記録する場合は、コンピュータシス テムCsから上記プログラムとしての動画像復 化装置を、フレキシブルディスクドライブ 介して書き込む。また、フレキシブルディ ク内のプログラムにより動画像復号化装置 コンピュータシステム中に構築する場合は フレキシブルディスクドライブによりプロ ラムをフレキシブルディスクから読み出し コンピュータシステムに転送する。

 なお、上記説明では、記録媒体としてフ キシブルディスクを用いて説明を行ったが 光ディスクを用いても同様に行うことがで る。また、記録媒体はこれに限らず、ICカ ド、ROMカセット等、プログラムを記録でき ものであれば同様に実施することができる

 本発明の動き検出装置は、通常の動き検 対応範囲を越えた参照画像空間に関して、 イレクト予測を活用することによって、外 メモリもしくは内部の広域なキャッシュメ リから画素データを取得し、外部メモリと 転送バンド幅を殆ど増加することなく、ま 実装メモリ量を増加することなく、画面間 測の対象範囲を拡張することが可能とする

 今回開示された実施の形態はすべての点 例示であって制限的なものではないと考え れるべきである。本発明の範囲は上記した 明ではなくて請求の範囲によって示され、 求の範囲と均等の意味及び範囲内でのすべ の変更が含まれることが意図される

 本発明は、例えば、H.264規格を用いたHD画 像サイズなどの大画角なピクチャサイズに対 応したムービー及びレコーダ等に適用できる 。