Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
MUSIC PLAYBACK DEVICE, MUSIC PLAYBACK METHOD, MUSIC PLAYBACK PROGRAM, AND INTEGRATED CIRCUIT
Document Type and Number:
WIPO Patent Application WO/2009/104402
Kind Code:
A1
Abstract:
A music playback device (200) is equipped with an sound/silence judgment unit (211) that evaluates a plurality of frames that are contained in first and second output PCM data and determines whether they are sound frames that contain samples having output level above a threshold value, a juncture extraction unit (212) that extracts, from at least the sound frames, juncture candidates, which are samples with the greatest amount of change in the PCM waveform slope, a song-end detection unit (213) that uses the juncture candidate contained in the last sound frame of the first output PCM data as a first juncture, and makes the juncture candidate contained in the first sound frame of the second output PCM into a juncture, and a continuous song output unit (209) that performs playback with the first and second output PCM data joined together at the first and second junctures.

Inventors:
KAWAKAMI TAKAHIRO
MORIOKA MASAAKI
NAKAHASHI JUNICHI
KIMURA YUKIHIKO
Application Number:
PCT/JP2009/000709
Publication Date:
August 27, 2009
Filing Date:
February 19, 2009
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
PANASONIC CORP (JP)
KAWAKAMI TAKAHIRO
MORIOKA MASAAKI
NAKAHASHI JUNICHI
KIMURA YUKIHIKO
International Classes:
G10L13/02; G10L19/00; G10L19/02
Foreign References:
JP2007179604A2007-07-12
JP2008020863A2008-01-31
JP2007179604A2007-07-12
Attorney, Agent or Firm:
NII, Hiromori (JP)
New house extensive 守 (JP)
Download PDF:
Claims:
 PCM(Pulse Code Modulation)形式のソース音源が分割され、個別に符号化及び復号化されることによって生成される第1及び第2の出力PCMデータを取得して再生する音楽再生装置であって、
 前記第1及び第2の出力PCMデータそれぞれの両端部には、出力レベルが予め定めた閾値未満の区間である無音部と、分割された前記ソース音源それぞれの曲端部に相当する部分及び前記無音部を接続する遷移部とが含まれており、
 前記音楽再生装置は、
 前記第1及び第2の出力PCMデータに含まれる複数のフレームそれぞれについて、出力レベルが前記閾値以上のサンプルを含む有音フレームであるか否かを判定する有音/無音判定部と、
 少なくとも前記有音フレームについて、PCM形式の波形の傾きの変化量が最も大きいサンプルである接合点候補を抽出する接合点抽出部と、
 前記第1の出力PCMデータの最後の前記有音フレームに含まれる前記接合点候補を第1の接合点とし、前記第2の出力PCMデータの最初の前記有音フレームに含まれる前記接合点候補を第2の接合点とする曲端検出部と、
 前記第1及び第2の出力PCMデータを前記第1及び第2の接合点で接合して再生する楽曲連続出力部とを備える
 音楽再生装置。
 前記第1及び第2の出力PCMデータは、前記ソース音源を分割して符号化及び復号化したことにより、分割された前記ソース音源それぞれの曲端部に相当する区間の波形に波形歪みが生じており、
 該音楽再生装置は、さらに、前記波形歪みが生じている区間の波形を、中央部に近づくほど傾きが大きくなる3次曲線である補完波形に置換する補完波形作成部を備える
 請求項1に記載の音楽再生装置。
 前記補完波形作成部は、前記波形歪みが生じている区間の時間間隔より長い時間Tの値を予め保持しており、
 前記第1の出力PCMデータにおいて、前記第1の接合点から前方に時間2T離れたサンプルより後方で、且つ前記第1の接合点から前方に時間T離れたサンプルより前方のサンプルであって、PCM形式の波形の傾きが最も小さいサンプルを補完波形作成開始点として抽出し、
 前記第1の接合点を補完波形作成終了点として抽出し、
 前記補完波形作成開始点と前記補完波形作成終了点との間の区間を、両者を接続する前記補完波形に置換する
 請求項2に記載の音楽再生装置。
 前記補完波形作成部は、前記第2の出力PCMデータにおいて、
 前記第1の出力PCMデータの第1の接合点を補完波形作成開始点として抽出し、
 前記補完波形作成開始点から後方に時間T離れたサンプルより後方で、且つ前記補完波形作成開始点から後方に時間2T離れたサンプルより前方のサンプルであって、PCM形式の波形の傾きが最も小さいサンプルを補完波形作成終了点として抽出し、
 前記補完波形作成開始点と前記補完波形作成終了点との間の区間を、両者を接続する前記補完波形に置換する
 請求項3に記載の音楽再生装置。
 前記接合点抽出部は、前記フレームに含まれるN(Nは自然数)番目のサンプル、(N+1)番目のサンプル、及び(N+2)番目のサンプルを含む区間について、隣接するサンプルのサンプル値の差である波形変化量と、隣接する前記波形変化量の差である波形変化加速度とをそれぞれ算出し、前記波形変化加速度が最も大きい区間における(N+2)番目のサンプルを前記接合点候補として抽出する
 請求項1に記載の音楽再生装置。
 該音楽再生装置は、さらに、前記第1の出力PCMデータにおいて、前記曲端検出部によって検出された前記第1の接合点より後方の全てのサンプルを除去すると共に、前記第2の出力PCMデータにおいて、前記曲端検出部によって検出された前記第2の接合点より前方の全てのサンプルを除去するギャップ除去部を備える
 請求項1に記載の音楽再生装置。
 PCM(Pulse Code Modulation)形式のソース音源が分割されて個別に符号化及び復号化されることによって生成される第1及び第2の出力PCMデータを取得して再生する音楽再生方法であって、
 前記第1及び第2の出力PCMデータそれぞれの両端部には、出力レベルが予め定めた閾値未満の区間である無音部と、分割された前記ソース音源それぞれの曲端部に相当する部分及び前記無音部を接続する遷移部とが含まれており、
 前記音楽再生方法は、
 前記第1及び第2の出力PCMデータに含まれる複数のフレームそれぞれについて、出力レベルが前記閾値以上のサンプルを含む有音フレームであるか否かを判定する有音/無音判定ステップと、
 少なくとも前記有音フレームについて、PCM形式の波形の傾きの変化量が最も大きいサンプルである接合点候補を抽出する接合点抽出ステップと、
 前記第1の出力PCMデータの最後の前記有音フレームに含まれる前記接合点候補を第1の接合点とし、前記第2の出力PCMデータの最初の前記有音フレームに含まれる前記接合点候補を第2の接合点とする曲端検出ステップと、
 前記第1及び第2の出力PCMデータを前記第1及び第2の接合点で接合して再生する楽曲連続出力ステップとを含む
 音楽再生方法。
 PCM(Pulse Code Modulation)形式のソース音源が分割されて個別に符号化及び復号化されることによって生成される第1及び第2の出力PCMデータトラックを取得して、コンピュータに再生させるプログラムであって、
 前記第1及び第2の出力PCMデータそれぞれの両端部には、出力レベルが予め定めた閾値未満の区間である無音部と、分割された前記ソース音源それぞれの曲端部に相当する部分及び前記無音部を接続する遷移部とが含まれており、
 前記プログラムは、
 前記第1及び第2の出力PCMデータに含まれる複数のフレームそれぞれについて、出力レベルが前記閾値以上のサンプルを含む有音フレームであるか否かを判定する有音/無音判定ステップと、
 少なくとも前記有音フレームについて、PCM形式の波形の傾きの変化量が最も大きいサンプルである接合点候補を抽出する接合点抽出ステップと、
 前記第1の出力PCMデータの最後の前記有音フレームに含まれる前記接合点候補を第1の接合点とし、前記第2の出力PCMデータの最初の前記有音フレームに含まれる前記接合点候補を第2の接合点とする曲端検出ステップと、
 前記第1及び第2の出力PCMデータを前記第1及び第2の接合点で接合して再生する楽曲連続出力ステップとを含む
 プログラム。
 PCM(Pulse Code Modulation)形式のソース音源が分割されて個別に符号化及び復号化されることによって生成される第1及び第2の出力PCMデータを取得して再生する集積回路であって、
 前記第1及び第2の出力PCMデータそれぞれの両端部には、出力レベルが予め定めた閾値未満の区間である無音部と、分割された前記ソース音源それぞれの曲端部に相当する部分及び前記無音部を接続する遷移部とが含まれており、
 前記音楽再生装置は、
 前記第1及び第2の出力PCMデータに含まれる複数のフレームそれぞれについて、出力レベルが前記閾値以上のサンプルを含む有音フレームであるか否かを判定する有音/無音判定部と、
 少なくとも前記有音フレームについて、PCM形式の波形の傾きの変化量が最も大きいサンプルである接合点候補を抽出する接合点抽出部と、
 前記第1の出力PCMデータの最後の前記有音フレームに含まれる前記接合点候補を第1の接合点とし、前記第2の出力PCMデータの最初の前記有音フレームに含まれる前記接合点候補を第2の接合点とする曲端検出部と、
 前記第1及び第2の出力PCMデータを前記第1及び第2の接合点で接合して再生する楽曲連続出力部とを備える
 集積回路。
Description:
音楽再生装置、音楽再生方法、 楽再生プログラム、及び集積回路

 本発明は音楽再生装置、再生制御方法、 びこれらを実現する音楽再生プログラムや 積回路に関し、より特定的には、ソース音 を分割して個別にエンコード及びデコード ることによって得られる複数の楽曲データ 連続再生する音楽再生装置、再生制御方法 音楽再生プログラム、及び集積回路に関す ものである。

 近年、内蔵及び外付けの不揮発性メモリ 小型の磁気記憶装置に記録された大量の楽 データを再生する携帯型プレーヤー・ミニ ンポ・カーオーディオなどの音楽再生装置 市販されている。これらの音楽再生装置で 、一般的に、限られた記憶領域の中に大量 楽曲データを格納するため、あるいは楽曲 ータの可搬性向上のために、ソース音源の 質を実用上保ったままデータサイズを圧縮 る音声符号化技術が用いられている。

 さらに、圧縮に用いられる音声符号化技 としてはMP3(MPEG Layer3)、WMA(Windows(登録商標)  Media Audio)、AAC(Advanced Audio Coding)などの非 逆圧縮方式が一般的である。ここで、ソー 音源とはPCM(Pulse Code Modulation)形式のデータ とする。

 しかし、これらの音声符号化技術を用い 場合、エンコード(音声符号化技術を用いた PCM形式のデータの符号化)とデコード(エンコ ドされたデータを再生するためのPCM形式へ 復号化)の過程で、符号化アルゴリズムの特 性上、ソース音源には存在しない無音部及び 遷移部(ソース音源に相当する部分と無音部 の繋ぎの波形)が、各楽曲データの曲先頭部 曲終端部あるいはその両方に付加される。 の無音部と遷移部とを合わせて以降ギャッ と呼ぶ。さらに、各楽曲データの曲先頭部 び曲終端部に相当する波形の近辺に波形の みが生じてしまう。この波形歪みは、各楽 データの曲先頭部及び曲終端部のPCMサンプ 値の絶対値が大きい場合ほど、より顕著に られる。

 例えば、ライブ音源、クラシック、ユー ビート等は、長時間のソース音源を複数の ラックに分割してCD等の記録媒体に記録し いる。そこで、このCDから複数のトラックを 読み出し、個別にエンコードとデコードとを 行い、元のCDの曲順通りに再生した場合、各 曲データの曲間にソース音源には存在しな ギャップの付加及び波形歪みが発生し、音 を聞くユーザの視点からはノイズとして聞 えてしまうという問題があった。

 そこで、ソース音源を複数に分割し、そ ぞれを音声符号化技術によりエンコード及 デコードし、連続再生した場合においても ソース音源と同様に曲間が違和感無く再生 きる「ギャップレス再生」が可能な音楽再 装置が求められてきた。

 図1を用いて、ギャップレス再生に関する従 来技術について説明する。Track(N)101とTrack(N+1) 102とは同一CD上の連続したトラックであり、 間の無いソース音源を分割したものである このとき、Track(N)101及びTrack(N+1)102に対し個 にエンコード及びデコードを実施すると、 楽曲データの曲端部にギャップ103の付加及 波形歪み104の発生が見られる。よって、デ ード後の楽曲データを単純に連結して再生 た場合、ソース音源には無い曲間が生じ、 ーザ視点では音途切れや間延び感を伴うノ ズに聞こえてしまう。この問題を解決する めの方法の1つとして、特許文献1のように 曲間の連続性を判定することによって、無 部の除去を行う技術が開示されている。

特開2007-179604号公報

 しかし、従来技術では無音部の除去は可 だが、遷移部の除去、及び波形歪み104への 応は行っていない。したがって、ギャップ ス再生を実現する上で不要となるギャップ1 03を全て除去することができず、音の途切れ や間延び感が残留する。

 また、波形歪み104がそのまま残るため、 間のノイズを解消しきれないという課題が った。

 本発明は、上記従来の課題を解決するも であり、残留ギャップである遷移部の除去 び波形歪み104への対策を行うことで、ユー が感じるノイズを極力抑えたギャップレス 生を実現する音楽再生装置、音楽再生方法 及びこれらを実現する音楽再生プログラム 集積回路を提供することを目的とする。

 本発明に係る音楽再生装置は、PCM(Pulse Co de Modulation)形式のソース音源が分割され、個 別に符号化及び復号化されることによって生 成される第1及び第2の出力PCMデータを取得し 再生する。また、前記第1及び第2の出力PCM ータそれぞれの両端部には、出力レベルが め定めた閾値未満の区間である無音部と、 割された前記ソース音源それぞれの曲端部 相当する部分及び前記無音部を接続する遷 部とが含まれている。そして、前記音楽再 装置は、前記第1及び第2の出力PCMデータに含 まれる複数のフレームそれぞれについて、出 力レベルが前記閾値以上のサンプルを含む有 音フレームであるか否かを判定する有音/無 判定部と、少なくとも前記有音フレームに いて、PCM形式の波形の傾きの変化量が最も きいサンプルである接合点候補を抽出する 合点抽出部と、前記第1の出力PCMデータの最 の前記有音フレームに含まれる前記接合点 補を第1の接合点とし、前記第2の出力PCMデ タの最初の前記有音フレームに含まれる前 接合点候補を第2の接合点とする曲端検出部 、前記第1及び第2の出力PCMデータを前記第1 び第2の接合点で接合して再生する楽曲連続 出力部とを備える。

 上記の音楽再生装置によれば、分割され ソース音源の端部に相当する箇所と遷移部 の境界にみられる特徴的な高周波成分(PCM形 式の波形の変化量が最も大きい点)を抽出す ことにより、無音部の除去に加えて遷移部 除去をも行うことができるので、音の途切 感や間延び感を解消することができる。

 また、前記第1及び第2の出力PCMデータは 前記ソース音源を分割して符号化及び復号 したことにより、分割された前記ソース音 それぞれの曲端部に相当する区間の波形に 形歪みが生じている。そして、該音楽再生 置は、さらに、前記歪みが生じている区間 波形を、中央部に近づくほど傾きが大きく る3次曲線である補完波形に置換する補完波 作成部を備えてもよい。

 このように、波形歪みをノイズ抑制用の 替波形である補完波形と置換する補完波形 成部をさらに備えるようにしたので、楽曲 連続再生時に、第1の出力PCMデータの終端部 と第2の出力PCMデータの先頭部とを滑らかに 続することができ、曲間のノイズを大幅に 減することができる。

 また、前記補完波形作成部は、前記波形 みが生じている区間の時間間隔より長い時 Tの値を予め保持している。そして、前記第 1の出力PCMデータにおいて、前記第1の接合点 ら前方に時間2T離れたサンプルより後方で 且つ前記第1の接合点から前方に時間T離れた サンプルより前方のサンプルであって、PCM形 式の波形の傾きが最も小さいサンプルを補完 波形作成開始点として抽出し、前記第1の接 点を補完波形作成終了点として抽出し、前 補完波形作成開始点と前記補完波形作成終 点との間の区間を、両者を接続する前記補 波形に置換してもよい。

 さらに、前記補完波形作成部は、前記第2 の出力PCMデータにおいて、前記第1の出力PCM ータの第1の接合点を補完波形作成開始点と て抽出し、前記補完波形作成開始点から後 に時間T離れたサンプルより後方で、且つ前 記補完波形作成開始点から後方に時間2T離れ サンプルより前方のサンプルであって、PCM 式の波形の傾きが最も小さいサンプルを補 波形作成終了点として抽出し、前記補完波 作成開始点と前記補完波形作成終了点との の区間を、両者を接続する前記補完波形に 換してもよい。

 このように、第1の出力PCMデータの最終サ ンプル値を第2の出力PCMデータの補完波形の 頭サンプル値とすることで、波形歪みによ 接合位置のずれに起因するノイズを低減す ことが可能となる。

 また、前記接合点抽出部は、前記フレー に含まれるN(Nは自然数)番目のサンプル、(N+ 1)番目のサンプル、及び(N+2)番目のサンプル 含む区間について、隣接するサンプルのサ プル値の差である波形変化量と、隣接する 記波形変化量の差である波形変化加速度と それぞれ算出し、前記波形変化加速度が最 大きい区間における(N+2)番目のサンプルを前 記接合点候補として抽出してもよい。

 このように、分割されたソース音源の端 に相当する箇所と遷移部との境界にみられ 特徴的な高周波成分を出力PCMデータの波形 化加速度を基に検出することで、少ない処 量で、無音部及び遷移部の除去が可能とな 。

 また、該音楽再生装置は、さらに、前記 1の出力PCMデータの前記第1の接合点より後 の全てのサンプルを除去すると共に、前記 2の出力PCMデータの前記第2の接合点より前方 の全てのサンプルを除去するギャップ除去部 を備えてもよい。なお、サンプルを記憶領域 から削除せずに、第1の接合点より後方のサ プルと第2の接合点より前方のサンプルとを 楽曲連続出力部で出力しないように制御し もよい。

 本発明に係る音楽再生方法は、PCM(Pulse Co de Modulation)形式のソース音源が分割されて個 別に符号化及び復号化されることによって生 成される第1及び第2の出力PCMデータを取得し 再生する。また、前記第1及び第2の出力PCM ータそれぞれの両端部には、出力レベルが め定めた閾値未満の区間である無音部と、 割された前記ソース音源それぞれの曲端部 相当する部分及び前記無音部を接続する遷 部とが含まれている。そして、前記音楽再 方法は、前記第1及び第2の出力PCMデータに含 まれる複数のフレームそれぞれについて、出 力レベルが前記閾値以上のサンプルを含む有 音フレームであるか否かを判定する有音/無 判定ステップと、少なくとも前記有音フレ ムについて、PCM形式の波形の傾きの変化量 最も大きいサンプルである接合点候補を抽 する接合点抽出ステップと、前記第1の出力P CMデータの最後の前記有音フレームに含まれ 前記接合点候補を第1の接合点とし、前記第 2の出力PCMデータの最初の前記有音フレーム 含まれる前記接合点候補を第2の接合点とす 曲端検出ステップと、前記第1及び第2の出 PCMデータを前記第1及び第2の接合点で接合し て再生する楽曲連続出力ステップとを含む。

 本発明に係るプログラムは、PCM(Pulse Code Modulation)形式のソース音源が分割されて個別 に符号化及び復号化されることによって生成 される第1及び第2の出力PCMデータを取得して コンピュータに再生させる。また、前記第1 及び第2の出力PCMデータそれぞれの両端部に 、出力レベルが予め定めた閾値未満の区間 ある無音部と、分割された前記ソース音源 れぞれの曲端部に相当する部分及び前記無 部を接続する遷移部とが含まれている。そ て、前記プログラムは、前記第1及び第2の出 力PCMデータに含まれる複数のフレームそれぞ れについて、出力レベルが前記閾値以上のサ ンプルを含む有音フレームであるか否かを判 定する有音/無音判定ステップと、少なくと 前記有音フレームについて、PCM形式の波形 傾きの変化量が最も大きいサンプルである 合点候補を抽出する接合点抽出ステップと 前記第1の出力PCMデータの最後の前記有音フ ームに含まれる前記接合点候補を第1の接合 点とし、前記第2の出力PCMデータの最初の前 有音フレームに含まれる前記接合点候補を 2の接合点とする曲端検出ステップと、前記 1及び第2の出力PCMデータを前記第1及び第2の 接合点で接合して再生する楽曲連続出力ステ ップとを含む。

 本発明に係る集積回路は、PCM(Pulse Code Mo dulation)形式のソース音源が分割されて個別に 符号化及び復号化されることによって生成さ れる第1及び第2の出力PCMデータを取得して再 する。また、前記第1及び第2の出力PCMデー それぞれの両端部には、出力レベルが予め めた閾値未満の区間である無音部と、分割 れた前記ソース音源それぞれの曲端部に相 する部分及び前記無音部を接続する遷移部 が含まれている。そして、前記音楽再生装 は、前記第1及び第2の出力PCMデータに含まれ る複数のフレームそれぞれについて、出力レ ベルが前記閾値以上のサンプルを含む有音フ レームであるか否かを判定する有音/無音判 部と、少なくとも前記有音フレームについ 、PCM形式の波形の傾きの変化量が最も大き サンプルである接合点候補を抽出する接合 抽出部と、前記第1の出力PCMデータの最後の 記有音フレームに含まれる前記接合点候補 第1の接合点とし、前記第2の出力PCMデータ 最初の前記有音フレームに含まれる前記接 点候補を第2の接合点とする曲端検出部と、 記第1及び第2の出力PCMデータを前記第1及び 2の接合点で接合して再生する楽曲連続出力 部とを備える。

 なお、本発明は、音楽再生装置として実 できるだけでなく、音楽再生装置の機能を 現する集積回路として実現したり、そのよ な機能をコンピュータに実行させるプログ ムとして実現したりすることもできる。そ て、そのようなプログラムは、CD-ROM等の記 媒体及びインターネット等の伝送媒体を介 て流通させることができるのは言うまでも い。

図1は、ギャップの発生と従来技術の課 題を模式的に示す図である。 図2は、本発明の実施の形態1における 楽再生装置の機能ブロック構成図である。 図3Aは、有音/無音判定処理後における ギャップ除去情報の一例を示す図である。 図3Bは、接合点抽出処理後におけるギ ップ除去情報の一例を示す図である。 図3Cは、曲端検出処理後におけるギャ プ除去情報の一例を示す図である。 図4は、本発明の実施の形態1における 楽再生装置のギャップレス再生処理を示す ローチャートである。 図5Aは、エンコード前の楽曲データの 形の一部を示す図である。 図5Bは、前側トラックをエンコード& ;デコードした後の波形の一部を示す図であ 。 図6Aは、有音/無音判定処理によって判 定された無音部の位置を示す図である。 図6Bは、接合点抽出処理によって抽出 れた遷移部の位置を示す図である。 図6Cは、補完波形作成処理によって補 波形に置換する前後の波形を示す図である 図7は、接合点候補抽出処理の具体的な 処理内容の一例を示すフローチャートである 。 図8は、接合点抽出処理を説明するため の波形の拡大図である。 図9は、曲端検出処理の具体的な処理内 容の一例を示すフローチャートである。 図10は、ギャップ除去処理の具体的な 理内容の一例を示すフローチャートである 図11は、補完波形作成区間決定処理の 体的な処理内容の一例を示すフローチャー である。 図12は、補完波形作成処理の具体的な 理内容の一例を示すフローチャートである 図13Aは、補完波形作成処理を説明す ための前側トラックの曲終端部の拡大図で る。 図13Bは、補完波形作成処理を説明す ための後側トラックの曲先頭部の拡大図で る。

符号の説明

 101 Track(N)
 102 Track(N+1)
 103 ギャップ
 104 波形歪み
 200 音楽再生装置
 201 再生制御部
 202 楽曲記憶部
 203 デコード制御部
 204 出力PCM記憶部
 205 ギャップ情報記憶部
 206 ギャップ検出部
 207 ギャップ除去部
 208 補完波形作成部
 209 楽曲連続出力部
 210 ギャップ除去情報
 211 有音/無音判定部
 212 接合点抽出部
 213 曲端検出部
 300 フレームNo
 301 フレーム状態
 302 有音開始位置
 303 無音開始位置
 304 フレーム情報
 601 サンプル(N)
 602 サンプル(N+1)
 603 サンプル(N+2)
 604 波形変化量(N)
 605 波形変化量(N+1)
 606 波形変化加速度(N)
 701 補完波形作成区間
 702 補完波形作成開始点
 703 補完波形作成終了点
 704 波形歪み部
 705 補完波形
 706 第1の接合点

 以下、本発明の実施の形態について、図 を参照しながら説明する。

 (実施の形態1)
 図2は、本発明の実施の形態1における音楽 生装置200の機能ブロックの構成を示す図で る。この音楽再生装置200としては、例えばMP 3、WMA、AACの再生が可能な携帯型プレーヤー どが想定される。図2において、本実施の形 1における音楽再生装置200は、再生制御部201 と、楽曲記憶部202と、デコード制御部203と、 出力PCM記憶部204と、ギャップ情報記憶部205と 、ギャップ検出部206と、ギャップ除去部207と 、補完波形作成部208と、楽曲連続出力部209と を備える。

 再生制御部201は、デコード制御部203、ギ ップ検出部206、ギャップ除去部207、補完波 作成部208、及び楽曲連続出力部209を制御す ことによって、通常の再生及びギャップレ 再生の制御を行う。

 楽曲記憶部202には、CD等の記録媒体に記 されている複数のトラックを、MP3、WMA、AAC どで個別にエンコードすることによって得 れる複数のエンコードデータが格納されて る。その実体は、不揮発性メモリ、ハード ィスク、CDなどの記録デバイスあるいは、外 部デバイスから楽曲が転送された内部メモリ 領域でも良い。また、典型的な実施形態とし て、上記のCDに収録されている複数のトラッ は、ライブ音源、クラシック、ユーロビー 等のソース音源を分割したものであり、連 して再生することによって1つの連続した楽 曲データとなるようなものを想定している。

 デコード制御部203は、再生制御部201の指 に従い、楽曲記憶部202に格納されている複 のエンコードデータそれぞれをデコードし 出力PCMデータを生成し、各音声符号化技術 規格に応じた処理単位であるフレーム単位 出力PCM記憶部204に格納する。なお、以降の 明において、各出力PCMデータの先頭部分を 曲先頭部」と、終端部分を「曲終端部」と する。また、曲先頭部と曲終端部とを合わ て「曲端部」と称する。

 出力PCM記憶部204は、デコード制御部203の 力である出力PCMデータを格納すると共に、 ャップ除去部207及び補完波形作成部208によ 出力PCMデータの加工結果を記憶する記憶領 である。この出力PCM記憶部204は、音楽再生 置200が対応する音声符号化技術により付加 れ得る最大のギャップ長以上のフレームを ッファリング可能、かつ楽曲連続出力部209 出力処理時にバッファ枯渇による音途切れ 発生しない程度の十分なサイズの記憶領域 持つものとする。

 もちろん、出力PCM記憶部204を複数持ち、 コード制御部203の出力を格納する領域と、 ャップ除去部207及び補完波形作成部208の処 結果を格納する領域とを分けて、それぞれ 役割において最適なサイズにチューニング ても良い。

 ギャップ情報記憶部205は、ギャップ除去 報210の記憶領域であり、フレーム毎に存在 るギャップ除去情報210を図3A~図3Cに示すよ にテーブル形式で記憶する。各フレームの ャップ除去情報210は図3A~図3Cの各フレーム情 報304にそれぞれ対応し、フレームNo300、フレ ム状態301、有音開始位置302、及び無音開始 置303が記憶される。

 ギャップ情報記憶部205の記憶領域は、出 PCM記憶部204に格納可能なフレーム数に対応 るギャップ除去情報210を十分格納可能なサ ズを持つものとする。もちろん、有音開始 置302及び無音開始位置303については処理の 程で同時に必要となることがないため、1つ にまとめてフレーム状態301の種別との組み合 わせで管理しても良い。

 ギャップ検出部206は、再生制御部201の指 に従い、ギャップ情報記憶部205内のギャッ 除去情報210をフレーム毎に登録あるいは更 する役割を持つ。具体的には、有音/無音判 定部211、接合点抽出部212、及び曲端検出部213 から構成される。

 有音/無音判定部211は、出力PCM記憶部204に 格納された出力PCMデータを構成する各フレー ムが「有音フレーム」又は「無音フレーム」 のどちらに該当するかを判定する。有音/無 の判定に際しては、対応する音声符号化ア ゴリズムの特性を考慮し、あらかじめ指定 れた無音判定閾値(以下、単に「閾値」と表 する)に基づいてフレーム単位で解析を行う 。そして、判定結果であるギャップ除去情報 210をギャップ情報記憶部205に登録する。

 図3Aは有音/無音判定部211の処理後のギャ プ除去情報210の一例である。有音/無音判定 部211は、フレーム状態301に「有音」または「 無音」を設定する。また、処理フレームを先 頭から走査し、最初に出現した閾値以上のサ ンプルのサンプル位置を有音開始位置302に、 閾値以上の値から閾値未満の値に最後に遷移 したサンプル位置を無音開始位置303にそれぞ れ格納する。

 接合点抽出部212は、遷移部の除去のため 、出力PCM記憶部204内に格納された出力PCMデ タと、有音/無音判定部211が格納したギャッ プ除去情報210とを基に、分割されたソース音 源(すなわち、「トラック」)の曲端部に相当 る波形と遷移部との境界を検出し、ギャッ 除去情報210の有音開始位置302あるいは無音 始位置303を更新する。具体的には、PCM形式 波形の傾きの変化量が最も大きいサンプル フレーム毎に抽出し、当該サンプルを「接 点候補」とする。

 図3Bは接合点抽出部212の処理後のギャッ 除去情報210の一例であり、有音開始位置302 び無音開始位置303の太枠で囲われた箇所が 合点抽出部212による更新が発生した箇所と る。

 曲端検出部213は、ギャップ情報記憶部205 走査し、ギャップ除去後の曲先頭部及び曲 端部の位置を検出する。同時に、「立上り レーム」、「立下りフレーム」、「立上り フレーム」、及び「立下り前フレーム」の 出を行い、ギャップ除去情報210のフレーム 態301を更新する。図3Cは曲端検出部213の処 後のギャップ除去情報210の一例であり、フ ーム状態301の太枠で囲われた箇所が曲端検 部213による更新が発生した箇所となる。

 ギャップ除去部207は、再生制御部201の指 に従い、ギャップ検出部206が作成した各フ ームのギャップ除去情報210を基に、出力PCM ータの曲端部のギャップをサンプル単位で 去する。具体的には、立上りフレームの有 開始位置より前方の全てのサンプルと、立 りフレームの無音開始位置より後方の全て サンプルとを除去する。

 補完波形作成部208は、再生制御部201の指 に従い、ギャップ除去部207によるギャップ 去後の出力PCMデータの曲端部の波形歪みを 完波形と置換する。

 楽曲連続出力部209は、再生制御部201の指 に従い、出力PCM記憶部204に格納された複数 出力PCMデータを連続して(楽曲間で処理が遅 延しないように)出力する。

 以下、このような構成を持つ音楽再生装 の動作の詳細について図3A~図13Bを参照しな ら説明する。

 図3A~図3Cは、後述の各処理におけるギャ プ除去情報210の一例を示す図であって、有 /無音判定処理後の状態(図3A)、接合点候補抽 出処理後の状態(図3B)、曲端検出処理後の状 (図3C)を示す図である。図4は、本実施の形態 における音楽再生装置200の処理手順を表すフ ローチャートである。また、図5Aは、複数の ラックに分割する前の楽曲データ(すなわち 「ソース音源」)のトラック境界付近の波形 示す図である。図5Bは、図5Aに示される前側 ラックをエンコード及びデコードして得ら る第1の出力PCMデータの曲終端部付近の波形 を示す図である。さらに、図6A~図6Cは、図5B 示される第1の出力PCMデータに対して、有音/ 無音判定処理を実施した後の状態を示す図( 6A)、接合点抽出処理を実施した後の状態を す図(図6B)、補完波形作成処理を実施した後 状態を示す図(図6C)である。

 まず、PCM形式のソース音源は、図5Aに示 れるように、複数のトラック(この実施形態 は、「前側トラック」と「後側トラック」 2つ)に分割されてCD等の記録媒体に記録され る。そして、当該記録媒体から読み出された 各トラックは、個別にMP3、WMA、又はAAC等の形 式にエンコードされ、楽曲記憶部202に格納さ れる。なお、トラックのエンコード処理は、 音楽再生装置200が行ってもよいし、他の装置 によって行われてもよい。

 本実施の形態における音楽再生装置200で 、ユーザからの楽曲再生要求を検出すると 再生制御部201がデコード制御部203にデコー 開始の指示を出す。

 デコード制御部203は、楽曲記憶部202からM P3、WMA、又はAACでエンコードされたエンコー データを読み出し、デコード処理を行う。 して、デコード結果である出力PCMデータを 力PCM記憶部204に格納する(S10)。

 なお、上記の前側トラックと後側トラッ とは、ソース音源の時間的に連続する2つの 区間である。また、以降の説明において、前 側トラックをエンコード及びデコードして得 られる出力PCMデータを「第1の出力PCMデータ と、後側トラックをエンコード及びデコー して得られる出力PCMデータを「第2の出力PCM ータ」と称する。

 また、第1及び第2の出力PCMデータを総称 て「出力PCMデータ」と称する。また、本発 が対象とする「出力PCMデータ」は、複数の レームで構成される。さらに、「フレーム は複数(本実施の形態では1024個)のサンプル 構成される。

 このとき、前側トラックをエンコード及 デコードして得られる第1の出力PCMデータに は、図5Bに示されるように、無音部と遷移部 を含むギャップが付加される。なお、「無 部」は、出力レベルが予め定めた閾値未満 区間を指す。「遷移部」は、エンコード前 楽曲データ(すなわち「前側トラック」)の 終端部に相当する部分と無音部とを接続す 区間を指す。また、前側トラックの曲終端 に相当する所定の区間には、波形歪みが生 ている。

 なお、図5Bでは、例として分かりやすい う、曲終端部のPCMサンプル値の絶対値が大 いものを使用しているため、エンコード及 デコードの過程で顕著な波形歪みが生じる 共に、遷移部を多く含むギャップが付加さ ている。また、図5Bでは、第1の出力PCMデー の曲終端部付近のみを図示しているが、第1 出力PCMデータの曲先頭部にもギャップが付 されると共に、曲先頭部の波形に波形歪み 生じる。さらに、図示は省略するが、後側 ラックをエンコード及びデコードして得ら る第2の出力PCMデータの曲先頭部及び曲終端 部にもギャップが付加されると共に、曲端部 の波形に波形歪みが生じる。

 次に、再生制御部201は、ギャップレス再 モードがONかOFFかを判定し、OFFの場合(S20でN o)、S10でデコードした結果をそのまま出力す よう楽曲連続出力部209に指示を出す。楽曲 続出力部209は指示に従い出力PCM記憶部204内 PCMデータを出力する。

 一方、ギャップレス再生モードがONの場 (S20でYes)、ギャップ検出部206にギャップ除去 情報210の生成を指示する。以降の処理は、音 声符号化技術の規格に順ずるフレーム単位で 実施する(S20)。

 再生制御部からの指示を受けたギャップ 出部206は、まず有音/無音判定部211に指示を 出し、処理フレームの有音/無音判定処理を う(S30)。有音/無音判定処理は、例えば、判 対象のフレームに含まれる全てのサンプル サンプル値と予め定めた閾値とを比較し、 値以上のサンプル(有音サンプル)が1つでも まれている場合に「有音フレーム」と、全 のサンプルが閾値未満の場合に「無音フレ ム」と判定する。

 また、処理の過程で閾値以上のサンプル を持つサンプルが最初に登場した有音開始 置と、閾値以上のサンプル値から閾値未満 サンプル値に最後に遷移したサンプル位置 示す無音開始位置とを記憶する。なお、こ 有音/無音判定処理は、デコード制御部203に よるデコード処理(S10)が全て終了してから開 されるわけではなく、最初のフレームが出 PCM記憶部204に格納された後に開始される。

 そして、図3Aに示すフォーマットに従い フレームNo300、フレーム状態301、有音開始位 置302、及び無音開始位置303をギャップ除去情 報210としてギャップ情報記憶部205に登録する 。有音/無音判定部211は、上記の処理(S3001~S301 6)を出力PCM記憶部204に格納されている全ての レームに対して実行する。

 図6Aは本処理後の第1の出力PCMデータの波 を模式的に示したものであり、最後に「有 」と判定されたフレームの無音開始位置以 のサンプルを無音部と見なし除去の対象(図 中斜線部)としている(S30)。

 次に、ギャップ検出部206は接合点抽出部2 12に指示を出し、遷移部の検出を行うために 接合点候補抽出処理を実行する(S40)。接合 抽出部212は、MP3、WMA、AACなどの音声符号化 術共通の特性である遷移部とエンコード前 楽曲データ(すなわち「トラック」)の曲端部 に相当する箇所との境界に出現する特徴的な 高周波成分を検出することによって遷移部を 特定する。

 図7は、図4の接合点候補抽出処理(S40)の具 体的な処理内容を示すフローチャートである 。また、図8は、接合点候補抽出処理を説明 るための波形の拡大図である。本実施の形 における接合点候補抽出処理のアルゴリズ を図7及び図8を用いて説明する。

 まず、本発明が対象とするソース音源は 1以上のチャネル(「2ch」、「5.1ch」等)で構 されている。そして、接合点抽出部212は、i 目のチャネルについて隣接するサンプル(j 目、j+1番目)のサンプル値(Sample[i][j]、Sample[i] [j+1]と表記する)の差の絶対値である波形変化 量(Var[i][j]と表記する)を算出する(S4003)。なお 、接合点抽出部212は、当該フレームに含まれ る全てのサンプルの間の波形変化量を算出す る(S4002)。

 図8中の例では、サンプル(N)601とサンプル (N+1)602の間の波形変化量(N)604と、サンプル(N+1 )602とサンプル(N+2)603の間の波形変化量(N+1)605 これに該当する。

 次に、接合点抽出部212は、隣接する波形 化量の差の絶対値である波形変化加速度(Acl [j]と表記する)を算出する(S4005)。なお、接合 抽出部212は、S4003で算出した全ての波形変 量の間の波形変化加速度を算出する(S4004)。 8中の例では、波形変化量(N)604と波形変化量 (N+1)605の差分である波形変化加速度(N)606がこ に該当する。

 接合点抽出部212は、上記の処理(S4002~S4005) を全てのチャネルについて実行する(S4001)。 まり、「2ch」なら2回、「5.1ch」なら6回繰り すことになる。また、S4005では、各チャネ の対応する波形変化加速度を積算している

 次に、接合点抽出部212は、波形変化加速 の最大値を保持する変数(AclMax)と、波形変 加速度が最も大きい区間のサンプル位置(「 合点候補」と称する)を保持する変数(AclMaxPo int)とを初期化し(S4006)、波形変化加速度の最 値を探索する(S4007~S4009)。

 具体的には、全ての波形変化加速度を(S40 07)、現時点での最大値(AclMax)と比較する(S4008) 。より大きな波形変化加速度が見つかったら (S4008でYes)、当該値で変数(AclMax)を更新すると 共に、そのサンプル位置を変数(AclMaxPoint)に 存する(S4009)。

 なお、波形変化加速度は、図8に示される ように、サンプル(N)601、サンプル(N+1)602、及 サンプル(N+2)603の3つのサンプルのサンプル から算出される。そして、波形変化加速度 最も大きい区間における最後のサンプル(つ まり、サンプル(N+2)603)を接合点候補(AclMaxPoint )としている。これは、サンプルを前から後 に向かって順に処理し、サンプル(N+2)603が新 たに加わったことで、当該区間の波形変化加 速度が最大になったと考えることができるか らである。一方、サンプルを後から前に向か って順に処理する場合には、波形変化加速度 が最も大きい区間における最初のサンプル( 記の例ではサンプル(N)601)を接合点候補(AclMax Point)とすればよい。

 当該フレームにおける波形変化加速度の 大値(AclMax)と、接合点候補(AclMaxPoint)とが確 したら(S4007~S4009)、接合点抽出部212は、ギャ ップ除去情報210を参照して、当該フレームが 有音フレームであるか、若しくは無音フレー ムであるかを確認する(S4010)。

 当該フレームが有音フレームであった場 (S4010でYes)、接合点抽出部212は、波形変化加 速度が最大となるサンプル位置(AclMaxPoint)と ギャップ除去情報210の有音開始位置302とを 較する(S4011)。そして、波形変化加速度が最 となるサンプル位置が有音開始位置302より 方に位置する場合(S4011でYes)、図3Bに示され ように、ギャップ除去情報210の有音開始位 302を接合点候補(AclMaxPoint)の値に更新する(S4 012)。

 一方、当該フレームが無音フレームであ た場合(S4010でNo)、接合点抽出部212は、波形 化加速度が最大となるサンプル位置(AclMaxPoi nt)と、ギャップ除去情報210の無音開始位置303 とを比較する(S4013)。そして、波形変化加速 が最大となるサンプル位置が無音開始位置30 3より前方に位置する場合(S4013でYes)、図3Bに されるように、ギャップ除去情報210の無音 始位置303を接合点候補(AclMaxPoint)の値に更新 る(S4014)。

 なお、この接合点候補抽出処理は、第1の 出力PCMデータに含まれる全てのフレームに対 して実行してもよいが、有音/無音判定処理 おいて「有音フレーム」であると判定され フレームのみについて実行してもよい。こ により、処理量を削減することができる。

 図6Bは本処理後の第1の出力PCMデータの波 を模式的に示したものであり、無音部除去 の曲終端部付近において、波形変化加速度 最大となる地点より後方を遷移部と見なし 除去の対象(図中斜線部)としている。本実 の形態では、高周波成分発生箇所の特定に 形変化加速度の最大値を用いているが、波 変化量の移動平均、加重移動平均など他の ルゴリズム、及び出力PCMデータの周波数変 を行い高周波成分の発生箇所を特定する手 を用いてもよい。

 さらに本実施の形態では、接合点検出処 は全フレームに対し行うため、検出した境 点を接合点の候補としているが、有音開始 置302及び無音開始位置303は曲端部のフレー でのみ有効になるため、本処理を後述の曲 検出処理(図4のS50)の後で曲端部のフレーム 対してのみ実施し、真の接合点を検出する 態を取っても良い(S40)。

 次に、ギャップ検出部206は、曲端検出部2 13に指示を出し、曲端部の検出を行うために 端検出処理を実行する(S50)。曲端検出部213 、出力PCM記憶部204内の出力PCMデータと、そ に対応する接合点候補抽出処理S40後のギャ プ除去情報210とを参照して、曲端部の検出 行う。図9は、図4の曲端検出処理(S50)の具体 な処理内容を示すフローチャートである。

 まず、曲端検出部213は、曲端検出処理の 始タイミングを監視する(S5001)。例えば、出 力PCMデータの先頭フレームから所定の個数の フレームが出力PCM記憶部204に記憶され、当該 フレームに対して有音/無音判定処理が実行 れた段階で当該出力PCMデータの曲先頭部の 出を行う(S5002~S5007)。なお、上述の「所定の 数」とは、出力PCM記憶部204に記憶可能な最 フレーム数であってもよいし、経験的に曲 の検出が可能と考えられる任意の個数であ てもよい。

 具体的には、曲端検出部213は、フレームN o300を示す変数(i)を先頭フレームに設定し(S500 2)、当該出力PCMデータが出力PCM記憶部204に含 れている状態で、ギャップ情報記憶部205内 ギャップ除去情報210を走査し、有音フレー が見つかるまでフレームNo300の昇順にフレ ム状態301を参照する(S5003)。

 参照したフレームが無音フレームであっ 場合、曲端検出部213は、当該フレームのフ ーム状態301を「無効フレーム」に更新する( S5004)。そして、変数(i)を1加算して(S5005)、次 レームのフレーム状態301を参照する。

 そして、曲端検出部213は、最初に検出し 有音フレームのフレーム状態301を「立上り レーム」に更新し(S5006)、立上りフレームの 直後のフレームを「立上り後フレーム」に更 新する(S5007)。また、第2の出力PCMデータにお る立上りフレームの接合点候補は、「第2の 接合点」となる。

 このとき、出力PCM記憶部204には音楽再生 置200が対応する音声符号化技術により付加 れ得るギャップ長以上のフレーム数が格納 れているはずであるが、ギャップ情報記憶 205内の全てのギャップ除去情報210から有音 レームを検出することができなかった場合 フレームNo300が最大のフレームを立上りフ ーム、そのフレーム以前のフレームはすべ 無効フレームとみなし、対応するギャップ 去情報210のフレーム状態301を更新する。そ て、次にデコード処理および有音/無音判定 理が実行されたフレームを立上り後フレー とする。これは、ソース音源の曲端部に元 含まれる無音検出閾値以下の微小のサンプ 値を持つデータを過剰に除去してしまうこ を防ぐためである。

 しかし、例えばMP3でエンコードされたデ タをデコード後にWMAで再度エンコードされ データを再生する場合のように複数回エン ードされたことによりソース音源に対し想 以上のギャップが付加されるケースを考慮 、有音フレームが検出されるまで無効フレ ムを設定し続けてもよい。

 一方、S5001において、出力PCMデータの最 フレームが出力PCM記憶部204に記憶され、当 フレームに対して有音/無音判定処理が実行 れた段階で当該出力PCMデータの曲終端部の 出処理を行う(S5008~S5013)。具体的には、曲端 検出部213は、フレームNo300を示す変数(i)を最 フレームに設定し(S5008)、当該出力PCMデータ が出力PCM記憶部204に含まれている状態でギャ ップ情報記憶部205内のギャップ除去情報210を 走査し、有音フレームが見つかるまでフレー ムNo300の降順にフレーム状態301を参照する(S50 09)。このとき、走査の対象とするギャップ除 去情報210は、ギャップ情報記憶部205内の全て としてもよいし、当該フレームと対応するギ ャップ除去情報210から、経験的に曲端の検出 が可能と考えられる任意の個数であってもよ い。

 参照したフレームが無音フレームであっ 場合、曲端検出部213は、当該フレームのフ ーム状態を「無効フレーム」に更新する(S50 10)。そして、変数(i)を1減算して(S5011)、前フ ームのフレーム状態301を参照する。

 そして、曲端検出部213は、最初に検出し 有音フレームのフレーム状態301を「立下り レーム」に更新し(S5012)、その直前のフレー ムのフレーム状態301を「立下り前フレーム」 に更新する(S5013)。また、第1の出力PCMデータ おける立下りフレームの接合点候補は、「 1の接合点」となる。

 このとき、曲先頭部の処理と同様に、ギ ップ情報記憶部205内の走査の対象としたギ ップ除去情報210から有音フレームを検出す ことができなかった場合、フレームNo300が 小のフレームを立下り前フレーム、そのフ ーム1つ後方のフレームを立下りフレームと なし、以降のフレームはすべて無効フレー とする。

 ここで、MP3でエンコードされたデータを コード後にWMAで再度エンコードされたデー を再生する場合のように複数回エンコード れたことによりソース音源に対し想定以上 ギャップが付加されるケースを考慮する場 は、走査の対象とするギャップ除去情報210 、ギャップ情報記憶部205内の全てとするこ が望ましい。

 上記の処理は、第1及び第2の出力PCMデー のそれぞれについて、曲先頭部及び曲終端 の2箇所で実行される。そして、処理を行っ 結果として、図3Cの太枠に示すように処理 レームに対応するギャップ除去情報210のフ ーム状態301を更新する(S50)。

 なお、図9では、出力PCMデータ内を先頭フ レームから後方に向かって有音フレームを探 索し、最初に見つかった有音フレームを「立 上りフレーム」にすると共に、最終フレーム から前方に向かって有音フレームを探索し、 最初に見つかった有音フレームを「立下りフ レーム」にした例を示した。しかしながら、 上記の方法に限ることなく、例えば、出力PCM データ内を先頭フレームから後方に向かって 探索し、最初に見つかった有音フレームを「 立上りフレーム」に、最後に見つかった有音 フレームを「立下りフレーム」にする等して もよい。

 次に、再生制御部201は、ギャップ除去部2 07に指示を出し、ギャップ除去処理(S60)を実 する。ギャップ除去部207は、ギャップ除去 報210を基に出力PCM記憶部204内のギャップの 去をサンプル単位で行う。図10は、図4のギ ップ除去処理(S60)の具体的な処理内容を示す フローチャートである。

 まず、ギャップ除去部207は、ギャップ除 情報210を参照して、判定対象となるフレー (Frame[i])のフレーム状態301を確認する(S6001) そして、フレーム状態301が「無効」であれ 、Frame[i]を出力PCM記憶部204から削除すると共 に、Frame[i]のフレーム情報304をギャップ除去 報210から削除する(S6002)。なお、無効フレー ムは無音部の一部なので、全ての無効フレー ムを削除することにより、曲端部の無音部が 除去される。

 Frame[i]のフレーム状態301が「立上り」で れば、ギャップ除去部207は、当該フレーム 有音開始位置302より前方の全てのサンプル 除去する(S6003)。なお、立上りフレームの有 開始位置302には、接合点候補抽出処理(図4 S40)で出力PCMデータの曲先頭部と遷移部との 界のサンプル位置が設定されている。従っ 、当該処理によって曲先頭部の遷移部が除 される。

 Frame[i]のフレーム状態301が「立下り」で れば、ギャップ除去部207は、当該フレーム 無音開始位置303より後方の全てのサンプル 除去する(S6004)。なお、立下りフレームの無 開始位置303には、接合点候補抽出処理(図4 S40)で出力PCMデータの曲終端部と遷移部との 界のサンプル位置が設定されている。従っ 、当該処理によって曲終端部の遷移部が除 される。

 一方、Frame[i]のフレーム状態301が上記の ずれにも該当しない場合(立上りフレームと 下りフレームとの間のフレーム)、ギャップ 除去部207は、当該フレームに特段の処理を施 すことなく処理を終了する。ギャップ除去部 207は、全てのフレームに対して上記の処理を 繰り返すことによって、曲端部に付加された ギャップを除去する。

 本実施の形態ではギャップ除去後の出力P CMデータを出力PCM記憶部204に書き戻している 、除去後のデータを別の記憶領域に格納し 以降の処理を行ってもよい。また、本実施 形態では本処理を曲端検出処理S50の後で行 ているが、補完波形作成処理S80の後で行っ もよい。

 さらに、出力PCM記憶部204内のデータを直 除去するのではなく、ギャップを出力しな ように再生制御部201経由で楽曲連続出力部2 09に指示する構成でも良い(S60)。

 次に、再生制御部201は、補完波形作成部2 08に指示を出し、補完波形作成区間決定処理( S70)及び補完波形作成処理(S80)を実行する。図 11は、図4の補完波形作成区間決定処理(S70)の 体的な処理内容を示すフローチャートであ 。図12は、図4の補完波形作成処理(S80)の具 的な処理内容を示すフローチャートである 図13Aは、第1の出力PCMデータの曲終端部の波 の拡大図である。図13Bは、第2の出力PCMデー タの曲先頭部の波形の拡大図である。

 まず、補完波形作成部208は、ギャップ除 情報210を参照し、Frame[i]のフレーム状態301 確認する(S7001)。フレーム状態301が「立上り レーム」又は「立下りフレーム」のいずれ も該当しない場合(S7001で「その他」)、補完 波形作成部208は、補完波形作成区間決定処理 を終了する。

 Frame[i]のフレーム状態が「立下りフレー 」であった場合(S7001で「立下り」)、補完波 作成部208は、当該出力PCMデータの曲終端部 おける補完波形作成開始点(StrtSample)と、補 波形作成終了点(EndSample)とを決定する(S7001~S 7010)。なお、当該処理は、例えば、図13Aに示 れるように、第1の出力PCMデータの曲終端部 の補完波形作成区間を決定する場合に行われ る。

 まず、補完波形作成部208は、第1の出力PCM データの最終サンプルのサンプル位置(第1の 合点)を補完波形作成終了点(EndSample)に設定 る(S7002)。また、補完波形作成部208は、補完 波形作成終了点から時間T前方のサンプルを 索サンプル(CntrSample)に設定する(S7003)。さら 、補完波形作成部208は、補完波形作成終了 から時間2T前方のサンプルを仮の補完波形 成開始点(StrtSample)に設定する(S7004)。なお、 間Tは、波形歪みが生じる区間の時間間隔よ り長い時間であり、例えば0.5(ms)である。つ り、波形歪みは、探索サンプルと補完波形 成終了点との間の区間で生じていることに る。

 次に、補完波形作成部208は、仮の補完波 作成開始点と探索サンプルとの間の区間か 、真の補完波形作成開始点を決定する(S7005~ S7010)。真の補完波形作成開始点は、上記の区 間のうちで波形の傾きが最も小さいサンプル とする。

 まず、補完波形作成部208は、波形の傾き 最小値を保持する変数(MinLean)と、波形の傾 が最小となるサンプルのサンプル位置を保 する変数(MinPoint)を初期化する(S7005)。

 次に、補完波形作成部208は、隣接するサ プルのサンプル値の差の絶対値である傾き (Lean[i])を算出する(S7007)。そして、S7007で算 した傾き量(Lean[i])と、現時点での傾き量の 小値(MinLean)とを比較する(S7008)。そして、今 回算出した傾き量が現時点での最小値を下回 った場合(S7008でYes)、補完波形作成部208は、 き量の最小値を更新すると共に、当該サン ル位置をMinPointに格納する。

 なお、補完波形作成部208は、上記の処理( S7007~S7009)を、StrtSample~CntrSampleに含まれる全て のサンプルについて繰り返し実行する(S7006) そして、上記処理終了後、補完波形作成部20 8は、波形の傾きが最小となるサンプルのサ プル位置(MinPoint)を補完波形作成開始点(StrtSa mple)に設定する(S7010)。これにより、第1の出 PCMデータの曲終端部における補完波形作成 間(StrtSample~EndSample)が決定される。

 一方、フレーム状態が「立上りフレーム であった場合(S7001で「立上り」)、補完波形 作成部208は、当該出力PCMデータがギャップレ ス再生開始トラックの出力PCMデータであるか 否かを判定する(S7011)。当該出力PCMデータが ャップレス再生開始時の出力PCMデータであ 場合(S7011でYes)、補完波形作成部208は、補完 形作成区間決定処理を終了する。当該出力P CMデータを処理中にギャップレス再生モード 「ON」に切り替わったということは、前の 力PCMデータではギャップの除去や補完波形 作成が行われていないということになる。 たがって、当該出力PCMデータの曲先頭部で 完波形を作成しても、前の出力PCMデータと 間の音の途切れ感や間延び感を除去するこ ができないからである。

 一方、当該出力PCMデータの処理前に既に ャップレス再生モードが「ON」になってい 場合(S7011でNo)、補完波形作成部208は、当該 力PCMデータの曲先頭部における補完波形作 開始点(StrtSample)と、補完波形作成終了点(EndS ample)とを決定する(S7012~S7020)。なお、当該処 は、例えば、図13Bに示されるように、第2の 力PCMデータの曲先頭部の補完波形作成区間 決定する場合に行われる。

 まず、補完波形作成部208は、第1の出力PCM データの最終サンプルのサンプル位置(第1の 合点)を補完波形作成開始点(StrtSample)に設定 する(S7012)。なお、S7012における補完波形作成 開始点は、第2の出力PCMデータの先頭サンプ (第2の接合点)を採用してもよい。しかしな ら、第1の接合点と第2の接合点とのサンプル 値が大きく乖離している場合、両者を滑らか に接続することができず、ユーザに音飛び感 等を与える原因となる。

 次に、補完波形作成部208は、補完波形作 開始点から時間T後方のサンプルを探索サン プル(CntrSample)に設定する(S7014)。また、補完 形作成部208は、補完波形作成開始点から時 2T後方のサンプルを仮の補完波形作成終了点 (EndSample)に設定する(S7014)。つまり、波形歪み は、補完波形作成開始点と探索サンプルとの 間の区間で生じていることになる。

 次に、補完波形作成部208は、探索サンプ と仮の補完波形作成終了点との間の区間か 、真の補完波形作成終了点を決定する(S7015~ S7020)。真の補完波形作成終了点は、上記の区 間のうちで波形の傾きが最も小さいサンプル のサンプル位置とする。

 まず、補完波形作成部208は、波形の傾き 最小値を保持する変数(MinLean)と、波形の傾 が最小となるサンプルのサンプル位置を保 する変数(MinPoint)を初期化する(S7015)。

 次に、補完波形作成部208は、隣接するサ プルのサンプル値の差の絶対値である傾き (Lean[i]と表記する)を算出する(S7017)。そして 、S7017で算出した傾き量(Lean[i])と、現時点で 傾き量の最小値(MinLean)とを比較する(S7018)。 そして、今回算出した傾き量が現時点での最 小値を下回った場合(S7018でYes)、補完波形作 部208は、傾き量の最小値を更新すると共に 当該サンプル位置をMinPointに格納する。

 なお、補完波形作成部208は、上記の処理( S7017~S7019)を、CntrSample~EndSampleに含まれる全て サンプルについて繰り返し実行する(S7016)。 そして、上記処理終了後、補完波形作成部208 は、波形の傾きが最小となるサンプルのサン プル位置(MinPoint)を補完波形作成終了点(EndSamp le)に設定する(S7020)。これにより、第2の出力P CMデータの曲先頭部における補完波形作成区 (StrtSample~EndSample)が決定される。

 本実施の形態では、図13A及び図13Bに示す うに補完波形705として補完波形作成区間701 中心に近づくほど傾きが大きくなる3次曲線 を用いるため、異音が発生しないよう波形を 滑らかに接合するためには、補完波形705とト ラックの元波形とは、傾きの緩やかな位置で 接合する必要がある。

 このため、本実施の形態では第1及び第2 接合点から波形歪み部704が見られる領域を け得るサンプル分(時間T)離れかつ、隣接サ プルとのサンプル値の差分が小さい箇所を 出し、補完波形作成区間701を決定する。よ て立下りフレームの場合は、図13Aに示すよ に、補完波形作成開始点702~補完波形作成終 点703(第1の接合点706)までが補完波形作成区 701となる。一方、立上りフレームの場合は 図13Bに示すように、補完波形作成開始点702( 第1の接合点706)~補完波形作成終了点703までが 補完波形作成区間701となる。

 なお、ギャップ除去処理(S60)の結果とし 、立上りフレーム、または立下りフレーム 補完波形作成区間701の決定に必要なサンプ 数に満たない場合が考えられるが、立上り 立上り後、立下りは立下り前と、それぞれ 接するフレームと結合して補完波形作成区 701の決定、及び後述の補完波形作成処理(S80) を行ってもよい(S70)。

 次に、補完波形作成部208は、補完波形作 区間決定処理(S70)により決定された補完波 作成区間701に基づき補完波形705の作成処理 実施する。

 まず、補完波形作成部208は、図12に示さ るように、補完波形作成開始点(StrtSample)と 補完波形作成終了点(EndSample)とのサンプル値 の差(Diff)と、補完波形作成区間に含まれるサ ンプル数(N)とを算出する(S8001)と共に、変数(C nt、SumCnt)を初期化する(S8002)。

 次に、補完波形作成部208は、補完波形の きを決定するための重み係数(SampleCnt[i])を 定する(S8003~S8007)。具体的には、サンプル位 がN/2より手前のサンプル(i<N/2)については Cntに1加算してから(S8005)、サンプル位置がN/2 り後方のサンプル(i>N/2)についてはCntを1 算してから(S8006)、サンプル位置がN/2のサン ル(i=N/2)についてはCntを変更せずに、それぞ れ重み係数SampleCnt[i]に設定する(S8007)。同時 、重み係数SampleCnt[i]の合計値(SumCnt)を求めて おく。

 上記の処理の結果、重み係数は、補完波 作成区間のサンプル数(N)が奇数の場合には SampleCnt[i]=1、2、3、・・・、k-1、k、k-1、・ ・、3、2、1となる。一方、補完波形作成区 のサンプル数(n)が偶数の場合には、SampleCnt[i ]=1、2、3、・・・k-1、k-1、・・・、3、2、1と る。

 次に、補完波形作成部208は、単位重み係 当りのサンプル値の増加量(IncBase)を算出す (S8008)。具体的には、補完波形作成区間のサ ンプル値の差(Diff)を重み係数の積算値(SumCnt) 除せばよい。

 次に、補完波形作成部208は、重み係数(Sam pleCnt[i])と、単位重み係数あたりのサンプル の増加量(IncBase)に基づいて、補完波形作成 間内の各サンプルのサンプル値を更新する(S 8009~S8010)。つまり、両変数を乗じた値を1つ前 のサンプル値(Sample[i-1])に加算する。これに り、補完波形は、重み係数の小さい両端部 波形の傾きが小さくなり、重み係数の大き 中央部で波形の傾きが大きくなる。

 上記の処理を行うことにより、第1の出力 PCMデータの曲終端部及び第2の出力PCMデータ 曲先頭部の波形は、図13A及び図13Bのように る。

 立下りフレームにおける補完波形705は、 13Aに示すように、補完波形作成区間決定処 (S70)で決定した補完波形作成区間701の開始 である補完波形作成開始点702と終了点であ 補完波形作成終了点703とを通り、2点の中間 点に近づくほど傾きが大きくなる3次曲線で 構成される。補完波形としてこのような波形 を用いるのは、波形歪みに起因する違和感や ノイズの主要因となる高周波成分を除去する ためである。なお、第1の出力PCMデータの曲 端部に対して上記の補完波形作成処理を実 した際、第1の接合点706のサンプル値を記憶 ておき、第2の出力PCMデータの曲先頭部に対 して補完波形作成処理を実行する際に使用す る。

 立上りフレームにおける補完波形705は、 13Bに示すように、補完波形作成区間701の開 点である補完波形作成開始点702と終了点で る補完波形作成終了点703とを通り、前記の り2点の中間地点に近いほど傾きの大きい3 曲線で構成される。

 ただし、第2の出力PCMデータの曲先頭部に おける補完波形作成処理は、補完波形作成開 始点702のサンプル値として、先の処理で予め 記憶しておいた第1の接合点706のサンプル値 用いる点で、第1の出力PCMデータの処理と異 る。これにより、第1及び第2のPCMデータを らかに接続することが可能となる。また、 次的な効果として、曲端が編集された楽曲 や異曲間に対してギャップレス再生処理が 用された場合に、ユーザが感じるノイズを 減することが可能である。

 一方、第2の出力PCMデータの曲先頭部にお いて、第2の接合点を補完波形作成開始点と て補間波形作成処理を実行することも可能 ある。しかしながら、第1の接合点と第2の接 合点とは、波形歪み等の影響を受けてサンプ ル値が大きく乖離している場合がある。この ような場合に第2の接合点を補完波形作成開 点とすれば、第1及び第2のPCMデータを滑らか に接合することができず、ユーザに音飛び感 等を与える原因となる。

 そして、補完波形作成部208は、作成した 完波形705を出力PCM記憶部204に上書きする。 6Cは本処理後のPCM波形を模式的に示したも であり、図中の破線が補完波形となる。な 、補完波形作成区間決定処理S70及び、補完 形作成処理S80は、音楽再生装置200のハード ェア資源の制約に応じて実施しなくても良 。このとき、もちろん、補完波形作成部208 図2に示す構成から外しても良い(S80)。

 次に、再生制御部201は楽曲連続出力部209 出力PCMデータの出力を指示する。楽曲連続 力部209は、S80までに加工した第1の出力PCMデ ータの立下りフレームと、第2の出力PCMデー の立上りフレームを曲間無く連続して出力 る(つまり、第1及び第2の出力PCMデータを第1 び第2の接合点で接合して出力する)。これ よりギャップレス再生が可能となる(S90)。

 かかる構成によれば、ソース音源が複数 トラックに分割されて収録されている記録 体から、当該複数のトラックを読み出して 別にMP3、WMA、AACなどの音声符号化技術によ エンコード及びデコードし、連続再生した 合においても、無音部の除去に加え、遷移 の除去と波形歪みの補完波形への置換とを うことにより、従来技術比でユーザにとっ より高品質なギャップレス再生が可能な音 再生装置200が提供可能となる。

 なお、本実施形態では、ソース音源を2つ のトラックに分割した例を示したが、これに 限ることなく、ソース音源を3つ以上のトラ クに分割して収録したCDから楽曲データを取 得した場合にも本発明を適用することができ る。この場合、まず、1番目のトラックに対 する出力PCMデータを「第1の出力PCMデータ」 2番目のトラックに対応する出力PCMデータを 「第2の出力PCMデータ」として上記の処理を う。その後、2番目のトラックに対応する出 PCMデータを「第1の出力PCMデータ」、3番目 トラックに対応する出力PCMデータを「第2の 力PCMデータ」として同様の処理を行えばよ 。

 また、本実施の形態における音楽再生装 200の実現において、上述の再生制御部201、 曲記憶部202、デコード制御部203、出力PCM記 部204、ギャップ情報記憶部205、ギャップ検 部206、ギャップ除去部207、補完波形作成部2 08、及び楽曲連続出力部209は、ソフトウェア のプログラム、そのプログラムを記録した 体でもよい。

 なお、上記実施の形態において、音楽再 装置200を構成する各機能ブロックは、典型 には、CPU(Central Processing Unit)やメモリを要 た情報機器上で動作するプログラムとして 現されるが、その機能の一部または全部を 積回路であるLSI(Large Scale Integration)として 現してもよい。これらのLSIは、個別に1チッ プ化されても良いし、一部又は全てを含むよ うに1チップ化されても良い。ここでは、LSI したが、集積度の違いにより、IC(Integrated Ci rcuit)、システムLSI、スーパーLSI、ウルトラLSI と呼称されることもある。

 また、集積回路化の手法はLSIに限るもの はなく、専用回路又は汎用プロセッサで実 してもよい。LSI製造後に、プログラムする とが可能なFPGA(Field Programmable Gate Array)や LSI内部の回路セルの接続や設定を再構成可 なリコンフィギュラブル・プロセッサを利 しても良い。

 さらには、半導体技術の進歩又は派生す 別技術によりLSIに置き換わる集積回路化の 術が登場すれば、当然、その技術を用いて 能ブロックの集積化を行ってもよい。バイ 技術の適用等が可能性としてありえる。

 本発明にかかる音楽再生装置は、従来技 では考慮されていなかった遷移部の除去機 及び波形歪みの補完機能を有し、聴覚上の 和感の少ない高品質なギャップレス再生を 現する音楽再生装置として有用である。