- 初版:2006-09-15
- 第2版改訂:2006-09-22
- 第3版改訂:2006-12-01
なお、このアーティクルは IE では正常に表示されない可能性があります。
つい先日に母校の文化祭に行ったのですけれども、高校生の展示を見るでもなければ 3D の女子高生を眺めるでもなく、『涼宮ハルヒの憂鬱』 OP (YouTube / stage6) の「星が飛び散る中をハルヒが走り鶴屋さんが顔を出し時計に乗ったみくるが泣きながら飛ぶ」という一連のシーンのエンコードが困難を極めた話なんぞを私と同じパソコン部 OB の方としていました。その際にあのシーンは DVD でもマトモに収録できていないんですよねーなんて話をしていたので、そのメモとして「なぜハルヒ OP が DVD では破綻しているのか」について簡素ながら MPEG-2 規格の話などを書いておきます。
まあ「いまさらハルヒ?」と言われそうですし、もう既にいろんなところで検証されてそうですが、参考程度のメモということでひとつ。
MPEG-2 すら破壊するハルヒ
アナログ放送をデジタル録画するだけでも大変な星のシーンですが、DVD でも MPEG-2 規格の限界を痛感させる内容になってます。一般的な DVD プレイヤーではデジタルレコーダーなどと同様にノイズリダクション処理を行いますが、それを行っても相当のブロックノイズが出ます。
どのように表示されるかは利用するデコーダー(≒プレイヤー)に依存しますが、その一例として2点を検証用参考資料として挙げます。24bit-PNG で引用していますので、壮絶に走っているブロックノイズは JPEG による劣化ではありません。


なぜこういうことになるのか?
なぜこういうことになるのかについて Wikipedia の MPEG-2 の項目あたりから引用できればいいなと思ったんですが、変換法について説明がありませんでした。仕方ないのでこれは後で自力で加筆することにして、MPEG-2 の特徴について自分の知っている限りで簡単な説明を書いておきます。もっとも、怪しい知識で話している以上たぶんなにか間違っていますので動画有識者の補完希望。私は説明するのが大の苦手なので、誰か代わりに書いて欲しいくらい(このサイトは全文 PD です)。
前提:フレームについて
日本の DVD はテレビ放送と同様に NTSC 方式を採用していますので原則として1秒間に30のイメージ(=フレーム)を表示することになります(これが 30fps の動画)。この 30fps で表示されるフレームはその全てが2枚のインターレース画像(縦に 525 本ある走査線が1本飛ばしで描かれている画像)で構成されていて、奇数の走査線が描かれているものと偶数が描かれているものが交互に表示され、この1秒間当たり60枚表示されるイメージのことをフィールドといいます。
余談:日本でアナログ放映されている動画は1つ残らず全て、この奇数フィールドと偶数フィールドがそれぞれ交互で表示されるフレームの連続再生によって描画されています。DVD やデジタル放送ではそれを行わないプログレッシブ方式も用いられます。
動画はみんなこんなもんだろうという想定
動画というのはイメージを連続で再生していくものである以上、デジタル化するとデータ量が非常に増えるものになります。非圧縮の動画を数分も保存しようものなら旧世代のハードディスクなら一杯になってしまうくらいのものですので、それを DVD という容量の制限下に収めるためにはそれを圧縮する必要があるわけです。その規格が MPEG-2 。
この規格はどういう概念で動画を保存するかというと、「フレームとフレーム、あるいはフィールドとフィールドを比較してもたいていの部分は動かない」ということを原則とします。手近にある動画を見ればわかりますけれども、まあたとえば「まじぽか」の OP (YouTube / stage6) で説明すれば、最初にゆうまのシーンであればスカートや光点以外はほとんど色が変化していませんし、次に一瞬で岩が崩れるシーンで絵全体が動いたあと、次の4人にそれぞれ陰が覆いかぶさるシーンも一部分の色が少しずつ変化していくだけであってほとんどの部分は同じ色のままなので絵全体としての変化量はそれほど大きくありません。動いている部分を見ずに、そこ以外の部分を凝視して動画を見てみてください。人間が見て「これは大きく動いてるな」と思う動画でも、実はそれほどフレームごとの色というのは大きく変化していないのです。
もちろん実際にはより複雑な処理をするわけですが、基本的には「フレームとフレーム間では全体としての差は軽微であり、それはほとんど類似したイメージになっている」という動画の一般性を MPEG-2 は利用して動画を圧縮します。まず元となる画像を参照して、そこから動いた部分だけを記録してほとんどの動いていないシーンに関しては前のフレームのデータをそのまま使うことで、時間当たりに必要な容量を削ることができます。このテクノロジーのことを「MC」ですとか「フレーム間予測」といいます。
3つのフレームとノイズの原因
MPEG-2 ではこの際に参照される元となるフレームのことを I-frame といいます。この I-frame の差分から一定の時間の間に動く部分を記録したフレームを P-frame 、さらにその I-frame と P-frame の間で動く小さな差分(相関性)を記録したフレームを B-frame といいます(一般に「Iフレ」「Pフレ」「Bフレ」などと言われるアレです)。こんな風に MPEG-2 では全てのフレームの画像をそのまま記録するのではなく、I-frame を先頭に B-frame がいくつか続き、P-frame が出てまたしばらく B-frame が続いて…というような、wiki の履歴のように I B B B B P B B B B P B B B B... と記録していく差分構造を原理としています。
この構造は当然ながら「動画がそれほど変化しない」ことを原理としている、つまり前のフレームとの差分はたいしたことではないであろうということを大原則としていて、大きく動くシーンが一瞬ではなく延々と続くことには向いていません。動きの激しいシーンが続くと I-frame からの P-frame までの差分は大きくなり、B-frame に記録される差分が一部分であるどころか画面全体の描写になります。もちろん動きの激しい動画に備えて MPEG-2 では可変ビットレートと実質最大 9Mbps のビットレートが用意されているので通常はちょっとくらい動きの激しい映像が続いても余裕ですし、MPEG-1 では用意されていなかったフィールド間での圧縮にも対応している(=動きが激しくなっても多少は緩和できる)のですけれども、それでももし必要となるビットレートよりもその動画の動きが激しい場合には差分を記録しきれなくなるため、その分はデジタル的なブロックノイズとして動画に現れます。その現象がハルヒ DVD の OP。
一層 DVD に2時間+αの映画を収録するために必要な平均ビットレートは約 4Mbps 。一昔前の映画はみんなそれで記録されていました。最近は二層の DVD が流行ですが、それにしても 6Mbps から 7Mbps です。ここまでくると通常は人間の目では静止させてもビットレート不足によるノイズかどうかは、よほど慣れている人でもなければ認識できなくなります。つまりハルヒの OP は一般的な実写映像よりも多くのビットレートを必要としているわけです 。
というわけで、
つまりこのブロックノイズの原因は「相関性フレームの差分情報過多によるビットレート不足」によります。しかも一般的にネットに落ちている荒い動画と異なり、MPEG-2、ひいては DVD 仕様の限界まで使ってもそれでも足りないという状態を示しています。ハルヒは DVD には収録できていないのです。
結論としてはハルヒは Blu-ray Disc や HD-DVD のような次世代メディアじゃないとちゃんと収録することさえ出来ませんでしたということ。たしかどちらも圧縮には H.264/AVC や VC-1 を使う予定なはずですけれども、これならハルヒもちゃんと収録できるかもしれません。
「ただの DVD には興味ありません。この中に Blu-ray Disc 、HD-DVD 、x264 、VC-1 がいたら私を録画してみなさい。以上。」






Comment (コメント)
地上デジタルの実際のレートが実際いくらぐらいなのかわからないので、さらに高いレートで
圧縮すれば大丈夫かもしれませんが…。
ちなみに高解像度でH.264化してみましたが、あの箇所は異常にCPU負荷が高く、焦ります。
「ハルヒ=ホスト部」は同意。
BD や HD-DVD は H.264/MPEG-4-AVC か VC-1 を採用した上で約 2 倍のビットレートでの録画が出来ますので、フルハイビジョンでもなんとか行けるんじゃないかなーと考えている次第。さすがに BD でこんなにブロックノイズが出たら引きますw
もっとも、ほとんど対応製品が出てもいない段階なのに、既に「本当に次世代メディアで再生できるのか」と心配させるアニメというのも凄いものです。
私もあのシーンを 720p の x264 で圧縮したら「紙芝居」だったタチでして、結局それを見て Core2Duo を買う決心をしたりしたものです。アレは編集するだけで一苦労でしたからね…
ところでカーリアさん (side=2) の指摘を読んで以降、自分も藤岡のほうのハルヒしか思い出せなくなった次第。「涼宮」の省略はよくないですね。
地デジでノイズ出てたなら
24fプログレで作ればDVDでも大分マシになるのに・・・。
実際地デジの画質は良くないと言われてますし自分も納得のいかない画質です^^;
次世代メディアの方が遥かに綺麗ですよ^^
スタッフのフォントがくっきりしたりボケボケになってたり……
BDとかで出たらまた買ってしまいそうです。
資料を提示できないのが申し訳ないですが同じソースならBSデジタルで見た方がより高画質で見ることが出来ます。
実際にはBSデジタルでもNHKハイビジョン以外はソースの画質がそもそも低かったりするようですが・・・
そういう私も大画面の出力となると720pでHDMI1.1のプロジェクターしかもってないので真のHDTVの恩恵を受けれないのでがっかりですorz
仕方なく買い直しを検討中です。
再生機もそうですがまずTVが・・・・最低でも50インチクラス(目視で差を感じ取れるインチサイズはこれくらいでしょう)じゃないとBDやHD-DVDの画質の恩恵は受けれないわけで・・・・
かといって大画面でブロックノイズバリバリだと泣きそうになりますDVD版ディープブルーとかw
ハルヒのOPは
480i 30fならMPEG2:15Mbps H.264、VC-1:10Mbps以上
1080i 30fならMPEG2:35Mbps以上 H.264、VC-1:25Mbps以上
はないとブロックノイズ等が出るな・・・。
あー…これはいつも画像にこういうタイプの枠をつけているのですけれども、画像編集中にミスったのだと思います。
枠内側を 856*480 にしたつもりでいたのですが、たぶん端っこが切り落とされてます。
絵だけみたらそれほど高い周波数特性が含まれていないようにみえますから
引用の画像はBフレームをのせたもの?
上は確か P フレームですね。このシーン周辺は B フレームが少なく、GOP そのものが小さくなっていたと思います。
Classic でも書きましたが、説得力については書いた本人が「概略以下」だと思っていますので、正直なところあとは詳しく説明できる方にお任せしたいと思ってます。
嫌味でもなんでもなく、ほぼ間違いなく「DVD 屋さん」から見たら退屈未満なはず。
全文 PD ですので、必要ならご利用いただければ幸いな限りです。
星と暗闇の境界は高周波成分でモスキートノイズの原因になりますし、
MPEG2の動き補償はズーム無しなので、だんだん奥にスクロールするとか
という動きだと動き補償後の差分データが大きくなってしまいます。
その点は、H264等の次世代codecは柔軟性が高いので、良いエンコーダなら
もっと上手くエンコードできるでしょうね。
ただ、HD-DVDは「容量は多層化でBDに対抗できる」と言ってますが、最高
ビットレートはBDに大きく劣ります。DVDのビットレート制限の問題が
次世代でも繰り返されることが無いよう、高ビットレートのBDを応援しています。
あの2001年宇宙の旅は素晴らしかった...
BSデジタルの本放送(BS-i 1440x1080 17Mbps? 20Mbps?)ではボケ味はあるものの、
ノイズまみれってことはなかったですね。
なので、ビットレート40MbpsというBru-Ray Disc Boxは喜んで予約しました(^_^;)
なんかビットレートの限界で足取られてるみたいだけど、コンテナ変えてもダメなの?要はオーサリング可能なコンテナじゃないと『コンテンツを提供するという形式の動画メディア』にならないからダメなんだよね。DVDの本質として。
MKVやらOGMを再生出来る、民生プレイヤーが発売されたらそれでいいとかじゃないの?MPEG2コンテナはMPEG2コーデックしか使えないからアレだけど、MKV、OGMならどのコーデックでも普通に扱えるんだよね。
それとも、プレイヤー自体が高ビットレートに対応出来ないということ?
シークが間に合わないとか?
そこんとこどうなんでしょ。
もちろん(本文中では意図的に無視していますが)デコーダー、あるいはプレイヤーの問題もあります。
プレイヤー側の性能・エンコーダーの性能・将来的な matroska におけるオーサリングなどの特殊な実装などを別としても、こういう部分を綺麗に再生するためには「必要なだけのビットレートが(どのようなコーデックであれ)要求されるけど、DVD では表現しきれないね」ということに過ぎません。
現実問題として放送されたハルヒを綺麗に MPEG-2 でキャプチャできなかったかといえば出来ないことはなかったわけで、「概要未満」のレベルとしてはそれほど深い問題ではありません。
とうぜんDVDでパッケージ化することを前提に作っているんだから、パッケージにしたときに破綻のないよう、スペックをその枠内に収まるよう逆算してフレームなりコマ数なりを構築するべきなんでしょう。何の作品だったか忘れましたけど(ジェネオンだったかな?)、OVAで、本編が長くなりすぎてEDテロップが時間内に収まらず、超高速でスクロールしたら文字がまったく読み取れなかったという、お粗末な製品がありましたよ。
過去の作品なら、ノイズのない画質で観たければ素直にLDを探した方が良いのでしょう。でも、新作であれば、DVDの性能の限界を超える表現は製作側が出来る限り避けるべきでしょう。