OGG Volbisはデファクトスタンダードの夢を見るか

大分から引っ越す直前に書いた文章をコピペ。

しばらく休んでおりました。
今週末から連休です。
引っ越しのための準備な訳ですが気力全くなし。
戦士には休息が必要なのであります。

この休日のスタートに何をしてたかと言うと、延々とエンコードをしてました。
MP3プレーヤを買ったばかりでなおかつ神経質な人間が初めに当たる壁。
それはエンコードの設定です。
貧乏臭いプレーヤを買っておきながら、骨の髄まで吸い尽くそうというのだから益々貧乏臭いです。
でも本当に貧乏なんだからしょうがない。

作業環境ですが、ThinkPad R30とVAIO C1VJしかありません。
仕事で使う場合が多いので(ってゆーか、ThinkPadは会社のじゃん)
音を出すこともなかったので気づかなかったのですが、
ノートパソコンのサウンドボードってすさまじくノイズが多いのね・・・。
一番うっとうしく感じるのがハードディスクから回ってくるノイズ。
ハードディスクのヘッドにマイクが入っててその音を取ってきてるんじゃないかと思うほど凄い。
まぁ、こんな劣悪な環境ですがそれなりに比較することは可能でした。

エンコーダはあれがいい、これが悪いとか某掲示板で永遠に終わらないんじゃないか
というほど議論されています。
ところが、難しいのは全員が同じ耳と感性を持ってるという訳じゃないとこですね。
結局、信者vs信者の痛い叩き合いとなっています。

で、俺ですが、以前ピュアオーディオに片足つっこんでいたのでそれなりの耳ソムリエかと
思ってました。
ところがこの前、耳のチェックをしたら、

13kHz以上が聞こえねぇ・・・。_| ̄|O (※注1)

え、マジ?
十代の頃は「人間、22kHz以上なんて余裕で聞こえるよな?」(※注2)とか言ってた気が・・・

(※注1:人間は歳を取るほど耳が衰えていきます。特に高音から聞こえにくくなっていきます。)
(※注2:22kHzの信号源があったからといって本当に22kHzだけの成分とは限りません。
     壁に反射にて異なる波形になる場合があります。例えば11kHzになったり。
     22kHzは普通の人はまず聞こえません。ピアノの調律師みたいな特別な人は別。
     よって、厨房発言です。お前が聞いていたのはきっと11kHzだ!>若かりし頃の俺)

まぁThinkPadのスピーカorサウンドボードが13kHz以上出せないのかもしれないし、気にしない♪


世の中、色々コーデックの種類があると思いますが、メジャーなのはこんなとこでしょうか。


・ MP3
 良いとこ:対応機種が多い。昔にMP3取り貯めした人はそれがそのまま使えるのが嬉しい。
      規格が公開されているので世界中のユーザーから色んなソフトが出ている。
 悪いとこ:古い規格なので音質・圧縮率に今更感がある。

・ WMA
 良いとこ:対応機種がそこそこ多い。Windows Media Playerで対応しているので
      パソコン苦手な人に優しめ。
      マイクロソフト曰く、MP3より優れてるとのことだが・・・
 悪いとこ:仕様が公開されていない。

・ ATRAC3
 良いとこ:SONYだったらこれしかない。最近は譲歩してMP3対応機種も出ましたが・・・。
 悪いとこ:音質がイマイチということで有名。

・ OGG Volbis
 良いとこ:ロイヤリティーフリー(※注3)。音質と圧縮率のバランスに優れる。
 悪いとこ:対応機種が少ない。対応ソフトも少ない。

(※注3:「OGGはうちの特許だから金払ってくれる?」と言われることがないということ
     MP3も初めはそうだったんだけど、後から金取りに変化。
     MP3は商用の場合だと結構高い。でも個人には請求来ないのが救い。
     同じような話はGIF特許問題が記憶に新しいですね。)

ここで検証に移る前に、ATRAC3君脱落です。さようなら~。
どこ言ってもATRAC3の音がいいと聞いたことなかったので。残念。(′・ω・`)


FFT(※注4)かけれるフリーソフトを発見したのでリアルタイムで表示しながら試聴。
地味な作業で何度も繰り返してると辛いっす。マジで。

(注4:Fast Forie Transration…スペルがあってるか怪しい。高速フーリエ変換のこと。
    よくわからねー人はグライコのお化けだと思って貰えばOK。)


○ 普通に聞いてみた感想

・ MP3(エンコーダ:LAME ver 3.96.1)の場合
 某掲示板で最も評判が良いのがこれです。
 確かに癖のない音で好感が持てます。

・ MP3(エンコーダ:午後のこーだ ver 3.13)の場合
 某掲示板で評判悪いのがこれです。
 LAMEの改造版なので当然LAMEの音に似てます。
 個人的にはちょっとキンキン気味に聞こえた。

・ WMA(エンコーダ:Windows Media Encoder)
 高音が強調されて明瞭感がある。
 よくよく聴き直し&検証していると、本当に明瞭「感」であった。
 つまり、高域の再現性が悪いのよね。
 (FFTの結果参照のこと)

・ OGG Volbis(エンコーダ:AudioEncoder 2.04dについてたヤツ)
 かなり再現性が高い。
 ビットレートを落としてもいい感じ。

で、聞いててどうよ?
上のように書いたけどはっきりはわからない実はプラシーボなんじゃないの?

つまり、なんだかんだ言ってどれも優秀なコーデックでどれでも好きなの使えばいいんじゃねーの?
これはこれで一つの答えかな。


しかし俺は貧乏なのでもうちょっとつっこんで解析しました。
「貧乏は不時の病だ。それに遺伝するから、気をつけろ!」


○ FFT解析結果

オリジナル音声は0Hz~22kHzまでフルに出てました。
うーん。理想的なソースだ。
ピークホールドをかけて最初から最後まで再生してます。
つまり、最大音圧を見てる訳ですね。
この状態のカットオフ周波数を見てみましょう。
基準は-80dBとしました。

・ 128k-320k VBR(俺が使おうと思ってた設定)

LAME 18kHz
午後 22kHz
WMA 17kHz
OGG 20kHz

うわ。数値上は評判の悪い午後がトップになりました。
ただし、LAMEも午後も言えることなんですが、16kHzにフィルタがかかっているようです。
ピークで比べるとオリジナルと一緒ですが、実際の再生時はちょっと雰囲気違います。
高い音が出てる時は16kHz以上出すけど、それ以外の時は16kHz以上出さないみたいな。
言葉でうまく表現できない・・・。

WMAは残念ながら最下位となりました。
しかも、高域の信号を出す際に高調波が乗る場合もあります。
いけませんねぇ・・・。

予想通り、OGGは優秀でした。
帯域が稼げて、フィルタのかかり方も自然。高調波も出てない。
総合判定で一位です。


・ 320kbs CBR(もうちょっとがんばれば音質よくなるんじゃないかと思って)

ポータブルプレイヤのカタログスペック上限です。
某掲示板では320kbpsなんてビットレート使うヤツはアホと言われています。
確かに、WiOOyとかですさまじくでかいMP3を拾うと腹が立ちます。
では、実際の音質はどうなんでしょうか検証してみましょう。

LAME 20kHz
午後 22kHz
WMA 20kHz
OGG 22kHz

なんだ。128kbps以上に設定する価値あるじゃないですか。

LAMEとWMAが脱落しました。
某掲示板で「午後を使う香具師は素人」とか言われるけど、それって本当なんですか?
俺には午後>LAMEに聞こえる(っていうか見える)。
午後は128k-320k VBRの時から22kHzピークが出ていました。
320kbpsしたときの違いは、16kHzにかかっている不定期フィルタがなくなったことです。
(つまり、そこでビットレートが切り替わってたのかも。よく考えろよ。>俺)
俺のLAMEの設定がおかしいのかもしれません。
もしここの存在に気づいた某掲示板の人が居てもいぢめないでください。
そして、ここでもOGGは優秀でした。
午後とOGGはスペクトラム波形を見てオリジナルと区別できる自信はありません。


○ オリジナルとの差信号

では、オリジナル信号との差をとってみましょう。
つまり、どういう音が省かれたのか、というのがわかります。
ここで聞こえる音がそのエンコーダでは苦手な分野ということになります。

オリジナル波形を反転させて、エンコード後の波形と合成。
このやり方考えた人に「お前、マジで頭いいな!」と言ってあげたい。

差信号を聞いてみて初めてわかりました。
圧縮音楽って高音を中心に省いてるのかと思ったらそうじゃないんですね。
全ての音域からまんべんなく間引かれてます。

320kbps CBRで差信号のピーク値を取ってみました。

LAME 測定不能
午後 測定不能
WMA -41dB
OGG -41dB

LAME&午後は先頭に無音が追加されてうまく合成できず・・・。
まぁ、根性があればできるんですが根性なしなんで諦め。

数値上はWMAとOGGが同じになりましたね。
ところが・・・

WMA・・・うは。これヤバイ。
ストリングスのアタック部分が削られています。
文字で表現すると
ざわざわざわ・・タン・・キン・・キン・・ざわ・・タン・・キン

OGGはスネアドラムのような音が削られています。
オリジナルソースにスネアドラムないし・・・。
あ。手拍子か。ライブ盤なんで。
ソースの選択に失敗してますね。(さっき逆の事言ってなかったか?>俺)
基本的にはWMAと同じ傾向です。
ただし、メロディーラインの音は全く乗ってない。


以上の結果から判断しますと、
OGG > 午後 > LAME > WMA
が俺の結論です。


ここでファイナルアンサーとしたいのですが、何度も聞いてるうちにOGGでも物足りなく
なっちゃいました。
世の中、可逆圧縮というのがございます。
これは上に上げたコーデックとは違い、全く音質が劣化しません。
容量はだいたいCDの半分くらいになります。
「半分くらいにしかならないんだったら今時ハードディスクの容量でかいんだし、
wavにすればいいだろ!」
という意見もあると思います。
ところが、wavの弱点・・・タグが使えない。
(2005年3月15日 追記)
実は使える事が判明。
ただ、対応してるソフト少なすぎ。
対応してるポータブルプレーヤはもっと少なすぎ。
この弱点はかなり痛いです。

可逆圧縮は下記のような派閥があります。
音質の違いで悩む必要がない分、答えは導き出しやすいです。

・ WMA LOSSLESS
  → WindosXPの人はこれにしとけ!
・ APPLE LOSSLES
  → 林檎のパソコンの人はこれにしとけ!
・ Monkey's Audio
  → 圧縮・解凍にかなりのCPUパワーが必要。今後廃れると思われる。
  → 高性能パソコンを持てあましててなおかつ偏屈な人はこれにしとけ!
  → MP3が普及し始めた頃を思い出したい人はこれにしとけ!
    (CPUのクロックが200MHz位だった頃はMP3再生するのも一苦労だったんす)
・ TTA
  → 軽量で圧縮率もいい。今後の本命?
  → でも俺はタグのつけかたがよくわからんかった。
  → 新しもの好きな人はこれにしとけ!
・ FLAC
  → ごく一部のポータブルプレイヤ持ってる人はこれにしとけ!
  → Windows2000以前の人はこれにしとけ!
  → まぁ、俺はこれをつかってなさいってこった。_| ̄|O

実はWindows2000でもWMA LOSSLESSは使えます。
Windows Media Encoderでは使えます。
Windows Media Playerでは使えません。
何か意図的なものを感じるんだが気のせいか?
Windows Media Playerで使えないと不便なので実質Windows2000
+WMA LOSSLESSという選択肢はNG。

あー。書くの疲れた。
FLACで母艦PCに入れておいて、出かける前の日の夜にエンコードしてポータブルプレイヤに入れるというスタイルで行きたいと思います。
FLAC→午後ができないのが泣けてきます。
しばらくはFLAC→LAMEで使います。

やっぱりOGG対応プレーヤ買えば良かったと後悔しました。
(2005年3月15日 追記)

買っちゃった。(*´д`*)
40G搭載で29,800円+15%ポイント還元。
安すぎ。

普段、店の補償なんてつけないんだが、3年補償に加入。
店の兄ぃちゃん「ははは。HDDタイプですからね。不安ですよね。」
ビoクカOラの店員もさわやかになったもんだな。

あとから気づいたんだが、Scarlet Rose氏が持ってるM3(通称兄さん)
はFLAC対応してやがんの・・・。_| ̄|O

貧乏性のおかげですっかり負け組。
今はOGG 500kbpsでエンコードする毎日です。

おっと。結論が無かったな。
OGG Volbisはもはや標準にはなり得ないでしょう。
世間の興味も遠ざかってしまいましたし。
やっぱりまだまだMP3が王者のまま、という図式は変わらなそうです。
[PR]
by mu-vipper | 2005-03-15 14:31 | 物欲系


<< がんばれexcite! 未来予想図 >>