音風景ブログ

目隠しテストによるエンコーダの音質評価などを行うブログです。

MP3 192kbpsの音質比較

概要

192kbps付近でエンコードしたときのMP3エンコーダの音質比較。
2011年12月時点で最新のLAME3.99.3(new)、2009年版のLAME3.98.4(old)、iTunes、MVP QDesignを採点して比較。
Rarewaresで配布されているLAMEを使いました。
LAMEは、CBRとVBRをテスト。VBRは、出力されるMP3のビットレートが192kbpsに近くなるように品質指定の数字(V)を調整した。

結果

LAME 3.98.4 CBRの方がLAME 3.99.3 CBRよりも良い(p=0.027)。
LAME 3.98.4 CBR、LAME 3.99.3 VBRiTunesよりも良い。
MVP QDesignは、他のどのエンコーダよりも悪い。
その他は、有意差はない(=差はあるかもしれないが、95%以上の自信を持って断言するほどではない。)。

評価

エンコーダ LAME LAME LAME LAME iTunes MVP
リリース年 2011 2011 2009 2009 2011 2001
バージョン 3.99.3 3.99.3 3.98.4 3.98.4 10.5 1.2.51
速度指定 -q 0 -q 0 -q 0 -q 0   HQ
レート制御 CBR VBR CBR VBR CBR CBR
ビットレート 192k V2.5 192k V2.3 192k 192k
Tarentella 管楽器 4.2 3.6 4.5 3.5 4.4 3.9
水瀬さんち 男女声 4.0 4.0 4.2 4.1 3.8 3.5
Miles Davis ジャズ 4.0 3.7 4.0 3.6 4.2 3.7
58-ギター 弦楽器 4.2 4.3 4.7 4.4 4.0 3.8
55-Haydn 管楽器 5.0 5.0 5.0 4.5 5.0 4.5
41_30sec 打楽器 3.6 4.1 3.4 3.9 3.2 2.1
finalfantasy 撥弦楽 3.9 3.8 4.0 3.7 3.8 3.3
ATrain ジャズ 4.3 4.4 4.4 4.2 4.7 4.2
BigYellow POPS 3.8 4.0 4.1 4.2 3.8 2.7
FloorEssence テクノ 3.3 4.1 3.6 4.2 3.5 3.0
macabre オケ 5.0 5.0 5.0 4.5 4.1 3.8
mybloodrusts 弦楽器 4.0 4.2 4.0 4.3 3.8 3.5
Quizas ラテン 4.1 4.0 4.3 4.0 3.9 3.2
VelvetRealm テクノ 3.6 4.1 3.8 4.1 3.6 4.0
雨降花 POPS 3.7 3.9 4.1 3.7 3.4 3.1
Trust Gosp 3.9 4.1 4.1 4.0 3.9 3.3
Waiting ロック 3.9 3.8 3.7 3.9 3.8 3.1
Experiencia ラテン 4.4 4.2 5.0 4.6 4.2 3.7
HeartToHeart POPS 3.8 4.1 4.0 4.6 3.6 2.7
Tom's Diner 女声 4.0 3.8 4.6 3.7 3.3 3.1
↑音源 平均点 4.00 4.09 4.21 4.05 3.88 3.38
実レート 193k 192k 193k 191k 193k 192k
全サイズ(KB) 10186 10147 10186 10093 10234 10161
エンコーダ LAME LAME LAME LAME iTunes MVP

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.0とRP-HT560を利用して、6個のエンコードされたMP3をランダムに並び替えて、銘柄を伏せて採点した。1=音質劣化が非常に気になる 2=気になる 3=少し気になる 4=原音からの音質変化が分かるが、気にならない 5=音質変化がわからない、区別できない。4.9点以下の評点をつける場合は、ABXYテストを20回行い、15回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。日時を空けて、同じ音源を2回採点して平均をとった。このテストでの採点は、20(音源)×6(エンコーダ)×2(回)=240(回)。

使用したオプション

LAME3.99.3 -q 0 -b 192
LAME3.99.3 -q 0 -V2.5
LAME3.98.4 -q 0 -b 192
LAME3.98.4 -q 0 -V2.3
iTunes MP3 エンコーダ、高音質(192 kbps)、エラー訂正を使用する
MVP QDesign High Quality MP3, Stereo, 44.1 KHz, 192 kbits/s

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 20
Critical significance:  0.05
Significance of data: 0.00E+000 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              119          30.71
Testers (blocks)    19          13.87
Codecs eval'd        5           8.58    1.72   19.73  0.00E+000
Error               95           8.27    0.09
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.185

Means:

oldcbr   newvbr   oldvbr   newcbr   itunes   mvp
  4.21     4.09     4.05     4.00     3.88     3.38

---------------------------- p-value Matrix ---------------------------

         newvbr   oldvbr   newcbr   itunes   mvp
oldcbr   0.192    0.100    0.027*   0.001*   0.000*
newvbr            0.728    0.351    0.025*   0.000*
oldvbr                     0.557    0.057    0.000*
newcbr                              0.183    0.000*
itunes                                       0.000*
-----------------------------------------------------------------------

oldcbr is better than newcbr, itunes, mvp
newvbr is better than itunes, mvp
oldvbr is better than mvp
newcbr is better than mvp
itunes is better than mvp

整形済みデータ

% MP3 192kbps ABC/HR
newcbr	newvbr	oldcbr	oldvbr	itunes	mvp
4.150	3.550	4.500	3.450	4.350	3.850	
3.950	3.950	4.200	4.100	3.800	3.450	
3.950	3.700	3.950	3.550	4.150	3.700	
4.150	4.300	4.650	4.350	3.950	3.750	
5.000	5.000	5.000	4.450	5.000	4.450	
3.550	4.100	3.350	3.900	3.200	2.100	
3.850	3.800	3.950	3.650	3.750	3.300	
4.250	4.350	4.400	4.150	4.650	4.200	
3.800	3.950	4.100	4.200	3.750	2.650	
3.250	4.050	3.600	4.200	3.450	3.000	
5.000	5.000	5.000	4.450	4.050	3.750	
4.000	4.200	4.000	4.300	3.800	3.450	
4.050	3.950	4.250	3.950	3.850	3.200	
3.550	4.050	3.800	4.100	3.600	3.950	
3.650	3.900	4.100	3.650	3.400	3.100	
3.850	4.050	4.100	3.950	3.850	3.250	
3.850	3.800	3.700	3.850	3.800	3.050	
4.350	4.150	5.000	4.600	4.200	3.700	
3.800	4.100	4.000	4.550	3.600	2.650	
4.000	3.800	4.550	3.700	3.300	3.050	

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。