音風景ブログ

目隠しテストによるエンコーダの音質評価などを行うブログです。

最新LAME3.100 コマンドライン指南 2021年版

2017年10月にリリースされた、最新版のLAME3.100で使えるコマンドラインを指南。

基本中の基本

lame [オプション] 入力ファイル [出力ファイル]

これがLAMEの基本。

lame -b 192 sample.wav sample.mp3

固定ビットレート(CBR): -b 192 または --preset cbr 192のように指定。数値部分には、192の他にも64 80 96 112 128 160 192 224 256 320などが有効。

lame --abr 192 sample.wav sample.mp3

可変ビットレート(ABR): --abr 192 or --preset 192のように指定。有効な数値はCBRと同じ。

lame -V2 sample.wav sample.mp3

可変ビットレート(VBR): -V2のように指定。有効な数値は0〜9.999で、数字は小さいほど高音質でファイルサイズも大きい。小数(例:-V2.3)も可。

最高音質のオプション

-V0 可変ビットレートのV0が、一般的なMP3フォーマットの最強設定。音の欠陥が生じるリスクは最小となる。
ビットレートは約256kbpsであり、1GBガバイトのメモリに約8時間の音楽を格納できる。
※2011年10月に可変ビットレートの改良が入り、また2021年9月に、CBR 320kよりV0の方が良いという結果が公表された*1ため、V0を最高音質のオプションに移動させました。

高音質のオプション

ハイファイ、静かな環境でのリスニング用。-V1(約224kbps)、-V2(約192kbps)
このオプションを使うと、多くの人には、圧縮前のオリジナルと圧縮後のMP3の区別がつかない。聞き分けられる音質の違いが存在することはあるが、まれ。

持ち運び用のオプション

うるさい環境でのリスニングや低いビットレート用。ファイルサイズは小さい。-V4(約160kbps)、-V5(約128kbps)、-V6(約112kbps)
-V6は「許容できるレベル」くらいのMP3を出力する。-V6では1GBガバイトのメモリに約20時間の音楽を格納できる。

超低ビットレート

--abr 80(ステレオ出力)、--abr 56 -m m(モノラル出力)
超低ビットレート(100kbps未満)では、ABRが最良。

変換に時間がかかるけど高音質なオプション

-q 0

CBR,VBR,ABRの違い

CBRはMP3の中で最も基礎的なエンコードモードで、どんな音が鳴っていようが(あるいは無音だろうが)それぞれのフレームに同じ数のビットが割り当てられる。利点は、エンコードする前からファイルサイズが予想できること、どのフレームも同じサイズなので、AVI動画に埋め込めるということ。開発はもう十年も前にストップしている。


VBRでは、ビットレート指定の代わりに、品質を示す数値指定でエンコードを行う。VBRは、いきなり難しくて複雑な音が出現した場合でも急激にビットレートを上昇させて対応できるので、CBRよりも合理的に音質を向上させることができ、全体のファイルサイズもCBRほど膨らさずにすむ。


ABRは、CBRとVBRの中間のモード。VBRとは違い、CBRと同じビットレート指定を行うが、必ずしもそれぞれのフレームに全く同じ数のビットを割り当てるわけではなく、音の複雑さによってビットレートを変動させることをある程度許す方式である。CBRよりも高音質。ファイルサイズは、音の内容によって若干ゆらぐ。

Opus, HE-AAC v2, xHE-AACの音質比較

概要

2006年~2012年に規格が策定された比較的新しいコーデックである、Opus、HE-AAC v2、xHE-AACの、40kbps付近での音質を、MP3の131kbps付近での音質と、二重盲検法により比較した。
全てのコーデックは48kHzの設定で比較した。

結果

40kbps前後だと、Opus、HE-AAC v2、xHE-AACの平均オピニオン評点は3.0を下回る低い評点となった。
40kbpsの最新のコーデックよりも、LAMEエンコードした131kbpsのMP3の方が高い忠実度となった。
MP3を除く最新コーデック3種は、40kbpsでは平均オピニオン評点に大きな差がなかった。
2種のハードウェアがテストに利用されたが、平均オピニオン評点に大きな差はなかった。

評価

f:id:kamedo2:20210627005318p:plain
全結果
f:id:kamedo2:20210627005338p:plain
テストに使われた15音源と評点一覧
f:id:kamedo2:20210627005356p:plain
全結果(ハードウェア別) 1回目がPanasonic RP-HT560、2回目がAKG K712
f:id:kamedo2:20210627005439p:plain
テストに使われた15音源と評点一覧(ハードウェア別) 1回目がPanasonic RP-HT560、2回目がAKG K712
f:id:kamedo2:20210627005416p:plain
ビットレートの平均と分布 FDK-AACのみがCBR。他はVBRでありエンコードが難しい音声に多くのビットを割り当てる。

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm
https://drive.google.com/file/d/0ByvUr-pp6BuUSnlwUG1WNkZzeDA/view?usp=sharing

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HT560(1回目)、AKG K712(2回目)を利用して、4個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。15種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、15(音源)×4(エンコーダ)×2(回)=120(回)。

使用したオプション

サンプリング周波数が44.1kHzのロスレス音源から48kHzへの変換

qaac に同梱されている refalac が使われた。

refalac64 原音.wav --rate 48000 -D -b 32 -o 原音.48kHz.wav

Opus

YoutubeやDiscord等、ウェブで広く使われているフリーな音声コーデック Opus。
2021年5月現在最新の公式ビルド opus-tools-0.2-opus-1.3 が使われた。

opusenc --bitrate 39 原音.48kHz.wav 出力.mp3

HE-AAC v2

HE-AAC v2 は、AAC-LCなどの後継として2006年に策定された音声コーデック。SBR(スペクトル帯域複製)やパラメトリックステレオなどの技術が使われる。
fdk-aacは、Androidで使われているFraunhofer社製のAACエンコーダ。FAAC (libfaac) とは別物です。
mstorsjo氏がメンテナンスしている、2021年5月現在最新版のバージョン fdk-aac v2.0.2 を FFmpeg r.102573 に組み込んで(MSYS MinGW 64bitを使って自分でビルドして)使われた。

ffmpeg -i 原音.48kHz.wav -c:a libfdk_aac -profile:a aac_he_v2 -b:a 42k 出力.mp4

xHE-AAC

xHE-AACは、HE-AAC v2の後継として2012年に策定された音声コーデック。Netflixデジタルラジオモンディエールで使われる。
今回はxHE-AACエンコーダとして、ドイツのコンピュータ技術者であるChristian R. Helmrich氏が開発したxHE-AACエンコーダで、2021年5月時点ではまだ最新版だったバージョン、exhale-V1.1.5-1592b40c_x64 が使われた。
なお、2021年6月現在の最新版である V1.1.6 では音質面の調整も入っている。
設定「a」は40kbps前後にエンコードされる、exhaleで選択できる最低のビットレートSBRが使われる。

exhale a 原音.48kHz.wav 出力.mp4

MP3

定番のMP3エンコーダ、LAMEの最新版 3.100.1 が使われた。

lame -V 5 原音.48kHz.wav 出力.mp3

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 15
Critical significance:  0.05
Significance of data: 7.34E-007 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total               59          20.71
Testers (blocks)    14           4.55
Codecs eval'd        3           8.43    2.81   15.26  7.34E-007
Error               42           7.73    0.18
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.316

Means:

mp3128   exh36k   opu36k   fdk36k  
  3.75     2.97     2.90     2.81  

---------------------------- p-value Matrix ---------------------------

         exh36k   opu36k   fdk36k  
mp3128   0.000*   0.000*   0.000*  
exh36k            0.673    0.313   
opu36k                     0.555   
-----------------------------------------------------------------------

mp3128 is better than exh36k, opu36k, fdk36k

整形済みデータ

Opus 1.3	FDK-AAC 2.0.2	exhale 1.1.5	LAME 3.100.1
%feature	0	Opus	HE-AAC v2	xHE-AAC(USAC)	MP3
%feature	7	≒40kbps	≒40kbps	≒40kbps	≒131kbps
%feature	10	--bitrate 39	-c:a libfdk_aac -profile:a aac_he_v2 -b:a 42k	a	-V 5
%feature	11	アルバム平均:~40kbps	アルバム平均:~43kbps	アルバム平均:~40kbps	アルバム平均:~131kbps
%feature	12	テスト音源平均:~46kbps	テスト音源平均:~43kbps	テスト音源平均:~45kbps	テスト音源平均:~143kbps
2.250	2.200	2.800	3.700	
3.200	3.900	3.300	2.900	
2.700	2.200	2.950	3.800	
2.750	2.400	2.950	3.900	
3.800	3.000	2.800	4.150	
2.000	1.800	3.050	3.750	
3.950	3.450	3.600	3.250	
3.400	3.200	2.750	4.100	
3.050	2.650	2.800	4.000	
2.100	2.900	2.550	3.750	
2.000	2.550	2.600	3.950	
3.100	2.750	2.900	3.700	
3.450	3.400	3.050	3.700	
2.600	2.750	3.150	3.900	
3.200	3.000	3.300	3.700	
%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	Heart to Heart	Pops
%samples	Tom's Diner	Acappella
%bitrate
46331	43282	55803	159545
56552	43277	42408	113421
44465	43593	45380	141851
42608	43387	46175	152219
53898	43559	44766	174336
41318	43588	46528	137064
44302	43542	39861	135788
46242	43303	46629	148985
47125	44295	52523	157022
45743	43367	43348	129806
36764	43224	42329	153864
46754	43495	44439	141483
43211	43515	44221	143500
42659	43323	43100	138090
47066	43481	42887	119125

整形済みデータ(ハードウェア別)

opus-1st	opus-2nd	he-aac-v2-1st	he-aac-v2-2nd	xhe-aac-1st	xhe-aac-2nd	mp3-1st	mp3-2nd
%feature 7 1回目 2回目 1回目 2回目 1回目 2回目 1回目 2回目
%feature	8	≒40kbps	≒40kbps	≒40kbps	≒40kbps	≒40kbps	≒40kbps	≒131kbps	≒131kbps
2.1 	2.4 	2.3 	2.1 	2.7 	2.9 	3.8 	3.6
2.9 	3.5 	3.9 	3.9 	3.4 	3.2 	3.3 	2.5
2.9 	2.5 	2.1 	2.3 	3.2 	2.7 	3.9 	3.7
2.8 	2.7 	2.3 	2.5 	3.1 	2.8 	4.1 	3.7
3.7 	3.9 	2.9 	3.1 	2.7 	2.9 	4.2 	4.1
1.9 	2.1 	1.7 	1.9 	3.2 	2.9 	3.7 	3.8
4.1 	3.8 	3.9 	3.0 	3.7 	3.5 	3.3 	3.2
3.5 	3.3 	3.2 	3.2 	3.0 	2.5 	4.1 	4.1
3.2 	2.9 	2.1 	3.2 	2.9 	2.7 	3.9 	4.1
2.1 	2.1 	3.1 	2.7 	2.7 	2.4 	3.9 	3.6
1.9 	2.1 	2.5 	2.6 	2.7 	2.5 	4.1 	3.8
2.9 	3.3 	2.7 	2.8 	2.9 	2.9 	3.7 	3.7
3.5 	3.4 	3.3 	3.5 	2.9 	3.2 	3.8 	3.6
2.7 	2.5 	2.6 	2.9 	3.5 	2.8 	4.1 	3.7
3.3 	3.1 	3.1 	2.9 	3.4 	3.2 	3.7 	3.7

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

Bluetoothで使えるコーデックの音質比較

概要

Bluetoothで使えるコーデックである、SBC、AAC、aptXの、二重盲検法による音質比較。

結果

一般的な設定で使う限り、SBCもAACもaptXも高音質であり、原音を忠実に再現した。
AACは、他より41%~45%低いビットレートで、SBCやaptXと同等の忠実度が得られた。

評価

f:id:kamedo2:20210323231720p:plain
Bluetoothで使えるコーデックの音質比較、一般的な設定の場合

f:id:kamedo2:20210323231747p:plain
Bluetoothで使えるコーデックの音質比較、全結果

f:id:kamedo2:20210323235400p:plain
Bluetoothで使えるコーデックの音質比較、テストに使われた27音源と評点一覧

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm
https://drive.google.com/file/d/0ByvUr-pp6BuUSnlwUG1WNkZzeDA/view?usp=sharing

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HT560を利用して、7個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。27種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、27(音源)×(3+2+2)(エンコーダ)×1(回)=189(回)。

使用したオプション

SBC

2020年10月時点で最新の、FFmpegに内蔵のSBCエンコーダとデコーダが使われた。

ffmpeg -i 原音.wav -c:a sbc -b:a 237k 出力.sbc
ffmpeg -i 原音.wav -c:a sbc -b:a 280k 出力.sbc
ffmpeg -i 原音.wav -c:a sbc -b:a 328k 出力.sbc (一般的なBluetoothの設定)
AAC

2020年10月時点で最新の、アンドロイドで使われている、Fraunhofer FDK AAC Codec Library がこのテストでもAAC-LCエンコーダとして使われた。

ffmpeg -i 原音.wav -c:a libfdk_aac -b:a 128k 出力.mp4
ffmpeg -i 原音.wav -c:a libfdk_aac -b:a 192k 出力.mp4 (一般的なBluetoothの設定)
aptX

2020年10月時点で最新の、FFmpegに内蔵のaptXエンコーダとデコーダが使われた。このテストでは、aptX LLやaptX HDではなく、通常のaptXがテストされた。

ffmpeg -i 原音.wav -c:a aptx -ar 32000 出力.aptX
ffmpeg -i 原音.wav -c:a aptx -ar 44100 出力.aptX (44kHzで、一般的なBluetoothの設定)

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 2.22E-016 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              188          64.42
Testers (blocks)    26          13.67
Codecs eval'd        6          26.69    4.45   28.85  2.22E-016
Error              156          24.05    0.15
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.211

Means:

aac192k  sbc328k  aptx352k sbc280k  aac128k  aptx256k sbc237k
  4.66     4.59     4.50     4.22     4.06     3.89     3.55

---------------------------- p-value Matrix ---------------------------

         sbc328k  aptx352k sbc280k  aac128k  aptx256k sbc237k
aac192k  0.534    0.157    0.000*   0.000*   0.000*   0.000*
sbc328k           0.427    0.001*   0.000*   0.000*   0.000*
aptx352k                   0.008*   0.000*   0.000*   0.000*
sbc280k                             0.148    0.002*   0.000*
aac128k                                      0.098    0.000*
aptx256k                                              0.002*
-----------------------------------------------------------------------

aac192k is better than sbc280k, aac128k, aptx256k, sbc237k
sbc328k is better than sbc280k, aac128k, aptx256k, sbc237k
aptx352k is better than sbc280k, aac128k, aptx256k, sbc237k
sbc280k is better than aptx256k, sbc237k
aac128k is better than sbc237k
aptx256k is better than sbc237k

整形済みデータ

sbc237k	sbc280k	sbc328k	aac128k	aac192k	aptx256k	aptx352k
%feature	7	SBC	SBC	SBC	AAC	AAC	aptX	aptX
%feature	10	ffmpeg N-99419-g4fceb2634e	ffmpeg N-99419-g4fceb2634e	ffmpeg N-99419-g4fceb2634e	FDK-AAC v2.0.1	FDK-AAC v2.0.1	ffmpeg N-99419-g4fceb2634e	ffmpeg N-99419-g4fceb2634e
%feature	11	-c:a sbc	-c:a sbc	-c:a sbc	-c:a libfdk_aac	-c:a libfdk_aac	-c:a aptx	-c:a aptx
%feature 12 237kbps 281kbps 331kbps 130kbps 194kbps 256kbps 353kbps
3.800	4.700	5.000	4.300	4.700	3.900	4.600	
3.100	3.800	4.600	4.600	5.000	3.600	4.400	
3.900	4.700	5.000	4.100	5.000	4.400	5.000	
3.600	5.000	5.000	4.300	5.000	4.500	5.000	
4.300	4.400	5.000	3.600	4.500	3.400	3.800	
3.200	3.900	4.500	4.100	4.600	4.200	4.400	
3.900	4.500	4.400	5.000	5.000	4.100	4.700	
3.200	4.100	4.600	4.400	5.000	5.000	5.000	
3.000	3.100	4.800	3.300	3.800	4.300	4.600	
2.900	3.300	4.300	4.100	4.700	3.500	4.600	
4.200	4.600	4.700	3.600	4.300	3.700	4.800	
2.900	3.900	4.500	3.500	4.400	3.700	4.200	
3.700	4.500	4.700	4.600	5.000	3.400	4.200	
3.100	3.800	4.300	3.900	5.000	3.400	4.200	
2.900	3.500	3.800	4.100	5.000	3.300	4.300	
4.100	4.400	5.000	3.700	4.500	3.900	4.800	
4.700	5.000	5.000	3.700	4.400	3.800	5.000	
4.300	4.800	4.700	3.800	4.200	3.200	4.500	
3.200	3.800	4.400	4.100	4.700	4.200	4.500	
3.100	4.200	4.400	4.500	5.000	3.300	3.500	
2.900	3.200	3.900	4.300	4.500	3.400	3.700	
3.700	4.400	4.300	3.200	4.100	3.800	4.200	
3.200	3.900	4.200	3.800	4.400	3.600	5.000	
3.800	5.000	4.700	3.400	3.900	4.300	4.500	
3.600	4.600	4.700	4.200	5.000	3.800	4.500	
3.800	4.400	5.000	5.000	5.000	5.000	5.000	
3.800	4.400	4.400	4.500	5.000	4.200	4.600	
%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	Heart to Heart	Pops
%samples	Tom's Diner	Acappella
%samples	01 castanets	inst.
%samples	02 fatboy_30sec	Techno
%samples	03 eig	Techno
%samples	04 Bachpsichord	inst.
%samples	05 Enola	Techno
%samples	06 trumpet	inst.
%samples	07 applaud	Live
%samples	08 velvet	perc.
%samples	09 Linchpin	Rock
%samples	10 spill_the_blood	guitar
%samples	11 female_speech	Speech
%samples	12 French_Ad	Speech
%bitrate
237036 	281135 	330747 	130016 	194031 	256000 	352800
237006 	281100 	330706 	130850 	195057 	256000 	352800
237030 	281128 	330739 	131475 	195827 	256001 	352800
236969 	281057 	330655 	131082 	195248 	256000 	352800
237027 	281125 	330735 	130561 	194707 	256000 	352800
237024 	281121 	330731 	129960 	194015 	256000 	352800
236965 	281051 	330648 	131447 	195921 	255999 	352800
237028 	281126 	330737 	130083 	194180 	256000 	352800
237016 	281112 	330720 	130659 	194779 	256000 	352800
237028 	281126 	330736 	129955 	194043 	256000 	352800
237016 	281112 	330720 	129951 	194008 	256000 	352800
237015 	281110 	330718 	130240 	194347 	256000 	352800
237028 	281126 	330736 	129990 	194050 	256000 	352800
236995 	281087 	330690 	130563 	194840 	256001 	352800
237008 	281102 	330708 	130306 	194432 	256000 	352800
237011 	281106 	330713 	130050 	194111 	256000 	352800
237032 	281131 	330743 	130262 	194347 	256000 	352800
237026 	281124 	330735 	130223 	194454 	256000 	352800
237008 	281103 	330709 	130183 	194246 	256000 	352800
237028 	281126 	330737 	129975 	194041 	256000 	352800
236973 	281061 	330660 	131100 	195263 	256000 	352800
237037 	281136 	330749 	130049 	194117 	256000 	352800
237015 	281111 	330719 	129868 	193955 	256000 	352800
237037 	281137 	330750 	130167 	194256 	256000 	352800
237005 	281099 	330705 	130234 	194273 	256000 	352800
237020 	281117 	330725 	130062 	194140 	256000 	352800
237009 	281104 	330711 	130241 	194337 	256000 	352800

注:「詳細な優劣の分析」欄で、分析ソフトウェアに最後の6音源の採点結果を入力していなかったため、お詫びして出力結果を訂正します。全体的な結論に影響はありません。(2021/8/1追記)
注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

LAME、Helix、iTunes MP3エンコーダの音質比較

概要

MP3エンコーダの音質比較。定評のあるオープンソースのMP3エンコーダであるLAMEの、現行版・α版に加え、爆速エンコードで知られるHelix MP3エンコーダ、Apple製のiTunesでMP3エンコードを選択したときに使われるエンコーダを、192kbpsで比較した。

結果

Helix MP3 エンコーダが最高得点となった。
iTunes のMP3エンコーダの品質は、2016年現在もなお、LAME等のオープンソースエンコーダに追い付いていない。
LAMEのα版(3.100α2)は、音質面で現行版に比べて明らかに優位ではない。

全てのエンコーダで、4.0(気にならない)以上の評点が過半数を占めた。

評価

f:id:kamedo2:20210324004740p:plain
LAME、Helix、iTunes MP3エンコーダの音質比較、全結果
f:id:kamedo2:20210324004823p:plain
LAME、Helix、iTunes MP3エンコーダの音質比較、テストされた27音源と評点一覧
形式 MP3 MP3 MP3 MP3
エンコーダ LAME LAME Helix iTunes
バージョン 3.100α2 3.99.5 v5.1 12.4.2.4
リリース年 2013 2011 2005 2016
レート制御 VBR VBR VBR VBR
指定レート -V2.75 -V2.3 -V111 192k
オプション なし なし -HF2 高品質
平均スコア 4.32 4.35 4.46 4.09
テスト音源平均 201k 201k 197k 194k
アルバム平均 184k 185k 188k 192k
指定レート -V2.75 -V2.3 -V111 192k
バージョン 3.100α2 3.99.5 v5.1 12.4.2.4
エンコーダ LAME LAME Helix iTunes

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm
https://drive.google.com/file/d/0ByvUr-pp6BuUSnlwUG1WNkZzeDA/view?usp=sharing

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HT560(1回目)、RP-HJE150(2回目)を利用して、4個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。27種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、27(音源)×4(エンコーダ)×2(回)=216(回)。

使用したオプション

Helix mp3 encoder v5.1 -V111 -HF2
LAME 3.99.5 -V2.3
LAME 3.100.alpha2 -V2.75
iTunes 12.4.2.4 high quality default, vbr enabled

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 1.42E-009 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              107           8.62
Testers (blocks)    26           4.02
Codecs eval'd        3           1.98    0.66   19.62  1.42E-009
Error               78           2.62    0.03
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.099

Means:

helixv   l3995v   l100a2   itunes   
  4.46     4.35     4.32     4.09   

---------------------------- p-value Matrix ---------------------------

         l3995v   l100a2   itunes   
helixv   0.029*   0.005*   0.000*   
l3995v            0.530    0.000*   
l100a2                     0.000*   
-----------------------------------------------------------------------

helixv is better than l3995v, l100a2, itunes
l3995v is better than itunes
l100a2 is better than itunes

整形済みデータ

l100a2	l3995v	helixv	itunes
4.400	4.450	4.350	3.900
4.300	4.200	4.500	4.150
4.400	4.100	5.000	4.400
4.450	4.250	4.800	4.400
4.350	4.250	4.050	3.850
4.400	4.150	4.300	3.900
4.250	4.300	4.550	4.200
4.500	4.350	4.700	4.200
4.200	4.050	3.950	3.700
4.250	4.500	4.750	3.950
4.250	4.250	4.150	4.200
3.800	3.850	4.200	3.950
4.100	4.400	4.500	4.150
4.000	4.300	4.400	3.750
4.400	4.400	4.700	3.950
4.100	4.150	4.350	3.750
4.350	4.450	4.750	3.750
4.100	4.250	4.350	3.650
4.350	4.450	4.450	4.300
4.300	4.250	4.400	4.300
4.350	4.600	4.450	4.050
4.100	4.150	4.250	4.100
4.800	5.000	4.850	4.300
4.600	4.600	4.050	4.300
4.100	4.350	4.500	4.550
5.000	4.900	4.750	4.600
4.450	4.550	4.450	4.150

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

Opusエンコーダの音質比較

概要

Opusエンコーダの音質比較。2013年からある安定版の Opus 1.1 と、Opus 1.1.1の音質向上を狙ったテスト版「exp_lbr_tune」(2016年2月時点)を比較。
テスト版「exp_lbr_tune」は、2016年7月現在も活発に改良が続けられており、さらに改良を重ねた上で将来 Opus 1.2 としてリリースされる予定である。

結果

テスト版の方が低レートで高い評価となった。64kbps以上では、有意差が無かった。

評価

形式 Opus Opus Opus Opus Opus Opus Opus Opus
エンコーダ 1.1 1.1 1.1 1.1 1.1.1 1.1.1 1.1.1 1.1.1
バージョン main main main main lbr_tune lbr_tune lbr_tune lbr_tune
リリース年 2013 2013 2013 2013 2016 2016 2016 2016
レート制御 VBR VBR VBR VBR VBR VBR VBR VBR
指定レート 32k 48k 64k 80k 32k 48k 64k 80k
10 41_30sec Perc. 1.7 3.1 3.5 4.0 1.8 2.8 3.7 4.0
11 finalfantasy Strings 2.6 3.7 4.1 4.4 2.0 3.2 4.2 4.4
12 ATrain Jazz 2.3 3.4 4.0 4.3 1.6 3.1 3.9 4.2
13 BigYellow Pops 1.7 2.9 3.8 4.1 1.7 2.8 3.9 4.0
14 FloorEssence Techno 3.1 3.7 4.2 4.3 2.0 3.4 4.1 4.3
15 macabre Classic 1.8 2.3 3.5 3.7 1.5 2.4 3.6 3.6
16 mybloodrusts Guitar 2.7 3.3 4.2 4.3 2.0 3.2 4.2 4.3
17 Quizas Latin 2.1 3.5 3.9 4.2 1.8 3.2 4.0 4.2
18 VelvetRealm Techno 2.4 3.1 3.5 3.7 1.9 2.8 3.5 3.7
19 雨降花 Pops 1.7 2.5 3.8 4.3 1.7 2.3 3.8 4.3
20 Trust Gospel 2.2 3.2 3.8 4.3 1.8 3.1 4.0 4.3
21 Waiting Rock 2.2 3.3 4.1 4.1 1.7 3.1 4.0 4.2
22 Experiencia Latin 2.7 3.5 4.1 4.4 1.9 3.6 4.0 4.4
23 Heart To Heart Pops 2.0 3.5 4.0 4.2 1.7 3.2 4.0 4.2
24 Tom's Diner Vocal 2.8 3.6 3.9 4.2 2.5 3.6 3.8 4.2
平均スコア 2.24 3.23 3.87 4.14 1.82 3.05 3.90 4.13
実レート 34k 50k 66k 83k 32k 49k 66k 83k
エンコーダ 1.1 1.1 1.1 1.1 1.1.1 1.1.1 1.1.1 1.1.1
形式 Opus Opus Opus Opus Opus Opus Opus Opus


テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HT560(1回目)、RP-HJE150(2回目)を利用して、8個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。このテストでの採点は、15(音源)×2(エンコーダ)×4(ビットレート種類)×2(回)=240(回)。

使用したオプション

安定版 Opus 1.1 with opus-tools-0.1.9

opusenc --bitrate 32 in.wav out.opus
opusenc --bitrate 48 in.wav out.opus
opusenc --bitrate 64 in.wav out.opus
opusenc --bitrate 80 in.wav out.opus

テスト版 Opus 1.1.1-rc-49-g5db9e14 branch exp_lbr_tune, with opus-tools 0.1.9.

opusenc --bitrate 32 in.wav out.opus
opusenc --bitrate 48 in.wav out.opus
opusenc --bitrate 64 in.wav out.opus
opusenc --bitrate 80 in.wav out.opus

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 15
Critical significance:  0.05
Significance of data: 1.11E-016 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              119          92.40
Testers (blocks)    14           6.66
Codecs eval'd        7          81.87   11.70   296.65  1.11E-016
Error               98           3.86    0.04
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.144

Means:

exp80k   org80k   org64k   exp64k   exp48k   org48k   exp32k   org32k   
  4.14     4.13     3.90     3.87     3.23     3.05     2.24     1.82   

---------------------------- p-value Matrix ---------------------------

         org80k   org64k   exp64k   exp48k   org48k   exp32k   org32k   
exp80k   0.854    0.001*   0.000*   0.000*   0.000*   0.000*   0.000*   
org80k            0.002*   0.001*   0.000*   0.000*   0.000*   0.000*   
org64k                     0.714    0.000*   0.000*   0.000*   0.000*   
exp64k                              0.000*   0.000*   0.000*   0.000*   
exp48k                                       0.015*   0.000*   0.000*   
org48k                                                0.000*   0.000*   
exp32k                                                         0.000*   
-----------------------------------------------------------------------

exp80k is better than org64k, exp64k, exp48k, org48k, exp32k, org32k
org80k is better than org64k, exp64k, exp48k, org48k, exp32k, org32k
org64k is better than exp48k, org48k, exp32k, org32k
exp64k is better than exp48k, org48k, exp32k, org32k
exp48k is better than org48k, exp32k, org32k
org48k is better than exp32k, org32k
exp32k is better than org32k

整形済みデータ

org32k	org48k	org64k	org80k	exp32k	exp48k	exp64k	exp80k
%feature	10	オリジナル版 Opus1.1	オリジナル版 Opus1.1	オリジナル版 Opus1.1	オリジナル版 Opus1.1	テスト版exp_lbr_tune	テスト版exp_lbr_tune	テスト版exp_lbr_tune	テスト版exp_lbr_tune
%feature	11	--bitrate 32	--bitrate 48	--bitrate 64	--bitrate 80	--bitrate 32	--bitrate 48	--bitrate 64	--bitrate 80
%feature	12	32 kbps	49 kbps	66 kbps	83 kbps	34 kbps	50 kbps	66 kbps	83 kbps
1.650	3.100	3.500	3.950	1.800	2.800	3.650	4.000	
2.600	3.650	4.100	4.350	1.950	3.200	4.150	4.350	
2.350	3.400	4.000	4.250	1.550	3.100	3.900	4.200	
1.700	2.900	3.750	4.050	1.700	2.850	3.950	4.000	
3.050	3.700	4.200	4.300	2.000	3.400	4.100	4.250	
1.750	2.350	3.450	3.700	1.500	2.400	3.550	3.550	
2.650	3.250	4.150	4.250	2.000	3.200	4.150	4.250	
2.100	3.450	3.900	4.200	1.750	3.150	3.950	4.200	
2.350	3.100	3.450	3.700	1.900	2.850	3.500	3.700	
1.650	2.450	3.800	4.250	1.700	2.300	3.750	4.250	
2.200	3.200	3.850	4.300	1.800	3.050	3.950	4.300	
2.150	3.350	4.050	4.100	1.650	3.050	4.000	4.150	
2.650	3.500	4.050	4.400	1.900	3.600	4.000	4.400	
1.950	3.450	3.950	4.150	1.650	3.200	4.000	4.150	
2.750	3.600	3.850	4.150	2.450	3.600	3.850	4.150	
%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	HearttoHeart	Pops
%samples	Tom'sDiner	Acappella

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。
注:2016/07/12 画像中のビットレートが誤っていたため訂正しました。

FFmpegから使えるAACエンコーダ の音質比較

概要

FFmpegから使えるAACエンコーダの音質比較。比較対象は、FFmpeg公式推奨の Fraunhofer FDK AAC 外部ライブラリ(-c:a libfdk_aac)と、FFmpeg内蔵AACエンコーダ(-c:a aac)。

結果

Fraunhofer FDK-AAC ライブラリがFFmpeg内蔵AACエンコーダよりも音質が良かった。FFmpeg内蔵AACエンコーダとの比較で、FDK-AAC は32kbps少ないビットレートで同等の音質を実現した。

評価

f:id:kamedo2:20210324010729p:plain
FFmpegから使えるAACエンコーダ の音質比較、全結果
f:id:kamedo2:20210324010823p:plain
FFmpegから使えるAACエンコーダ の音質比較、テストされた15音源と評点一覧
形式 AAC AAC AAC AAC AAC AAC
エンコーダ FFmpeg FFmpeg FFmpeg FDK FDK FDK
バージョン r.77891 r.77891 r.77891 0.1.4 0.1.4 0.1.4
リリース年 2016 2016 2016 2015 2015 2015
レート制御 ABR ABR ABR ABR ABR ABR
指定レート 64k 96k 128k 64k 96k 128k
平均スコア 2.02 2.83 3.47 2.69 3.43 4.33
実レート 66k 99k 134k 66k 98k 130k
エンコーダ FFmpeg FFmpeg FFmpeg FDK FDK FDK
バージョン r.77891 r.77891 r.77891 0.1.4 0.1.4 0.1.4
形式 AAC-LC AAC-LC AAC-LC AAC-LC AAC-LC AAC-LC

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HJE150を利用して、5個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。このテストでの採点は、15(音源)×6(エンコーダ)×1(回)=90(回)。

使用したオプション

FFmpeg 内蔵AACエンコーダ
ffmpeg77891 -i in.wav -c:a aac -b:a 64k out.mp4
ffmpeg77891 -i in.wav -c:a aac -b:a 96k out.mp4
ffmpeg77891 -i in.wav -c:a aac -b:a 128k out.mp4
FDK-AAC
ffmpeg77891 -i in.wav -c:a libfdk_aac -b:a 64k out.mp4
ffmpeg77891 -i in.wav -c:a libfdk_aac -b:a 96k out.mp4
ffmpeg77891 -i in.wav -c:a libfdk_aac -b:a 128k out.mp4

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 15
Critical significance:  0.05
Significance of data: 0.00E+000 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total               89          55.70
Testers (blocks)    14           1.91
Codecs eval'd        5          47.62    9.52   107.92  0.00E+000
Error               70           6.18    0.09
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.216

Means:

fdk128   ffa128   fdk96k   ffa96k   fdk64k   ffa64k   
  4.33     3.47     3.43     2.83     2.69     2.02   

---------------------------- p-value Matrix ---------------------------

         ffa128   fdk96k   ffa96k   fdk64k   ffa64k   
fdk128   0.000*   0.000*   0.000*   0.000*   0.000*   
ffa128            0.668    0.000*   0.000*   0.000*   
fdk96k                     0.000*   0.000*   0.000*   
ffa96k                              0.201    0.000*   
fdk64k                                       0.000*   
-----------------------------------------------------------------------

fdk128 is better than ffa128, fdk96k, ffa96k, fdk64k, ffa64k
ffa128 is better than ffa96k, fdk64k, ffa64k
fdk96k is better than ffa96k, fdk64k, ffa64k
ffa96k is better than ffa64k
fdk64k is better than ffa64k

整形済みデータ

ffa64k	ffa96k	ffa128	fdk64k	fdk96k	fdk128	
1.800	2.600	3.300	2.600	3.600	4.200	
2.000	2.800	3.500	2.700	3.200	4.400	
2.000	2.900	3.300	2.700	3.900	4.100	
2.100	3.300	3.900	2.600	3.800	4.200	
2.200	2.700	3.500	3.200	3.800	4.000	
1.800	2.700	3.300	2.500	3.300	3.900	
2.200	2.800	3.400	2.900	3.700	5.000	
2.000	3.100	3.600	2.700	3.800	4.300	
1.900	2.500	3.500	3.400	3.800	4.000	
2.100	2.900	3.500	2.400	2.800	3.900	
1.800	2.800	2.900	2.300	3.200	3.900	
2.200	2.400	3.400	2.900	3.500	4.100	
2.200	2.800	3.500	2.600	3.300	5.000	
2.100	3.000	3.700	2.500	2.700	5.000	
1.900	3.100	3.800	2.300	3.000	5.000	
%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	HearttoHeart	Pops
%samples	Tom'sDiner	Acappella

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

MP3, Opus, AAC 96kbps の音質比較

概要

音声コーデック3種類の音質比較。ビットレートは 96kbps にて比較。使用したエンコーダは、人気 MP3 エンコーダの LAME, 低遅延と高音質を両立する Opus コーデックの Opus 1.1, AACエンコーダ 3種類。その中でも AAC は、エンコーダによって圧縮性能が大きく異なるが、今回は Apple のエンコーダよりは悪いが、フリーなエンコーダよりは良いとされる、NeroAACEncと、実験段階のフリーなエンコーダである FFmpeg内蔵AACエンコーダに中間 v7 パッチ、中間 v9b パッチを適用したもの(一般配布はされていない)の3種類をテストした。
(2016/02/16追記:2016年現在、FFmpeg内蔵AACエンコーダはv9b相当の音質となっています。)

結果

Opus > NeroAACEnc > LAME > FFmpeg内蔵AACエンコーダ+中間v9bパッチ > FFmpeg内蔵AACエンコーダ+中間v7パッチ
Opus が最も原音に忠実という結果になった。Nero が2位、LAME が3位、FFmpeg内蔵AACエンコーダが最下位となった。FFmpeg内蔵AACエンコーダの中では、M/Sエンコードに対応した新しい v9bパッチの方が原音に近い音質となった。

評価

形式 MP3 Opus AAC AAC AAC
エンコーダ LAME Opus Nero FFmpeg FFmpeg
バージョン 3995 0.1.9 1540 v7 v9b
リリース年 2012 2014 2009 2013 2014
レート制御 ABR VBR VBR ABR ABR
指定レート 98k 91k q0.333 96k 96k
35_SQAM_glockenspiel_cut Inst. 4.3 4.5 4.4 3.9 3.4
Can't Wait Until Tonight (Dry Wurlitzer Mix) Pops 3.2 3.7 3.5 3.1 2.7
girl Techno 3.2 3.6 2.8 2.0 2.4
Robots_old Techno 3.2 4.3 4.1 3.4 3.5
SinceAlways Guitar 3.6 5.0 3.8 3.4 2.8
trumpet Wind 3.6 5.0 3.9 2.4 2.5
velvet Perc. 3.2 3.5 3.7 2.8 2.7
Waiting Pops 3.3 4.3 3.8 3.5 3.7
Asleep__4.11-4.31_ Strings 3.8 5.0 5.0 3.6 3.9
Greatest_Love_of_All_2min57 Pops 3.7 4.1 3.6 3.1 3.7
Hey Tonight Rock 3.1 3.8 3.5 2.6 3.3
Severance__1.31-1.51_ Pops 3.8 4.2 3.9 3.4 3.7
Shinsho_pool_3min45_4min4 Pops 3.0 4.3 3.6 3.4 3.2
SlavesOfFear Metal 4.4 5.0 5.0 4.6 4.0
The Chastising of Renegade Rock 3.2 5.0 4.0 3.0 3.7
TrosYGareg Pops 3.7 4.4 4.0 3.4 4.1
4-Sound-English-male.441 Voice 4.3 5.0 4.4 2.9 3.9
9-Have-big-expensive-car.441 Pops 3.0 3.9 3.6 3.2 3.2
12-German-male-speech.441 Voice 3.7 4.0 3.2 2.4 3.0
15-Good-evening.441 Voice 3.9 4.0 3.8 3.0 3.5
21-classic.441 Classic 3.6 5.0 4.0 3.3 3.7
24-Greensleeves-Korean-male-speech.441 Voice 3.8 4.6 4.1 2.8 3.1
25-This-is-the-end.441 Voice 3.8 4.4 4.1 3.4 3.6
27-last-song-drums-and-trampets.441 Perc. 3.3 5.0 4.3 3.1 3.9
bonhemian_rhapsody Rock 4.2 4.3 4.1 3.3 3.9
clapton_44k Guitar 3.9 4.2 4.1 3.3 3.7
Coral Pops 4.0 5.0 4.0 3.3 3.7
ExitMusic Vocal 3.9 4.1 3.5 2.2 3.1
liberate Metal 2.8 4.5 4.2 3.2 3.3
NewYorkCity Pops 3.6 4.3 4.2 3.2 3.5
sandman Rock 3.3 3.7 3.6 2.7 3.0
take_your_finger_frin_my_head Rock 4.0 3.8 3.9 3.4 3.7
Changes Rock 4.1 4.4 4.5 3.2 3.8
Girl_In_The_Fire__Sample_ Rock 4.1 4.4 4.0 3.6 3.7
Hotel California Rock 3.5 4.2 3.8 3.1 3.6
Jupiter, the Bringer of Jolity Classic 3.8 4.1 4.4 4.5 4.3
Last_Of_The_Mohicanz__Sample_ Techno 4.0 4.4 4.0 3.1 2.9
Only Time Newage 3.2 4.2 3.9 3.6 3.8
Through The Fire And Flames Metal 4.7 5.0 5.0 3.6 3.5
With Love (Outro) Techno 3.3 4.3 3.9 3.1 3.2
10 41_30sec Perc. 2.6 3.5 2.9 2.1 2.0
11 finalfantasy Strings 4.2 4.5 4.3 3.2 3.8
12 ATrain Jazz 3.2 4.3 3.6 3.5 3.3
13 BigYellow Pops 3.0 4.2 3.9 2.5 3.2
14 FloorEssence Techno 3.6 4.4 3.9 2.7 3.1
15 macabre Classic 2.9 3.2 3.5 2.9 3.3
16 mybloodrusts Guitar 4.0 4.4 4.2 3.5 2.7
17 Quizas Latin 3.5 4.2 3.6 3.0 3.6
18 VelvetRealm Techno 3.6 3.9 4.0 3.0 3.2
19 雨降花 Pops 3.6 4.3 4.2 2.6 3.8
20 Trust Gospel 2.7 4.0 3.3 2.5 2.9
21 Waiting Rock 3.2 4.2 3.6 3.0 3.4
22 Experiencia Latin 4.0 4.1 3.8 3.3 3.5
23 Heart To Heart Pops 3.7 4.6 4.3 2.9 3.3
24 Tom's Diner Vocal 3.5 4.0 3.2 2.6 2.9
25 ReunionBlues Jazz 3.1 3.9 3.8 2.9 3.3
26 French Voice 4.0 4.4 3.7 2.8 3.5
27 undelete Pops 3.8 4.1 4.2 2.7 3.3
28 Dimmu Borgir Metal 4.2 5.0 4.5 3.6 3.4
29 Run up Pops 4.1 4.5 3.3 3.0 3.5
30 German Voice 3.4 4.2 3.6 2.7 3.3
31 It could be sweet Pops 3.9 4.1 4.1 2.8 3.5
32 on the roof with Quasimodo Pops 4.1 4.5 3.8 2.8 3.4
33 easy game Pops 4.1 4.3 4.0 3.6 3.9
34 Tears Infection Pops 4.0 4.5 3.7 3.4 3.8
J.S.Bach, "Easter-Oratorio" Classic 3.8 5.0 4.4 3.6 3.9
Bass Vocal 3.8 4.0 3.8 3.4 3.5
Castanets Inst. 2.9 4.2 3.7 2.5 2.4
French Male Speech Voice 4.4 4.7 4.5 2.8 3.6
Glockenspiel Inst. 4.3 4.5 4.6 3.7 4.1
Harpsichord Inst. 3.8 3.7 4.0 3.3 3.6
Postscriptum, "You were here" Pops 3.8 4.5 4.0 3.4 3.7
Mike Oldfield, "Music From The Balcony" Rock 3.7 5.0 4.5 4.0 4.1
Quartet Vocal 3.7 3.9 3.2 3.3 3.6
平均スコア 3.65 4.31 3.93 3.13 3.42
実レート 99k 101k 96k 98k 98k
エンコーダ LAME Opus Nero FFmpeg FFmpeg
バージョン 3995 0.1.9 1540 v7 v9b
形式 MP3 Opus AAC AAC AAC

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://listening-test.coresv.net/results.htm
http://zak.s206.xrea.com/bitratetest/main.htm
[file:kamedo2:bitratetest_wav30-34.zip]
http://soundexpert.org/sound-samples

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HJE150を利用して、5個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。このテストでの採点は、74(音源)×5(エンコーダ)×1(回)=370(回)。

使用したオプション

LAME 3.99.5

lame --abr 98 -S in.wav out.mp3

Opus 1.1、opus-tools-0.1.9 経由

opusenc --bitrate 91 in.wav out.opus

NeroAACEnc 1.5.4.0

NeroAacEnc -q 0.333 -if in.wav -of out.mp4

FFmpeg内蔵AACエンコーダ、r.70351+中間パッチv7適用済みビルド(一般配布なし)

ffmpeg70351_v7 -y -i in.wav -c:a aac -strict experimental -b:a 96k out.mp4

FFmpeg内蔵AACエンコーダ、r.70351+中間パッチv9b適用済みビルド(一般配布なし)

ffmpeg70351_v9b -y -i in.wav -c:a aac -strict experimental -b:a 96k out.mp4

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 74
Critical significance:  0.05
Significance of data: 1.11E-016 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              369         134.26
Testers (blocks)    73          45.11
Codecs eval'd        4          61.69   15.42   164.04  1.11E-016
Error              292          27.45    0.09
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.099

Means:

opus     nero     lame     ffv9b    ffv7
  4.31     3.93     3.65     3.42     3.13

---------------------------- p-value Matrix ---------------------------

         nero     lame     ffv9b    ffv7
opus     0.000*   0.000*   0.000*   0.000*
nero              0.000*   0.000*   0.000*
lame                       0.000*   0.000*
ffv9b                               0.000*
-----------------------------------------------------------------------

opus is better than nero, lame, ffv9b, ffv7
nero is better than lame, ffv9b, ffv7
lame is better than ffv9b, ffv7
ffv9b is better than ffv7

整形済みデータ

% 96kbps ABC/HR Score
% This format is compatible with my graphmaker, as well as ff123's FRIEDMAN.
lame	opus	nero	ffv7	ffv9b
4.300	4.500	4.400	3.900	3.400	
3.200	3.700	3.500	3.100	2.700	
3.200	3.600	2.800	2.000	2.400	
3.200	4.300	4.100	3.400	3.500	
3.600	5.000	3.800	3.400	2.800	
3.600	5.000	3.900	2.400	2.500	
3.200	3.500	3.700	2.800	2.700	
3.300	4.300	3.800	3.500	3.700	
3.800	5.000	5.000	3.600	3.900	
3.700	4.100	3.600	3.100	3.700	
3.100	3.800	3.500	2.600	3.300	
3.800	4.200	3.900	3.400	3.700	
3.000	4.300	3.600	3.400	3.200	
4.400	5.000	5.000	4.600	4.000	
3.200	5.000	4.000	3.000	3.700	
3.700	4.400	4.000	3.400	4.100	
4.300	5.000	4.400	2.900	3.900	
3.000	3.900	3.600	3.200	3.200	
3.700	4.000	3.200	2.400	3.000	
3.900	4.000	3.800	3.000	3.500	
3.600	5.000	4.000	3.300	3.700	
3.800	4.600	4.100	2.800	3.100	
3.800	4.400	4.100	3.400	3.600	
3.300	5.000	4.300	3.100	3.900	
4.200	4.300	4.100	3.300	3.900	
3.900	4.200	4.100	3.300	3.700	
4.000	5.000	4.000	3.300	3.700	
3.900	4.100	3.500	2.200	3.100	
2.800	4.500	4.200	3.200	3.300	
3.600	4.300	4.200	3.200	3.500	
3.300	3.700	3.600	2.700	3.000	
4.000	3.800	3.900	3.400	3.700	
4.100	4.400	4.500	3.200	3.800	
4.100	4.400	4.000	3.600	3.700	
3.500	4.200	3.800	3.100	3.600	
3.800	4.100	4.400	4.500	4.300	
4.000	4.400	4.000	3.100	2.900	
3.200	4.200	3.900	3.600	3.800	
4.700	5.000	5.000	3.600	3.500	
3.300	4.300	3.900	3.100	3.200	
2.600	3.500	2.900	2.100	2.000	
4.200	4.500	4.300	3.200	3.800	
3.200	4.300	3.600	3.500	3.300	
3.000	4.200	3.900	2.500	3.200	
3.600	4.400	3.900	2.700	3.100	
2.900	3.200	3.500	2.900	3.300	
4.000	4.400	4.200	3.500	2.700	
3.500	4.200	3.600	3.000	3.600	
3.600	3.900	4.000	3.000	3.200	
3.600	4.300	4.200	2.600	3.800	
2.700	4.000	3.300	2.500	2.900	
3.200	4.200	3.600	3.000	3.400	
4.000	4.100	3.800	3.300	3.500	
3.700	4.600	4.300	2.900	3.300	
3.500	4.000	3.200	2.600	2.900	
3.100	3.900	3.800	2.900	3.300	
4.000	4.400	3.700	2.800	3.500	
3.800	4.100	4.200	2.700	3.300	
4.200	5.000	4.500	3.600	3.400	
4.100	4.500	3.300	3.000	3.500	
3.400	4.200	3.600	2.700	3.300	
3.900	4.100	4.100	2.800	3.500	
4.100	4.500	3.800	2.800	3.400	
4.100	4.300	4.000	3.600	3.900	
4.000	4.500	3.700	3.400	3.800	
3.800	5.000	4.400	3.600	3.900	
3.800	4.000	3.800	3.400	3.500	
2.900	4.200	3.700	2.500	2.400	
4.400	4.700	4.500	2.800	3.600	
4.300	4.500	4.600	3.700	4.100	
3.800	3.700	4.000	3.300	3.600	
3.800	4.500	4.000	3.400	3.700	
3.700	5.000	4.500	4.000	4.100	
3.700	3.900	3.200	3.300	3.600	

%samples	35_SQAM_glockenspiel_cut	Inst.
%samples	Can't Wait Until Tonight (Dry Wurlitzer Mix)	Pops
%samples	girl	Techno
%samples	Robots_old	Techno
%samples	SinceAlways	Guitar
%samples	trumpet	Wind
%samples	velvet	Perc.
%samples	Waiting	Pops

%samples	Asleep__4.11-4.31_	Strings
%samples	Greatest_Love_of_All_2min57	Pops
%samples	Hey Tonight	Rock
%samples	Severance__1.31-1.51_	Pops
%samples	Shinsho_pool_3min45_4min4	Pops
%samples	SlavesOfFear	Metal
%samples	The Chastising of Renegade	Rock
%samples	TrosYGareg	Pops

%samples	4-Sound-English-male.441	Voice
%samples	9-Have-big-expensive-car.441	Pops
%samples	12-German-male-speech.441	Voice
%samples	15-Good-evening.441	Voice
%samples	21-classic.441	Classic
%samples	24-Greensleeves-Korean-male-speech.441	Voice
%samples	25-This-is-the-end.441	Voice
%samples	27-last-song-drums-and-trampets.441	Perc.

%samples	bonhemian_rhapsody	Rock
%samples	clapton_44k	Guitar
%samples	Coral	Pops
%samples	ExitMusic	Vocal
%samples	liberate	Metal
%samples	NewYorkCity	Pops
%samples	sandman	Rock
%samples	take_your_finger_from_my_hair	Rock

%samples	Changes	Rock
%samples	Girl_In_The_Fire__Sample_	Rock
%samples	Hotel California	Rock
%samples	Jupiter, the Bringer of Jolity	Classic
%samples	Last_Of_The_Mohicanz__Sample_	Electro
%samples	Only Time	Newage
%samples	Through The Fire And Flames	Metal
%samples	With Love (Outro)	Techno


%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	HearttoHeart	Pops
%samples	Tom'sDiner	Acappella
%samples	ReunionBlues	Jazz
%samples	French	Voice
%samples	undelete	Pops
%samples	DimmuBorgir	Metal
%samples	Run_up	Pops
%samples	German	Speech
%samples	ItCouldBeSweet	Pops
%samples	OnTheRoofWith	Pops
%samples	easy_game	Pops
%samples	TearsInfection	Pops

%samples	J.S.Bach, "Easter-Oratorio"	Classic
%samples	Bass	Vocal
%samples	Castanets	Inst.
%samples	FrenchMaleSpeech	Voice
%samples	Glockenspiel	Inst.
%samples	Harpsichord	Inst.
%samples	You were here	Pops
%samples	Music From The Balcony	Rock
%samples	Quartet	Vocal

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。