音風景ブログ

目隠しテストによるエンコーダの音質評価などを行うブログです。

Bluetoothに登場するLC3コーデックと、AACの比較

概要

Bluetoothに登場する新しいコーデック、LC3を、従来からあるAAC二重盲検法で比較した。
2022年以降、Bluetooth 5.2という新しい規格がリリースされ、イヤホンやスピーカーと無線で接続するための新しい方法が準備される。以降のBluetooth規格では、LC3のサポートが必須となる見込み。
LC3の採用により、音声の遅延を抑えた自然な音声再生と、バッテリ消費の軽減が見込まれている。
このLC3コーデックを、Bluetoothイヤホン等で現在広く使われているAACコーデックと比較した。
LC3コーデックのエンコーダとして、欧州電気通信標準化機構(ETSI)が配布している最新版のLC3plusと、GoogleAndroid用に開発しているliblc3の2銘柄が使われた。
AACコーデックのエンコーダとして、Apple製品で採用されているCoreAudioと、Androidで採用されているFDK-AACの2銘柄が使われた。
今回はストリーミングによる音楽聴取環境を想定して、ロスレスの原音をOpusの128kbpsでエンコードし、デコードしてからLC3かAACの160kbps CBRでエンコードし、この再エンコードされた音を原音と比較した。
あくまで参考として、MP3も比較対象に加えられた。MP3は再エンコードではなく、原音から直接エンコードされた。

結果

現在Bluetoothイヤホンで広く採用されている、AACエンコーダの方がむしろ原音に近い結果となった。
AACは、再エンコードにもかかわらず両者とも平均オピニオン評点4.3点以上と高い忠実度となった。
LC3の平均オピニオン評点は4点を下回った。
AACについては、CBRを強制したAppleのCoreAudioと、FDK-AACに大きな違いは無かった。これは前回の48kHz, 144kbpsで行ったテストと同様の結果。
LC3については、欧州電気通信標準化機構(ETSI)版とGoogle版に大きな違いは無かった。
AAC, LC3のいずれも、Opusからの再エンコードにも関わらず、MP3 128kbps(CBR)よりも高い忠実度となった。

評価

全結果
テストに使われた27音源と評点一覧

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm
https://drive.google.com/file/d/0ByvUr-pp6BuUSnlwUG1WNkZzeDA/view?usp=sharing

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HJE150を利用して、6個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。27種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、27(音源)×6(エンコーダ)×1(回)=162(回)。

使用したオプション

サンプリング周波数が44.1kHzのロスレス音源からOpusへの変換(ストリーミングによる音楽聴取環境を再現するために使用)

Opusエンコードとデコードには、最新版のopus-tools-0.2-opus-1.3が使われた。
Opusをデコードした一時ファイルについては、ビット深度とサンプリング周波数を各LC3エンコーダが対応する16bitと48kHz, 44.1kHzに変換するため、qaac に同梱されている refalac の64bit版が使われた。

opusenc --bitrate 128 原音.wav 一時ファイル.opus
opusdec --float --quiet 一時ファイル.opus 一時ファイル.wav
refalac64 一時ファイル.wav --rate 48000 -D -b 16 -o 一時ファイル48kHz.wav
refalac64 一時ファイル.wav --rate 44100 -D -b 16 -o 一時ファイル44kHz.wav

AAC (Appleのエンジン)

Appleが使うエンジン CoreAudioToolbox 7.10.9.0 が qaac 2.73 (x64 version) 経由で使われた。
Bluetoothでの伝送環境を再現するため、CBRを指定して強制させた。

qaac64 --cbr 160 -o 出力.mp4 一時ファイル44kHz.wav

AAC (Androidのエンジン)

Androidで使われているFraunhofer社製のAACエンコーダ、fdk-aacが使われた。これはFAAC (libfaac) とは別物。
mstorsjo氏がメンテナンスしている、バージョン fdk-aac v2.0.2 を FFmpeg N-102573-g9d4c018497 に組み込んだ状態で使われた。このコマンドラインだけで、CBRで出力される。

ffmpeg -y -i 一時ファイル44kHz.wav -c:a libfdk_aac -b:a 160k 出力.mp4

LC3(欧州電気通信標準化機構の配布するLC3plus)

2022年4月19日時点でFraunhoferのページで紹介され、欧州電気通信標準化機構(ETSI)から配布されていた最新の、
LC3plus Floating Point Software V1.6.3ETSI, ETSI TS 103 634 V1.3.1. が使われた。
配布されていたソースコードのfloating_point版をMSYS環境でビルドしエンコードさせた。
なお2022年6月29日現時点でも同バージョンが配布されている。

LC3plus -E -q -v 一時ファイル44kHz.wav 出力.lc3 160000

LC3(Googleの開発する Google/liblc3 、Zephyr上ではliblc3codec表記)

2022年4月19日時点で配布されていたバージョンを使用。
以降、2022年6月28日までに高速化やAPIの24bit深度対応、外部モジュール化などが行われたため最新版ではない。
このGoogle/liblc3は、2022年6月29日現在もサンプリング周波数44.1kHzのwavファイルを直接入力できない。
そのため、これのみOpus-toolsのサンプリング周波数48kHz出力を44.1kHzに変換せずに48kHzのまま使った。

elc3 -b 160000 一時ファイル48kHz.wav 出力.lc3

MP3

あくまでLC3, AACとの比較参考のために使用。最新版のLAMELAME 3.100.1(64bit版)がCBRで使われた。

lame -b 128 原音.wav 出力.mp3
lame -b 64 原音.wav 出力.mp3

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 0.00E+000 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              161         132.90
Testers (blocks)    26           7.81
Codecs eval'd        5         114.05   22.81   268.52  0.00E+000
Error              130          11.04    0.08
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.157

Means:

AAC(FDK) AAC(Appl LC3plus  liblc3   LAMECBR1 LAMECBR6
  4.36     4.35     3.99     3.89     3.56     1.90  

---------------------------- p-value Matrix ---------------------------

         AAC(Appl LC3plus  liblc3   LAMECBR1 LAMECBR6
AAC(FDK) 0.926    0.000*   0.000*   0.000*   0.000*  
AAC(Appl          0.000*   0.000*   0.000*   0.000*  
LC3plus                    0.227    0.000*   0.000*  
liblc3                              0.000*   0.000*  
LAMECBR1                                     0.000*  
-----------------------------------------------------------------------

AAC(FDK) is better than LC3plus, liblc3, LAMECBR128kbps, LAMECBR64kbps
AAC(Apple) is better than LC3plus, liblc3, LAMECBR128kbps, LAMECBR64kbps
LC3plus is better than LAMECBR128kbps, LAMECBR64kbps
liblc3 is better than LAMECBR128kbps, LAMECBR64kbps
LAMECBR128kbps is better than LAMECBR64kbps


FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Friedman Analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 0.00E+000 (highly significant)
Fisher's protected LSD for rank sums:  26.945

Ranksums:

AAC(Appl AAC(FDK) LC3plus  liblc3   LAMECBR1 LAMECBR6
143.00   141.00    98.00    87.00    71.00    27.00  

---------------------------- p-value Matrix ---------------------------

         AAC(FDK) LC3plus  liblc3   LAMECBR1 LAMECBR6
AAC(Appl 0.884    0.001*   0.000*   0.000*   0.000*  
AAC(FDK)          0.002*   0.000*   0.000*   0.000*  
LC3plus                    0.424    0.050*   0.000*  
liblc3                              0.244    0.000*  
LAMECBR1                                     0.001*  
-----------------------------------------------------------------------

AAC(Apple) is better than LC3plus, liblc3, LAMECBR128kbps, LAMECBR64kbps
AAC(FDK) is better than LC3plus, liblc3, LAMECBR128kbps, LAMECBR64kbps
LC3plus is better than LAMECBR128kbps, LAMECBR64kbps
liblc3 is better than LAMECBR64kbps
LAMECBR128kbps is better than LAMECBR64kbps

整形済みデータ

CoreAudio	FDK-AAC	LC3plus	Google / liblc3	LAME	LAME
%feature	5	Opus ⇒ AAC	Opus ⇒ AAC	Opus ⇒ LC3	Opus ⇒ LC3
%feature	7	   	 	  	 	MP3	MP3
%feature	10	CoreAudioToolbox 7.10.9.0, via qaac 2.73	FDK-AAC v2.0.2	V1.6.3 ETSI (floating point ver.)	liblc3 Apr 19, 2022	LAME 3.100.1-x64	LAME 3.100.1-x64
%feature	11	--cbr 160	-c:a libfdk_aac -b:a 160k	160000	-b 160000	-b 128 (CBR 128kbps)	-b 64 (CBR 64kbps)
%feature	12	Opus 128kbpsから再エンコード	Opus 128kbpsから再エンコード	Opus 128kbpsから再エンコード	Opus 128kbpsから再エンコード	原音から直接エンコード	原音から直接エンコード
%genre 15個のテスト音源
4.300	4.400	4.100	3.700	3.200	1.800	
4.700	4.500	4.200	3.700	4.100	1.700	
4.500	4.300	3.900	4.100	4.400	1.600	
4.500	4.400	4.100	3.900	3.700	2.100	
3.800	4.100	3.500	3.600	2.500	1.700	
4.300	4.200	3.700	3.400	3.800	1.700	
4.400	4.500	4.100	3.900	2.900	2.400	
4.400	4.500	3.600	4.100	3.900	1.700	
3.900	3.800	4.300	4.400	4.100	2.700	
4.500	4.400	3.900	3.500	3.600	1.800	
4.400	4.300	4.100	4.200	3.100	1.600	
4.200	4.100	3.900	3.700	3.300	2.200	
4.400	4.500	3.800	3.700	3.600	1.700	
4.200	4.400	3.900	3.800	3.600	1.600	
4.400	4.300	3.600	3.700	4.100	1.800		
%genre IgorC氏による12個のテスト音源
4.400	4.500	4.100	4.000	2.700	1.800	
4.100	4.400	4.600	4.500	3.600	1.600	
4.600	4.500	4.100	4.200	3.200	1.700	
4.300	4.400	3.900	3.800	3.600	1.900	
4.500	4.200	4.400	3.800	3.600	1.900	
4.300	4.200	3.800	3.700	3.200	2.100	
3.900	3.700	3.400	3.500	2.800	1.600	
4.100	4.400	3.900	4.300	2.600	1.900	
4.500	4.600	3.900	3.700	4.100	2.100	
4.200	4.300	3.800	3.500	4.100	2.200	
5.000	4.800	4.700	4.400	4.500	2.300	
4.700	5.000	4.400	4.300	4.100	2.200	

%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	Heart to Heart	Pops
%samples	Tom's Diner	Acappella

%samples	01 castanets	inst.
%samples	02 fatboy_30sec	Techno
%samples	03 eig	Techno
%samples	04 Bachpsichord	inst.
%samples	05 Enola	Techno
%samples	06 trumpet	inst.
%samples	07 applaud	Live
%samples	08 velvet	perc.
%samples	09 Linchpin	Rock
%samples	10 spill_the_blood	guitar
%samples	11 female_speech	Speech
%samples	12 French_Ad	Speech
%bitrate
162387	161978	161014	161659	128285	64154
162562	162020	160979	161667	128230	64196
162879	162365	160984	161655	128372	64266
162679	162084	161015	161646	128319	64214
162749	162340	160981	161652	128368	64267
162989	162338	160987	161719	128440	64278
162974	162222	161016	161679	128458	64286
162331	162011	160989	161658	128271	64202
163932	163180	161141	161773	128827	64534
162628	162092	160980	161683	128295	64199
162327	161897	161024	161667	128244	64205
163037	162391	161182	161834	128553	64319
162736	162244	161050	161634	128353	64260
162391	162100	160983	161628	128304	64185
162832	162343	161019	161702	128470	64276
165547	163738	161116	161762	129023	64827
162311	161976	161009	161624	128336	64161
163482	162617	161070	161709	128613	64406
162476	162136	160979	161669	128396	64204
162317	162027	161015	161648	128300	64203
164590	163095	161051	161759	128666	64466
165505	163638	161164	161773	128851	64589
164116	162966	161075	161768	128639	64396
163213	162632	161036	161696	128588	64332
162477	162004	161025	161649	128264	64195
162842	162243	160988	161630	128432	64282
163657	162689	161047	161716	128663	64396


注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

Bluetoothで使われるLC3とAACの比較

概要

Bluetoothで使われる、LC3コーデックとAACコーデックの二重盲検法による比較。
2022年以降、Bluetooth 5.2という新しい規格がリリースされ、イヤホンやスピーカーと無線で接続するための新しい方法が準備される見込み。
新しい LE Audio を採用するデバイスでは、LC3というコーデックのサポートが必須となっている。
LC3は、音声の遅延を抑えた自然な音声再生と、バッテリ消費の軽減を狙って近年設計されたコーデックである。
このLC3コーデックを、現在Bluetoothで広く使われているAACコーデックと比較。
LC3コーデックのエンコーダとしては、欧州電気通信標準化機構(ETSI)が配布している最新版のLC3plusが使われた。
AACコーデックのエンコーダとしては、Apple製品で採用されている CoreAudioと、Androidで採用されているFDK-AACが使われた。

結果

ETSIが配布するLC3エンコーダよりも、現在のイヤホンやヘッドホンへの接続に広く使われているAACエンコーダの方がむしろ原音に忠実だった。
Appleが採用するエンコーダとAndroidが採用するエンコーダは大差ない結果となった。

評価

f:id:kamedo2:20220315030714p:plain
全結果
f:id:kamedo2:20220315030752p:plain
テストに使われた27音源と評点一覧

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm
https://drive.google.com/file/d/0ByvUr-pp6BuUSnlwUG1WNkZzeDA/view?usp=sharing

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とAKG K712を利用して、3個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。15種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、27(音源)×3(エンコーダ)×1(回)=81(回)。

使用したオプション

サンプリング周波数が44.1kHzのロスレス音源から48kHzへの変換

qaac に同梱されている refalac が使われた。

refalac64 原音.44kHz.wav --rate 48000 -D -b 24 -o 原音.48kHz.wav

AAC (Appleのエンジン)

Appleが使うエンジン CoreAudioToolbox 7.10.9.0 が qaac 2.72 (x64 version) 経由で使われた。

qaac64 --cbr 144 -o 出力.mp4 原音.48kHz.wav

AAC (Androidのエンジン)

Androidで使われているFraunhofer社製のAACエンコーダ、fdk-aacが使われた。FAAC (libfaac) とは別物。
mstorsjo氏がメンテナンスしている、最新版のバージョン fdk-aac v2.0.2 を FFmpeg N-102573-g9d4c018497 に組み込んで使われた。

ffmpeg -y -i 原音.48kHz.wav -c:a libfdk_aac -b:a 144k 出力.mp4

LC3

2021年11月17日時点で欧州電気通信標準化機構(ETSI)から配布されていた最新の、
LC3plus Floating Point Software V1.6.3ETSI, ETSI TS 103 634 V1.3.1. が使われた。
配布されていたソースコードのfloating_point版をMSYS環境でビルドしエンコードさせた。
なお2022年3月15日時点でも同バージョンが配布されている。

LC3plus -E -q -v 原音.48kHz.wav 出力.lc3 144000

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 2.56E-012 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total               80          19.52
Testers (blocks)    26           7.06
Codecs eval'd        2           8.00    4.00   46.58  2.56E-012
Error               52           4.47    0.09
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.160

Means:

AndroidA AppleAAC LC3plus 
  4.41     4.40     3.74  

---------------------------- p-value Matrix ---------------------------

         AppleAAC LC3plus 
AndroidA 0.926    0.000*  
AppleAAC          0.000*  
-----------------------------------------------------------------------

AndroidAAC is better than LC3plus
AppleAAC is better than LC3plus

整形済みデータ

Apple AAC	Android AAC	LC3plus
%feature	5	AAC	AAC	LC3
%feature	10	CoreAudioToolbox 7.10.9.0, via qaac 2.72	FDK-AAC 2.0.2	V1.6.3 ETSI (floating point ver.)
%feature	11	--cbr 144	-c:a libfdk_aac -b:a 144k	144000
%genre Kamedo2's 15 sample
4.700	4.500	4.200	
4.500	5.000	3.300	
4.400	4.600	3.200	
4.700	4.500	4.200	
4.100	4.400	3.500	
4.500	4.300	3.700	
5.000	5.000	4.400	
4.400	4.600	3.900	
3.900	3.500	4.200	
4.400	4.500	3.300	
4.300	4.200	3.600	
4.200	3.900	3.500	
5.000	4.600	3.600	
4.300	4.600	3.500	
5.000	5.000	3.600	
%genre IgorC's 12 sample
4.400	4.200	3.700	
3.800	4.100	3.600	
4.200	4.100	3.300	
4.500	4.400	3.700	
4.400	4.500	3.500	
3.900	4.200	3.300	
4.100	3.400	3.700	
4.300	4.400	4.100	
4.400	4.200	3.800	
4.100	4.400	3.700	
5.000	5.000	5.000	
4.400	5.000	3.900	

%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	Heart to Heart	Pops
%samples	Tom's Diner	Acappella

%samples	01 castanets	inst.
%samples	02 fatboy_30sec	Techno
%samples	03 eig	Techno
%samples	04 Bachpsichord	inst.
%samples	05 Enola	Techno
%samples	06 trumpet	inst.
%samples	07 applaud	Live
%samples	08 velvet	perc.
%samples	09 Linchpin	Rock
%samples	10 spill_the_blood	guitar
%samples	11 female_speech	Speech
%samples	12 French_Ad	Speech
%bitrate
146469	146146	145654
146500	146046	145613
146974	146453	145651
146778	146180	145642
146777	146356	145649
146921	146302	145626
147158	146361	145673
146681	146144	145653
148366	147429	145617
146607	146261	145618
146446	146024	145611
146748	146341	145645
146744	146334	145632
146687	146168	145627
146773	146411	145621
149514	147559	145751
146462	146076	145622
147719	146806	145700
146732	146184	145664
146422	146178	145644
148665	147225	145747


注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

最新LAME3.100 コマンドライン指南 2021年版

2017年10月にリリースされた、最新版のLAME3.100で使えるコマンドラインを指南。

基本中の基本

lame [オプション] 入力ファイル [出力ファイル]

これがLAMEの基本。

lame -b 192 sample.wav sample.mp3

固定ビットレート(CBR): -b 192 または --preset cbr 192のように指定。数値部分には、192の他にも64 80 96 112 128 160 192 224 256 320などが有効。

lame --abr 192 sample.wav sample.mp3

可変ビットレート(ABR): --abr 192 or --preset 192のように指定。有効な数値はCBRと同じ。

lame -V2 sample.wav sample.mp3

可変ビットレート(VBR): -V2のように指定。有効な数値は0〜9.999で、数字は小さいほど高音質でファイルサイズも大きい。小数(例:-V2.3)も可。

最高音質のオプション

-V0 可変ビットレートのV0が、一般的なMP3フォーマットの最強設定。音の欠陥が生じるリスクは最小となる。
ビットレートは約256kbpsであり、1GBガバイトのメモリに約8時間の音楽を格納できる。
※2011年10月に可変ビットレートの改良が入り、また2021年9月に、CBR 320kよりV0の方が良いという結果が公表された*1ため、V0を最高音質のオプションに移動させました。

高音質のオプション

ハイファイ、静かな環境でのリスニング用。-V1(約224kbps)、-V2(約192kbps)
このオプションを使うと、多くの人には、圧縮前のオリジナルと圧縮後のMP3の区別がつかない。聞き分けられる音質の違いが存在することはあるが、まれ。

持ち運び用のオプション

うるさい環境でのリスニングや低いビットレート用。ファイルサイズは小さい。-V4(約160kbps)、-V5(約128kbps)、-V6(約112kbps)
-V6は「許容できるレベル」くらいのMP3を出力する。-V6では1GBガバイトのメモリに約20時間の音楽を格納できる。

超低ビットレート

--abr 80(ステレオ出力)、--abr 56 -m m(モノラル出力)
超低ビットレート(100kbps未満)では、ABRが最良。

変換に時間がかかるけど高音質なオプション

-q 0

CBR,VBR,ABRの違い

CBRはMP3の中で最も基礎的なエンコードモードで、どんな音が鳴っていようが(あるいは無音だろうが)それぞれのフレームに同じ数のビットが割り当てられる。利点は、エンコードする前からファイルサイズが予想できること、どのフレームも同じサイズなので、AVI動画に埋め込めるということ。開発はもう十年も前にストップしている。


VBRでは、ビットレート指定の代わりに、品質を示す数値指定でエンコードを行う。VBRは、いきなり難しくて複雑な音が出現した場合でも急激にビットレートを上昇させて対応できるので、CBRよりも合理的に音質を向上させることができ、全体のファイルサイズもCBRほど膨らさずにすむ。


ABRは、CBRとVBRの中間のモード。VBRとは違い、CBRと同じビットレート指定を行うが、必ずしもそれぞれのフレームに全く同じ数のビットを割り当てるわけではなく、音の複雑さによってビットレートを変動させることをある程度許す方式である。CBRよりも高音質。ファイルサイズは、音の内容によって若干ゆらぐ。

Opus, HE-AAC v2, xHE-AACの音質比較

概要

2006年~2012年に規格が策定された比較的新しいコーデックである、Opus、HE-AAC v2、xHE-AACの、40kbps付近での音質を、MP3の131kbps付近での音質と、二重盲検法により比較した。
全てのコーデックは48kHzの設定で比較した。

結果

40kbps前後だと、Opus、HE-AAC v2、xHE-AACの平均オピニオン評点は3.0を下回る低い評点となった。
40kbpsの最新のコーデックよりも、LAMEエンコードした131kbpsのMP3の方が高い忠実度となった。
MP3を除く最新コーデック3種は、40kbpsでは平均オピニオン評点に大きな差がなかった。
2種のハードウェアがテストに利用されたが、平均オピニオン評点に大きな差はなかった。

評価

f:id:kamedo2:20210627005318p:plain
全結果
f:id:kamedo2:20210627005338p:plain
テストに使われた15音源と評点一覧
f:id:kamedo2:20210627005356p:plain
全結果(ハードウェア別) 1回目がPanasonic RP-HT560、2回目がAKG K712
f:id:kamedo2:20210627005439p:plain
テストに使われた15音源と評点一覧(ハードウェア別) 1回目がPanasonic RP-HT560、2回目がAKG K712
f:id:kamedo2:20210627005416p:plain
ビットレートの平均と分布 FDK-AACのみがCBR。他はVBRでありエンコードが難しい音声に多くのビットを割り当てる。

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm
https://drive.google.com/file/d/0ByvUr-pp6BuUSnlwUG1WNkZzeDA/view?usp=sharing

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HT560(1回目)、AKG K712(2回目)を利用して、4個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。15種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、15(音源)×4(エンコーダ)×2(回)=120(回)。

使用したオプション

サンプリング周波数が44.1kHzのロスレス音源から48kHzへの変換

qaac に同梱されている refalac が使われた。

refalac64 原音.wav --rate 48000 -D -b 32 -o 原音.48kHz.wav

Opus

YoutubeやDiscord等、ウェブで広く使われているフリーな音声コーデック Opus。
2021年5月現在最新の公式ビルド opus-tools-0.2-opus-1.3 が使われた。

opusenc --bitrate 39 原音.48kHz.wav 出力.mp3

HE-AAC v2

HE-AAC v2 は、AAC-LCなどの後継として2006年に策定された音声コーデック。SBR(スペクトル帯域複製)やパラメトリックステレオなどの技術が使われる。
fdk-aacは、Androidで使われているFraunhofer社製のAACエンコーダ。FAAC (libfaac) とは別物です。
mstorsjo氏がメンテナンスしている、2021年5月現在最新版のバージョン fdk-aac v2.0.2 を FFmpeg r.102573 に組み込んで(MSYS MinGW 64bitを使って自分でビルドして)使われた。

ffmpeg -i 原音.48kHz.wav -c:a libfdk_aac -profile:a aac_he_v2 -b:a 42k 出力.mp4

xHE-AAC

xHE-AACは、HE-AAC v2の後継として2012年に策定された音声コーデック。Netflixデジタルラジオモンディエールで使われる。
今回はxHE-AACエンコーダとして、ドイツのコンピュータ技術者であるChristian R. Helmrich氏が開発したxHE-AACエンコーダで、2021年5月時点ではまだ最新版だったバージョン、exhale-V1.1.5-1592b40c_x64 が使われた。
なお、2021年6月現在の最新版である V1.1.6 では音質面の調整も入っている。
設定「a」は40kbps前後にエンコードされる、exhaleで選択できる最低のビットレートSBRが使われる。

exhale a 原音.48kHz.wav 出力.mp4

MP3

定番のMP3エンコーダ、LAMEの最新版 3.100.1 が使われた。

lame -V 5 原音.48kHz.wav 出力.mp3

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 15
Critical significance:  0.05
Significance of data: 7.34E-007 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total               59          20.71
Testers (blocks)    14           4.55
Codecs eval'd        3           8.43    2.81   15.26  7.34E-007
Error               42           7.73    0.18
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.316

Means:

mp3128   exh36k   opu36k   fdk36k  
  3.75     2.97     2.90     2.81  

---------------------------- p-value Matrix ---------------------------

         exh36k   opu36k   fdk36k  
mp3128   0.000*   0.000*   0.000*  
exh36k            0.673    0.313   
opu36k                     0.555   
-----------------------------------------------------------------------

mp3128 is better than exh36k, opu36k, fdk36k

整形済みデータ

Opus 1.3	FDK-AAC 2.0.2	exhale 1.1.5	LAME 3.100.1
%feature	0	Opus	HE-AAC v2	xHE-AAC(USAC)	MP3
%feature	7	≒40kbps	≒40kbps	≒40kbps	≒131kbps
%feature	10	--bitrate 39	-c:a libfdk_aac -profile:a aac_he_v2 -b:a 42k	a	-V 5
%feature	11	アルバム平均:~40kbps	アルバム平均:~43kbps	アルバム平均:~40kbps	アルバム平均:~131kbps
%feature	12	テスト音源平均:~46kbps	テスト音源平均:~43kbps	テスト音源平均:~45kbps	テスト音源平均:~143kbps
2.250	2.200	2.800	3.700	
3.200	3.900	3.300	2.900	
2.700	2.200	2.950	3.800	
2.750	2.400	2.950	3.900	
3.800	3.000	2.800	4.150	
2.000	1.800	3.050	3.750	
3.950	3.450	3.600	3.250	
3.400	3.200	2.750	4.100	
3.050	2.650	2.800	4.000	
2.100	2.900	2.550	3.750	
2.000	2.550	2.600	3.950	
3.100	2.750	2.900	3.700	
3.450	3.400	3.050	3.700	
2.600	2.750	3.150	3.900	
3.200	3.000	3.300	3.700	
%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	Heart to Heart	Pops
%samples	Tom's Diner	Acappella
%bitrate
46331	43282	55803	159545
56552	43277	42408	113421
44465	43593	45380	141851
42608	43387	46175	152219
53898	43559	44766	174336
41318	43588	46528	137064
44302	43542	39861	135788
46242	43303	46629	148985
47125	44295	52523	157022
45743	43367	43348	129806
36764	43224	42329	153864
46754	43495	44439	141483
43211	43515	44221	143500
42659	43323	43100	138090
47066	43481	42887	119125

整形済みデータ(ハードウェア別)

opus-1st	opus-2nd	he-aac-v2-1st	he-aac-v2-2nd	xhe-aac-1st	xhe-aac-2nd	mp3-1st	mp3-2nd
%feature 7 1回目 2回目 1回目 2回目 1回目 2回目 1回目 2回目
%feature	8	≒40kbps	≒40kbps	≒40kbps	≒40kbps	≒40kbps	≒40kbps	≒131kbps	≒131kbps
2.1 	2.4 	2.3 	2.1 	2.7 	2.9 	3.8 	3.6
2.9 	3.5 	3.9 	3.9 	3.4 	3.2 	3.3 	2.5
2.9 	2.5 	2.1 	2.3 	3.2 	2.7 	3.9 	3.7
2.8 	2.7 	2.3 	2.5 	3.1 	2.8 	4.1 	3.7
3.7 	3.9 	2.9 	3.1 	2.7 	2.9 	4.2 	4.1
1.9 	2.1 	1.7 	1.9 	3.2 	2.9 	3.7 	3.8
4.1 	3.8 	3.9 	3.0 	3.7 	3.5 	3.3 	3.2
3.5 	3.3 	3.2 	3.2 	3.0 	2.5 	4.1 	4.1
3.2 	2.9 	2.1 	3.2 	2.9 	2.7 	3.9 	4.1
2.1 	2.1 	3.1 	2.7 	2.7 	2.4 	3.9 	3.6
1.9 	2.1 	2.5 	2.6 	2.7 	2.5 	4.1 	3.8
2.9 	3.3 	2.7 	2.8 	2.9 	2.9 	3.7 	3.7
3.5 	3.4 	3.3 	3.5 	2.9 	3.2 	3.8 	3.6
2.7 	2.5 	2.6 	2.9 	3.5 	2.8 	4.1 	3.7
3.3 	3.1 	3.1 	2.9 	3.4 	3.2 	3.7 	3.7

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

Bluetoothで使えるコーデックの音質比較

概要

Bluetoothで使えるコーデックである、SBC、AAC、aptXの、二重盲検法による音質比較。

結果

一般的な設定で使う限り、SBCもAACもaptXも高音質であり、原音を忠実に再現した。
AACは、他より41%~45%低いビットレートで、SBCやaptXと同等の忠実度が得られた。

評価

f:id:kamedo2:20210323231720p:plain
Bluetoothで使えるコーデックの音質比較、一般的な設定の場合

f:id:kamedo2:20210323231747p:plain
Bluetoothで使えるコーデックの音質比較、全結果

f:id:kamedo2:20210323235400p:plain
Bluetoothで使えるコーデックの音質比較、テストに使われた27音源と評点一覧

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm
https://drive.google.com/file/d/0ByvUr-pp6BuUSnlwUG1WNkZzeDA/view?usp=sharing

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HT560を利用して、7個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。27種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、27(音源)×(3+2+2)(エンコーダ)×1(回)=189(回)。

使用したオプション

SBC

2020年10月時点で最新の、FFmpegに内蔵のSBCエンコーダとデコーダが使われた。

ffmpeg -i 原音.wav -c:a sbc -b:a 237k 出力.sbc
ffmpeg -i 原音.wav -c:a sbc -b:a 280k 出力.sbc
ffmpeg -i 原音.wav -c:a sbc -b:a 328k 出力.sbc (一般的なBluetoothの設定)
AAC

2020年10月時点で最新の、アンドロイドで使われている、Fraunhofer FDK AAC Codec Library がこのテストでもAAC-LCエンコーダとして使われた。

ffmpeg -i 原音.wav -c:a libfdk_aac -b:a 128k 出力.mp4
ffmpeg -i 原音.wav -c:a libfdk_aac -b:a 192k 出力.mp4 (一般的なBluetoothの設定)
aptX

2020年10月時点で最新の、FFmpegに内蔵のaptXエンコーダとデコーダが使われた。このテストでは、aptX LLやaptX HDではなく、通常のaptXがテストされた。

ffmpeg -i 原音.wav -c:a aptx -ar 32000 出力.aptX
ffmpeg -i 原音.wav -c:a aptx -ar 44100 出力.aptX (44kHzで、一般的なBluetoothの設定)

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 2.22E-016 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              188          64.42
Testers (blocks)    26          13.67
Codecs eval'd        6          26.69    4.45   28.85  2.22E-016
Error              156          24.05    0.15
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.211

Means:

aac192k  sbc328k  aptx352k sbc280k  aac128k  aptx256k sbc237k
  4.66     4.59     4.50     4.22     4.06     3.89     3.55

---------------------------- p-value Matrix ---------------------------

         sbc328k  aptx352k sbc280k  aac128k  aptx256k sbc237k
aac192k  0.534    0.157    0.000*   0.000*   0.000*   0.000*
sbc328k           0.427    0.001*   0.000*   0.000*   0.000*
aptx352k                   0.008*   0.000*   0.000*   0.000*
sbc280k                             0.148    0.002*   0.000*
aac128k                                      0.098    0.000*
aptx256k                                              0.002*
-----------------------------------------------------------------------

aac192k is better than sbc280k, aac128k, aptx256k, sbc237k
sbc328k is better than sbc280k, aac128k, aptx256k, sbc237k
aptx352k is better than sbc280k, aac128k, aptx256k, sbc237k
sbc280k is better than aptx256k, sbc237k
aac128k is better than sbc237k
aptx256k is better than sbc237k

整形済みデータ

sbc237k	sbc280k	sbc328k	aac128k	aac192k	aptx256k	aptx352k
%feature	7	SBC	SBC	SBC	AAC	AAC	aptX	aptX
%feature	10	ffmpeg N-99419-g4fceb2634e	ffmpeg N-99419-g4fceb2634e	ffmpeg N-99419-g4fceb2634e	FDK-AAC v2.0.1	FDK-AAC v2.0.1	ffmpeg N-99419-g4fceb2634e	ffmpeg N-99419-g4fceb2634e
%feature	11	-c:a sbc	-c:a sbc	-c:a sbc	-c:a libfdk_aac	-c:a libfdk_aac	-c:a aptx	-c:a aptx
%feature 12 237kbps 281kbps 331kbps 130kbps 194kbps 256kbps 353kbps
3.800	4.700	5.000	4.300	4.700	3.900	4.600	
3.100	3.800	4.600	4.600	5.000	3.600	4.400	
3.900	4.700	5.000	4.100	5.000	4.400	5.000	
3.600	5.000	5.000	4.300	5.000	4.500	5.000	
4.300	4.400	5.000	3.600	4.500	3.400	3.800	
3.200	3.900	4.500	4.100	4.600	4.200	4.400	
3.900	4.500	4.400	5.000	5.000	4.100	4.700	
3.200	4.100	4.600	4.400	5.000	5.000	5.000	
3.000	3.100	4.800	3.300	3.800	4.300	4.600	
2.900	3.300	4.300	4.100	4.700	3.500	4.600	
4.200	4.600	4.700	3.600	4.300	3.700	4.800	
2.900	3.900	4.500	3.500	4.400	3.700	4.200	
3.700	4.500	4.700	4.600	5.000	3.400	4.200	
3.100	3.800	4.300	3.900	5.000	3.400	4.200	
2.900	3.500	3.800	4.100	5.000	3.300	4.300	
4.100	4.400	5.000	3.700	4.500	3.900	4.800	
4.700	5.000	5.000	3.700	4.400	3.800	5.000	
4.300	4.800	4.700	3.800	4.200	3.200	4.500	
3.200	3.800	4.400	4.100	4.700	4.200	4.500	
3.100	4.200	4.400	4.500	5.000	3.300	3.500	
2.900	3.200	3.900	4.300	4.500	3.400	3.700	
3.700	4.400	4.300	3.200	4.100	3.800	4.200	
3.200	3.900	4.200	3.800	4.400	3.600	5.000	
3.800	5.000	4.700	3.400	3.900	4.300	4.500	
3.600	4.600	4.700	4.200	5.000	3.800	4.500	
3.800	4.400	5.000	5.000	5.000	5.000	5.000	
3.800	4.400	4.400	4.500	5.000	4.200	4.600	
%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	Heart to Heart	Pops
%samples	Tom's Diner	Acappella
%samples	01 castanets	inst.
%samples	02 fatboy_30sec	Techno
%samples	03 eig	Techno
%samples	04 Bachpsichord	inst.
%samples	05 Enola	Techno
%samples	06 trumpet	inst.
%samples	07 applaud	Live
%samples	08 velvet	perc.
%samples	09 Linchpin	Rock
%samples	10 spill_the_blood	guitar
%samples	11 female_speech	Speech
%samples	12 French_Ad	Speech
%bitrate
237036 	281135 	330747 	130016 	194031 	256000 	352800
237006 	281100 	330706 	130850 	195057 	256000 	352800
237030 	281128 	330739 	131475 	195827 	256001 	352800
236969 	281057 	330655 	131082 	195248 	256000 	352800
237027 	281125 	330735 	130561 	194707 	256000 	352800
237024 	281121 	330731 	129960 	194015 	256000 	352800
236965 	281051 	330648 	131447 	195921 	255999 	352800
237028 	281126 	330737 	130083 	194180 	256000 	352800
237016 	281112 	330720 	130659 	194779 	256000 	352800
237028 	281126 	330736 	129955 	194043 	256000 	352800
237016 	281112 	330720 	129951 	194008 	256000 	352800
237015 	281110 	330718 	130240 	194347 	256000 	352800
237028 	281126 	330736 	129990 	194050 	256000 	352800
236995 	281087 	330690 	130563 	194840 	256001 	352800
237008 	281102 	330708 	130306 	194432 	256000 	352800
237011 	281106 	330713 	130050 	194111 	256000 	352800
237032 	281131 	330743 	130262 	194347 	256000 	352800
237026 	281124 	330735 	130223 	194454 	256000 	352800
237008 	281103 	330709 	130183 	194246 	256000 	352800
237028 	281126 	330737 	129975 	194041 	256000 	352800
236973 	281061 	330660 	131100 	195263 	256000 	352800
237037 	281136 	330749 	130049 	194117 	256000 	352800
237015 	281111 	330719 	129868 	193955 	256000 	352800
237037 	281137 	330750 	130167 	194256 	256000 	352800
237005 	281099 	330705 	130234 	194273 	256000 	352800
237020 	281117 	330725 	130062 	194140 	256000 	352800
237009 	281104 	330711 	130241 	194337 	256000 	352800

注:「詳細な優劣の分析」欄で、分析ソフトウェアに最後の6音源の採点結果を入力していなかったため、お詫びして出力結果を訂正します。全体的な結論に影響はありません。(2021/8/1追記)
注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

LAME、Helix、iTunes MP3エンコーダの音質比較

概要

MP3エンコーダの音質比較。定評のあるオープンソースのMP3エンコーダであるLAMEの、現行版・α版に加え、爆速エンコードで知られるHelix MP3エンコーダ、Apple製のiTunesでMP3エンコードを選択したときに使われるエンコーダを、192kbpsで比較した。

結果

Helix MP3 エンコーダが最高得点となった。
iTunes のMP3エンコーダの品質は、2016年現在もなお、LAME等のオープンソースエンコーダに追い付いていない。
LAMEのα版(3.100α2)は、音質面で現行版に比べて明らかに優位ではない。

全てのエンコーダで、4.0(気にならない)以上の評点が過半数を占めた。

評価

f:id:kamedo2:20210324004740p:plain
LAME、Helix、iTunes MP3エンコーダの音質比較、全結果
f:id:kamedo2:20210324004823p:plain
LAME、Helix、iTunes MP3エンコーダの音質比較、テストされた27音源と評点一覧
形式 MP3 MP3 MP3 MP3
エンコーダ LAME LAME Helix iTunes
バージョン 3.100α2 3.99.5 v5.1 12.4.2.4
リリース年 2013 2011 2005 2016
レート制御 VBR VBR VBR VBR
指定レート -V2.75 -V2.3 -V111 192k
オプション なし なし -HF2 高品質
平均スコア 4.32 4.35 4.46 4.09
テスト音源平均 201k 201k 197k 194k
アルバム平均 184k 185k 188k 192k
指定レート -V2.75 -V2.3 -V111 192k
バージョン 3.100α2 3.99.5 v5.1 12.4.2.4
エンコーダ LAME LAME Helix iTunes

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm
https://drive.google.com/file/d/0ByvUr-pp6BuUSnlwUG1WNkZzeDA/view?usp=sharing

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HT560(1回目)、RP-HJE150(2回目)を利用して、4個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。27種の多様なジャンルを含むテスト用の非圧縮音源が使われた。このテストでの採点は、27(音源)×4(エンコーダ)×2(回)=216(回)。

使用したオプション

Helix mp3 encoder v5.1 -V111 -HF2
LAME 3.99.5 -V2.3
LAME 3.100.alpha2 -V2.75
iTunes 12.4.2.4 high quality default, vbr enabled

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 27
Critical significance:  0.05
Significance of data: 1.42E-009 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              107           8.62
Testers (blocks)    26           4.02
Codecs eval'd        3           1.98    0.66   19.62  1.42E-009
Error               78           2.62    0.03
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.099

Means:

helixv   l3995v   l100a2   itunes   
  4.46     4.35     4.32     4.09   

---------------------------- p-value Matrix ---------------------------

         l3995v   l100a2   itunes   
helixv   0.029*   0.005*   0.000*   
l3995v            0.530    0.000*   
l100a2                     0.000*   
-----------------------------------------------------------------------

helixv is better than l3995v, l100a2, itunes
l3995v is better than itunes
l100a2 is better than itunes

整形済みデータ

l100a2	l3995v	helixv	itunes
4.400	4.450	4.350	3.900
4.300	4.200	4.500	4.150
4.400	4.100	5.000	4.400
4.450	4.250	4.800	4.400
4.350	4.250	4.050	3.850
4.400	4.150	4.300	3.900
4.250	4.300	4.550	4.200
4.500	4.350	4.700	4.200
4.200	4.050	3.950	3.700
4.250	4.500	4.750	3.950
4.250	4.250	4.150	4.200
3.800	3.850	4.200	3.950
4.100	4.400	4.500	4.150
4.000	4.300	4.400	3.750
4.400	4.400	4.700	3.950
4.100	4.150	4.350	3.750
4.350	4.450	4.750	3.750
4.100	4.250	4.350	3.650
4.350	4.450	4.450	4.300
4.300	4.250	4.400	4.300
4.350	4.600	4.450	4.050
4.100	4.150	4.250	4.100
4.800	5.000	4.850	4.300
4.600	4.600	4.050	4.300
4.100	4.350	4.500	4.550
5.000	4.900	4.750	4.600
4.450	4.550	4.450	4.150

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

Opusエンコーダの音質比較

概要

Opusエンコーダの音質比較。2013年からある安定版の Opus 1.1 と、Opus 1.1.1の音質向上を狙ったテスト版「exp_lbr_tune」(2016年2月時点)を比較。
テスト版「exp_lbr_tune」は、2016年7月現在も活発に改良が続けられており、さらに改良を重ねた上で将来 Opus 1.2 としてリリースされる予定である。

結果

テスト版の方が低レートで高い評価となった。64kbps以上では、有意差が無かった。

評価

形式 Opus Opus Opus Opus Opus Opus Opus Opus
エンコーダ 1.1 1.1 1.1 1.1 1.1.1 1.1.1 1.1.1 1.1.1
バージョン main main main main lbr_tune lbr_tune lbr_tune lbr_tune
リリース年 2013 2013 2013 2013 2016 2016 2016 2016
レート制御 VBR VBR VBR VBR VBR VBR VBR VBR
指定レート 32k 48k 64k 80k 32k 48k 64k 80k
10 41_30sec Perc. 1.7 3.1 3.5 4.0 1.8 2.8 3.7 4.0
11 finalfantasy Strings 2.6 3.7 4.1 4.4 2.0 3.2 4.2 4.4
12 ATrain Jazz 2.3 3.4 4.0 4.3 1.6 3.1 3.9 4.2
13 BigYellow Pops 1.7 2.9 3.8 4.1 1.7 2.8 3.9 4.0
14 FloorEssence Techno 3.1 3.7 4.2 4.3 2.0 3.4 4.1 4.3
15 macabre Classic 1.8 2.3 3.5 3.7 1.5 2.4 3.6 3.6
16 mybloodrusts Guitar 2.7 3.3 4.2 4.3 2.0 3.2 4.2 4.3
17 Quizas Latin 2.1 3.5 3.9 4.2 1.8 3.2 4.0 4.2
18 VelvetRealm Techno 2.4 3.1 3.5 3.7 1.9 2.8 3.5 3.7
19 雨降花 Pops 1.7 2.5 3.8 4.3 1.7 2.3 3.8 4.3
20 Trust Gospel 2.2 3.2 3.8 4.3 1.8 3.1 4.0 4.3
21 Waiting Rock 2.2 3.3 4.1 4.1 1.7 3.1 4.0 4.2
22 Experiencia Latin 2.7 3.5 4.1 4.4 1.9 3.6 4.0 4.4
23 Heart To Heart Pops 2.0 3.5 4.0 4.2 1.7 3.2 4.0 4.2
24 Tom's Diner Vocal 2.8 3.6 3.9 4.2 2.5 3.6 3.8 4.2
平均スコア 2.24 3.23 3.87 4.14 1.82 3.05 3.90 4.13
実レート 34k 50k 66k 83k 32k 49k 66k 83k
エンコーダ 1.1 1.1 1.1 1.1 1.1.1 1.1.1 1.1.1 1.1.1
形式 Opus Opus Opus Opus Opus Opus Opus Opus


テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HT560(1回目)、RP-HJE150(2回目)を利用して、8個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。このテストでの採点は、15(音源)×2(エンコーダ)×4(ビットレート種類)×2(回)=240(回)。

使用したオプション

安定版 Opus 1.1 with opus-tools-0.1.9

opusenc --bitrate 32 in.wav out.opus
opusenc --bitrate 48 in.wav out.opus
opusenc --bitrate 64 in.wav out.opus
opusenc --bitrate 80 in.wav out.opus

テスト版 Opus 1.1.1-rc-49-g5db9e14 branch exp_lbr_tune, with opus-tools 0.1.9.

opusenc --bitrate 32 in.wav out.opus
opusenc --bitrate 48 in.wav out.opus
opusenc --bitrate 64 in.wav out.opus
opusenc --bitrate 80 in.wav out.opus

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 15
Critical significance:  0.05
Significance of data: 1.11E-016 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              119          92.40
Testers (blocks)    14           6.66
Codecs eval'd        7          81.87   11.70   296.65  1.11E-016
Error               98           3.86    0.04
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.144

Means:

exp80k   org80k   org64k   exp64k   exp48k   org48k   exp32k   org32k   
  4.14     4.13     3.90     3.87     3.23     3.05     2.24     1.82   

---------------------------- p-value Matrix ---------------------------

         org80k   org64k   exp64k   exp48k   org48k   exp32k   org32k   
exp80k   0.854    0.001*   0.000*   0.000*   0.000*   0.000*   0.000*   
org80k            0.002*   0.001*   0.000*   0.000*   0.000*   0.000*   
org64k                     0.714    0.000*   0.000*   0.000*   0.000*   
exp64k                              0.000*   0.000*   0.000*   0.000*   
exp48k                                       0.015*   0.000*   0.000*   
org48k                                                0.000*   0.000*   
exp32k                                                         0.000*   
-----------------------------------------------------------------------

exp80k is better than org64k, exp64k, exp48k, org48k, exp32k, org32k
org80k is better than org64k, exp64k, exp48k, org48k, exp32k, org32k
org64k is better than exp48k, org48k, exp32k, org32k
exp64k is better than exp48k, org48k, exp32k, org32k
exp48k is better than org48k, exp32k, org32k
org48k is better than exp32k, org32k
exp32k is better than org32k

整形済みデータ

org32k	org48k	org64k	org80k	exp32k	exp48k	exp64k	exp80k
%feature	10	オリジナル版 Opus1.1	オリジナル版 Opus1.1	オリジナル版 Opus1.1	オリジナル版 Opus1.1	テスト版exp_lbr_tune	テスト版exp_lbr_tune	テスト版exp_lbr_tune	テスト版exp_lbr_tune
%feature	11	--bitrate 32	--bitrate 48	--bitrate 64	--bitrate 80	--bitrate 32	--bitrate 48	--bitrate 64	--bitrate 80
%feature	12	32 kbps	49 kbps	66 kbps	83 kbps	34 kbps	50 kbps	66 kbps	83 kbps
1.650	3.100	3.500	3.950	1.800	2.800	3.650	4.000	
2.600	3.650	4.100	4.350	1.950	3.200	4.150	4.350	
2.350	3.400	4.000	4.250	1.550	3.100	3.900	4.200	
1.700	2.900	3.750	4.050	1.700	2.850	3.950	4.000	
3.050	3.700	4.200	4.300	2.000	3.400	4.100	4.250	
1.750	2.350	3.450	3.700	1.500	2.400	3.550	3.550	
2.650	3.250	4.150	4.250	2.000	3.200	4.150	4.250	
2.100	3.450	3.900	4.200	1.750	3.150	3.950	4.200	
2.350	3.100	3.450	3.700	1.900	2.850	3.500	3.700	
1.650	2.450	3.800	4.250	1.700	2.300	3.750	4.250	
2.200	3.200	3.850	4.300	1.800	3.050	3.950	4.300	
2.150	3.350	4.050	4.100	1.650	3.050	4.000	4.150	
2.650	3.500	4.050	4.400	1.900	3.600	4.000	4.400	
1.950	3.450	3.950	4.150	1.650	3.200	4.000	4.150	
2.750	3.600	3.850	4.150	2.450	3.600	3.850	4.150	
%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	HearttoHeart	Pops
%samples	Tom'sDiner	Acappella

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。
注:2016/07/12 画像中のビットレートが誤っていたため訂正しました。