音風景ブログ

目隠しテストによるエンコーダの音質評価などを行うブログです。

FFmpegから使えるAACエンコーダ の音質比較

概要

FFmpegから使えるAACエンコーダの音質比較。比較対象は、FFmpeg公式推奨の Fraunhofer FDK AAC 外部ライブラリ(-c:a libfdk_aac)と、FFmpeg内蔵AACエンコーダ(-c:a aac)。

結果

Fraunhofer FDK-AAC ライブラリがFFmpeg内蔵AACエンコーダよりも音質が良かった。FFmpeg内蔵AACエンコーダとの比較で、FDK-AAC は32kbps少ないビットレートで同等の音質を実現した。

評価

f:id:kamedo2:20210324010729p:plain
FFmpegから使えるAACエンコーダ の音質比較、全結果
f:id:kamedo2:20210324010823p:plain
FFmpegから使えるAACエンコーダ の音質比較、テストされた15音源と評点一覧
形式 AAC AAC AAC AAC AAC AAC
エンコーダ FFmpeg FFmpeg FFmpeg FDK FDK FDK
バージョン r.77891 r.77891 r.77891 0.1.4 0.1.4 0.1.4
リリース年 2016 2016 2016 2015 2015 2015
レート制御 ABR ABR ABR ABR ABR ABR
指定レート 64k 96k 128k 64k 96k 128k
平均スコア 2.02 2.83 3.47 2.69 3.43 4.33
実レート 66k 99k 134k 66k 98k 130k
エンコーダ FFmpeg FFmpeg FFmpeg FDK FDK FDK
バージョン r.77891 r.77891 r.77891 0.1.4 0.1.4 0.1.4
形式 AAC-LC AAC-LC AAC-LC AAC-LC AAC-LC AAC-LC

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm

方法

銘柄に対する先入観が影響しないように、PSP ABC/HR v2.4とRP-HJE150を利用して、5個のエンコードされた圧縮音源をランダムに並び替えて、銘柄を伏せて採点した。採点基準は、「音質劣化が非常に気になる」が1点 「気になる」が2点 「わずかに気になる」が3点 「原音からの音質変化が分かるが、気にならない」が4点 「音質変化がわからない、区別できない」が5点。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。このテストでの採点は、15(音源)×6(エンコーダ)×1(回)=90(回)。

使用したオプション

FFmpeg 内蔵AACエンコーダ
ffmpeg77891 -i in.wav -c:a aac -b:a 64k out.mp4
ffmpeg77891 -i in.wav -c:a aac -b:a 96k out.mp4
ffmpeg77891 -i in.wav -c:a aac -b:a 128k out.mp4
FDK-AAC
ffmpeg77891 -i in.wav -c:a libfdk_aac -b:a 64k out.mp4
ffmpeg77891 -i in.wav -c:a libfdk_aac -b:a 96k out.mp4
ffmpeg77891 -i in.wav -c:a libfdk_aac -b:a 128k out.mp4

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 15
Critical significance:  0.05
Significance of data: 0.00E+000 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total               89          55.70
Testers (blocks)    14           1.91
Codecs eval'd        5          47.62    9.52   107.92  0.00E+000
Error               70           6.18    0.09
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.216

Means:

fdk128   ffa128   fdk96k   ffa96k   fdk64k   ffa64k   
  4.33     3.47     3.43     2.83     2.69     2.02   

---------------------------- p-value Matrix ---------------------------

         ffa128   fdk96k   ffa96k   fdk64k   ffa64k   
fdk128   0.000*   0.000*   0.000*   0.000*   0.000*   
ffa128            0.668    0.000*   0.000*   0.000*   
fdk96k                     0.000*   0.000*   0.000*   
ffa96k                              0.201    0.000*   
fdk64k                                       0.000*   
-----------------------------------------------------------------------

fdk128 is better than ffa128, fdk96k, ffa96k, fdk64k, ffa64k
ffa128 is better than ffa96k, fdk64k, ffa64k
fdk96k is better than ffa96k, fdk64k, ffa64k
ffa96k is better than ffa64k
fdk64k is better than ffa64k

整形済みデータ

ffa64k	ffa96k	ffa128	fdk64k	fdk96k	fdk128	
1.800	2.600	3.300	2.600	3.600	4.200	
2.000	2.800	3.500	2.700	3.200	4.400	
2.000	2.900	3.300	2.700	3.900	4.100	
2.100	3.300	3.900	2.600	3.800	4.200	
2.200	2.700	3.500	3.200	3.800	4.000	
1.800	2.700	3.300	2.500	3.300	3.900	
2.200	2.800	3.400	2.900	3.700	5.000	
2.000	3.100	3.600	2.700	3.800	4.300	
1.900	2.500	3.500	3.400	3.800	4.000	
2.100	2.900	3.500	2.400	2.800	3.900	
1.800	2.800	2.900	2.300	3.200	3.900	
2.200	2.400	3.400	2.900	3.500	4.100	
2.200	2.800	3.500	2.600	3.300	5.000	
2.100	3.000	3.700	2.500	2.700	5.000	
1.900	3.100	3.800	2.300	3.000	5.000	
%samples	41_30sec	Perc.
%samples	finalfantasy	Strings
%samples	ATrain	Jazz
%samples	BigYellow	Pops
%samples	FloorEssence	Techno
%samples	macabre	Classic
%samples	mybloodrusts	Guitar
%samples	Quizas	Latin
%samples	VelvetRealm	Techno
%samples	Amefuribana	Pops
%samples	Trust	Gospel
%samples	Waiting	Rock
%samples	Experiencia	Latin
%samples	HearttoHeart	Pops
%samples	Tom'sDiner	Acappella

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。