音風景ブログ

目隠しテストによるエンコーダの音質評価などを行うブログです。

FFmpeg AACの音質評価

警告

この内容は2012年の古い結果です。
2021年現時点では、FFmpeg公式推奨の Fraunhofer FDK AAC 外部ライブラリ(-c:a libfdk_aac) を推奨します。

  • 現在のFFmpegでは、-cutoffオプションは付けない方が良いです。
  • vo-aacenc のサポートは廃止されました。
  • libfaac のサポートも廃止されました。使おうとするとUnknown encoder ‘libfaac’と言われるはずです。

概要

FFmpegから直接使えるAACエンコーダー3種の評価。
FFmpeg内蔵AACエンコーダー(-strict experimental)については、-cutoffオプションを使用し、最適な-cutoffの値を探った。

結果

libfaac ≒ FFmpeg内蔵AACエンコーダー(-strict experimental -cutoff 15000) > vo-aacenc

評価

エンコーダ FFmpe FFmpe FFmpe FFmpe FFmpe FFmpe
-acodec aac aac aac aac libvo libfaac
-cutoff 13000 15000 17000 19000    
リリース年 2012 2012 2012 2012 2012 2009
バージョン r42106 r42106 r42106 r42106 v0.1.2 r18607
フォーマット AAC AAC AAC AAC AAC AAC
ビットレート 128k 128k 128k 128k 128k 128k
Tarentella 管楽器 3.0 3.5 3.7 3.9 3.1 4.0
水瀬さんち 男女声 3.3 3.9 3.5 3.8 3.0 3.8
Miles Davis ジャズ 3.0 3.9 3.8 3.6 2.5 3.1
58-ギター 弦楽器 3.2 3.6 3.4 3.5 2.7 3.4
55-Haydn 管楽器 3.2 3.5 3.2 3.0 2.3 4.0
41_30sec 打楽器 2.6 3.0 2.7 2.5 2.7 2.7
finalfantasy 撥弦楽 2.5 3.3 3.0 2.6 3.9 2.9
ATrain ジャズ 3.5 4.0 4.2 4.2 2.7 3.5
BigYellow POPS 2.8 3.4 3.6 3.5 2.9 2.5
FloorEssence テクノ 2.8 2.9 2.9 3.0 2.8 3.6
macabre オケ 2.8 3.3 3.6 3.7 2.7 4.2
mybloodrusts 弦楽器 2.8 2.7 2.7 2.7 2.9 3.3
Quizas ラテン 3.0 3.9 3.5 3.4 2.5 3.7
VelvetRealm テクノ 3.3 3.1 3.0 2.9 3.0 3.9
雨降花 POPS 3.0 3.5 3.4 3.0 2.6 3.6
Trust Gosp 2.9 3.5 3.4 3.2 3.2 4.0
Waiting ロック 3.2 3.0 3.2 2.7 2.9 3.1
Experiencia ラテン 2.7 3.3 3.6 3.4 3.1 2.8
HeartToHeart POPS 2.9 3.2 3.2 2.9 3.4 3.2
Tom's Diner 女声 3.1 3.3 3.3 3.2 3.4 2.8
ReunionBlues ジャズ 3.2 3.6 3.8 3.4 3.1 3.5
French 男女声 3.0 3.1 2.9 2.6 2.8 2.5
undelete POPS 3.2 3.7 3.4 3.4 2.6 4.1
Dimmu Borgir メタル 2.9 2.8 3.1 2.9 2.4 4.3
Run up POPS 3.1 3.3 3.6 3.3 3.9 3.4
↑音源 平均点 3.00 3.37 3.35 3.21 2.92 3.44
実レート 128k 128k 129k 130k 130k 129k
全サイズ(KB) 8786 8817 8846 8951 8935 8879
-acodec aac aac aac aac libvo libfaac
エンコーダ FFmpe FFmpe FFmpe FFmpe FFmpe FFmpe

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm

方法

銘柄に対する先入観が影響しないように、PSP abc/hr v2.3とRP-HT560を利用して、6個の音声ファイルをランダムに並び替えて、銘柄を伏せた状態で聴いて採点した。1.0=音質劣化が非常に気になる 2.0=気になる 3.0=わずかに気になる 4.0=原音からの音質変化が分かるが、気にならない 5.0=音質変化がわからない、区別できない。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。
このテストでの採点は、25(音源)×6(エンコーダ)×1(回)=150(回)。

使用したオプション

 -aprofile aac_low -acodec aac -strict experimental -ab 128k -cutoff 13000
 -aprofile aac_low -acodec aac -strict experimental -ab 128k -cutoff 15000
 -aprofile aac_low -acodec aac -strict experimental -ab 128k -cutoff 17000
 -aprofile aac_low -acodec aac -strict experimental -ab 128k -cutoff 19000
 -acodec libvo_aacenc -ab 128k
 -acodec libfaac -ab 128k

使用したオプション(フル)

echo ===================FFmpeg Native AAC Encoder Section Start===================
bin\ffmpeg42106 -y -i %InputWavFile% -aprofile aac_low -acodec aac -strict experimental -ab 128k -cutoff 13000 "%OutputFile%%Aac1Name%"
bin\ffmpeg42106 -y -i %InputWavFile% -aprofile aac_low -acodec aac -strict experimental -ab 128k -cutoff 15000 "%OutputFile%%Aac2Name%"
bin\ffmpeg42106 -y -i %InputWavFile% -aprofile aac_low -acodec aac -strict experimental -ab 128k -cutoff 17000 "%OutputFile%%Aac3Name%"
bin\ffmpeg42106 -y -i %InputWavFile% -aprofile aac_low -acodec aac -strict experimental -ab 128k -cutoff 19000 "%OutputFile%%Aac4Name%"
bin\faad -b 4 -o %Aac1Decode% "%OutputFile%%Aac1Name%"
bin\faad -b 4 -o %Aac2Decode% "%OutputFile%%Aac2Name%"
bin\faad -b 4 -o %Aac3Decode% "%OutputFile%%Aac3Name%"
bin\faad -b 4 -o %Aac4Decode% "%OutputFile%%Aac4Name%"

echo ===================FFmpeg OpenAMR VisualOn VO-AACENC Section Start===================
bin\ffmpeg42106 -y -i %InputWavFile% -acodec libvo_aacenc -ab 128k "%OutputFile%%Aac5Name%"
bin\faad -b 4 -o %Aac5Decode% "%OutputFile%%Aac5Name%"

echo ===================FFmpeg FAAC (libfaac) Section Start===================
bin\ffmpeg18607 -y -i %InputWavFile% -acodec libfaac -ab 128k "%OutputFile%%Aac6Name%"
bin\faad -b 4 -o %Aac6Decode% "%OutputFile%%Aac6Name%"

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 25
Critical significance:  0.05
Significance of data: 3.12E-007 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              149          28.67
Testers (blocks)    24           8.20
Codecs eval'd        5           5.55    1.11    8.93  3.12E-007
Error              120          14.93    0.12
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.198

Means:

lib_faac ffexp15k ffexp17k ffexp19k ffexp13k voaacenc
  3.44     3.37     3.35     3.21     3.00     2.92

---------------------------- p-value Matrix ---------------------------

         ffexp15k ffexp17k ffexp19k ffexp13k voaacenc
lib_faac 0.522    0.379    0.027*   0.000*   0.000*
ffexp15k          0.810    0.111    0.000*   0.000*
ffexp17k                   0.175    0.001*   0.000*
ffexp19k                            0.036*   0.005*
ffexp13k                                     0.448
-----------------------------------------------------------------------

lib_faac is better than ffexp19k, ffexp13k, voaacenc
ffexp15k is better than ffexp13k, voaacenc
ffexp17k is better than ffexp13k, voaacenc
ffexp19k is better than ffexp13k, voaacenc

整形済みデータ

% FFmpeg AAC 128kbps ABC/HR score
ffcut13k	ffcut15k	ffcut17k	ffcut19k	voaacenc	lib_faac	
%feature	7	Native experimental	Native experimental	Native experimental	Native experimental	vo-aacenc	libfaac
3.000	3.500	3.700	3.900	3.100	4.000	
3.300	3.900	3.500	3.800	3.000	3.800	
3.000	3.900	3.800	3.600	2.500	3.100	
3.200	3.600	3.400	3.500	2.700	3.400	
3.200	3.500	3.200	3.000	2.300	4.000	
2.600	3.000	2.700	2.500	2.700	2.700	
2.500	3.300	3.000	2.600	3.900	2.900	
3.500	4.000	4.200	4.200	2.700	3.500	
2.800	3.400	3.600	3.500	2.900	2.500	
2.800	2.900	2.900	3.000	2.800	3.600	
2.800	3.300	3.600	3.700	2.700	4.200	
2.800	2.700	2.700	2.700	2.900	3.300	
3.000	3.900	3.500	3.400	2.500	3.700	
3.300	3.100	3.000	2.900	3.000	3.900	
3.000	3.500	3.400	3.000	2.600	3.600	
2.900	3.500	3.400	3.200	3.200	4.000	
3.200	3.000	3.200	2.700	2.900	3.100	
2.700	3.300	3.600	3.400	3.100	2.800	
2.900	3.200	3.200	2.900	3.400	3.200	
3.100	3.300	3.300	3.200	3.400	2.800	
3.200	3.600	3.800	3.400	3.100	3.500	
3.000	3.100	2.900	2.600	2.800	2.500	
3.200	3.700	3.400	3.400	2.600	4.100	
2.900	2.800	3.100	2.900	2.400	4.300	
3.100	3.300	3.600	3.300	3.900	3.400	
続きを読む

Opus,Ogg,AAC 128kbpsの音質比較

概要

Opus Audio Codec, Ogg Vorbis, AACの128kbpsでの音質比較。

結果

AAC ≒ Opus ≒ Ogg
3者とも評点に有意差を検出できなかった。おおむね同程度の音質。

評価

エンコーダ opus aoTuV qaac
リリース年 2012 2011 2012
バージョン v0.9.10 B6.03 1.36
フォーマット Opus Ogg AAC
ビットレート 128000 q3 cvbr128
41_30sec 打楽器 3.7 4.0 4.1
finalfantasy 撥弦楽 3.8 4.2 4.1
ATrain ジャズ 3.8 3.8 4.2
BigYellow POPS 3.9 3.5 4.0
FloorEssence テクノ 4.2 4.3 3.7
macabre オケ 3.9 4.0 4.3
mybloodrusts 弦楽器 5.0 3.7 5.0
Quizas ラテン 3.9 3.6 4.0
VelvetRealm テクノ 3.5 4.5 4.1
雨降花 POPS 3.9 3.6 4.2
Trust Gosp 3.7 4.2 4.0
Waiting ロック 3.8 3.6 3.8
Experiencia ラテン 4.3 3.9 4.1
HeartToHeart POPS 3.8 3.8 4.1
Tom's Diner 女声 3.9 3.6 4.4
ReunionBlues ジャズ 4.1 4.2 5.0
French 男女声 4.6 3.7 4.0
undelete POPS 3.7 4.2 4.1
Dimmu Borgir メタル 4.5 5.0 4.8
Run up POPS 4.6 4.4 4.1
↑音源 平均点 4.02 3.97 4.18
実レート 131k 129k 136k
全サイズ(KB) 7658 7565 7954
エンコーダ opus aoTuV qaac

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm

方法

銘柄に対する先入観が影響しないように、PSP abc/hr v2.3とRP-HT560を利用して、3個の音声ファイルをランダムに並び替えて、銘柄を伏せた状態で聴いて採点した。1.0=音質劣化が非常に気になる 2.0=気になる 3.0=わずかに気になる 4.0=原音からの音質変化が分かるが、気にならない 5.0=音質変化がわからない、区別できない。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。
同じテストをもう一度行い、2評点の平均を求めた。このテストでの採点は、20(音源)×3(エンコーダ)×2(回)=120(回)。

使用したオプション

echo ===================Opus Section Start===================
bin\sox -D %InputWavFile% -b 16 "%TemporaryFile%1.wav" gain -3 rate -v 48000
bin\sox -D "%TemporaryFile%1.wav" "%TemporaryFile%1.raw"
bin\opus20120515\opus -e audio 48000 2 128000 "%TemporaryFile%1.raw" "%OutputFile%%OpusName%"
bin\opus20120515\opus -d 48000 2 "%OutputFile%%OpusName%" "%TemporaryFile%2.raw"
bin\sox -D -r 48000 -e signed -b 16 -c 2 "%TemporaryFile%2.raw" -b 32 -e float %OpusDecode% rate -v 44100

echo ===================Ogg Section Start===================
bin\venc603 -q3 %InputWavFile% "%OutputFile%%OggName%"
bin\oggdec -b 5 "%OutputFile%%OggName%" --wavout %OggDecode%

echo ===================Aac Section Start===================
bin\qaac_1.36\qaac --cvbr 128 -o "%OutputFile%%AacName%" %InputWavFile%
bin\faad -b 4 -o %AacDecode% "%OutputFile%%AacName%"

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 20
Critical significance:  0.05
Significance of data: 1.14E-001 (not significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total               59           8.44
Testers (blocks)    19           3.91
Codecs eval'd        2           0.49    0.24    2.30  1.14E-001
Error               38           4.04    0.11
---------------------------------------------------------------

整形済みデータ

% Opus/Ogg/Aac 128kbps ABC/HR score
opus v0.9.10	aoTuV b6.03	qaac 1.36
%feature 7 OPUS OGG AAC-LC	
3.700	4.000	4.050	
3.800	4.150	4.100	
3.800	3.850	4.200	
3.950	3.450	3.950	
4.150	4.300	3.700	
3.950	3.950	4.250	
5.000	3.700	5.000	
3.900	3.600	3.950	
3.500	4.500	4.050	
3.900	3.550	4.150	
3.650	4.200	3.950	
3.800	3.550	3.850	
4.250	3.950	4.100	
3.750	3.800	4.100	
3.900	3.550	4.350	
4.050	4.200	5.000	
4.600	3.650	4.000	
3.700	4.150	4.050	
4.450	5.000	4.750	
4.550	4.350	4.100	

エンコード・デコードのログ

===================Processing Wav File "D:\autoencode\10xh_.wav"===================
===================Opus Section Start===================
libopus unknown
Encoding 48000 Hz input at 128.000 kb/s in auto mode with 960-sample frames.
average bitrate:             128.492 kb/s
maximum bitrate:             221.200 bkp/s
active bitrate:              128.578 kb/s
bitrate standard deviation:   33.717 kb/s
libopus unknown
Decoding with 48000 Hz output (2 channels)
average bitrate:             128.492 kb/s
maximum bitrate:             221.200 bkp/s
bitrate standard deviation:   33.717 kb/s
===================Ogg Section Start===================
aoTuV Beta 6.03 - OggVorbis Encoder (c) 2003-2011 Aoyumi

Output file : "sound_out\10xh_.aotuv603_q3.ogg"
Stream info.: 2ch/44.1kHz/16bit(int) -> 2ch/44.1kHz/32bit(float)

Quality 3 (nominal bitrate : 112kbps)
Processing...Done.

 [Report of the encoded file]
   play time    : 30.000 sec.
  encode time   : 1.212 sec. (x24.752)
 stream bitrate : 142.56 kbps
 bit reduction  : 1 / 9.9 


OggDec v1.9.7 (libVorbis 1.3.1) Compiled on: Mar 29 2010
 !%!INVISIBLE.DONTUPDATE!%!ENCODE_INFO=1,VENC 2.61,2,int16,44100,17100,Coupling,Q3.00
 Encoder Version: 0
 Serial Number: 26035

 Bitstream is 2 channel, 44100Hz
 Scale = 1.0000
 Decoded length: 1323001 samples = 0:30 mins.
 Encoded by: AO; aoTuV [20110424] (based on Xiph.Org's libVorbis)
 Decoding: sound_out\10xh_.aotuv603_q3.ogg

  100% decoded.

 ********** Done decoding all input files. **********
===================Aac Section Start===================
qaac 1.36, CoreAudioToolbox 7.9.7.9

10xh_.wav
AAC-LC Encoder, CVBR 128kbps, Quality 96
[100.0%] 0:30.000/0:30.000 (38.5x), ETA 0:00.000  
1323001/1323001 samples processed in 0:00.780
Overall bitrate: 143.181kbps
 *********** Ahead Software MPEG-4 AAC Decoder V2.7 ******************

 Build: Jun 14 2010
 Copyright 2002-2004: Ahead Software AG
 http://www.audiocoding.com
 Floating point version

 This program is free software; you can redistribute it and/or modify
 it under the terms of the GNU General Public License.

 **************************************************************************

sound_out\10xh_.qaac136_cvbr_128k.m4a file info:

LC AAC	30.040 secs, 2 ch, 44100 Hz

tool: qaac 1.36, CoreAudioToolbox 7.9.7.9, AAC-LC Encoder, CVBR 128kbps, Quality 96
iTunSMPB:  00000000 00000840 000003C7 0000000000142FF9 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000

  ---------------------
 | Config:  2 Ch       |
  ---------------------
 | Ch |    Position    |
  ---------------------
 | 00 | Left front     |
 | 01 | Right front    |
  ---------------------

Decoding sound_out\10xh_.qaac136_cvbr_128k.m4a took:  0.31 sec. 96.28x real-time.
===================Rawgene2 Section Start===================
rawgene v.2.0.0  /  original reference file:sound_raw\10xh_.original.f32b.wav
                     Offset[sample]  Gain    Gain[dB]     Score
FLO 1>10xh_.opusv091> O:  287   G: 1.410961  G: 2.990303  S: 0.280587
FLO 2>10xh_.aotuv603> O:    0   G: 1.009737  G: 0.084167  S: 0.183967
FLO 3>10xh_.qaac136_> O: 1088   G: 1.006208  G: 0.053757  S: 0.156985
biggest_delay    : 1088
smallest_delay   : 0
biggest_gain     : 1.410961
shortest_sample  : 1321913
initial_offset   : 7126

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

Opus,Ogg,AACの音質比較

概要

Opus Audio Codec, Ogg Vorbis, AACの80kbpsでの音質比較。

結果

Opus ≒ Ogg > AAC
OpusとOggが互角、qaac(Apple社のAACエンコーダを借りてエンコードするソフト)でtvbrエンコードしたAACの音質は比較的悪い。

評価

エンコーダ opus aoTuV aoTuV qaac
リリース年 2012 2011 2009 2012
バージョン v0.9.9 B6.03 B5.7 1.31
フォーマット Opus Ogg Ogg AAC
ビットレート 80000 q0.80 q0.86 tv36
41_30sec 打楽器 2.8 3.0 3.1 2.6
finalfantasy 撥弦楽 2.9 3.3 3.2 3.1
ATrain ジャズ 2.8 2.8 3.0 3.5
BigYellow POPS 3.3 3.3 3.4 2.8
FloorEssence テクノ 3.3 3.3 3.4 3.0
macabre オケ 3.2 2.9 3.0 3.0
mybloodrusts 弦楽器 3.5 3.4 3.3 3.1
Quizas ラテン 3.2 3.3 3.1 2.9
VelvetRealm テクノ 3.1 3.6 3.3 3.3
雨降花 POPS 3.5 3.1 3.2 2.8
Trust Gosp 3.0 3.3 3.3 2.6
Waiting ロック 3.1 2.8 2.9 2.8
Experiencia ラテン 3.6 3.3 3.3 2.9
HeartToHeart POPS 3.3 3.1 3.0 2.6
Tom's Diner 女声 3.4 3.3 3.3 3.0
ReunionBlues ジャズ 3.2 3.1 3.0 3.5
French 男女声 3.5 3.3 3.2 3.1
undelete POPS 3.3 3.5 3.3 3.2
Dimmu Borgir メタル 3.4 3.3 3.3 2.9
Run up POPS 3.6 3.7 3.6 3.1
↑音源 平均点 3.23 3.22 3.19 2.97
実レート 83k 83k 83k 80k
全サイズ(KB) 4850 4859 4853 4676
エンコーダ opus aoTuV aoTuV qaac

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm

方法

銘柄に対する先入観が影響しないように、PSP abc/hr v2.1とRP-HT560を利用して、4個の音声ファイルをランダムに並び替えてして、銘柄を伏せた状態で聴いて採点した。1.0=音質劣化が非常に気になる 2.0=気になる 3.0=少し気になる 4.0=原音からの音質変化が分かるが、気にならない 5.0=音質変化がわからない、区別できない。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。
同じテストをもう一度行い、2評点の平均を求めた。このテストでの採点は、20(音源)×4(エンコーダ)×2(回)=160(回)。

使用したオプション

sox -D %wavfile% -b 16 "temp1.wav" gain -1 rate -v 48000
sox -D "temp1.wav" "temp1.raw"
opus -e audio 48000 2 80000 "temp1.raw" %outfile.opus%
opus -d 48000 2 "outfile.opus" "temp2.raw"
sox -D -r 48000 -e signed -b 16 -c 2 "temp2.raw" -b 16 %outfile.wav% gain 1 rate -v 44100
venc570 -q0.86 %wavfile% %outfile.ogg%
venc603 -q0.80 %wavfile% %outfile.ogg%
qaac --tvbr 36 -o %outfile.mp4% %wavfile%

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 20
Critical significance:  0.05
Significance of data: 8.46E-005 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total               79           4.59
Testers (blocks)    19           1.71
Codecs eval'd        3           0.90    0.30    8.60  8.46E-005
Error               57           1.98    0.03
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.118

Means:

opus     ao_new   ao_old   qaac
  3.22     3.22     3.19     2.97

---------------------------- p-value Matrix ---------------------------

         ao_new   ao_old   qaac
opus     0.899    0.528    0.000*
ao_new            0.613    0.000*
ao_old                     0.000*
-----------------------------------------------------------------------

opus is better than qaac
ao_new is better than qaac
ao_old is better than qaac

整形済みデータ

% Opus/Ogg/Aac 80kbps ABC/HR score
opus_v0.9.9	aoTuV_b6.03	aoTuV_b5.7	qaac_tvbr
%features	7	Opus	Ogg Vorbis	Ogg Vorbis	AAC-LC	
2.850	3.000	3.100	2.550	
2.900	3.250	3.150	3.050	
2.800	2.850	3.000	3.450	
3.250	3.300	3.400	2.850	
3.250	3.350	3.400	2.950	
3.150	2.850	2.950	2.950	
3.500	3.350	3.250	3.050	
3.200	3.300	3.050	2.900	
3.050	3.550	3.300	3.250	
3.450	3.100	3.200	2.850	
3.000	3.250	3.250	2.600	
3.100	2.850	2.850	2.800	
3.550	3.300	3.250	2.900	
3.300	3.050	3.000	2.600	
3.350	3.250	3.250	2.950	
3.150	3.050	3.000	3.450	
3.500	3.250	3.200	3.050	
3.250	3.450	3.300	3.200	
3.350	3.350	3.250	2.900	
3.550	3.650	3.600	3.050	

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

cutoffオプションでFFmpeg内蔵AACエンコーダーの品質を改善する

概要

FFmpegネイティブのAACエンコーダー(実験段階)でAACエンコードする時に、cutoffオプションを使うと音質が少しよくなることを確認した。

結果

AAC 192kbps(with cutoff) > AAC 192kbps(without cutoff) >
AAC 128kbps(with cutoff) > AAC 128kbps(without cutoff) >
AAC 64kbps(with cutoff) > AAC 64kbps(without cutoff)

評価

エンコーダ FFmpeg FFmpeg FFmpeg FFmpeg FFmpeg FFmpeg
リリース年 2012 2012 2012 2012 2012 2012
バージョン r37610 r37610 r37610 r37610 r37610 r37610
フォーマット LC-AAC LC-AAC LC-AAC LC-AAC LC-AAC LC-AAC
ビットレート 64k 64k 128k 128k 192k 192k
-cutoff あり なし あり なし あり なし
数値(Hz) 12000 16000 18000
41_30sec 打楽器 1.8 1.5 2.6 2.3 3.6 3.3
finalfantasy 撥弦楽 2.1 1.8 3.5 2.6 4.3 4.0
ATrain ジャズ 2.3 1.9 4.0 3.2 4.4 4.4
BigYellow POPS 2.3 1.7 3.5 2.7 4.1 3.9
FloorEssence テクノ 2.0 1.7 3.0 2.5 3.6 3.2
macabre オケ 2.1 1.7 3.3 2.6 4.6 3.9
mybloodrusts 弦楽器 2.1 1.7 2.7 2.6 4.1 3.9
Quizas ラテン 2.1 1.6 3.5 2.8 4.0 3.8
VelvetRealm テクノ 2.2 1.9 2.7 2.5 2.9 3.1
雨降花 POPS 2.1 1.7 3.0 2.7 3.8 3.5
Trust Gosp 2.2 1.7 2.9 2.6 3.8 3.5
Waiting ロック 2.3 1.9 3.0 2.6 3.6 3.5
Experiencia ラテン 2.1 1.6 3.2 2.3 4.1 3.9
HeartToHeart POPS 2.3 1.5 3.2 2.2 3.7 3.5
Tom's Diner 女声 2.3 1.8 3.2 2.3 3.4 3.6
ReunionBlues ジャズ 2.3 1.8 3.7 3.1 4.2 4.1
French 男女声 2.5 1.9 3.1 2.6 3.7 3.5
undelete POPS 2.1 1.9 3.1 3.1 4.0 3.7
Dimmu Borgir メタル 1.9 1.8 3.0 3.0 3.9 3.5
Run up POPS 2.3 1.8 3.4 2.8 4.0 3.9
↑音源 平均点 2.16 1.71 3.16 2.63 3.87 3.67
実レート 69k 72k 130k 133k 190k 188k
全サイズ(KB) 4068 4208 7608 7820 11127 11024

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm

方法

先入観が影響しないように、PSP ABC/HR v2.0とRP-HT560を利用して、WAVからエンコードされた6個のAACをランダムに並び替えて、ブラインドで採点した。WAVとの区別がつかない場合、5.0点をつけた。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。その作業を20音源について繰り返した。同じテストをもう一度行った。2回の平均を使った。このテストでの採点は、20(音源)×3(ビットレート)×2(cutoffあり/なし)×2(回)=240(回)。

使用したオプション

ffmpeg37610 -y -i %wavfile% -vn -aprofile aac_low -acodec aac -strict experimental -ab 64k -cutoff 12000 %outfile%.mp4
ffmpeg37610 -y -i %wavfile% -vn -aprofile aac_low -acodec aac -strict experimental -ab 64k %outfile%.mp4
ffmpeg37610 -y -i %wavfile% -vn -aprofile aac_low -acodec aac -strict experimental -ab 128k -cutoff 16000 %outfile%.mp4
ffmpeg37610 -y -i %wavfile% -vn -aprofile aac_low -acodec aac -strict experimental -ab 128k %outfile%.mp4
ffmpeg37610 -y -i %wavfile% -vn -aprofile aac_low -acodec aac -strict experimental -ab 192k -cutoff 18000 %outfile%.mp4
ffmpeg37610 -y -i %wavfile% -vn -aprofile aac_low -acodec aac -strict experimental -ab 192k %outfile%.mp4

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 20
Critical significance:  0.05
Significance of data: 0.00E+000 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              119          81.56
Testers (blocks)    19           4.71
Codecs eval'd        5          72.29   14.46   301.50  0.00E+000
Error               95           4.56    0.05
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.137

Means:

192k_cut 192nocut 128k_cut 128nocut 64k__cut 64knocut
  3.87     3.67     3.16     2.63     2.16     1.71

---------------------------- p-value Matrix ---------------------------

         192nocut 128k_cut 128nocut 64k__cut 64knocut
192k_cut 0.005*   0.000*   0.000*   0.000*   0.000*
192nocut          0.000*   0.000*   0.000*   0.000*
128k_cut                   0.000*   0.000*   0.000*
128nocut                            0.000*   0.000*
64k__cut                                     0.000*
-----------------------------------------------------------------------

192k_cut is better than 192nocut, 128k_cut, 128nocut, 64k__cut, 64knocut
192nocut is better than 128k_cut, 128nocut, 64k__cut, 64knocut
128k_cut is better than 128nocut, 64k__cut, 64knocut
128nocut is better than 64k__cut, 64knocut
64k__cut is better than 64knocut

整形済みデータ

% FFmpeg native experimental AAC Encoder ABC/HR score
64k__cut	64knocut	128k_cut	128nocut	192k_cut	192nocut
%features 7 64kbps 64kbps 128kbps 128kbps 192kbps 192kbps
1.800	1.500	2.600	2.250	3.600	3.250	
2.100	1.750	3.450	2.550	4.250	3.950	
2.300	1.850	4.000	3.200	4.350	4.400	
2.300	1.650	3.500	2.650	4.100	3.900	
2.000	1.700	3.000	2.500	3.600	3.200	
2.050	1.700	3.300	2.600	4.600	3.900	
2.100	1.700	2.700	2.550	4.050	3.900	
2.050	1.600	3.450	2.850	4.000	3.800	
2.200	1.850	2.700	2.450	2.900	3.050	
2.100	1.650	2.950	2.700	3.750	3.500	
2.150	1.650	2.900	2.600	3.750	3.500	
2.250	1.850	3.000	2.600	3.550	3.450	
2.100	1.550	3.200	2.350	4.100	3.900	
2.300	1.500	3.150	2.150	3.700	3.500	
2.350	1.800	3.150	2.250	3.400	3.550	
2.300	1.750	3.700	3.050	4.150	4.050	
2.450	1.850	3.100	2.550	3.700	3.450	
2.100	1.900	3.100	3.050	3.950	3.700	
1.900	1.750	2.950	2.950	3.900	3.500	
2.250	1.750	3.350	2.800	3.950	3.900	

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

AACとWMAの音質比較

概要

AACWMAとMP3の音質比較。AACエンコーダによる差が非常に激しいので、優秀なエンコーダの代表としてqaac、劣悪なエンコーダの代表としてvo-aacencの2種を使用。その他のエンコーダについては他の記事を参照。

iTunesでも使われているAppleのエンジン(Apple Software Support)を借りてエンコードするqaac 1.18Windows XP以降に付属するマイクロソフト謹製のエンジンでエンコードするWMAEncode_0.2.9、言わずと知れたオープンソースのMP3エンコーダ LAME 3.98.4、ビリ基準も兼ねて、最近オープンソースになったVisualOn社のvo-aacenc 0.1.1の計4種を聴いて採点した。

結果

QAAC 192kbps > WMA 192k > QAAC 128k ≒ LAME 192k ≒ WMA 128k > LAME 128k ≒ vo-aac 192k ≒ vo-aac 128k
ただしQAAC 128kbps > WMA 128k(p = 0.025)
Apple社のエンジンを利用したQAACの192kbpsが最も高い評価となり、LAME 128kbps, vo-aac 192kbps, vo-aac 128kbpsが最も低い評価となった。

評価

エンコーダ qaac voaac wmae lame qaac voaac wmae lame
リリース年 2012 2011 2011 2009 2012 2011 2011 2009
バージョン 1.18 0.1.1 0.2.9 398.4 1.18 0.1.1 0.2.9 398.4
フォーマット AAC AAC WMA MP3 AAC AAC WMA MP3
プロファイル LC LC Std. - LC LC Std. -
レート制御 CVBR ABR ABR CBR CVBR ABR ABR CBR
ビットレート 128k 128k 128k 128k 192k 192k 192k 192k
41_30sec 打楽器 3.9 2.6 3.3 2.1 5.0 2.8 3.7 3.3
finalfantasy 撥弦楽 4.4 3.4 4.0 2.9 4.6 3.9 5.0 3.7
ATrain ジャズ 4.6 2.7 4.6 2.3 5.0 2.9 5.0 4.5
BigYellow POPS 3.8 2.8 3.1 2.3 4.7 3.2 4.2 4.0
FloorEssence テクノ 3.4 2.5 3.4 2.5 5.0 2.4 4.1 3.4
macabre オケ 4.6 2.8 5.0 3.4 5.0 2.8 4.7 4.7
mybloodrusts 弦楽器 5.0 2.4 3.9 2.8 5.0 2.4 5.0 3.9
Quizas ラテン 4.1 2.3 3.6 3.1 5.0 2.3 4.3 4.5
VelvetRealm テクノ 3.8 2.5 2.7 3.0 4.5 2.6 3.5 3.2
雨降花 POPS 4.0 2.3 4.4 2.8 5.0 2.3 4.7 5.0
Trust Gosp 3.7 2.8 3.6 3.3 4.3 3.2 4.6 4.1
Waiting ロック 3.8 2.6 3.7 2.8 4.2 2.7 4.6 4.0
Experiencia ラテン 3.8 3.8 3.7 3.5 5.0 2.8 5.0 4.0
HeartToHeart POPS 3.7 3.1 3.5 2.8 4.6 3.5 4.5 3.9
Tom's Diner 女声 4.6 2.7 3.6 3.3 5.0 3.0 4.5 4.1
↑音源 平均点 4.05 2.74 3.73 2.85 4.78 2.83 4.47 4.00
実レート 136k 130k 135k 128k 208k 194k 203k 193k
全サイズ(KB) 5803 5555 5782 5495 8894 8294 8674 8242
エンコーダ qaac voaac wmae lame qaac voaac wmae lame

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm

方法

銘柄に対する先入観が影響しないように、ABC/HR for Java 0.53aとMHP-A1を利用して、8個の音声ファイルをシャッフルして、銘柄を伏せた状態で聴いて採点した。1.0=音質劣化が非常に気になる 2.0=気になる 3.0=少し気になる 4.0=原音からの音質変化が分かるが、気にならない 5.0=音質変化がわからない、区別できない。4.9点以下の評点をつける場合は、ABXテストを20回行い、15回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした(2.9以下の場合は省略)。
同じテストを、SE-DIR800CIIでもう一度行い、平均を求めた。このテストでの採点は、15(音源)×4(エンコーダ)×2(ビットレート)×2(回)=240(回)。

使用したオプション

qaac_1.18 --cvbr 128 -o %outfile% %infile%
ffmpeg36030 -y -i %infile% -acodec libvo_aacenc -ab 128k %outfile%
WMAEncode_0.2.9\WMAEncode64 %infile% %outfile% --bitrate 128
lame3.98.4 -q 0 -b 128 %infile% %outfile%
qaac_1.18 --cvbr 192 -o %outfile% %infile%
ffmpeg36030 -y -i %infile% -acodec libvo_aacenc -ab 192k %outfile%
WMAEncode_0.2.9\WMAEncode64 %infile% %outfile% --bitrate 192
lame3.98.4 -q 0 -b 192 %infile% %outfile%

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 15
Critical significance:  0.05
Significance of data: 0.00E+000 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              119          88.91
Testers (blocks)    14           8.12
Codecs eval'd        7          65.64    9.38   60.70  0.00E+000
Error               98          15.14    0.15
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.285

Means:

qaac192  wmaen192 qaac128  lame192  wmaen128 lame128  voaac192 voaac128
  4.78     4.47     4.05     4.00     3.73     2.85     2.83     2.74

---------------------------- p-value Matrix ---------------------------

         wmaen192 qaac128  lame192  wmaen128 lame128  voaac192 voaac128
qaac192  0.035*   0.000*   0.000*   0.000*   0.000*   0.000*   0.000*
wmaen192          0.004*   0.001*   0.000*   0.000*   0.000*   0.000*
qaac128                    0.694    0.025*   0.000*   0.000*   0.000*
lame192                             0.063    0.000*   0.000*   0.000*
wmaen128                                     0.000*   0.000*   0.000*
lame128                                               0.889    0.445
voaac192                                                       0.532
-----------------------------------------------------------------------

qaac192 is better than wmaen192, qaac128, lame192, wmaen128, lame128, voaac192, voaac128
wmaen192 is better than qaac128, lame192, wmaen128, lame128, voaac192, voaac128
qaac128 is better than wmaen128, lame128, voaac192, voaac128
lame192 is better than lame128, voaac192, voaac128
wmaen128 is better than lame128, voaac192, voaac128

整形済みデータ

% AAC/WMA/MP3 128/192kbps ABC/HR score
qaac128 voaac128 wmaen128 lame128 qaac192 voaac192 wmaen192 lame192
%qaac vo-aacenc wmaencode lame qaac vo-aacenc wmaencode lame
%features 6 AAC AAC WMA MP3 AAC AAC WMA MP3
%features 7 128kbps 128kbps 128kbps 128kbps 192kbps 192kbps 192kbps 192kbps
3.850	2.600	3.300	2.100	5.000	2.750	3.650	3.300	
4.350	3.400	4.000	2.900	4.600	3.850	5.000	3.700	
4.550	2.700	4.600	2.350	5.000	2.900	5.000	4.500	
3.800	2.800	3.100	2.300	4.650	3.150	4.200	3.950	
3.400	2.450	3.350	2.450	5.000	2.400	4.050	3.350	
4.550	2.750	5.000	3.350	5.000	2.800	4.650	4.650	
5.000	2.350	3.900	2.750	5.000	2.350	5.000	3.900	
4.100	2.300	3.600	3.100	5.000	2.300	4.250	4.450	
3.800	2.450	2.650	2.950	4.450	2.550	3.500	3.200	
3.950	2.300	4.350	2.850	5.000	2.300	4.700	5.000	
3.650	2.850	3.600	3.300	4.250	3.200	4.600	4.100	
3.750	2.600	3.700	2.800	4.150	2.650	4.600	3.950	
3.800	3.800	3.700	3.450	5.000	2.850	5.000	3.950	
3.700	3.050	3.500	2.800	4.600	3.450	4.450	3.850	
4.550	2.700	3.550	3.300	5.000	2.950	4.450	4.100	

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。

2012年版最新FFmpeg、携帯動画変換君、PSP用設定

携帯動画変換君を、Youtubeニコニコ動画で使われるOn2 VP6/FLV4やH.264に対応したバージョンに改造する。
最新版のQuickTimeを必要とします。携帯動画変換に使われるQT3GPPFlattenなどはQuickTimeが古いバージョンであることを要求するので注意。

  1. http://blog.k-tai-douga.com/article/52952627.htmlから、ffmpeg_bin-36539.zipまたは各自のCPUごとの最適化版をダウンロードして解凍したffmpeg.exeをffmpeg36539.exeに名前を変更してcoresフォルダの中へ。
  2. http://sites.google.com/site/qaacpage/cabinetから、qaac_1.20.zipをダウンロードして解凍して、x86フォルダの中にあるqaac.exeなど5ファイルをcoresフォルダの中へ。
  3. Transcoding.iniを以下からコピペして書き換え。または[Item0]以下を[Item(数字)]に書き換えて最後尾に追加。
[Info][Info]
Title=FFmpeg rev.36539 for PSP
TitleE=FFmpeg rev.36539 for PSP

Description=FFmpeg rev.36539 用の設定。PSP用。
DescriptionE=for FFmpeg rev.36539 configuration for PSP

[Item0]
Title=【低画質】AVC 480x272 2MB/分
TitleE=[low] AVC 480x272 2MB/min
Command0=""<%AppPath%>\cores\ffmpeg36539" -y -i "<%InputFile%>" -vn -acodec pcm_s16le -ac 2 "<%AppPath%>\cores\sound_k.wav""
Command1=""<%AppPath%>\cores\qaac" -s --cvbr 64 -o "<%AppPath%>\cores\aac.m4a" "<%AppPath%>\cores\sound_k.wav""
Command2=""<%AppPath%>\cores\ffmpeg36539" -y -i "<%AppPath%>\cores\aac.m4a" -i "<%InputFile%>" -map 1:v:0 -map 0:0 -acodec copy -vcodec libx264 -preset slow -x264opts ref=3 -r 29.97 -crf 32 -bufsize 768k -maxrate 640k -vprofile main -level 30 -s 480x272 "<%OutputFile%>_low.MP4""
Command3=""<%AppPath%>\cores\ffmpeg36539" -y -i "<%InputFile%>" -f image2 -ss 5 -vframes 1 -s 160x120 -an -loglevel quiet "<%OutputFile%>_low.jpg""

[Item1]
Title=【中画質】AVC 480x272 3MB/分
TitleE=[mid] AVC 480x272 3MB/min
Command0=""<%AppPath%>\cores\ffmpeg36539" -y -i "<%InputFile%>" -vn -acodec pcm_s16le -ac 2 "<%AppPath%>\cores\sound_k.wav""
Command1=""<%AppPath%>\cores\qaac" -s --cvbr 80 -o "<%AppPath%>\cores\aac.m4a" "<%AppPath%>\cores\sound_k.wav""
Command2=""<%AppPath%>\cores\ffmpeg36539" -y -i "<%AppPath%>\cores\aac.m4a" -i "<%InputFile%>" -map 1:v:0 -map 0:0 -acodec copy -vcodec libx264 -preset slow -x264opts ref=3 -r 29.97 -crf 28 -bufsize 768k -maxrate 640k -vprofile main -level 30 -s 480x272 "<%OutputFile%>_mid.MP4""
Command3=""<%AppPath%>\cores\ffmpeg36539" -y -i "<%InputFile%>" -f image2 -ss 5 -vframes 1 -s 160x120 -an -loglevel quiet "<%OutputFile%>_mid.jpg""

[Item2]
Title=【最高画質】AVC 720x480 6MB/分
TitleE=[high] AVC 720x480 6MB/min
Command0=""<%AppPath%>\cores\ffmpeg36539" -y -i "<%InputFile%>" -vn -acodec pcm_s16le -ac 2 "<%AppPath%>\cores\sound_k.wav""
Command1=""<%AppPath%>\cores\qaac" -s --cvbr 128 -o "<%AppPath%>\cores\aac.m4a" "<%AppPath%>\cores\sound_k.wav""
Command2=""<%AppPath%>\cores\ffmpeg36539" -y -i "<%AppPath%>\cores\aac.m4a" -i "<%InputFile%>" -map 1:v:0 -map 0:0 -acodec copy -vcodec libx264 -preset slow -x264opts ref=3 -r 29.97 -crf 25 -bufsize 768k -maxrate 1024k -vprofile main -level 30 -s 720x480 "<%OutputFile%>_high.MP4""
Command3=""<%AppPath%>\cores\ffmpeg36539" -y -i "<%InputFile%>" -f image2 -ss 5 -vframes 1 -s 160x120 -an -loglevel quiet "<%OutputFile%>_high.jpg""

成功した環境はCore i5の2.8GHz、ffmpegPentium4最適化版。PSPはFW6.20。H.264divx、MPEG2 tsファイル、movやYoutubeのmp4は難なく変換できた。可変ビットレート音声、24fps動画では、ごくまれに変換できないかもしれない。

続きを読む

AACエンコーダの比較

警告

この内容は2011年の古い結果です。
2021年5月現時点では、qaacか、FFmpegから使う場合はFFmpeg公式推奨の Fraunhofer FDK AAC 外部ライブラリ(-c:a libfdk_aac) を推奨します。

  • 現在のFFmpegでは、cutoffオプションは付けない方が良いです。
  • vo-aacenc のサポートは廃止されました。
  • libfaac のサポートも廃止されました。使おうとするとUnknown encoder ‘libfaac’と言われるはずです。

概要

96kbps付近でエンコードしたときのAACエンコーダの音質比較。64k,128k, 128k,192kでの評価もあります。
iTunesでも使われるAppleのエンジン(Apple Software Support)を借りてエンコードするqaac 1.16Winamp付属のenc_aacplus.dllを使ってエンコードするenc_aacPlusNeroAACEncFFmpeg・Handbrake・BonkEncなどの多くのフリーソフトに使われているlibfaac(FAAC)オープンソースとなったVisualOn社のvo-aacenc 0.1.1、ffmpeg内蔵のAACエンコーダcutoffオプション追加したもの、計6種を聴いて採点、比較。

結果

qaac > enc_aacPlus > NeroAACEnc > ffmpeg内蔵+cutoffオプション ≒ libfaac ≒ vo-aacenc

qaacの音質はずば抜けて良く、次にenc_aacPlus、次にNeroAACEncが良く、ffmpeg、libfaac、vo-aacencの音質は最も悪い。

評価

エンコーダ qaac enc_a nero faac voaac ffmpeg
リリース年 2011 2006 2010 2010 2011 2011
バージョン 1.16 N/A 1540 1.28 0.1.1 r36030
フォーマット AAC-LC AAC-LC AAC-LC AAC-LC AAC-LC AAC-LC
レート制御 CVBR CBR ABR ABR ABR ABR
ビットレート 96k 98k 96k 96k 96k 96k
Tarentella 管楽器 3.7 3.0 2.6 2.1 2.4 2.6
水瀬さんち 男女声 3.8 3.3 2.6 2.0 2.2 2.9
Miles Davis ジャズ 3.5 2.9 3.2 2.5 2.2 2.6
58-ギター 弦楽器 3.5 3.5 2.9 2.5 2.7 2.3
55-Haydn 管楽器 5.0 3.6 3.8 2.9 2.3 2.3
41_30sec 打楽器 3.6 2.8 2.5 2.3 2.2 1.8
finalfantasy 撥弦楽 3.8 3.4 3.2 2.2 2.6 2.5
ATrain ジャズ 3.7 2.8 3.2 2.4 2.3 3.0
BigYellow POPS 3.4 3.6 3.0 2.2 2.5 2.3
FloorEssence テクノ 3.4 3.1 3.0 2.6 2.3 2.4
macabre オケ 4.0 3.8 3.7 2.4 2.2 2.5
mybloodrusts 弦楽器 3.4 2.8 3.1 2.5 2.2 2.0
Quizas ラテン 3.9 3.6 3.1 2.3 2.5 2.1
VelvetRealm テクノ 3.7 2.9 2.8 2.4 2.5 2.4
雨降花 POPS 3.9 3.7 2.7 2.2 1.7 2.0
Trust Gosp 3.3 2.7 2.5 2.3 2.4 2.1
Waiting ロック 3.4 2.6 3.1 2.5 2.0 2.0
Experiencia ラテン 3.3 3.7 3.3 2.2 2.5 2.9
HeartToHeart POPS 3.2 3.4 3.3 2.3 2.7 2.3
Tom's Diner 女声 3.4 3.7 2.8 2.2 2.5 2.4
↑音源 平均点 3.65 3.25 3.02 2.35 2.35 2.37
実レート 101k 98k 98k 97k 98k 98k
全サイズ(KB) 5347 5167 5150 5148 5175 5163
エンコーダ qaac enc_a nero faac voaac ffmpeg

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm

方法

銘柄に対する先入観が影響しないように、ABC/HR for Java 0.53aとMHP-A1を利用して、6個のエンコードされたAACをシャッフルして、銘柄を伏せた状態で聴いて採点した。1=音質劣化が非常に気になる 2=気になる 3=少し気になる 4=原音からの音質変化が分かるが、気にならない 5=音質変化がわからない、区別できない。4.9点以下の評点をつける場合は、ABXテストを20回行い、15回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした(2.9以下の場合は省略)。このテストでの採点は、20(音源)×6(エンコーダ)=120(回)。

使用したオプション

qaac_1.16 --cvbr 96 -o %outfile% %infile%
enc_aacPlus %infile% %outfile% --cbr 98000 --lc --mp4box
neroAacEnc -if %infile% -lc -br 96000 -of %outfile%
ffmpeg18607 -y -i %infile% -acodec libfaac -ab 96k %outfile%
ffmpeg36030 -y -i %infile% -acodec libvo_aacenc -ab 96k %outfile%
ffmpeg36030 -y -i %infile% -strict experimental -acodec aac -ab 96k -cutoff 15000 %outfile%

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 20
Critical significance:  0.05
Significance of data: 0.00E+000 (highly significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total              119          43.29
Testers (blocks)    19           3.86
Codecs eval'd        5          31.00    6.20   69.81  0.00E+000
Error               95           8.44    0.09
---------------------------------------------------------------
Fisher's protected LSD for ANOVA:   0.187

Means:

qaaccvbr encaacpl nero_abr ffmpegof lib_faac voaacenc
  3.65     3.25     3.02     2.37     2.35     2.35

---------------------------- p-value Matrix ---------------------------

         encaacpl nero_abr ffmpegof lib_faac voaacenc
qaaccvbr 0.000*   0.000*   0.000*   0.000*   0.000*
encaacpl          0.019*   0.000*   0.000*   0.000*
nero_abr                   0.000*   0.000*   0.000*
ffmpegof                            0.832    0.791
lib_faac                                     0.958
-----------------------------------------------------------------------

qaaccvbr is better than encaacpl, nero_abr, ffmpegof, lib_faac, voaacenc
encaacpl is better than nero_abr, ffmpegof, lib_faac, voaacenc
nero_abr is better than ffmpegof, lib_faac, voaacenc

整形済みデータ

% AAC 96kbps ABC/HR score
qaaccvbr	encaacpl	nero_abr	lib_faac	voaacenc	ffmpegof	
3.700	3.000	2.600	2.100	2.400	2.600	
3.800	3.300	2.600	2.000	2.200	2.900	
3.500	2.900	3.200	2.500	2.200	2.600	
3.500	3.500	2.900	2.500	2.700	2.300	
5.000	3.600	3.800	2.900	2.300	2.300	
3.600	2.800	2.500	2.300	2.200	1.800	
3.800	3.400	3.200	2.200	2.600	2.500	
3.700	2.800	3.200	2.400	2.300	3.000	
3.400	3.600	3.000	2.200	2.500	2.300	
3.400	3.100	3.000	2.600	2.300	2.400	
4.000	3.800	3.700	2.400	2.200	2.500	
3.400	2.800	3.100	2.500	2.200	2.000	
3.900	3.600	3.100	2.300	2.500	2.100	
3.700	2.900	2.800	2.400	2.500	2.400	
3.900	3.700	2.700	2.200	1.700	2.000	
3.300	2.700	2.500	2.300	2.400	2.100	
3.400	2.600	3.100	2.500	2.000	2.000	
3.300	3.700	3.300	2.200	2.500	2.900	
3.200	3.400	3.300	2.300	2.700	2.300	
3.400	3.700	2.800	2.200	2.500	2.400	

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。