音風景ブログ

目隠しテストによるエンコーダの音質評価などを行うブログです。

Opus,Ogg,AAC 128kbpsの音質比較

概要

Opus Audio Codec, Ogg Vorbis, AACの128kbpsでの音質比較。

結果

AAC ≒ Opus ≒ Ogg
3者とも評点に有意差を検出できなかった。おおむね同程度の音質。

評価

エンコーダ opus aoTuV qaac
リリース年 2012 2011 2012
バージョン v0.9.10 B6.03 1.36
フォーマット Opus Ogg AAC
ビットレート 128000 q3 cvbr128
41_30sec 打楽器 3.7 4.0 4.1
finalfantasy 撥弦楽 3.8 4.2 4.1
ATrain ジャズ 3.8 3.8 4.2
BigYellow POPS 3.9 3.5 4.0
FloorEssence テクノ 4.2 4.3 3.7
macabre オケ 3.9 4.0 4.3
mybloodrusts 弦楽器 5.0 3.7 5.0
Quizas ラテン 3.9 3.6 4.0
VelvetRealm テクノ 3.5 4.5 4.1
雨降花 POPS 3.9 3.6 4.2
Trust Gosp 3.7 4.2 4.0
Waiting ロック 3.8 3.6 3.8
Experiencia ラテン 4.3 3.9 4.1
HeartToHeart POPS 3.8 3.8 4.1
Tom's Diner 女声 3.9 3.6 4.4
ReunionBlues ジャズ 4.1 4.2 5.0
French 男女声 4.6 3.7 4.0
undelete POPS 3.7 4.2 4.1
Dimmu Borgir メタル 4.5 5.0 4.8
Run up POPS 4.6 4.4 4.1
↑音源 平均点 4.02 3.97 4.18
実レート 131k 129k 136k
全サイズ(KB) 7658 7565 7954
エンコーダ opus aoTuV qaac

テストに利用した音源を試聴したい方、ダウンロードしたい方、ログを見たい方はこちらへ。
http://zak.s206.xrea.com/bitratetest/main.htm

方法

銘柄に対する先入観が影響しないように、PSP abc/hr v2.3とRP-HT560を利用して、3個の音声ファイルをランダムに並び替えて、銘柄を伏せた状態で聴いて採点した。1.0=音質劣化が非常に気になる 2.0=気になる 3.0=わずかに気になる 4.0=原音からの音質変化が分かるが、気にならない 5.0=音質変化がわからない、区別できない。4.9点以下の評点をつける場合は、ABXYテストを15回行い、12回以上(これ以上の成績をまぐれで出す確率は約2%)正解して、違いを聞き取れることを確認してからそうした。
同じテストをもう一度行い、2評点の平均を求めた。このテストでの採点は、20(音源)×3(エンコーダ)×2(回)=120(回)。

使用したオプション

echo ===================Opus Section Start===================
bin\sox -D %InputWavFile% -b 16 "%TemporaryFile%1.wav" gain -3 rate -v 48000
bin\sox -D "%TemporaryFile%1.wav" "%TemporaryFile%1.raw"
bin\opus20120515\opus -e audio 48000 2 128000 "%TemporaryFile%1.raw" "%OutputFile%%OpusName%"
bin\opus20120515\opus -d 48000 2 "%OutputFile%%OpusName%" "%TemporaryFile%2.raw"
bin\sox -D -r 48000 -e signed -b 16 -c 2 "%TemporaryFile%2.raw" -b 32 -e float %OpusDecode% rate -v 44100

echo ===================Ogg Section Start===================
bin\venc603 -q3 %InputWavFile% "%OutputFile%%OggName%"
bin\oggdec -b 5 "%OutputFile%%OggName%" --wavout %OggDecode%

echo ===================Aac Section Start===================
bin\qaac_1.36\qaac --cvbr 128 -o "%OutputFile%%AacName%" %InputWavFile%
bin\faad -b 4 -o %AacDecode% "%OutputFile%%AacName%"

詳細な優劣の分析

FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
Blocked ANOVA analysis

Number of listeners: 20
Critical significance:  0.05
Significance of data: 1.14E-001 (not significant)
---------------------------------------------------------------
ANOVA Table for Randomized Block Designs Using Ratings

Source of         Degrees     Sum of    Mean
variation         of Freedom  squares   Square    F      p

Total               59           8.44
Testers (blocks)    19           3.91
Codecs eval'd        2           0.49    0.24    2.30  1.14E-001
Error               38           4.04    0.11
---------------------------------------------------------------

整形済みデータ

% Opus/Ogg/Aac 128kbps ABC/HR score
opus v0.9.10	aoTuV b6.03	qaac 1.36
%feature 7 OPUS OGG AAC-LC	
3.700	4.000	4.050	
3.800	4.150	4.100	
3.800	3.850	4.200	
3.950	3.450	3.950	
4.150	4.300	3.700	
3.950	3.950	4.250	
5.000	3.700	5.000	
3.900	3.600	3.950	
3.500	4.500	4.050	
3.900	3.550	4.150	
3.650	4.200	3.950	
3.800	3.550	3.850	
4.250	3.950	4.100	
3.750	3.800	4.100	
3.900	3.550	4.350	
4.050	4.200	5.000	
4.600	3.650	4.000	
3.700	4.150	4.050	
4.450	5.000	4.750	
4.550	4.350	4.100	

エンコード・デコードのログ

===================Processing Wav File "D:\autoencode\10xh_.wav"===================
===================Opus Section Start===================
libopus unknown
Encoding 48000 Hz input at 128.000 kb/s in auto mode with 960-sample frames.
average bitrate:             128.492 kb/s
maximum bitrate:             221.200 bkp/s
active bitrate:              128.578 kb/s
bitrate standard deviation:   33.717 kb/s
libopus unknown
Decoding with 48000 Hz output (2 channels)
average bitrate:             128.492 kb/s
maximum bitrate:             221.200 bkp/s
bitrate standard deviation:   33.717 kb/s
===================Ogg Section Start===================
aoTuV Beta 6.03 - OggVorbis Encoder (c) 2003-2011 Aoyumi

Output file : "sound_out\10xh_.aotuv603_q3.ogg"
Stream info.: 2ch/44.1kHz/16bit(int) -> 2ch/44.1kHz/32bit(float)

Quality 3 (nominal bitrate : 112kbps)
Processing...Done.

 [Report of the encoded file]
   play time    : 30.000 sec.
  encode time   : 1.212 sec. (x24.752)
 stream bitrate : 142.56 kbps
 bit reduction  : 1 / 9.9 


OggDec v1.9.7 (libVorbis 1.3.1) Compiled on: Mar 29 2010
 !%!INVISIBLE.DONTUPDATE!%!ENCODE_INFO=1,VENC 2.61,2,int16,44100,17100,Coupling,Q3.00
 Encoder Version: 0
 Serial Number: 26035

 Bitstream is 2 channel, 44100Hz
 Scale = 1.0000
 Decoded length: 1323001 samples = 0:30 mins.
 Encoded by: AO; aoTuV [20110424] (based on Xiph.Org's libVorbis)
 Decoding: sound_out\10xh_.aotuv603_q3.ogg

  100% decoded.

 ********** Done decoding all input files. **********
===================Aac Section Start===================
qaac 1.36, CoreAudioToolbox 7.9.7.9

10xh_.wav
AAC-LC Encoder, CVBR 128kbps, Quality 96
[100.0%] 0:30.000/0:30.000 (38.5x), ETA 0:00.000  
1323001/1323001 samples processed in 0:00.780
Overall bitrate: 143.181kbps
 *********** Ahead Software MPEG-4 AAC Decoder V2.7 ******************

 Build: Jun 14 2010
 Copyright 2002-2004: Ahead Software AG
 http://www.audiocoding.com
 Floating point version

 This program is free software; you can redistribute it and/or modify
 it under the terms of the GNU General Public License.

 **************************************************************************

sound_out\10xh_.qaac136_cvbr_128k.m4a file info:

LC AAC	30.040 secs, 2 ch, 44100 Hz

tool: qaac 1.36, CoreAudioToolbox 7.9.7.9, AAC-LC Encoder, CVBR 128kbps, Quality 96
iTunSMPB:  00000000 00000840 000003C7 0000000000142FF9 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000

  ---------------------
 | Config:  2 Ch       |
  ---------------------
 | Ch |    Position    |
  ---------------------
 | 00 | Left front     |
 | 01 | Right front    |
  ---------------------

Decoding sound_out\10xh_.qaac136_cvbr_128k.m4a took:  0.31 sec. 96.28x real-time.
===================Rawgene2 Section Start===================
rawgene v.2.0.0  /  original reference file:sound_raw\10xh_.original.f32b.wav
                     Offset[sample]  Gain    Gain[dB]     Score
FLO 1>10xh_.opusv091> O:  287   G: 1.410961  G: 2.990303  S: 0.280587
FLO 2>10xh_.aotuv603> O:    0   G: 1.009737  G: 0.084167  S: 0.183967
FLO 3>10xh_.qaac136_> O: 1088   G: 1.006208  G: 0.053757  S: 0.156985
biggest_delay    : 1088
smallest_delay   : 0
biggest_gain     : 1.410961
shortest_sample  : 1321913
initial_offset   : 7126

注:公開試聴試験での多人数の平均評点と管理人の評点が似たような傾向になることは確認しているので言えるが、ある個人がある再生環境で、ある価値観のもとに聞いたときの評価が、ここに書いた管理人の評価に似るかどうかまでは何とも言えない。また、今回利用した音源とは傾向の異なる音を多くエンコードした場合、結果や順位が異なる可能性があります。