音声の基礎知識

スポンサーリンク
dvd-shrink0011

音声ファイルの形式やコーデックなどの基礎知識

画質も音質もこだわればキリがない。
デジタルの場合は数値で表すことができるため、どうしても数値に捕らわれてしまうが、体感できるほどの変化があるかと言えば、そうでもないことが多く、音質はデータのクオリティもさることながら、再生環境に大きく依存するので、必要以上に理論や理屈に拘る必要はなかったりする。

高音質の条件にはいくつかあるが、元データを超える音質は基本的には得られないが、 AudaCity のようなソフトを使用してノイズ部分を低減したり、波形 を操作してデータを編集加工し、元データの質を上げることは可能。
ただ、編集するには更に専門知識が必要になる。



CD の規格と寿命

CD が発売されてから30年ほど経過し、そろそろ発売当初の CD が経年劣化する時期だと言われている。
CD も DVD も発売 当初は「 半永久 」を謳っていたと記憶しているが、後から経年劣化することが判明し、現在  CD の寿命は概ね25年が目安と言われている。

保管状態によりメディアの寿命は変化し、再生できなくなる原因が反射膜やポリカーボネイト( CD の素材)の劣化のため、全ての CD が一定期間で再生不能になるわけではない。現に手元にある1986年に購入した CD は今も再生できる。
ただ、これらの CD はいわゆる CD-ROM のことであり、2000年前後から急速に普及した CD-R とは別物。

CD-ROM と CD-R ではデータの記録方法が異なり、 CD-R は CD-ROM と比較して劣化しやすいため、直射日光が当たるところなど、保管状態が悪ければ数日でデータが消失するケースもある。
DVD に関しては CD より長寿で30年が目安だが、これも DVD-ROM のことであって、 DVD-R になると状況は CD-R と同じ。

DVD-ROM と DVD-R 、 CD-ROM と CD-R を同一視している人は意外と多く、 DVD-R や CD-R のデータが半永久だと思っている。
この勘違いは「 大切な思い出は DVD で保存 」といったPRを展開した製造メーカーや販売店の訴求が原因。もし大切なデータを DVD -Rのみで保存しているなら、手遅れにならないうちにバックアップしておいたほうがいい。

再生環境

高音質なデータも再生環境が整っていなければ、本来の音質を得ることができない。
市販PCでの音楽再生はほぼマザーボードのサウンド機能を使用す る。
AC’97 の頃に比べれば High Difinition Audio ( HD Audio ) になり、パソコンの音質は格段に向上したが、 HD Audio は高音質なデータを扱えるだけで、 HD Audio だから高音質になるわけではない。

音楽 CD は CD -DA(Compact Disc Digital Audio)と表記され、データ形式は原音に最も近いとされている無圧縮のリニアPCM(LPCM)。
CD や音声ファイルを一般的なスピーカーで再生する際には DAC と呼ばれる D/A (デジタル/アナログ)変換が行われ、 サウンドカードを増設した場合はサウンドカードで処理され、オンボードのサウンド機能を使用するとオンボードのチップで変換処理される。

デジタルからアナログに変換された信号は、出力端子からケーブルを通ってアンプに送られ、そこで増幅されてスピーカーから出力される。

音質は DAC の変換性能やノイズ、アナログ出力時の劣化などで左右されるため、オンボードの HD Audio が高音質なデータを取り扱えても、高音質での入出力に特化しているサウンドカードや外付けのオーディオコンバータと比較すると音質に差が生じてく る。

最近は内蔵型のサウンドカードよりも外付けのユニットの方が需要があるようで、 D/A コンバーター など DAC に特化した製品の人気も高い。

スピーカーは前述のように D/A 変換されたアナログ信号をアンプで増幅して出力する。パソコン用のスピーカーはアンプ内蔵型のパワードスピーカーが多く、最近はBluetoothを使用した無線タイプも増えてきている。

通常タイプのスピーカーは D/A 変換が音質劣化の一因になるが、クラリオンから D/A 変換を必要としない、フルデジタルスピーカーが販売されている。
このスピーカーは再生されたデジタル信号を処理し、デジタル信号でスピーカーからサウンドを出力するらしい。

理論的には D/A 変換による音質劣化や、ノイズの影響を受けにくいため、通常タイプのスピーカーより高音質になる。が、サウンドは好みもあり、再生するサウンドによっても異なってくるため、一概にはなんとも言えない。

ファイルの形式とエンコード

音楽 CD ( CD -DA)は前述のように原音に最も近いとされるリニアPCM(LPCM)音源で記録されており、圧縮されていない、つまり データが削られていないため、品質的には最高の状態になっている。
当然、無圧縮なので1分で9MB弱のサイズになり、700MBの CD で最大約80分の収録が可能。

このデータを変換して取り込む際、データの変換(エンコード)には3通りある。

  • CD -DAのデータをそのまま圧縮加工せずに取り込む「 無圧縮 」。
  • CD -DAのデータを圧縮して取り込むが、圧縮する前と圧縮後のデータが完全に一致している「 可逆圧縮(ロスレ ス) 」。
  • CD -DAのデータを取り込む際にデー タを削って圧縮するため、圧縮前と圧縮後でデータが一致しない「 非可逆圧縮 」。

無圧縮のファイル形式には WAV (Wave)や AIFF があり、可逆圧縮にはOgg FLAC ( オッグ・フラック ) や Apple Lossless 、非可逆圧縮には MP3 や AAC 、 Ogg Vorbis  (オッグ・ボルビス )などがある。

これらのファイル形式にはそれぞれメリットとデメリットがあり、ベストなファイル形式というものはない。
強いて言うなら、非可逆圧縮ファイルのファイルサイズで無圧縮の音質を維持し、更に汎用性のあるファイル形式が最善なのだが、現在のところそのようなファイル形式は存在しない。

無圧縮の WAV ファイルはファイルサイズが大きく、可逆圧縮のファイルは無圧縮に比べるとサイズは小さいが再生できるプレーヤーが限られて汎用性がなく、 非可逆圧縮のファイルはファイルサイズが小さく汎用性も高いが音質が損なわれる。
ただ、音質が損なわれると言えば聞こえは悪いが、それは理論的な話であり、全ての非可逆圧縮ファイルの音質が劣悪なわけではない。

無圧縮や可逆圧縮、非可逆圧縮などの各形式に変換するプログラムや機材をエンコーダといい、無圧縮や可逆圧縮は別として、圧縮によってデータを損失する非可逆圧縮は、使用するエンコーダによって音質が左右すると言われている。

最も汎用性の高い MP3 のエンコーダは Windows にデフォルトで搭載されており、Media Playerを使用すれば手軽に MP3 ファイルにエンコードできる。
ただ、音質にこだわるなら Windows や iTunes の MP3 エンコーダではなくLame(レイム)を使用したほうが良いとされている。

Lame ( LAME Ain’t an MP3 Encoder ) は 1998年から開発が継続されている オープンソースライセンス の MP3エンコーダーで、 高音質として定評がある。

The LAME Project音声データの基礎知識

MP3 だけでなく、 AAC や Ogg Vorbis などのファイルも、使用するエンコーダによって音質が左右されるため、 CD-DA からの取り込み時には使用しているエンコードを把握しておいたほうが良いかも。

コーデック

ファイル形式と混同しやすく、ややこしい感じになるのがコーデックで、データの圧縮復元を行うプログラムの総称。

音声コーデックには無圧縮のLPCM、可逆圧縮の Apple Lossless 、 FLAC 、非可逆圧縮の MP3 / AAC / Ogg Vorbis などがあり、前述のファイル形式と重複しているが、 MP3 ファイルは文字通り MP3 コーデックを使用したファイルで、 AAC なども同様。

ただし、コンテナフォーマットと呼ばれる「 WAV 」「 mp4 」「 Ogg 」など、ファイル形式だけではコーデックが判別できない場合もある。
これらのファイル形式は文字通りコンテナ(容器)のようなもので、中に格納することができる。
ファイルの拡張子が mp4 の場合、使用されているコーデックは AAC の可能性が高いものの、 MP3 なども格納できるためファイルの拡張子だけでは判別でき ない。

ビットレート形式とファイルサイズ

ビットレートとは「 1秒間に送受信するデータ量 」のことで、単純にビットレートが高ければ1秒間に多くの情報を送ることができる。
MP3 や AAC など非可逆圧縮のファイルは、エンコード時にビットレート形式とビットレートを設定し、その設定により音質やファイルサイズを調整できるようになっている。

ビットレート形式には CBR ( Constant bitrate ) 固定ビットレート、 VBR ( Variable bitrate ) 可変ビットレート、ABR ( Averate bitrate ) 平均ビットレートなどがある。
厳密に言えばABR(平均ビットレート)は VBR (可変ビットレート)の一種なのだが、リッピングソフトなどでは CBR ・ VBR ・ABRを選択できること が多い。

★固定ビットレート( CBR )
その名のとおりデータ量が固定のため、転送データが少ないときは無駄が発生し、データが多いときは不足する可能性がある。

★可変ビットレート( VBR )
転送する情報量に合わせてビットレートが変化するため、固定ビットレートのようなムダがない反面、最終的なファイルサイズやビットレートの予測がつかない というデメリットがあるものの、固定ビットレートと比較すると同じファイルサイズであれば可変ビットレートは品質が向上する。

★平均ビットレート(ABR)
可変ビットレート( VBR )のデメリットであるファイルサイズの予測がつかない点を補いつつ、可変ビットレートと同様にデータ量に合わせてビットレート の調整を行う。
通常は複数パス方式(1度全体を解析する処理を行い、その後にビットレートを調整する)をとるため、1パスの VBR と比べて処理に時間を要 する。

エンコード後のファイルサイズは固定ビットレートの場合のみ算出することが可能で、数式は以下のようになる。

★1秒あたりのビットレート数( KB ) =  ビットレート( kbps )÷ 8
★曲の長さ(秒) × 1秒あたりのビットレート数 = 1曲のファイルサイズ(B)
★1曲のファイルサイズ( MB ) = 1曲のファイルサイズ(B) ÷ 1024

192kbpsの固定ビットレートでは、1秒あたりのビットレートが24KB、256kbpsでは32KB で、1分あたり 192 kbps では 1.41MB 、256kbps で1.88MB 、320kbps で2.34MB のファイルサイズになる。
ただし、算出した数値は理論値であり、実際にエンコードしたファイルサイズは若干異なってくる。

ビットレートと音質

聴くジャンルによっても異なってくるが、ロックやポップスなどでは  MP3 でビットレート256kbps以上、サンプルレート44.1KHzあれば、リニアPCM  の音源と比較しても遜色はない。
一般的に MP3 のビットレートが128kbpsと198kbpsの差は判別がつきやすく、128kbps以下では音質の悪さを感じてしまうレベルになる。

MP3 のダウンロード販売が始まった頃は、 iTunes ストアなどではビットレートが128kbpsのものも多く、音質では CD に遠く及ばない音源が、 CD と同額で販売されていたのだが、最近は音質も随分と改善されている。





関連記事

copyright

著作権法と違法行為

コピーやリッピングの際には要注意 違法ファイルとは著作権法に抵触しているファイルで、俗に「割れ(Warez)」と呼ばれる不正コピーしたものを指す。 著作権法では「私的利用での複製」は認められているが、複製したものをファイ […]

dvd-shrink0011

4K UHD の基礎知識

4K UHD の解像度や視聴距離とHDRなどのスペックについて 2011年にアナログ放送が終了して地上デジタル放送に移行した際、地デジ対応のテレビへの買い替えが強制され、それからすでに5年以上経過しているので、そろそろテ […]

dvd-shrink0011

オリジナル動画でのDVD製作方法

無料アプリで動画をDVD化 パソコンを使用した動画編集は、任意のシーンの抽出しや置換、削除など自由に編集が可能な「ノンリニア編集」になり、専用のソフトを使用する。 対義語となる「リニア編集」はビデオテープ全盛の世代なら経 […]

dvd-shrink0011

Blu-rayリッピングの基礎知識

Blu-rayの規格やリッピングアプリについて Blu-ray はDVDの後継となるメディアで、DVDと同じ大きさのディスクにDVDの5倍超になる25GBの容量を記録することができる。 もともとDVDはアナログからデジタ […]

dvd-shrink0011

DVD Ripping – DVDを動画ファイルに変換する方法

DVDのコンテンツを動画ファイルとして保存する手順と基礎知識 DVDを動画ファイルに変換すると PC や スマホ、タブレットなど再生できるデバイスが増え、ファイルなのでデバイスやUSBメモリ、クラウドストレージなどへの保 […]





タイトルとURLをコピーしました