FE EXAM

MP3(音声の圧縮)

人間の聴覚特性を利用して音声を圧縮する非可逆音声形式

DIAGRAM
聞こえる音マスクされる音削除する音

① マスキング効果:大きい音の近くの小さい音は聞こえない → 削除

周波数(音の高さ)→音量 →大きい音このライン以下は聞こえない(マスキングしきい値)削除削除残す離れているので聞こえる近くの小さい音はかき消されるので、保存しても無駄 → 思い切って捨てる

② 身近な例:大きな音のそばでは小さな音に気づけない

静かな部屋🔈小さなささやき声も聞こえる→ この音は情報として保存する価値がある大音量のライブ会場🔊同じささやき声はかき消されて聞こえない→ どうせ聞こえないので削除してOK

③ ビットレートと音質のトレードオフ

64 kbps容量:小さい音質は粗い128 kbps容量:ほどよい標準的な音質320 kbps容量:大きい高音質(ほぼ原音)大きいほど高音質大きいほどファイル大
解説

📌
MP3とは

聞こえない音を捨てて小さくする原音(WAV)10MB非可逆MP31MB約1/10に。耳ではほぼ違いが分からない

MP3(エムピースリー、MPEG-1 Audio Layer-3)とは、音声を大幅に小さく圧縮する代表的な音声形式です。動画規格のMPEGの音声部分から生まれ、音楽配信や携帯音楽プレーヤーを一気に普及させました。

MP3は非可逆圧縮(=展開しても完全には元へ戻らない圧縮)です。元のCD音源(WAV形式)を、ファイルサイズでおよそ1/10にまで縮められます。それでも多くの人が「ほぼ同じ音」と感じるのが特徴です。

なぜ大きく削っても気づきにくいのか。その秘密が「人間の聴覚特性(耳のクセ)を利用する」点です。人が実際には聞き取れていない音を見つけ出し、思い切って捨ててしまうのです。これを支えるのが次に説明するマスキング効果です。

🔊
マスキング効果の仕組み

削除残す

マスキング効果とは、大きな音のそばにある小さな音は、人の耳には聞こえなくなるという聴覚の性質です。MP3はこの性質を逆手に取り、「どうせ聞こえない音」を計算で見つけて削除します。

削るかどうかは次の観点で判断されます。
音量の差:大きい音の近くにある小さい音はかき消される → 削除
周波数の近さ:高さ(周波数)が近い音ほどマスクされやすい
可聴域外:そもそも人間が聞き取れない高すぎる/低すぎる音 → 削除

身近な例で言うと、大音量のライブ会場でのささやき声です。静かな部屋なら聞こえるささやき声も、大音量の演奏の中ではまったく聞こえません。「聞こえないものは記録しても無駄」という発想で大胆にデータを減らすのがMP3の核心です。

🎚️
ビットレートと音質

MP3では圧縮の強さをビットレート(1秒あたりのデータ量、単位はkbps)で指定します。値を変えると音質とファイルサイズが連動して変わります。

ビットレート音質ファイルサイズ主な用途
64 kbps粗い小さい音声・通話・ラジオ
128 kbps標準ほどよい一般的な音楽配信
320 kbps高音質大きいこだわりのリスニング

ビットレートには明確なトレードオフ(あちらを立てればこちらが立たずの関係)があります。
ビットレートを上げる:音質は良くなるが、ファイルは大きくなる
ビットレートを下げる:ファイルは小さくなるが、音質は劣化する
一般的な音楽では128kbps前後が品質と容量のバランスのよい目安とされます。

身近な例で言うと、写真の解像度に似ています。高解像度ほどきれいですが容量も大きい。用途に合わせて「どこまで質を落として小さくするか」を選ぶ点が同じです。「ビットレートが高い=高音質かつ大容量」という関係を押さえておくとよいでしょう。

関連コンテンツ

MP3 | Vizigo