Spectrogram (スペクトログラム・声紋分析)

概要
音の成分を「時間(横軸)」「周波数(縦軸)」「強さ(色)」の3次元で表示するツールです。 スペクトラムアナライザが「現在の瞬間の周波数分布」を表示するのに対し、スペクトログラムは時々刻々と変化する「音紋(声紋)」を可視化します。 音声のイントネーション分析、楽器の倍音の時間変化、鳥の鳴き声の解析、間欠的なノイズの発見など、音の「移ろい」を観察するのに最適です。
操作方法
測定の開始と停止
- Start / Stop ボタン: 測定の開始と停止を切り替えます。
- スタートすると、グラフの右端から新しいデータが現れ、古いデータは左へと流れていきます(ウォーターフォール表示)。
グラフの見方
- 横軸 (Time): 時間の経過を表します。現在時刻が右端で、左に行くほど過去の音になります。
- 縦軸 (Frequency): 周波数(音の高さ)を表します。上に行くほど高い音です。
- 色 (Color): その瞬間の、その周波数の音の「強さ」を表します。
- 明るい色(黄・赤など): 強い音
- 暗い色(青・紫・黒など): 弱い音、または無音
右側の分布図(カラーバー)の見方
グラフの右側にあるこの縦長のバーは、「色と音量(dB)の対応表」であり、同時に表示の明るさを調整するコントローラーでもあります。
- 色の意味: バーの上部は強い音(0dB付近)、下部は弱い音(-120dB付近)に対応する色が示されています。「グラフ上のこの色は、これくらいの音量なんだな」という凡例として使います。
- 表示範囲の調整(コントラスト調整):
- 白いハンドル(三角マーク)をドラッグ: 表示する色の範囲を調整できます。
- 全体の明るさを変えたい: バー全体を上下にドラッグ、またはマウスホイールでスクロールします。
- コントラスト(メリハリ)を変えたい: ハンドルの幅を広げたり狭めたりします。幅を狭くすると、小さな音量差で急激に色が変わるようになり、微妙な変化が見やすくなります。
設定項目
Settings (基本設定)
-
Channel (チャンネル)
- Left / Right / Average: 分析する音声チャンネルを選択します。
-
FFT Size (周波数分解能)
- 分析の細かさを設定します。
- 4096 / 8192など: 周波数が細かく見えますが、時間方向の反応が少しぼやけます。
- 512 / 1024など: 時間的な反応(リズムなど)はシャープに見えますが、周波数は大雑把になります。
- 通常は
2048程度がバランス良くおすすめです。
-
Window (窓関数)
- ノイズ分析には
hann(標準) やblackmanが適しています。
- ノイズ分析には
-
Colormap (配色)
- グラフの色使いを変更します。
- viridis / plasma / inferno / magma: 科学的によく使われる、明るさの変化が均等で見やすい配色です。
- turbo: 虹色のようなカラフルな配色で、細かいレベル差を見分けるのに適しています。
-
Speed (流れる速さ)
- グラフがスクロールするスピードを調整します。
- Fast (Realtime): リアルタイムで流れます。短時間の変化を見るのに向いています。
- Medium / Slow / Meteor: ゆっくり流れます。環境音のモニタリングなど、長い時間をかけて変化を観察する場合に使います(数分〜10分間の履歴を一画面に表示)。
-
Min Freq / Max Freq
- 縦軸(周波数)の表示範囲を絞り込みます。
- 例えば「低音だけ詳しく見たい」場合は、Max Freq を
1000 Hzなどに設定します。
使用例
「声」の見える化
自分の声や話し声を分析してみましょう。
- Start ボタンを押します。
- マイクに向かって「あー」「いー」と喋ってみます。
- 母音によって、色の縞模様(フォルマント)の位置が変わるのが見えます。
- 口笛を吹くと、非常に鮮明な一本の線(純音に近い)が現れます。
異音の正体を探る
「キーン」という高周波ノイズや、「ブーン」という低いハムノイズなど、耳障りな音の成分を特定します。
- FFT Size を大きめ(
4096~8192)に設定します。 - Speed を
Medium程度にします。 - ノイズが鳴っている時の画面を観察します。
- ずっと横に伸びる線: ファンやモーター、電源ハムなど、定常的なノイズです。縦軸を見て周波数を特定できます。
- 縦に走る線: 衝撃音やクリックノイズです。
- モヤモヤした霧: 空調の風切り音(ホワイトノイズ)などです。
ハイレゾ音源の確認
再生している音楽ファイルが本当にハイレゾ(高域まで成分が含まれているか)なのか、単にアップサンプリングされたものなのかを確認できます。
- 音楽を再生します。
- Max Freq を
48000 Hz(96kHzサンプリングの場合) などに広げます。 - 20kHz (20000Hz) より上の領域を見ます。
- 20kHz以上にも色がしっかり乗っていれば、ハイレゾ成分が含まれています。20kHzでスパッと切れて真っ暗になっている場合、元はCD音質である可能性が高いです。