マルチメディア処理(I類)第3回アイコン  第3回:音声のディジタル表現と処理
  • 今回の要点
    • 音の構成要素:高さ、強さ、音色
    • 音の標本化と量子化
      • A/D(Analog to Digital)、D/A(Digital to Analog変換)
    • 音声音響データ
      • 波形符号化 → 分析合成符号化 → ハイブリッド符号化
      • MP3, AAC, MMA, AIFF, WAVE, MIDI
    • 音声認識
      • スペクトル分析、音響モデル
      • 言語モデル
      • ニューラルネットワーク音響モデル、End-to-End音声認識モデル
    • 音声合成
      • 分析合成方式、テキスト音声合成方式
      • 素片編集、統計的パラメトリック、一貫学習:WaveNet、Tactron

    講義資料(2024年度版、2024年4月26日14:40〜16:10)