audio

command module

v1.0.9 Latest Latest Go to latest Published: May 23, 2026 License: MIT Imports: 6 Imported by: 0

Details

Valid go.mod file
Redistributable license
Tagged version
Stable version
Learn more about best practices

Repository

github.com/shouni/audio

Links

Open Source Insights

README ¶

🎼 audio

audio は、Go 言語で音響バイナリを低レイヤーかつ安全に操作し、音声合成（TTS）や生成系 AI のワークフローを最適化するためのユーティリティ・キットです。

バイナリレベルでの高品質な WAV 結合と、形態素解析に基づく高精度なテキスト前処理を組み合わせることで、次世代の音声生成パイプラインを支えます。

✨ Core Features

Lossless Binary Merging: WAV セクションをデコードなしでバイナリレベルで直接結合。再エンコードによる世代損失（音質劣化）をゼロに抑えた長尺構成を実現。
Phonetic Text Processing: 日本語の形態素解析に基づき、音声合成エンジンが解釈しやすい読み（カタカナ）を生成。助詞（は→ワ、へ→エ、を→オ）の歌唱用補正と、挨拶表現（こんにちは→コンニチワ、こんばんは→コンバンワ）の発音補正を標準装備。
Dynamic Chunk Analysis: RIFF/WAVE 構造を動的に解析し、fmt や data チャンクを正確に特定。メタデータが含まれる複雑なファイルにも対応。
Memory Efficient: 最終的なバッファサイズを事前に計算し、最小限のアロケーションで高速に処理。
Production Ready: 4GB 超過チェックや、不正なヘッダーに対する厳密なバリデーションを標準装備。

📦 Installation

go get github.com/shouni/audio

🚀 Usage

1. 日本語の「読み」変換 (Phonetic Conversion)

日本語テキストを、音声合成エンジンに最適な読み上げ形式に変換します。

package main

import (
    "fmt"
    "github.com/shouni/audio/phonetic"
)

func main() {
    converter, _ := phonetic.NewConverter()
    
    // 助詞補正と発音補正を含むカタカナ変換
    reading := converter.ConvertToReading("こんにちは、絆を奏でる")
    fmt.Println(reading) // Output: コンニチワ、キズナオカナデル
}

2. WAV ファイルの結合 (Combine WAV Data)

複数の WAV バイナリを、単一のファイルとしてロスレスに結合します。

package main

import (
    "os"
    "github.com/shouni/audio/wav"
)

func main() {
    var wavParts [][]byte // 読み込み済みのWAVデータ
    
    combined, err := wav.CombineWavData(wavParts)
    if err != nil {
        panic(err)
    }

    _ = os.WriteFile("output.wav", combined, 0644)
}

🏗 Project Structure

audio/
├── wav/             # 音響バイナリ操作 (Merging, Validation, Header Analysis)
├── phonetic/        # 日本語解析・音韻変換 (Tokenizing, Reading, Particle Correction)
├── go.mod
└── README.md