Deepgram（音声文字起こし）

Deepgram は音声テキスト変換 API です。OpenClaw では、tools.media.audio を介したインバウンドオーディオ/音声ノートの文字起こしに使用されます。

有効にすると、OpenClaw はオーディオファイルを Deepgram にアップロードし、トランスクリプトを返信パイプライン（{{Transcript}} + [Audio] ブロック）に挿入します。これはストリーミングではありません。事前録音された文字起こしエンドポイントを使用します。

ウェブサイト: https://deepgram.com
ドキュメント: https://developers.deepgram.com

クイックスタート

API キーを設定：

DEEPGRAM_API_KEY=dg_...

プロバイダを有効化：

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }]
      }
    }
  }
}

オプション

model: Deepgram モデル ID（デフォルト: nova-3）
language: 言語ヒント（オプション）
tools.media.audio.providerOptions.deepgram.detect_language: 言語検出を有効化（オプション）
tools.media.audio.providerOptions.deepgram.punctuate: 句読点を有効化（オプション）
tools.media.audio.providerOptions.deepgram.smart_format: スマートフォーマットを有効化（オプション）

言語を指定する例：

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [
          { provider: "deepgram", model: "nova-3", language: "en" }
        ]
      }
    }
  }
}

Deepgram オプションを使用する例：

{
  tools: {
    media: {
      audio: {
        enabled: true,
        providerOptions: {
          deepgram: {
            detect_language: true,
            punctuate: true,
            smart_format: true
          }
        },
        models: [{ provider: "deepgram", model: "nova-3" }]
      }
    }
  }
}

注意事項

認証は標準のプロバイダ認証順序に従います。DEEPGRAM_API_KEY が最もシンプルなパスです。
プロキシを使用する場合は、tools.media.audio.baseUrl と tools.media.audio.headers でエンドポイントやヘッダーを上書きします。
出力は他のプロバイダと同じオーディオルール（サイズ上限、タイムアウト、トランスクリプト挿入）に従います。