Deepgram(音声文字起こし)
Deepgram は音声テキスト変換 API です。OpenClaw では、tools.media.audio を介したインバウンドオーディオ/音声ノートの文字起こしに使用されます。
有効にすると、OpenClaw はオーディオファイルを Deepgram にアップロードし、トランスクリプトを返信パイプライン({{Transcript}} + [Audio] ブロック)に挿入します。これはストリーミングではありません。事前録音された文字起こしエンドポイントを使用します。
ウェブサイト: https://deepgram.com
ドキュメント: https://developers.deepgram.com
クイックスタート
- API キーを設定:
DEEPGRAM_API_KEY=dg_...
- プロバイダを有効化:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }]
}
}
}
}
オプション
- model: Deepgram モデル ID(デフォルト: nova-3)
- language: 言語ヒント(オプション)
- tools.media.audio.providerOptions.deepgram.detect_language: 言語検出を有効化(オプション)
- tools.media.audio.providerOptions.deepgram.punctuate: 句読点を有効化(オプション)
- tools.media.audio.providerOptions.deepgram.smart_format: スマートフォーマットを有効化(オプション)
言語を指定する例:
{
tools: {
media: {
audio: {
enabled: true,
models: [
{ provider: "deepgram", model: "nova-3", language: "en" }
]
}
}
}
}
Deepgram オプションを使用する例:
{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true
}
},
models: [{ provider: "deepgram", model: "nova-3" }]
}
}
}
}
注意事項
- 認証は標準のプロバイダ認証順序に従います。DEEPGRAM_API_KEY が最もシンプルなパスです。
- プロキシを使用する場合は、tools.media.audio.baseUrl と tools.media.audio.headers でエンドポイントやヘッダーを上書きします。
- 出力は他のプロバイダと同じオーディオルール(サイズ上限、タイムアウト、トランスクリプト挿入)に従います。