Deepgram (Транскрипция аудио)
Deepgram — это API для преобразования речи в текст. В OpenClaw он используется для транскрипции входящих аудио/голосовых заметок через tools.media.audio.
Когда включено, OpenClaw загружает аудиофайл в Deepgram и вставляет транскрипт в конвейер ответа (\{\{Transcript\}\} + блок [Audio]). Это не потоковая передача; используется конечная точка транскрипции для предварительно записанных файлов.
Веб-сайт: https://deepgram.com
Документация: https://developers.deepgram.com
Быстрый старт
- Установите ваш API ключ:
DEEPGRAM_API_KEY=dg_...
- Включите провайдера:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }]
}
}
}
}
Опции
- model: ID модели Deepgram (по умолчанию: nova-3)
- language: подсказка языка (опционально)
- tools.media.audio.providerOptions.deepgram.detect_language: включить определение языка (опционально)
- tools.media.audio.providerOptions.deepgram.punctuate: включить пунктуацию (опционально)
- tools.media.audio.providerOptions.deepgram.smart_format: включить умное форматирование (опционально)
Пример с языком:
{
tools: {
media: {
audio: {
enabled: true,
models: [
{ provider: "deepgram", model: "nova-3", language: "en" }
]
}
}
}
}
Пример с опциями Deepgram:
{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true
}
},
models: [{ provider: "deepgram", model: "nova-3" }]
}
}
}
}
Примечания
- Аутентификация следует стандартному порядку аутентификации провайдера; DEEPGRAM_API_KEY — это самый простой путь.
- Переопределите конечные точки или заголовки с помощью tools.media.audio.baseUrl и tools.media.audio.headers при использовании прокси.
- Вывод следует тем же правилам аудио, что и другие провайдеры (ограничения размера, таймауты, вставка транскрипта).