语音通话（Voice Call）（插件）

OpenClaw 的语音通话功能通过插件提供。支持外拨通知和带有来电策略的多轮对话。

当前支持的提供者：

twilio（可编程语音 + 媒体流）
telnyx（呼叫控制 v2）
plivo（语音 API + XML 转接 + GetInput 语音）
mock（开发/无网络）

快速理解：

安装插件
重启 Gateway
在 plugins.entries.voice-call.config 下配置
使用 openclaw voicecall ... 或 voice_call 工具

运行位置（本地 vs 远程）

语音通话插件在 Gateway 进程内部运行。

如果你使用远程 Gateway，请在运行 Gateway 的机器上安装/配置插件，然后重启 Gateway 以加载它。

安装

选项 A：从 npm 安装（推荐）

openclaw plugins install @openclaw/voice-call

之后重启 Gateway。

选项 B：从本地文件夹安装（开发，无复制）

openclaw plugins install ./extensions/voice-call
cd ./extensions/voice-call && pnpm install

之后重启 Gateway。

配置

在 plugins.entries.voice-call.config 下设置配置：

{
  plugins: {
    entries: {
      "voice-call": {
        enabled: true,
        config: {
          provider: "twilio", // or "telnyx" | "plivo" | "mock"
          fromNumber: "+15550001234",
          toNumber: "+15550005678",

          twilio: {
            accountSid: "ACxxxxxxxx",
            authToken: "..."
          },

          plivo: {
            authId: "MAxxxxxxxxxxxxxxxxxxxx",
            authToken: "..."
          },

          // Webhook server
          serve: {
            port: 3334,
            path: "/voice/webhook"
          },

          // Public exposure (pick one)
          // publicUrl: "https://example.ngrok.app/voice/webhook",
          // tunnel: { provider: "ngrok" },
          // tailscale: { mode: "funnel", path: "/voice/webhook" }

          outbound: {
            defaultMode: "notify" // notify | conversation
          },

          streaming: {
            enabled: true,
            streamPath: "/voice/stream"
          }
        }
      }
    }
  }
}

注意事项：

Twilio/Telnyx 需要一个公开可访问的 webhook URL。
Plivo 需要一个公开可访问的 webhook URL。
mock 是本地开发提供者（无网络调用）。
skipSignatureVerification 仅用于本地测试。
如果你使用 ngrok 免费版，请将 publicUrl 设置为确切的 ngrok URL；签名验证始终强制执行。
tunnel.allowNgrokFreeTierLoopbackBypass: true 仅在 tunnel.provider="ngrok" 且 serve.bind 是回环地址（ngrok 本地代理）时允许无效签名的 Twilio webhooks。仅用于本地开发。
Ngrok 免费版 URL 可能会更改或添加中间页行为；如果 publicUrl 漂移，Twilio 签名将失败。对于生产环境，建议使用稳定域名或 Tailscale funnel。

通话的 TTS

语音通话使用核心 messages.tts 配置（OpenAI 或 ElevenLabs）在通话中流式传输语音。你可以在插件配置下使用相同的结构覆盖它——它会与 messages.tts 深度合并。

{
  tts: {
    provider: "elevenlabs",
    elevenlabs: {
      voiceId: "pMsXgVXv3BLzUgSXRplE",
      modelId: "eleven_multilingual_v2"
    }
  }
}

注意事项：

语音通话会忽略 Edge TTS（电话音频需要 PCM；Edge 输出不可靠）。
当启用 Twilio 媒体流时使用核心 TTS；否则通话回退到提供者原生语音。

来电

来电策略默认为 disabled。要启用来电，请设置：

{
  inboundPolicy: "allowlist",
  allowFrom: ["+15550001234"],
  inboundGreeting: "Hello! How can I help?"
}

自动响应使用代理系统。调整参数：

responseModel
responseSystemPrompt
responseTimeoutMs

命令行界面（CLI）

openclaw voicecall call --to "+15555550123" --message "Hello from OpenClaw"
openclaw voicecall continue --call-id <id> --message "Any questions?"
openclaw voicecall speak --call-id <id> --message "One moment"
openclaw voicecall end --call-id <id>
openclaw voicecall status --call-id <id>
openclaw voicecall tail
openclaw voicecall expose --mode funnel

代理工具

工具名称：voice_call

操作：

initiate_call（message，to?，mode?）
continue_call（callId，message）
speak_to_user（callId，message）
end_call（callId）
get_status（callId）

此仓库在 skills/voice-call/SKILL.md 提供了匹配的技能文档。

Gateway RPC

voicecall.initiate（to?，message，mode?）
voicecall.continue（callId，message）
voicecall.speak（callId，message）
voicecall.end（callId）
voicecall.status（callId）