Venice AI (выбор Venice)

Venice — это наша рекомендуемая настройка Venice для приватного вывода с опциональным анонимным доступом к проприетарным моделям.

Venice AI предоставляет вывод AI с фокусом на конфиденциальность с поддержкой нецензурированных моделей и доступом к основным проприетарным моделям через их анонимный прокси. Весь вывод по умолчанию приватный — без обучения на ваших данных, без логирования.

Почему Venice в OpenClaw

  • Приватный вывод для моделей с открытым исходным кодом (без логирования).
  • Нецензурированные модели, когда они вам нужны.
  • Анонимный доступ к проприетарным моделям (Opus/GPT/Gemini), когда важно качество.
  • Конечные точки, совместимые с OpenAI /v1.

Режимы конфиденциальности

Venice предлагает два уровня конфиденциальности — понимание этого ключ к выбору вашей модели:

РежимОписаниеМодели
ПриватныйПолностью приватный. Промпты/ответы никогда не сохраняются или не логируются. Эфемерный.Llama, Qwen, DeepSeek, Venice Uncensored и т.д.
АнонимизированныйПроксируется через Venice с удаленными метаданными. Базовый провайдер (OpenAI, Anthropic) видит анонимизированные запросы.Claude, GPT, Gemini, Grok, Kimi, MiniMax

Функции

  • Фокус на конфиденциальность: выбирайте между режимами "приватный" (полностью приватный) и "анонимизированный" (проксируемый)
  • Нецензурированные модели: доступ к моделям без ограничений по контенту
  • Доступ к основным моделям: используйте Claude, GPT-5.2, Gemini, Grok через анонимный прокси Venice
  • Совместимый API OpenAI: стандартные конечные точки /v1 для простой интеграции
  • Потоковая передача: ✅ поддерживается на всех моделях
  • Вызов функций: ✅ поддерживается на отдельных моделях (проверьте возможности модели)
  • Видение: ✅ поддерживается на моделях с возможностью видения
  • Без жестких ограничений: для экстремального использования может применяться честное дросселирование

Настройка

1. Получите API-ключ

  1. Зарегистрируйтесь на venice.ai
  2. Перейдите в Settings → API Keys → Create new key
  3. Скопируйте ваш API-ключ (формат: vapi_xxxxxxxxxxxx)

2. Настройте OpenClaw

Вариант A: Переменная окружения

export VENICE_API_KEY="vapi_xxxxxxxxxxxx"

Вариант B: Интерактивная настройка (рекомендуется)

openclaw onboard --auth-choice venice-api-key

Это:

  1. Запросит ваш API-ключ (или использует существующий VENICE_API_KEY)
  2. Покажет все доступные модели Venice
  3. Позволит вам выбрать модель по умолчанию
  4. Автоматически настроит провайдер

Вариант C: Неинтерактивный

openclaw onboard --non-interactive \
  --auth-choice venice-api-key \
  --venice-api-key "vapi_xxxxxxxxxxxx"

3. Проверьте настройку

openclaw chat --model venice/llama-3.3-70b "Привет, ты работаешь?"

Выбор модели

После настройки OpenClaw показывает все доступные модели Venice. Выбирайте в соответствии с вашими потребностями:

  • По умолчанию (наш выбор): venice/llama-3.3-70b для приватной, сбалансированной производительности.
  • Лучшее общее качество: venice/claude-opus-45 для сложных задач (Opus остается самым сильным).
  • Конфиденциальность: выбирайте "приватные" модели для полностью приватного вывода.
  • Возможности: выбирайте "анонимизированные" модели для доступа к Claude, GPT, Gemini через прокси Venice.

Изменяйте модель по умолчанию в любое время:

openclaw models set venice/claude-opus-45
openclaw models set venice/llama-3.3-70b

Список всех доступных моделей:

openclaw models list | grep venice

Настройка через openclaw configure

  1. Запустите openclaw configure
  2. Выберите Model/auth
  3. Выберите Venice AI

Какую модель мне использовать?

Сценарий использованияРекомендуемая модельПочему
Общий чатllama-3.3-70bХорошая универсальная, полностью приватная
Лучшее общее качествоclaude-opus-45Opus остается самым сильным для сложных задач
Конфиденциальность + качество Claudeclaude-opus-45Лучшее рассуждение через анонимный прокси
Программированиеqwen3-coder-480b-a35b-instructОптимизирован для кода, контекст 262k
Задачи виденияqwen3-vl-235b-a22bЛучшая приватная модель видения
Нецензурированныйvenice-uncensoredБез ограничений по контенту
Быстрый + дешевыйqwen3-4bЛегковесный, но все еще способный
Сложное рассуждениеdeepseek-v3.2Сильное рассуждение, приватный

Доступные модели (всего 25)

Приватные модели (15) — полностью приватные, без логирования

ID моделиНазваниеКонтекст (токены)Функции
llama-3.3-70bLlama 3.3 70B131kОбщие задачи
llama-3.2-3bLlama 3.2 3B131kБыстрая, легковесная
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B131kСложные задачи
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking131kРассуждение
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct131kОбщие задачи
qwen3-coder-480b-a35b-instructQwen3 Coder 480B262kКод
qwen3-next-80bQwen3 Next 80B262kОбщие задачи
qwen3-vl-235b-a22bQwen3 VL 235B262kВидение
qwen3-4bVenice Small (Qwen3 4B)32kБыстрое рассуждение
deepseek-v3.2DeepSeek V3.2163kРассуждение
venice-uncensoredVenice Uncensored32kНецензурированный
mistral-31-24bVenice Medium (Mistral)131kВидение
google-gemma-3-27b-itGemma 3 27B Instruct202kВидение
openai-gpt-oss-120bOpenAI GPT OSS 120B131kОбщие задачи
zai-org-glm-4.7GLM 4.7202kРассуждение, многоязычный

Анонимизированные модели (10) — через прокси Venice

ID моделиОригиналКонтекст (токены)Функции
claude-opus-45Claude Opus 4.5202kРассуждение, видение
claude-sonnet-45Claude Sonnet 4.5202kРассуждение, видение
openai-gpt-52GPT-5.2262kРассуждение
openai-gpt-52-codexGPT-5.2 Codex262kРассуждение, видение
gemini-3-pro-previewGemini 3 Pro202kРассуждение, видение
gemini-3-flash-previewGemini 3 Flash262kРассуждение, видение
grok-41-fastGrok 4.1 Fast262kРассуждение, видение
grok-code-fast-1Grok Code Fast 1262kРассуждение, код
kimi-k2-thinkingKimi K2 Thinking262kРассуждение
minimax-m21MiniMax M2.1202kРассуждение

Обнаружение моделей

OpenClaw автоматически обнаруживает модели из API Venice, когда установлен VENICE_API_KEY. Если API недоступен, используется статический каталог.

Конечная точка /models публична (аутентификация не требуется для списка), но для вывода требуется действительный API-ключ.

Потоковая передача и поддержка инструментов

ФункцияПоддержка
Потоковая передача✅ Все модели
Вызов функций✅ Большинство моделей (проверьте supportsFunctionCalling в API)
Видение/изображения✅ Модели с отметкой "Видение"
Режим JSON✅ Поддерживается через response_format

Ценообразование

Venice использует систему кредитов. Проверьте venice.ai/pricing для текущих тарифов:

  • Приватные модели: обычно меньшая стоимость
  • Анонимизированные модели: похоже на прямое ценообразование API + небольшая комиссия Venice

Сравнение: Venice vs прямой API

АспектVenice (анонимизированный)Прямой API
КонфиденциальностьМетаданные удалены, анонимизированоВаш аккаунт связан
Задержка+10-50мс (прокси)Прямая
ФункцииБольшинство функций поддерживаетсяПолные функции
БиллингКредиты VeniceБиллинг провайдера

Примеры использования

# Использование приватной модели по умолчанию
openclaw chat --model venice/llama-3.3-70b

# Использование Claude через Venice (анонимизировано)
openclaw chat --model venice/claude-opus-45

# Использование нецензурированной модели
openclaw chat --model venice/venice-uncensored

# Использование модели видения с изображением
openclaw chat --model venice/qwen3-vl-235b-a22b

# Использование модели для программирования
openclaw chat --model venice/qwen3-coder-480b-a35b-instruct

Устранение неполадок

API-ключ не распознан

echo $VENICE_API_KEY
openclaw models list | grep venice

Убедитесь, что ключ начинается с vapi_.

Модель недоступна

Каталог моделей Venice обновляется динамически. Запустите openclaw models list для просмотра доступных моделей. Некоторые модели могут быть временно недоступны.

Проблемы с подключением

API Venice находится по адресу https://api.venice.ai/api/v1. Убедитесь, что ваша сеть разрешает HTTPS-соединения.

Пример конфигурационного файла

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/llama-3.3-70b" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "llama-3.3-70b",
            name: "Llama 3.3 70B",
            reasoning: false,
            input: ["text"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 131072,
            maxTokens: 8192
          }
        ]
      }
    }
  }
}

Ссылки