Salutespeech

БесплатноНе проверен

Provides speech recognition and synthesis tools via SaluteSpeech API, enabling AI assistants to handle voice input and output.

автор: trashchenkov

GitHub Embed

Описание

Provides speech recognition and synthesis tools via SaluteSpeech API, enabling AI assistants to handle voice input and output.

README

GitHub

MCP SaluteSpeech - это реализация MCP (Model Context Protocol) сервера, предоставляющего инструменты для работы с голосовыми API SaluteSpeech от Сбера. Позволяет AI ассистентам записывать речь пользователя с микрофона, распознавать её с помощью и синтезировать речь из текста.

Сервер предоставляет доступ агентам на основе LLM к голосовому интерфейсу, значительно расширяя возможности взаимодействия с пользователем.

Из чего состоит MCP SaluteSpeech?

MCP SaluteSpeech предоставляет два основных инструмента:

sber_stt_record_and_recognize - записывает аудио с микрофона до появления 3-секундной паузы, отправляет запись на API распознавания речи SaluteSpeech и возвращает распознанный текст.
synthesize_speech - синтезирует речь из текста с помощью API SaluteSpeech и воспроизводит её через аудиоустройство компьютера.

Эти инструменты особенно полезны для:

Создания голосовых интерфейсов для AI ассистентов
Разработки приложений с поддержкой голосового управления
Интеграции голосовых возможностей в агентные системы на базе LLM

Возможности

Реализация голосовых инструментов для MCP (Model Context Protocol)
Полная интеграция с API SaluteSpeech от Сбера
Готовность к работе с такими ассистетами как Cursor, Windsurf и другими
Поддержка распознавания и синтеза русской речи

Возможные проблемы с аудиоустройствами и дополнительные зависимости

Если запись или воспроизведение аудио не работает "из коробки", возможно, потребуется установить дополнительные зависимости для вашей операционной системы:

Linux: убедитесь, что установлен пакет portaudio и соответствующие dev-заголовки. Например, для Ubuntu/Debian:
```
sudo apt-get install portaudio19-dev
```
Также может понадобиться установить alsa-utils:
```
sudo apt-get install alsa-utils
```
macOS: обычно всё работает из коробки, но убедитесь, что приложению даны разрешения на доступ к микрофону и динамикам (Системные настройки → Конфиденциальность → Микрофон/Звук).
Windows: убедитесь, что установлены последние драйверы для вашей звуковой карты. Для работы некоторых библиотек может понадобиться Microsoft Visual C++ Redistributable.

Если после установки зависимостей проблема не решена, проверьте сообщения об ошибках в консоли — они могут подсказать, какой компонент отсутствует или требует настройки.

Настройка MCP сервера

Добавьте этот MCP сервер к вашему агенту.

"mcpServers": {
    "mcp-salutespeech": {
        "command": "uvx",
        "args": [
        "--from", "mcp_voice_salute", "mcp-salutespeech"
        ],
        "enabled": true,
        "env": {
            "SALUTE_SPEECH": "ВАШ_ТОКЕН_SALUTESPEECH"
        }
    }
}

Описание инструментов

sber_stt_record_and_recognize

Записывает аудио с микрофона до появления 3-секундной паузы, затем отправляет запись на API распознавания речи SaluteSpeech и возвращает распознанный текст.

Вход: Не требует параметров Поведение: Выполняет запись с микрофона, распознавание и возвращает текст Выход: Строка с распознанным текстом

synthesize_speech

Синтезирует речь из текста с помощью API SaluteSpeech и воспроизводит её через аудиоустройство компьютера.

Вход:

text (string) — Текст для преобразования в речь
format (string, опционально) — Формат аудио (по умолчанию "wav16")
voice (string, опционально) — Голос для синтеза (по умолчанию "Bys_24000")

Поведение: Преобразует текст в речь и воспроизводит через динамики Выход: Подтверждение успешного воспроизведения

Как добавить этот MCP сервер в Cursor

Есть два способа добавить MCP сервер в Cursor:

Глобально - добавить сервер в файл ~/.cursor/mcp.json
Для проекта - добавить сервер в файл .cursor/mcp.json в вашем проекте

Требования к окружению

Для работы с API требуется установить переменную окружения:

SALUTE_SPEECH - токен Basic авторизации для доступа к API SaluteSpeech

Лицензия

MIT License

from github.com/trashchenkov/mcp_voice_salute

Установка Salutespeech

У этого сервера нет опубликованного пакета — он собирается из исходников. Открой репозиторий и следуй инструкции в README.

▸ github.com/trashchenkov/mcp_voice_salute

FAQ

Salutespeech MCP бесплатный?

Да, Salutespeech MCP бесплатный — установка в пару кликов через Unyly без оплаты.

Нужен ли API-ключ для Salutespeech?

Нет, Salutespeech работает без API-ключей и переменных окружения.

Salutespeech — hosted или self-hosted?

Self-hosted: сервер запускается локально на твоей машине командой из раздела установки.

Как установить Salutespeech в Claude Desktop, Claude Code или Cursor?

Открой Salutespeech на unyly.org, выбери вкладку своего клиента (Claude Desktop, Claude Code, Cursor) и нажми Install — конфиг сгенерируется автоматически, без правки JSON.

Compare Salutespeech with

SalutespeechvsFetch SalutespeechvsAWS KB Retrieval SalutespeechvsSpring AI MCP Server Salutespeechvsllm-analysis-assistant

Не уверен что выбрать?

Найди свой стек за 60 секунд

Автор?

Embed-бейдж для README

Похожее

Все в категории ai

Command Palette