About

Unified audio processing server combining speech-to-text (faster-whisper), text-to-speech (Silero), and speaker diarization (SpeechBrain). Supports GPU acceleration, multiple Whisper models, and Russian/English TTS voices. Exposes capabilities as both REST API and MCP tools.

Is this your project?

Claim this listing to manage your page, access analytics, and unlock upgrades. Verification takes 60 seconds.

Compare

Speech Audio vs CogmemAi Speech Audio vs AiList MCP Speech Audio vs gemini-cli

List Your Project

Join the directory Ai agents read. Free forever.

Submit Your Project

Speech Audio

About

Is this your project?

Share This Project

Embed Badge

Compare

Similar Projects

CogmemAi

AiList MCP

gemini-cli

List Your Project