Free Mimo TTS 2.5 (Voice Design) on Xiaomi

Voice design capabilities offered completely free currently.

About the Model

为什么要选择 MiMo Voice Design 2.5?

这是一种颠覆传统的语音合成方式,它完全摒弃了传统的“选定音色”和“提供音频克隆”的思路,能够做到“无中生有”。

核心优势与特点

  • 自然语言捏制声音:您只需要输入类似于『粗犷、带点口音的中年大叔,说话直来直去』这样的文本描述,大模型就能根据语义理解直接生成出一个世上独一无二的声音。
  • 导演模式控制:支持通过提示词控制人物的背景、当下的场景、甚至是特定的演绎风格,给内容创作提供了无尽的想象空间。
  • 零样本需求:您甚至不需要准备几十秒的干净音频,彻底打破了素材限制。

How to Access for Free (via Xiaomi)

免费依据 (Why is it free?)

此创新功能作为 MiMo 平台吸引创作者体验的入口产品,现阶段开放全额度限时免费。由于生成特定高质量声音的算力成本较高,建议尽早利用此免费红利期产出内容。

【额外福利】虽然本模型本身免费,如果您还想体验小米的其他付费顶尖模型(如 MiMo V2.5 对话模型),我目前正在使用 MiMo 开放平台,通过我的邀请码注册为新用户,即可获得 $2 API 体验金。 • 邀请码:TUE76X • 注册链接:https://platform.xiaomimimo.com?ref=TUE76X • 兑换方式:注册后点击控制台左下方入口填入,体验金 40 天有效。

Code Examples

python
import os
from openai import OpenAI
import base64

client = OpenAI(
    api_key=os.environ.get("MIMO_API_KEY"),
    base_url="https://api.xiaomimimo.com/v1"
)

completion = client.chat.completions.create(
    model="mimo-v2.5-tts-voicedesign",
    messages=[
        {
            "role": "user", 
            "content": "A deep, gravelly middle-aged male voice with a heavy accent, sounding blunt and matter-of-fact."
        },
        {
            "role": "assistant", 
            "content": "I don't have time for games. Tell me what you know, or leave."
        }
    ],
    audio={ "format": "wav" }
)

audio_bytes = base64.b64decode(completion.choices[0].message.audio.data)
with open("designed_output.wav", "wb") as f:
    f.write(audio_bytes)
Xiaomi Free Mimo TTS 2.5 (Voice Design) on Xiaomi - Free AI API | Free AI API