为什么要选择 MiMo Voice Clone 2.5?
如果您需要为虚拟数字人、播客生成器或个性化应用提供极其逼真的音色复刻能力,这款模型是目前免费方案中的顶流。
核心优势与特点
- 极简复刻体验:仅需上传一段不到 10MB 的 MP3 或 WAV 短音频,无需几十分钟的长时间训练,即刻复刻出目标人声。
- 高还原度:精准捕捉发音人的音色、停顿习惯与情感共鸣。
- 多语言发音:即便原音频是中文,复刻后的音色也能够流利朗读英文,打破了原发音人的语言壁垒。
Voice clone capabilities offered completely free currently.
如果您需要为虚拟数字人、播客生成器或个性化应用提供极其逼真的音色复刻能力,这款模型是目前免费方案中的顶流。
该声音复刻接口目前属于 MiMo 2.5 TTS 系列的公测/推广红利期,享有完全限时免费额度,暂无失效倒计时。
【额外福利】虽然本模型本身免费,如果您还想体验小米的其他付费顶尖模型(如 MiMo V2.5 对话模型),我目前正在使用 MiMo 开放平台,通过我的邀请码注册为新用户,即可获得 $2 API 体验金。 • 邀请码:TUE76X • 注册链接:https://platform.xiaomimimo.com?ref=TUE76X • 兑换方式:注册后点击控制台左下方入口填入,体验金 40 天有效。
import os
import base64
from openai import OpenAI
client = OpenAI(
api_key=os.environ.get("MIMO_API_KEY"),
base_url="https://api.xiaomimimo.com/v1"
)
with open("sample.mp3", "rb") as f:
voice_base64 = base64.b64encode(f.read()).decode("utf-8")
completion = client.chat.completions.create(
model="mimo-v2.5-tts-voiceclone",
messages=[
{"role": "user", "content": ""},
{"role": "assistant", "content": "This is my cloned voice speaking."}
],
audio={
"format": "wav",
"voice": f"data:audio/mpeg;base64,{voice_base64}"
}
)