小米再推语音新模型：MiMo-V2.5-TTS与ASR补齐语音全链路，支持方言混说-企业动态-数据世界

小米技术团队在语音技术领域再推重磅成果。继MiMo-V2.5系列大模型开启公测后，团队于今日正式发布MiMo-V2.5-TTS语音合成系列与MiMo-V2.5-ASR语音识别模型，完成语音交互全链路技术布局。此次发布涵盖从声音生成到语音转写的完整解决方案，为智能设备语音交互能力带来显著提升。

TTS系列包含三款创新模型，形成差异化技术矩阵。基础版MiMo-V2.5-TTS内置20余种专业音色库，支持语速、音高、情感强度等参数实时调节，用户可通过自然语言指令实现"温柔劝导"或"严厉警告"等复杂语气表达。VoiceDesign模型突破传统音色生成范式，仅需输入"25岁女声，带江南口音"等文字描述，即可在3秒内合成全新音色，无需提供任何音频样本。旗舰版VoiceClone模型则展现高保真复刻能力，通过5秒参考音频即可精准捕捉声纹特征，同时保留对情感、语速等维度的控制权限，官方演示中成功复现了包含"阴阳怪气"等微妙情绪的语音样本。

作为技术底座的MiMo-V2.5-ASR模型采用开源策略，同步公开模型权重与训练代码。该模型专门针对真实场景优化，在方言识别方面支持吴语、粤语等8种中文方言，对中英文混杂、专业术语等复杂语料的转写准确率提升37%。通过引入多通道声源分离技术，模型在咖啡厅、地铁站等强噪音环境下仍能保持92%以上的识别率，并支持最多6人同时对话的实时转写。输出端创新采用结构化文本格式，自动添加逗号、句号等标点符号，转写结果可直接用于文档处理。

目前TTS系列已上线MiMo Studio开发平台，提供可视化调参界面与API接口。ASR模型代码与预训练权重同步登陆GitHub及HuggingFace模型库，支持PyTorch与TensorFlow双框架部署。技术文档显示，团队正在研发支持环境音效生成的AudioCraft模块，并计划通过上下文记忆机制提升多轮对话的连贯性，相关功能预计在第三季度进入内测阶段。

Perplexity CEO：AI赋能下iPhone“数字护照”地位更稳固潜力待释放

他强调，苹果Silicon芯片是苹果“被低估的资产”，随着 AI 工作负载逐渐向设备本地迁移，这一硬件优势将愈发凸显。“如果智能体循环开始本地运行，就不再需要集中在服务器上，”Srinivas解释道，这些工作…

2026-04-24

雷军宣布新一代小米SU7锁单破6000台全面升级性能续航双提升

标准版和Pro车型为后驱，搭载小米V6s Plus超级电机，最高转速提升到22000转，最大可输出392马力，最高车速240km/h；双电机版前电机220千瓦，后电机288千瓦，系统功率508千瓦，零百加速…

2026-04-24

SpaceX 1.75万亿美元IPO文件曝光：拟自研GPU，技术路线引猜测

值得注意的是，文件中使用的措辞是GPU而非AI专用加速器（ASIC），这一命名选择引发了业内广泛讨论。SpaceX在招股书中刻意使用GPU而非AI ASIC，是否意味着其计划设计一款与Tesla AI系列…

2026-04-24

华为Pura X Max深度体验：大阔屏新玩法，折叠屏体验跃升新境界

华为作为折叠屏产品的重要引领者和推动者，在Pura XMax身上再次实现突破，这是行业首款运用三重复合叠层结构的折叠内屏，内屏抗冲击能力相较于Mate X7得到50%的提升。总结华为Pura X Max的…

2026-04-24

雷军北京车展官宣：小米YU7 GT 5月底发布，定义跑车级SUV新体验

2026-04-24

OpenAI发布GPT-5.5：运算提速逻辑精准，多场景应用助力科研办公

2026-04-24

2026北京车展：仰望U9X高定版破晓登场 U8L鼎藏版座舱升级定制来袭

2026-04-24

SpaceX拟自研GPU：因供应链隐患，未来资本支出计划曝光
2026-04-24