阶跃星辰语音模型 Step-Audio-R1.1 登顶全球榜首

3,474 0

近日，阶跃星辰（StepFun AI）发布的语音模型 Step-Audio-R1.1 在全球权威语音评测平台 LMSYS Chatbot Arena 的最新榜单中登顶，成为目前综合性能最强的开源语音模型。该模型在语音识别、语音合成、多语种支持及自然对话理解等多项关键指标上均实现突破，尤其在低延迟响应与复杂语境下的语义一致性方面表现尤为突出，获得国际AI社区广泛认可。据LMSYS最新数据，Step-Audio-R1.1 在语音生成质量（Voice Quality）、情感表达自然度（Emotional Expressiveness）和上下文连贯性（Contextual Coherence）等维度评分超越GPT-4o、Claude 3 Sonnet等主流闭源模型，位居榜首。其采用创新的混合注意力机制与自适应声学建模架构，有效提升了对口音、背景噪音和快速语速的鲁棒性，显著优化了真实场景下的可用性。分析人士指出，这一成就标志着中国企业在通用语音大模型领域已具备全球领先竞争力。与此前以技术追赶为主的路径不同，阶跃星辰此次通过自主研发的核心算法与大规模高质量语音数据训练，实现了从“跟跑”到“领跑”的跨越。此外，模型采用开源策略，推动行业生态共建，有望加速智能客服、无障碍通信、虚拟助手等应用场景落地。业内专家认为，随着语音交互向更自然、更人性化的方向演进，Step-Audio-R1.1 的登顶不仅是技术里程碑，更预示着下一代人机交互范式正在形成。

AI资讯

阶跃星辰语音模型 Step-Audio-R1.1 登顶全球榜首

买断用户遭“降级”？苹果回应 Final Cut Pro 争议：未来高级 AI 功能或仅限订阅用户

博纳影业AI短剧播放量超1.6亿，《三星堆：未来启示录》掀起热潮，AI原生动画电影进入收官阶段

相关文章

OpenAI正式宣布重启机器人业务，奥特曼公开招聘工程师，短期聚焦基础设施研发

国产多模态大模型实现重大突破，MiniMax M3 正式开源并实现响应速度翻倍

阶跃星辰获50亿元B+轮融资创纪录，印奇任董事长布局“AI+终端”

专家借ChatGPT与AlphaFold为爱犬定制抗癌方案，肿瘤缩小75%

最新资讯