阿里通义实验室发布Fun-ASR 1.5:覆盖30种语言及七大方言,推动语音识别进入新阶段

张开发
2026/4/20 22:36:47 15 分钟阅读

分享文章

阿里通义实验室发布Fun-ASR 1.5:覆盖30种语言及七大方言,推动语音识别进入新阶段
4月20日阿里通义实验室正式发布语音识别大模型Fun - ASR 1.5在多方言与多文化理解领域取得重大突破已通过阿里云百炼平台上线API服务。重大突破多语言与方言覆盖Fun - ASR 1.5基于统一架构单模型就能无缝覆盖30种语言及汉语七大方言体系。典型方言场景字错误率相对下降56.2%其中5种方言准确率突破90%这是语音技术的一大飞跃。技术升级四大核心亮点该模型实现四大核心升级。深度适配20余种地区口音支持30种主流语言自由混说识别专项优化古诗词识别字符级准确率达97%强化文本归一化能力输出规范文本。应用场景多领域广泛落地目前Fun - ASR 1.5已通过阿里云百炼平台上线API服务广泛应用于县域教育、地方政务及跨国协作等场景展现出强大的实用性。行业影响迈向工业级新阶段Fun - ASR 1.5的推出推动语音识别从“听得清”迈向“听得懂”的工业级新阶段有望改变行业格局为更多领域带来新的可能。编辑观点Fun - ASR 1.5的发布是语音识别领域的重要里程碑其多语言和方言处理能力将拓宽应用边界未来有望在更多场景大放异彩。

更多文章