摩尔线程开源MooER:国产GPU驱动的先进语音识别与翻译大模型

网络 2024-08-26 15:00:31新闻资讯
634

8月26日消息:摩尔线程智能科技有限公司(Moore Threads)近日宣布,其基于国产全功能GPU训练和推理的大型语音模型MooER(摩耳)已成功开源。这一举措标志着国产GPU在人工智能领域的应用实力,同时为全球音频AI技术的发展注入了新的活力。

摩尔线程.jpg

MooER模型采用了创新的三部分结构设计,包括Encoder(编码器)、Adapter(适配器)和Decoder(大型语言模型,LLM)。这种设计使得MooER能够有效地处理原始音频数据,提取关键特征,并执行包括语音识别和翻译在内的下游任务。

在与多个知名开源音频理解大模型的对比测试中,MooER展现出了卓越的性能。在中文测试集上,MooER的字错误率(CER)达到了4.21%,在英文测试集上的词错误率(WER)为17.98%,与其他顶级模型相比表现更优或相当。特别值得一提的是,在Covost2zh2en中译英测试集上,MooER的BLEU分数高达25.2,大幅领先其他开源模型,达到了工业级应用的水平。

MooER.png

摩尔线程的项目团队已经开源了推理代码和基于5000小时数据训练的模型,并计划进一步开源训练代码和基于8万小时数据训练的增强版模型。基于8万小时数据训练的MooER-80K模型在性能上更进一步,在中文测试集上的CER降至3.50%,英文测试集上的WER优化到12.66%,显示了其巨大的发展潜力。

摩尔线程开源MooER的行动不仅展示了国产GPU的强大计算能力,也为音频AI技术的创新应用和普及提供了新的可能性。随着更多训练数据和代码的开源,业界期待MooER能在语音识别、翻译等领域带来更多突破性进展。

有关MooER的更多信息和开源资源,可以通过以下链接访问:

摩尔线程 大模型
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

2025世界AI大模型排行榜:中美争霸,开源崛起
综合排名:巨头领跑,中国力量突起 2025年AI大模型排名变化很快。Google Gemini 3 Pro Preview拿了73分第一。OpenAI和Anthropic紧追其后。国产模型MiniMax和DeepSeek表现亮...
2026-04-02 新闻资讯
217

VLMEvalKit:OpenCompass推出的开源多模态大模型评测工具包
VLMEvalKit 是由OpenCompass团队开发的一个专注于多模态大模型(Vision-Language Models, VLMs)评测的开源工具包。作为CompassKit大模型评测全栈工具链的重要组成部分,它旨在...
2025-08-15 新闻资讯
976

BaiChuan-M2:百川智能推出的开源医疗增强大模型
Baichuan-M2是百川智能开源的医疗增强大模型,标志着中国在医疗人工智能领域实现从"追赶者"到"引领者"的关键跨越。作为一款专为医疗场景设计的轻量化大模型,Baichuan-M2以32...
2025-08-12 新闻资讯
902

MiDashengLM:小米开源的跨场景声音理解大模型
MiDashengLM 是小米集团旗下"MiLM Plus"团队于2025年8月4日正式发布并全量开源的声音理解大模型,该模型以Xiaomi Dasheng音频编码器为核心,结合Qwen2.5-Omni-7B Thinker自回...
2025-08-05 新闻资讯
1043

HYPIR:1.7秒实现8K超清图像复原的开源大模型
HYPIR(High-Performance Image Restoration)是由中国科学院深圳先进技术研究院董超研究员团队开发的图像复原大模型,该项目通过创新的技术路线,解决了传统图像复原领域长期...
2025-07-31 新闻资讯
1705

Intern-S1:上海人工智能实验室开源的多模态科学大模型
Intern-S1是上海人工智能实验室(Shanghai AI Laboratory)发布的一款先进的开源多模态科学大模型,属于"书生"大模型家族的最新成员。作为首个融合专业科学能力的开源通用模型...
2025-07-29 新闻资讯
1091