两秒延迟!AI语言翻译系统Seamless实现跨语言交流突破

站长之家 2023-12-01 10:28:57新闻资讯
53

在我们日益互联的世界中,语言差异可能成为沟通的障碍。Seamless作为新一代AI语言翻译系统,通过SeamlessExpressive和SeamlessStreaming模型的首次发布,为实时、跨语言交流带来了全新的突破。

Seamless.png

SeamlessExpressive是专注于语音到语音翻译的表达保留模型,而SeamlessStreaming则是一种流式翻译模型,以约两秒的延迟提供最先进的结果。这两个模型都基于SeamlessM4T v2,这是在8月份发布的基础模型的最新版本,展现了在自动语音识别、语音到文本、文本到语音等方面的性能提升。

Seamless2.png

与以往在表达性语音研究方面的努力相比,SeamlessExpressive更加关注韵律的某些未被充分探索的方面,例如语速和节奏停顿,同时保留情感和风格。该模型目前在英语、西班牙语、德语、法语、意大利语和中文之间的语音到语音翻译中保留了这些元素。

SeamlessStreaming的突破性在于实现了与说不同语言的人实时对话。与传统系统在说话者完成句子后进行翻译不同,SeamlessStreaming在说话者仍在说话时进行翻译,使得对话更接近实时。该模型支持近100种输入输出语言的自动语音识别和语音转文本,以及近100种输入语言和36种输出语言的语音到语音翻译。

除了模型本身,Seamless还在今天发布了metadata、数据和数据对齐工具,旨在帮助研究社区收集更多的翻译数据。这包括SeamlessAlign的扩展元数据,涵盖额外115,000小时的语音和文本对齐,以及SeamlessAlignExpressive的元数据,作为表达性焦点版本的数据集。此外,还提供了mExpresso的翻译文本数据,这是Expresso的多语言平行扩展,以及用于收集更多翻译数据的工具。

Seamless作为新一代AI语言翻译系统,在实现表达保留和流式处理方面取得了重要进展,为跨语言交流提供了更加自然和真实的体验。

ai
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Adobe Express 应用全新升级,AI 驱动的创作工具让设计更简单
Adobe公司于10月9日发布博文,宣布对Express应用进行重大更新,旨在改善Creative Cloud集成,加速和扩展企业创作品牌内容,提升团队、机构和合作伙伴之间的协作效率。Adobe E...
2024-10-12 新闻资讯
111

17岁高中生开发AI应用爆火!6个月狂揽700万
随着AI技术的火爆,一位年仅17岁的高中生Zach Yadegari凭借其开发的AI应用Cal AI,在今年9月份的时候实现了超过100万美元(约合706万元人民币)的收入。当时Zach Yadegari在社交...
2024-10-09 新闻资讯
115

iPadAir6怎么截图?iPadAir6截图方法汇总
iPadAir6 作为苹果公司推出的一款平板电脑,具备强大的功能和便捷的操作体验。截图是日常使用中经常会用到的功能,无论是用于记录重要信息、分享有趣的内容还是用于工作和学习...
2024-10-05 电脑知识
153

美图公司旗下AI短片创作工具MOKI正式对所有用户开放使用
美图公司近日宣布,其开发的AI短片创作工具MOKI正式对所有用户开放。用户现在可以登录MOKI官网体验这一创新工具,享受前所未有的视频创作体验。MOKI是市场上独树一帜的视频创...
2024-09-27 新闻资讯
121

AI代码生成器(Cursor)安装和使用详细教程
随着人工智能技术的不断发展,越来越多的工具被应用于软件开发领域。其中,AI代码生成器(Cursor)因其能够自动生成代码、提高开发效率而受到广泛关注。本文将详细介绍Cursor的...
2024-09-14 编程技术
132

夸克自主研发AI智能对话助手CueMe正式上线:支持2万字长文创作
近日,夸克宣布其自主研发的AI智能对话助手 CueMe 正式对外发布,为用户带来全新的智能写作体验。它具备多项卓越的特性。其中,最为引人瞩目的是其支持 2 万字长文创作的能力...
2024-09-12 新闻资讯
132