首页 > 科技 > 智能 Meta 推出 Seamless Communication AI 翻译套件:支持近百种语言输入、同声延迟仅 2 秒

Meta 推出 Seamless Communication AI 翻译套件:支持近百种语言输入、同声延迟仅 2 秒

IT之家 12 月 4 日消息,Meta 日前公布了 AI 翻译套件 Seamless Communication,该套件由 4 款 AI 模型组成,Meta 声称,该 AI 套件能够“精准再现说话者情绪”,可实现延迟仅 2 秒的同声传译能力、并支持近百种语言输入。据悉,Seamless Communication 是 Meta 庆祝自家 AI 研究机构“Fundamental AI Resear…

IT之家 12 月 4 日消息,Meta 日前公布了 AI 翻译套件 Seamless Communication,该套件由 4 款 AI 模型组成,Meta 声称,该 AI 套件能够“精准再现说话者情绪”,可实现延迟仅 2 秒的同声传译能力、并支持近百种语言输入。

据悉,Seamless Communication 是 Meta 庆祝自家 AI 研究机构“Fundamental AI Research”成立 10 周年所发表的研究成果。

Meta 介绍称,该套件包含用于加速翻译的“第二代 SeamlessM4T 模型”、口译模型“Seamless Expressive”、 同声翻译模型“Seamless Streaming”,与综合模型“Seamless”,IT之家整理相关信息如下:

SeamlessM4T 模型号称能在翻译时基于用户说话内容,自动联想可能的后文,以加速翻译。

Seamless Expressive 是一种口译模型,号称可以解决“传统 AI 翻译无法抓住用户语调、停顿、读词重轻度的问题”,能够在维持翻译品质的基础上,保存用户情绪、风格、说话速度、停顿和节奏,从而为翻译内容带来更多“情感信息”。

Seamless Streaming 是同声翻译模型,主打 2 秒延迟的语音和文字翻译,支持口译(speech-to-speech translation)、听写翻译(speech-to-text translation,S2TT)及自动语音识别功能(Automatic speech recognition ,ASR)。

而综合模型 Seamless,则是整合了上述三种语言模型,便于通用场景。

目前 Meta 已经将示例视频发布在 GitHub 以及 HuggingFace 网站上,感兴趣的小伙伴们可以点此进行查看。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

本文来自网络,不代表头条在线-头条新闻网立场。
上一篇格灵深瞳声明:没有开发所谓的“收费版寻亲 App”
下一篇 微软仅凭「提示工程」让 GPT-4 成医学专家!超过一众高度微调模型,专业测试准确率首次超 90%
头条新闻网

来源: IT之家

本文来源于IT之家。包含文章,图片,视频等资源归属于原作者所有。如有侵权请联系gridf@126.com处理。紧急处理联系电话:15144810328

为您推荐

评论列表()

    联系我们

    联系我们

    0898-88888888

    在线咨询: QQ交谈

    邮箱: email@wangzhan.com

    工作时间:周一至周五,9:00-17:30,节假日休息

    关注微信
    微信扫一扫关注我们

    微信扫一扫关注我们

    关注微博
    返回顶部