首页 > 科技 > 智能 阿里大模型产品“通义听悟”升级:超长视频自由问,还会做思维导图

阿里大模型产品“通义听悟”升级:超长视频自由问,还会做思维导图

IT之家 3 月 19 日消息,今日阿里大模型产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。通义听悟接入通义千问大模型,融合了十多项 AI 功能,包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT 提取等,并支持标重点、记笔记。通义听悟本次升级上新了六大功能点,其中最重磅的是音视频问答助手“小悟”,关键信息直接“问”出来。小悟通过…

IT之家 3 月 19 日消息,今日阿里大模型产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。

通义听悟接入通义千问大模型,融合了十多项 AI 功能,包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT 提取等,并支持标重点、记笔记。

通义听悟本次升级上新了六大功能点,其中最重磅的是音视频问答助手“小悟”,关键信息直接“问”出来。小悟通过多语言 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。

用户不仅可在单一记录页呼唤小悟,对最高 6 小时、6G 大小的音视频提问任何相关话题,或直接小悟要求整理金句、梳理结论、写会议纪要;更可在首页针对用户所有记录提问,支持一次性扫描理解上百条音视频内容;也可花式对英文视频用中文提问,小悟将直接给出中文回答,省去翻译。作为一个“懂你”的 AI,小悟还会智能推荐问题。

IT之家注意到,针对用户需求,通义听悟还上线了一键 AI 改写、思维导图生成等新能力。例如,一键 AI 改写,将口语转为书面表达,尤其适合整理采访;思维导图自动生成,最多支持五级 xmind 脑图,适合播客摘要。

▲ 通义听悟思维导图示例

产品细节体验也进一步升级,包括笔记支持一键插入视频时间戳及截图、音视频文件语种自动识别等。

此外,通义听悟推出“高校公益计划”,所有中国大陆高校师生通过后缀 edu.cn 的教育邮箱进行认证后,均可直接获赠 500 小时转写时长,存储空间从 20G 拓展至 200G。

据官方介绍,作为国内首个开放公测的大模型产品,去年 6 月发布以来,通义听悟累计已有上百万用户,包括学生、老师、白领、记者、律师、金融分析师等群体,活跃用户日均转写音视频 3 次以上,平台每天处理字符数约 20 亿字。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

投诉水文 我要纠错
本文来自网络,不代表头条在线-头条新闻网立场。
上一篇英伟达进军人形机器人领域,推出 Project GR00T 项目
下一篇 返回列表
头条新闻网

来源: IT之家

本文来源于IT之家。包含文章,图片,视频等资源归属于原作者所有。如有侵权请联系gridf@126.com处理。紧急处理联系电话:15144810328

为您推荐

评论列表()

    联系我们

    联系我们

    0898-88888888

    在线咨询: QQ交谈

    邮箱: email@wangzhan.com

    工作时间:周一至周五,9:00-17:30,节假日休息

    关注微信
    微信扫一扫关注我们

    微信扫一扫关注我们

    关注微博
    返回顶部