随着科技的飞速发展,人工智能(AI)正逐渐渗透到我们生活的各个领域,成为提升效率的得力助手。近日,达摩院推出的全新AI效率工具——通义听悟,便是其中的佼佼者。
通义听悟,原名为听悟,现已全面升级,它不仅是一款智能的音视频转写工具,更是一个集实时字幕上屏、中英互译、音视频文件转写等多项功能于一体的综合性AI应用。无论是学习、会议、培训还是访谈等场景,通义听悟都能提供精准、高效的服务。
在使用过程中,通义听悟能够实时将音视频内容转写为文字,并自动区分说话人,确保信息的准确传达。同时,它还支持中英互译,打破了语言壁垒,让交流更加顺畅。在会话结束后,通义听悟还能智能分析会话内容,提取关键词、议程、重点内容和待办任务等,自动生成智能纪要,方便用户快速回顾,提高工作效率。
官网入口:https://tingwu.aliyun.com/
通义听悟功能特点
通义听悟是一款由阿里云推出的基于大模型的工作学习AI助手,其功能特点主要体现在以下几个方面:
1.实时记录与转写:
实时记录交流内容,精准快捷生成记录,实现音字对应播放。支持音视频文件的快速上传和批量转写,可处理多种语言(如中文、英文、粤语、中英混、日语、韩语)的转写。
2.翻译与发言人区分:
支持一键开启中英互译,打破语言壁垒,实现无障碍沟通。能够自动区分发言人,并允许对发言人进行编辑和筛选,使回顾整理更加清晰。
3.智能提炼与整理:
提供全文摘要功能,智能总结音视频内容,快速把握核心内容。章节速览功能可智能提炼章节摘要,帮助用户轻松把握会话脉络。
发言总结功能能够智能概括发言人的观点,使会议或讨论的主要观点一目了然。
4.多模态处理:
结合语音、语言、视觉多模态技术,提供丰富的AI功能,如语音识别、说话人分离、翻译等。灵活的模块划分和自定义Prompt功能,满足用户多样化的业务需求。
5.内容管理与导出:
支持编辑整理笔记,导出记录,方便用户回顾和利用。绑定阿里云盘账号后,可快捷转写阿里云盘音视频文件,并将记录文件一键转存至云盘。
6.进阶功能:
在未来,通义听悟还将上线一键提取PPT、内容问答、为网络视频自动生成字幕等进阶功能,为用户提供更加全面的音视频处理体验。
通义听悟的这些功能特点使其成为一个强大的工作学习助手,能够帮助用户高效地处理音视频内容,提取关键信息,优化工作流程,提高学习和工作的效率。
通义听悟收费方式
通义听悟的收费方式相对清晰,主要基于不同的功能和服务进行计费。以下是对其收费方式的详细解释:
1.费用结算:
通义听悟仅支持后付费模式,即按照实际使用的服务进行结算。遵循阿里云统一出账周期和扣费规则,一般次日出账扣费。账户余额需保证充足,以免因欠费影响业务。
2.免费试用:
新开通服务的用户可免费试用90天,期间不收取费用。试用期间,实时记录每天免费使用额度为48小时,音视频文件记录每天免费使用额度为2小时(音频时长)。
3.计费构成:
费用主要由语音数据处理、大模型任务、多模态任务和翻译四个部分组成。语音数据处理包括ASR实时记录和音视频文件记录,均按时长计费。大模型部分,如发言人总结、问答对提取、待办事项等功能,也均按时长计费。若同时使用多个功能或多个Prompt,将叠加计费。多模态功能,如视频PPT提取及PPT摘要功能,同样按时长计费。
翻译功能,如实时翻译,按翻译音频的时长计费,使用中英自由说翻译目标语言为中文+英文时,计费时长翻倍。
4.具体价格:
ASR实时会议转写和音视频文件转写的标准价格为0.6元/小时。大模型功能,如章节速览、全文摘要、关键词等,按照处理的音视频时长,独立计费,标准价格为0.064元/小时。
多模态功能的标准价格为0.8元/小时。实时翻译的标准价格为4元/小时。
5.注意事项:
当接入2路或3路音频时,只对有转写结果的时长收费,但当多路均同时无转写结果时也收费。语音时长按秒累计,并转换为小时进行计费。
请注意,以上信息仅供参考,具体价格可能会根据服务升级、促销活动等因素发生变化。如需更详细的信息,建议访问阿里云官方网站或咨询相关售前客服。