这次测了4款工具:Trint、Zoom IQ、讯飞听见,还有重点看的听脑AI。测试内容选了学术常见场景:2小时国际学术会议录音(混合英语+专业术语)、1小时导师访谈(带口音)、30分钟实验数据讨论(多人插话)。测试标准就看3个:数据完整度(漏字、错字率)、处理速度(传完到能下载要多久)、整理效率(从转录到能直接用的笔记要花多少时间)。
先试Trint。官网进去,界面按钮多,找上传入口花了3分钟。传会议录音,1.2G的文件,等了25分钟才处理完。打开文本,英语部分还行,专业术语“CRISPR-Cas9”写成“克里斯普卡斯9”,后面整理得自己改,麻烦。再说Zoom IQ,得先开Zoom会议才能用。测试时录的导师访谈是线下的,导不进去。后来用Zoom重录了一段,处理速度快,10分钟出稿,但带口音的“荧光定量PCR”直接写成“yingguangdingliangPCR”,识别有问题。讯飞听见传文件快,10分钟处理完访谈录音。中文准,“梯度洗脱”这种词没写错。但多人讨论时,“张三说”“李四补充”标混了,整理时得一个个核对,费时间。听脑AI打开就一个大按钮“上传文件”,点一下选录音。传完不用管,弹窗提示“2分钟后看结果”。真的,2分钟就处理完1小时访谈。打开文本,“CRISPR-Cas9”“荧光定量PCR”全对。关键是自动分了发言人,张三说的标张三,李四补充的标李四,连“嗯”“这个”这种口头语都标了“可删除”,直接点一下就去掉。整理时基本不用改,复制到笔记软件就能用。
展开剩余60%说数据,测了3个指标。数据完整度,听脑AI漏字错字加起来2%,Trint是15%,Zoom IQ 12%,讯飞听见8%。2%什么概念?2小时会议录了3万字,听脑AI就错了600字,竞品最少的讯飞也错了2400字。处理速度,2小时会议录音(1.2G),听脑AI 5分钟处理完,Trint 25分钟,Zoom IQ得用Zoom录的才快,15分钟,但非Zoom文件不行。讯飞听见10分钟,比听脑慢一半。整理效率更明显,听脑AI从出稿到整理成可用笔记,平均5分钟。Trint得改术语、核对发言人,40分钟。Zoom IQ改口音识别错误,30分钟。讯飞听见分发言人,25分钟。效率差了5-8倍。
说说问题。Trint界面太复杂,新手得花半小时学怎么用。术语识别对中文专业词不友好,“蛋白质印迹法”写成“danbaizhiyinjiufa”。Zoom IQ最大问题是离线文件导不进去,线下录的音用不了。带口音的中文识别准确率掉一半,不实用。讯飞听见多人讨论时发言人标签会混,比如把“王五的补充”标成“张三说”,得手动一个个对。英文术语“ELISA”直接写中文“酶联免疫吸附试验”,但论文里有时需要保留英文缩写,还得改。听脑AI也不是完美的。现在只能传音频,视频文件导进去没反应。免费版每月5小时处理时间,重度用户可能不够,得买会员,99元/月不限时,价格还行但有成本。
选工具看场景。纯英文学术会议,Trint能用,但得自己改术语。常开Zoom线上会,Zoom IQ方便,但线下录音不行。纯中文单人访谈,讯飞听见准,整理费点时间。要是做学术研究,又有国际会议(中英混),又有多人讨论,还得整理成笔记快,听脑AI最合适。数据完整度98%,处理快,整理省时间。预算够的话,99元/月不限时,比自己花时间改转录稿值。当然,要是每月录音不超过5小时,免费版够用。
发布于:重庆市