您的位置：首页 >银行 >

“西湖”西湖大学成立5周年，施一公：做创新的守护者是使命也是未来 “考生”下半年自考即将开始省考试院发出温馨提示 “铜陵”化工厂爆炸？两名造谣者被查处 “尔森”用心倾听大自然的神秘邀约 “小行星”我国2030年前后实现载人登月 “在我”忆来只把旧书读 “儿子”妈妈将50余万“读书钱”存儿子名下，19岁儿子取出转给女友，妈妈无奈起诉追回 “父亲”父亲的眼神杀 “爷爷”爷爷的石榴树 “考生”硕士统考发布报名提醒考生需及时自查，抓紧时间修改 “都是”A股的觉醒之年！ “科博会”芜湖科博会集中展示大国重器 “力学”王博已任大连理工大学副校长 “这是”自内耗到自洽 “陈老”高山仰止，景行行止 ——读春桃老师所著《国医》 “合肥市”“柿柿如意，柿如破竹”…… 高三学子“花式解压” “孩子”一生的功课 “诗人”带着大海散步的人 “说了”云朵的话语，心灵的方剂 ——读周实《有些话语好像云朵》 “大桥”G3铜陵长江公铁大桥先导索过江 “超新星”云南天文台发现Ia型超新星前身星候选体 “某甲”父亲被羁押继母要离婚，未成年女儿谁来抚养？法官多方努力，难题解决了！ “知网”中国知网用户委员会两名成员公开亮相 “肌肉”磁铁刺激疗法可“对齐”肌肉纤维 “益康”倍益康上市几个月收入净利都大减市值仅几亿创始人张文有啥办法？ “宁德”宁德时代三季报：业绩增速放缓、海外市场份额扩大 “科幻”和成都和教育，一起遇见未来！两份重要“科幻教育”名单公布 “亚马逊”哪些以色列芯片公司已被美国企业收购？ “宜宾”近2万人参加！2023宜宾长江马拉松开跑：埃塞俄比亚选手包揽全马组男女前三名 “低价”第15个双11：电商巨头争夺“最低价”、取消预售、开放生态 “科幻”嘉宾共话科幻的未来：被视为“珍贵市场”，中国科幻正青春 “新材料”信金控股完成新一期人民币基金首关 “红星”梁静茹南京演唱会再现“柱子票” 主办方：临时布置追光灯，正与观众沟通 “结构”结核杆菌致病机制获揭示 “鲁南”鲁南制药集团建厂55周年：“向新向未来” “犯罪嫌疑人”湖南新化砍伤一对夫妇的犯罪嫌疑人落网，4人涉嫌窝藏罪被批捕 “灯会”红星观察｜自贡灯会走出“春节舒适区”：首次试水中秋国庆主题灯会火出圈背后 “同比增长”失守3000点后，A股市场的危与机｜智氪 “导盲犬”视障女子自曝带导盲犬进公园遭保安阻拦公园方：天色较晚不知其实情，沟通后已放行 “装修”装修公司老板明知公司亏损仍吸引客户签合同，骗取上百人700余万，被判11年 “小行星”首次！我国计划实施近地小行星防御任务 “射电”穿越80亿光年的快速射电暴源于一场“星系交通事故” “民谣”玉林民谣，从成都走向深圳 “中国移动”中移动市场详情：合作伙伴大会重要发言及发布、反诈、5G应用获奖 “华为”新麒麟全面替代！曝华为正在清理骁龙机型库存：掀起全线新品的“洪流” “商务部”商务部：达成共识！ “肿瘤”科学家揭示肿瘤免疫逃逸新机制，鉴定三个癌症生存相关因子，为肿瘤免疫治疗注入新动力 “必胜客”必胜客最黑暗的料理来了 “亿元”爱仕达董事长陈合林做铁锅起家公司已连续亏损两年多他有啥招术？ “血液”简单的血液检查调整可使重症监护治疗更安全

“转录”能听懂语音的ChatGPT来了：10小时录音扔进去，想问什么问什么

2023-06-02 13:05:25来源：机器之心Pro

今天，很高兴为大家分享来自机器之心Pro的能听懂语音的ChatGPT来了：10小时录音扔进去，想问什么问什么，如果您对能听懂语音的ChatGPT来了：10小时录音扔进去，想问什么问什么感兴趣，请往下看。

类 ChatGPT 模型的输入框里可以粘贴语音文档了。

大型语言模型（LLM）正在改变每个行业的用户期望。然而，建立以人类语音为中心的生成式人工智能产品仍然很困难，因为音频文件对大型语言模型构成了挑战。

将 LLM 应用于音频文件的一个关键挑战是，LLM 受其上下文窗口的限制。在一个音频文件能够被送入 LLM 之前，它需要被转换成文本。音频文件越长，绕过 LLM 的上下文窗口限制的工程挑战就越大。但工作场景中，我们往往需要 LLM 帮我们处理非常长的语音文件，比如从一段几个小时的会议录音中抽取核心内容、从一段访谈中找到某个问题的答案……

最近，语音识别 AI 公司 AssemblyAI 推出了一个名为 LeMUR 的新模型。就像 ChatGPT 处理几十页的 PDF 文本一样，LeMUR 可以将长达 10 小时的录音进行转录、处理，然后帮用户总结语音中的核心内容，并回答用户输入的问题。

试用地址：https://www.assemblyai.com/playground/v2/source

LeMUR 是 Leveraging Large Language Models to Understand Recognized Speech（利用大型语言模型来理解识别的语音）的缩写，是将强大的 LLM 应用于转录的语音的新框架。只需一行代码（通过 AssemblyAI 的 Python SDK），LeMUR 就能快速处理长达 10 小时的音频内容的转录，有效地将其转化为约 15 万个 token。相比之下，现成的、普通的 LLM 只能在其上下文窗口的限制范围内容纳最多 8K 或约 45 分钟的转录音频。

为了降低将 LLM 应用于转录音频文件的复杂性，LeMUR 的 pipeline 主要包含智能分割、一个快速矢量数据库和若干推理步骤（如思维链提示和自我评估），如下图所示：

图 1：LeMUR 的架构使用户能够通过一个 API 调用将长的和 / 或多个音频转录文件发送到 LLM 中。

未来，LeMUR 有望在客服等领域得到广泛应用。

LeMUR 解锁了一些惊人的新可能性，在几年前，我认为这些都是不可能的。它能够毫不费力地提取有价值的见解，如确定最佳行动，辨别销售、预约或呼叫目的等呼叫结果，感觉真的很神奇。—— 电话跟踪和分析服务技术公司 CallRail 首席产品官 Ryan Johnson

LeMUR 解锁了什么可能性？

将 LLM 应用于多个音频文本

LeMUR 能够让用户一次性获得 LLM 对多个音频文件的处理反馈，以及长达 10 小时的语音转录结果，转化后的文本 token 长度可达 150K 。

可靠、安全的输出

由于 LeMUR 包含安全措施和内容过滤器，它将为用户提供来自 LLM 的回应，这些回应不太可能产生有害或有偏见的语言。

可补充上下文

在推理时，它允许加入额外的上下文信息，LLM 可以利用这些额外信息在生成输出时提供个性化和更准确的结果。

模块化、快速集成

LeMUR 始终以可处理的 JSON 形式返回结构化数据。用户可以进一步定制 LeMUR 的输出格式，以确保 LLM 给出的响应是他们下一块业务逻辑所期望的格式（例如将回答转化为布尔值）。在这一流程中，用户不再需要编写特定的代码来处理 LLM 的输出结果。

试用结果

根据 AssemblyAI 提供的测试链接，机器之心对 LeMUR 进行了测试。

LeMUR 的界面支持两种文件输入方式：上传音视频文件或粘贴网页链接均可。

我们用 Hinton 近期的一份访谈资料作为输入，测试 LeMUR 的性能。

上传之后，系统提示我们要等一段时间，因为它要先把语音转成文字。

转录之后的界面如下：

在页面右侧，我们可以要求 LeMUR 总结采访内容或回答问题。LeMUR 基本可以轻松地完成任务：

如果要处理的语音是一段演讲或客服回复，你还能向 LeMUR 征求改进建议。

不过，LeMUR 似乎目前还不支持中文。感兴趣的读者可以去尝试一下。

好了，关于能听懂语音的ChatGPT来了：10小时录音扔进去，想问什么问什么就讲到这。

返回科技金融网首页 >>

版权及免责声明：凡本网所属版权作品，转载时须获得授权并注明来源“科技金融网”，违者本网将保留追究其相关法律责任的权力。凡转载文章，不代表本网观点和立场，如有侵权，请联系我们删除。

相关文章

精彩推荐

“大桥”G3铜陵长江公铁大桥先导索过江

“某甲”父亲被羁押继母要离婚，未成年女儿谁来抚养？法官多方努

“亚马逊”哪些以色列芯片公司已被美国企业收购？

“装修”装修公司老板明知公司亏损仍吸引客户签合同，骗取上百人

“必胜客”必胜客最黑暗的料理来了

“运营商”运营商本周行业动态：电信年度优秀领导及上半年重点工

最新文章

“在我”忆来只把旧书读

“科博会”芜湖科博会集中展示大国重器

“诗人”带着大海散步的人

“宁德”宁德时代三季报：业绩增速放缓、海

“新材料”信金控股完成新一期人民币基金首

“同比增长”失守3000点后，A股市场的危与

“商务部”商务部：达成共识！

“基金”又一家基金公司换董事长，年内公募

图文欣赏

“儿子”妈妈将50余万“读书钱”存儿子名下，19岁儿子取出转给女友，妈妈无奈起诉追回

“儿子”妈妈将50余万“读书钱”存儿子名

“说了”云朵的话语，心灵的方剂 ——读周实《有些话语好像云朵》

“说了”云朵的话语，心灵的方剂 ——

“科幻”和成都和教育，一起遇见未来！两份重要“科幻教育”名单公布

“科幻”和成都和教育，一起遇见未来！两

“红星”梁静茹南京演唱会再现“柱子票” 主办方：临时布置追光灯，正与观众沟通

“红星”梁静茹南京演唱会再现“柱子票”

热门文章

“龙舟”击鼓赛龙！“穗城源”首届九龙湖龙

“红星”广州一小车碰撞行人已致5死13伤

“高淳”红星观察丨当部分幼儿园开始“一孩

Sibos 2018：DLT对新兴市场的影响

“公司”和佳医疗将退市，两次年报被出具“

最新的MacBook Pro价格重置类似于2012年的Retina

“小麦”祁县2.5万亩小麦“开镰”收割

“公司”宝付因侵权责任纠纷遭列被执行人，