详情
【Arm 专栏】人工智慧对人类的未来是好或坏? 让 Arm 机器学习专家为你说分明挖掘语音中的洞察,超越一般逐字稿软体的  AI 线上语音协作神器 Vocol.ai
人工智慧将会拯救或是毁灭人类的未来? Arm 机器学习部门专家认为能源密集型人工智慧将成为推动全球永续发展的重要工具。我们被人工智慧 (AI) 包围,当你使用网路、拍照、看电视或使用字词预测时,你正在与人工智慧互动,目前我们仍处于这场科技和生活革命的早期阶段。但人工智慧可能需要大量的电力,研究人员发现训练现代人工智慧演算法时所需耗费的电力相当惊人。人们使用人工智慧的方式很多,例如用来寻找猫,即使把此类应用移除,限制在对人类有明显助益的应用上,例如医疗诊断等,然而这些 AI 应用仍然会产生更多对于人工智慧运算週期和能源的需求,所以我们又回到原点:这一切是值得的吗? 简而言之,我们的结论是这一切是值得的,倘若人工智慧能够有远见的被加以使用,人工智慧将成为我们推动全球永续发展最重要的新工具之一,原因如下:1. 人工智慧正变得更有效率虽然早期的人工智慧主要是在功能方面的竞赛,以及相关的指数能耗需求,但最近的焦点已经转向更高效的人工智慧演算法、优化工具和为高效人工智慧调整的专用处理器,这些都带来了巨大的能源效率提升。若只考虑晶片,2020 年 Arm 发布了 Cortex-M55 CPU 和 Ethos-U55 microNPU,用于增强物联网装置中的机器学习 (ML) 处理。单 Cortex-M55 就提供了 7 倍的 ML 性能提升,每瓦性能提升 6 倍,若将这两种处理器结合在一起,性能可提高 50 倍,效率提高 25 倍。除了 Arm 之外,GPU 在资料中心为有效率地处理人工智慧发挥关键作用,许多新创公司也都在为人工智慧开发处理器,我们称此为为「性能- 完美迴圈」。通常,当一种创新出现时,公司就会持续追求更好的性能,一旦功能达到「够好」的水準,对效率的追求就展开了,人工智慧目前正围绕此迴圈努力。 2. 人工智慧任务将从云转移到本机装置在需要人工智慧的地方运行,例如在我们周围的装置上运行,可以减少频宽、成本和能耗。考量一台声控咖啡机,如果製造商选择在云运算处理消费者的语音指令,那么为每台装置每年提供支援的成本可能为 15 美元,由于装置平均寿命为 5 到 10 年,一台声控、云驱动的咖啡机将亏损,但在本机上执行人工智慧则几乎没有任何开销,人工智慧推理将转移到本机装置,而複杂的、一次性的「训练」目前仍将留在云端,但随着时间的推移,我们将会看到它也朝向边缘和装置移动。3. 人工智慧有让几乎所有会消耗功耗的装置变得更高效的潜力根据全球最大的泵 (pump) 製造商 Grundfos 指出,泵消耗了全球约 10% 的电力,其中 90% 是低效率的。透过人工智慧控制,即使仅能提升一半的潜在效率,也可以减少全球 1 - 2% 的电力消耗。本地化的 AI 控制在这个领域已经变得很普遍,且将随着时间更普及。 甚至像建筑管理系统此类已经从数位控制中受益的设计,也能透过人工智慧和 ML 得到改善,因为它们能够根据交通模式提供更好的预测和反应,一些数据指出,透过良好的处理,数位技术可以减少 15% 的排放,将能源花在高效且本机化的人工智慧上,对于实现巨大的电力节约极具潜力。4. 人工智慧将使世界更加多样化人工智慧将迅速扩展,Google 使用人工智慧透过天气资料等资料将资料中心的冷却降低了30%,接着,它试验负载转移,也就是把非紧急的任务,转移到人工智慧演算法预测风能和太阳能能供应更大 (也就是更便宜) 的时段。现在,Google 正在研究从一个资料中心移至另一个资料中心的滚动式应用,以儘可能地利用可再生能源,累积的效应能更显着地提高资料中心的效率、永续性和更具经济性。5. 有些设计已经到位: 例如更智慧的 AI 冰箱假设现在是天气炎热的深夜,而你有点饿,大多数人可能会走向冰箱拿出一瓶清凉饮料与食物。大约有 3,500 万个美国家庭拥有两台冰箱,其中 600 万家庭拥有三台或三台以上的冰箱,而冰箱,作为一种需要永远插电的设备,通常是家庭用电的第二大来源,消耗了家庭总能源消耗的 7- 13%,地区效率法规使得冰箱效率改善,加上人们对能源消耗的影响以及其在应对气候危机中所应该扮演的角色的认知逐步提高,因此人工智慧在冰箱效率上有更进一步能提升的潜力。以 Arm 的合作伙伴、土耳其一家大型家电製造商 Arcelik 为例,Arcelik 是全球最大的家电製造商之一,它拥有包括 Grundig 和 Beko 在内的 11 个品牌,Areclik 了解消费者希望购买可靠品牌的产品,为了儘量减少对环境的影响,Areclik 一直将永续发展作为研发过程的核心,从而开发出像 BioFridge 这样的产品,它是由高性能、基于植物的生物塑胶製成,碳足迹比普通塑胶低了 80%。除了材质之外,冰箱的工作原理是使内部循环的製冷剂蒸发,从而冷却周围区域。为了启动该过程,製冷剂由压缩机加压并冷却成液态。然后透过膨胀装置降低製冷剂的压力,将其从液体变成气体。然后将其重新压缩,并重新开始该过程。由于冰箱大部分能源的消耗来自压缩机在迴圈冷却液时的开启和关闭,所以降低耗电一个方法是优化循环系统,或是提高导热係数,例如升级压缩机或引入其他形式的隔热材料,如真空隔热板,然而,以真空隔热板为例,虽能带来 10% 的节能但将使零售价增加 30% 以上,显然,这并非能持续的解决方法,因此 Areclik 决定借助 Arm 创新的技术来解决方案,从不同的角度来解决这个问题。一般情况下,压缩机运行得越快,能带走的热量就越多,电力成本就越高,Arcelik 的人工智慧冰箱利用 Arm Cortex-M 类处理器来平衡压缩机速度和功耗,在硬体限制和标準和产品寿命规定的最短工作/停止时间内工作,Arm Cortex-M 不仅小巧但功能强大,还能存取 Cortex-M 的软体库、工具和优化流程,在不增加材料成本下提升效能。Arcelik 开发了一种轻量的强化学习 (Reinforcement Learning; RL) 演算法,能分析当地的家庭行为,而非大量的训练资料,以尽可能地减少人们开关冰箱门时产生的温度波动,当波动越小,压缩机消耗的功率就会越小,由于一般冰箱的温度波动幅度为摄氏 +/-0.5 度,若能将此波动幅度压低至摄氏 +/-0.2 度以下,将能使食物保鲜延长 10%,目前每年全球约有价值 1.2 亿美元食物被浪费的情况 (约佔全球食物产量的三分之一),也可能因而获得改善。根据联合国粮食及农业组织(FAO)的数据,如果将食物垃圾算作一个国家,它将成为仅次于美国和中国的第三大温室气体排放国,如果世界公民能够停止浪费食物,将减少全球总排放量的 8%。目前 Arcelik 的 AI 冰箱仍在开发中,至今为止,节能可达 10%,明年可能有试用原型。节能冰箱对减少家庭能耗带来的效益相当惊人,理论上来说,仅在欧洲这些节电量就可以关闭 9 座发电厂,并有助于实现 2050 年全球碳排放量降至零的目标。我们继续思考,假设全球安装了约 10 亿支智慧电錶,想像一下,使用电錶可以让电器与公用事业公司协商节省峰值用电的折扣。峰值发电厂的成本高达数亿美元,然而一年只有几天的使用时间,而且比其他发电厂的排放更高,安装电表将有机会省下巨额的电量。要能实现分散式的智慧仍需努力,演算法和处理效率、安全性、资料管理和资料治理都是需要关注之处,我们还将看到作为服务模式的创新,设备製造商将优化和预测性维护服务添加到设备和家电销售中。儘管如此,努力还是值得的,人工智慧独特的力量将使我们能够应对世界上最大的挑战,而同样重要的是,未来十年我们累积的经验和技术将使我们能够有效率地对应这一切。2021 Arm终端AI运算生态高峰会身为主流微控制处理器架构开发者,Arm 在人工智慧解决人类永续性问题的道路上,一直是关键的推动者,除了家电业者以 AI 提升冰箱效率,你也能藉由 Arm AI 解决方案在装置上进行更高效的部署。9 月 14日于线上举办的 2021 Arm终端AI运算生态高峰会,将邀请 AI 技术专家,以及生态系伙伴 TensorFlow、Skymizer、赛微科技(Cyberon)与Edge Impulse分享开源ML框架、AI解决方案、语言机器学习、AI系统软体与指令客製工具,欢迎有兴趣的观众报名,让 Arm 与你一起用机器学习提升装置效能而努力。报名 2021 Arm终端AI运算生态高峰会责任编辑:Mia核稿编辑:Anny延伸阅读:【AIoT 的智慧未来】人工智慧加上物联网,两个成熟技术引爆了一个高速成长的新产业!【Howie 商业投资】自动产生 AI 模型!人工智慧大规模部署的关键:AI 工业化OpenAI ChatGPT 等大型语言模型横空出世,甚至有人认为人类文明改变的奇点已近,但至少在语音转录文字领域,奇点已近的现象愈发明显,先进的语言模型能大大提升转录的準确性与速度,包括支援多语言转录、即时转录后产生内容摘要与分析,再再都创新了使用体验并强化服务的价值,仿佛预见了 AI 的强大潜力快速浮现,看见一种趋近于奇点的可能。Vocol.ai 语音协作平台採用的就是现在各擅胜场的四大语言模型:GPT-3、BERT、BLOOM、DPR,能快速将语音转录为文字,还能 AI 即时分析摘要与主题,针对公司团队成员提供一站式协作平台与数据分析总览,更能串接 Google Meet、微软 Teams 即时直接转录会议内容,让这股从 OpenAI 的 ChatGPT 大型语言模型带起的生成式人工智慧应用,带我们彻底抛弃无效率的人工逐字稿时代。 Vocol.ai 结合四大常见大型语言模型,提供最全面的语音转录与分析工具。/ Photo Credit:Vocol.ai解决法律、医疗等白领与资讯工作者痛点人无通才,但受过长时间深度学习训练的 AI,其专业知识丰富程度绝对不亚于专业领域人士,在法律产业,AI 强化的语音转录文字服务,就能提供比人工转录準确度更高的审讯和会议记录;在医疗领域,更能让医生专注在病患照护,而将冗长、单调的病历记录交给精準且专业的语音转文字服务来完成;在客服领域,透过即时转录并结合 AI 分析,不只能改善语音对话纪录的管理与档案储存,更能大大提升客户服务品质;对新闻媒体与学术研究来说,过去针对各种不同学科群的录音内容,往往都需要对应学科群的人才能準确翻出文字,现在透过AI驱动的语音转录文字服务,不只大幅缩短访谈录音转成逐字稿的时间,甚至主动整理出摘要与重点,Vocol.ai 语音协作平台能解决白领工作者、资讯工作者,不管是远距工作或传统办公室上班的许多工作痛点,提昇了工作效率,甚至改变整个产业运作模式。多人会议的传统逐字稿製作非常麻烦,除了内容要正确以外,要分辨出不同讲者所讲的内容更是一大难题。/ Photo Credit:Vocol.aiVocol.ai 从录音到文字 从逐字稿到重点 一站搞定Vocol.ai 作为一个具备强大功能的语音转录文字服务,但却具备异常简洁的网页操作介面,使用者可以直接上传 mp3、mp4aac, .mp4, .weba 等不同格式的影音档案,或是直接用会议机器人与控制台进行录音后,将音档转录为文字。而且仰赖强大语言模型之赐,更能「听懂」中文、英文与日文这三种亚洲地区的强势语言,不管你是在国内或国外,客户或与会者用哪种语言进行会议,或者新闻工作者在国内外进行採访工作,都能即时将录音内容转录成文字,甚至直接透过 AI 分析摘要与主题,不仅可以迅速完成原本需时不斐的人工转录与整理工作,更能协助语言能力不够强的使用者,打破语言造成的隔阂。/ Photo Credit:Vocol.ai逐字稿的生成语言可以选择自动侦测,特别适用于那些档案中有多国语系的用户,为选择困难者增加更便利的选项,而完成逐字稿后,还能根据需求产出不同语系的摘要,让即使无法参加会议的跨国同事也能一键获取会议重点,大幅缩短工作中的沟通障碍。 根据官方资讯,七月即将推出的翻译功能,让 Vocol 更进阶到跨语系协作平台,支援高达二十种语系。让用户在进行跨国工作或是多语系教学场景时,能透过平台生成多语系逐字稿翻译并分享协作,进行评论。/ Photo Credit:Vocol.ai谈到分享,Vocol.ai 还具有整合度极高的会议协作功能,可以邀请与会者在 Vocol 简洁易用的操作介面下,进行线上评论、tag 朋友、划重点等协作功能,大大提升工作效率。OpenAI 执行长国会作证 Vocol.ai 快速整理 AI 产业变革以 OpenAI 执行长奥特曼在 5/16 到美国国会作证 3 个小时,讲述了关于 AI 未来的规範与发展问题为例,以前我们至少要有熟悉AI与法规层面的专业人士,3 个小时从头听到尾才能整理出逐字稿,接下来要再花几个小时才能整理出摘要与重点。现在我们只需要把影音或音讯档案上传到 Vocol.ai 上,短时间内就能产出逐字稿,而且会列出各个美国国会议员、OpenAI 执行长等许多不同讲者的发言,并且做出摘要分析。 短时间即可产出逐字稿,并做出摘要分析。/ Photo Credit:Vocol.aiVocol.ai 的 AI 分析功能,还能更进一步整理这段国会作证内容的各个主题,像是科技产业中的企业权力和集中度、AI 管制及其对社会的影响、管制生成式 AI 及其风险、全新 AI 管制机关的需求等等,不管你是 AI 相关产业参与者,或是新闻媒体工作者,都能第一时间了解这次国会证词的重要内容。AI分析功能进一步整理国会作证内容的各个主题。/ Photo Credit:Vocol.ai活用 Vocol.ai 逐字稿与重点整理 旅游安排更简单Vocol.ai 不只可以用在工作上,结合的 ChatGPT 服务,更可应用在日常生活中,像是目前各大旅游 Youtube 都常推出「某某地方必去的 10 大景点」之类的影片,就可以活用 Vocol.ai 帮忙做出逐字稿内容,再利用 ChatGPT 让 AI 帮我们整理、行程安排。以这部提到 25 个去美国时值得一访的影片为例,全部看完要接近 30 分钟,但交给 Vocol.ai 就不用那么久。Photo Credit:截自touropia在 Vocol.ai 产出逐字稿后,就可以用分享的功能把内容分享给朋友,自己可以把想要去的景点先用评论的方式注记下来并且 tag 朋友,朋友可以直接点选文字区段就会被带到对应的影片段落,透过评论的方式,一边互相讨论,注记未来有机会去的探访景点。/ Photo Credit:Vocol.ai除了分享逐字稿给朋友,也可以下载整篇逐字稿内容后,留下讨论时想要去的景点再请 ChatGPT 依据逐字稿内容,用条列式方式规划合理的旅游行程,像是安排预算在十万内的双人滑雪行程等等。Vocol.ai 结合 ChatGPT,就能快速帮我们把这一篇旅游景点影片,浓缩成一个简单的旅游计画,如果不想滑雪,想体验纽约、加州的旅游计画,也可以用相同模式来设计。/ Photo Credit:Vocol.ai如果在选看留下的评论时,想要对照看景点影片,也可以透过变换影片视窗的配置,随意拖拉,甚至可以让画面置于逐字稿上方,非常适合需要对照影片跟文字的工作者,适用的场景可以是企业中进行教育训练,或是大专院校学生要比对课堂图示跟讲述内容时,以下我们举以黄仁勋的演讲影片为例,对于不能快速理解英文的人来说,还能搭配七月上线的翻译功能,对照英文演说跟中文逐字稿。/ Photo Credit:Vocol.ai200 分钟免费试用 体验最强逐字稿平台 续用还有75折优惠就像 ChatGPT 也有提供免费试用,让使用者体验生成式 AI 的神奇之处,注册 Vocol.ai 也会提供 200 V-points( 200 分钟 )的免费试用时数,使用者可以上传两三场的会议或访谈录音稿,亲身试试快速转录文字档、AI 分析重点与摘要的的功能。在200分钟的试用过后,目前也提供依照时数的付费个人方案,企业甚至可以大量採购,未来也将会推出订阅制的企业方案。/ Photo Credit:Vocol.ai目前推广期间也提供输入折扣代码 FLSHV,就可在个人方案享75折优惠。/ Photo Credit:Vocol.aiVocol.ai:语音转录文字结合线上协作平台的创新里程碑Vocol.ai 使用四大先进 AI 语言模型,能高效且準确的将语音转为文字,并进行即时分析与总结,将语音转录文字服务的精确性、效率与适用层面提升到前所未有的水準,不仅将淘汰传统的人工逐字稿方式,这种创新的使用体验以及服务价值的提升,更有充分的潜力改变未来白领与资讯工作者的工作模式,平台不仅持续地优化效能外,预计于七月也将推出更多功能,也预示人工智慧为主导的未来,而 Vocol.ai 融合线上协作平台的概念,也让人们能一站式随时随地存取与共笔,将带给各产业巨大变革。Vocol.ai 语音协作平台 :https://bit.ly/43Ytpit/ Photo Credit:Vocol.ai本文章内容由「 Vocol.ai 」提供,经关键评论网媒体集团广编企划编审。