解析2021世界人工智能大会:人工智能就在我们身边
近日,2021世界人工智能大会在上海拉开帷幕。百余场论坛活动,300多家参会厂商共同展现人工智能技术创新与产业落地的前沿进展。
与传统的大型展会相比,本届世界人工智能大会非常“特别”——人工智能、数字化技术的影子延伸到各个角落。会场内,百度创始人李彦宏与全球首个火星车数字人“祝融号”相谈甚欢,来自“B站”(哔哩哔哩网站)的虚拟主持人“泠鸢”和大会主持人一起为观众来了一场“脱口秀”。会场外,“商汤闪存柜”利用人脸识别技术轻松实现物品存取,无人咖啡店的机器人能让你喝一杯现磨咖啡,迷路了还能找智能“魔镜”问路……
可以说,今年的世界人工智能大会就是个生动的试验场,它把各类新奇、好玩、实用的技术聚集在一起,人工智能就在我们身边。
行业发展服务于人
上海已经连续4年举办世界人工智能大会。4年来,我国人工智能产业发展迅猛。截至去年底,全球人工智能产业规模达1565亿美元,同比增长12.3%;我国产业规模为434亿美元,同比增长13.75%,超过全球增速。在全球人工智能竞争格局中,中国已跻身第一梯队。大会治理论坛上发布的《2020全球人工智能创新指数报告》也显示,中国人工智能创新指数升至第2位,仅次于美国。
“在产学研用各方共同努力下,我国人工智能产业发展取得了显著成效,图像识别、语音识别等技术创新应用进入世界先进行列。”工业和信息化部部长肖亚庆说,我国人工智能发明专利授权总量居全球第一,核心产业规模持续增长,已形成覆盖技术层和应用层的完整产业链和应用生态,并不断创造出新市场、新发展机会、新就业岗位。
“人工智能无疑会影响未来40年人类发展进程,将给交通、金融、工业、能源、媒体等行业带来数字化升级的新思路和新解法,甚至已经开始重塑行业面貌,进而影响人类社会的未来。”李彦宏表示,人工智能的价值在服务人、帮助人,而不是超越人、替代人。
技术赋能千行百业
“过去几年的人工智能展览给人感觉技术和应用都很炫,但今年在世界人工智能大会上,好像看不到那么多炫的东西了。”华为轮值董事长胡厚崑在大会演讲中说。
事实上,不是人工智能不炫了,而是我们已习惯这些技术。胡厚崑表示,人工智能技术已被人们熟知,已深入行业、充分应用。这种看似平淡无奇的变化,恰恰体现了人工智能从有形化为无形,成为改变各行各业的力量。
当人工智能遇见政务服务,上海“12345”市民服务热线成了百姓的“知心人”。“上海人总说,有事就打‘12345’,反应速度快,回答问题多,这背后的人工智能助力值得关注。”胡厚崑介绍,上海“12345”市民服务热线近年来引入了人工智能技术,包括自动派单、语音语义识别甚至还有情绪感知,过去派一张单要好几分钟,现在几秒钟就搞定了。
当人工智能与金融业务结合,银行业的稽核与审计部门能够更有效规避金融风险。在明略科技展台,一套基于知识图谱的风险稽核平台系统被许多参观者“围观”,经过工作人员一番操作,信贷资金用途不合规、还款能力存疑等问题清晰地在知识图谱中显示出来。明略科技金融事业部技术总监潘宗伟告诉记者,大数据技术的快速发展和应用使得关联图谱分析成为银行风险管理的重要手段。在知识图谱数据库的基础上,建立稽核数据集市,稽核部门可以将账务数据标准化,保证信息数据质量的完整、准确及真实,提前介入规避风险。
得益于算法、算力、数据的支撑以及应用场景的牵引,人工智能已由实验室阶段转向产业化生产阶段,并逐渐进入千行百业,于无声处服务群众。
“上海高地”数字转型
上海是我国第一个人工智能创新应用先导区,人工智能发展势头强劲,风向标作用明显。
4年来,世界人工智能大会已成为国内人工智能领域最具影响力的专业化、国际化高端平台。一大批优秀企业通过大会平台走向世界。世界人工智能大会与上海人工智能产业发展形成循环联动,成为引进产业项目的“会客厅”、展示产业成果的“大舞台”、优化创新生态的“百花园”,为建设人工智能“上海高地”打下了坚实基础。
作为上海三大先导产业之一,人工智能产业近3年的年均增速接近30%。上海拥有人工智能重点企业1149家,已形成较为完备的人工智能产业链条。接下来,“紧盯人工智能关键环节和重点领域,持续往深里抓、往实里抓”,成为上海人工智能产业发展的新要求。
何为关键环节?哪里是重点领域?上海结合实际找到了重要突破口——城市数字化转型。
2021 世界人工智能大会在沪落地,以“智联世界,众智成城”为主题,此次大会汇聚了知名行业专家、优秀企业、前沿科技产品代表,一同探讨、破解智能时代下的科研难题与挑战,呈现AI创新赛道上的新亮点,并且展望产业的广阔前景。
作为在人工智能领域的突出代表与品牌,王者荣耀亦携手腾讯AI Lab,将双方共同探索人工智能在游戏场景应用的联合产品“王者绝悟”带到了大会现场。
在大会上,通过人气职业选手与“王者绝悟”的精彩表演赛,王者荣耀与腾讯AI Lab展现了策略协作型AI在多智能体博弈方面的极高研究水平;而通过玩家开放式体验,其也进一步向大众普及了人工智能技术在多元场景中的广泛应用价值。
“AI+游戏”激发无限可能
7月8日上午,腾讯公司董事会主席、首席执行官马化腾在开幕式中表示:“过去一年,AI在医疗、城市治理、非接触服务等领域,为生活带来越来越多的便利,但我们对AI的未知仍然大于已知。追求科技向善,就要推动AI向善,让AI技术实现可知、可控、可用、可靠。”
在如今的数字化时代下,AI的重要性不言而喻。作为新一轮产业变革的核心驱动力,AI正与各行各业深度融合。大会现场,诸多行业重磅嘉宾提到了AI在不同应用场景下的研究成果,比如制造业的“无灯车间”、交通运输业的“智慧交通”等等。
此外,马化腾还预告了8日下午的一场精彩的“王者荣耀AI电竞赛” (人气职业选手 VS 王者绝悟表演赛)—— “让大家欣赏到最高水平的AI竞技,同时激发青年人对于通用AI的研究兴趣“。而这场表演赛,恰好也展现了AI技术在游戏、电竞场景下的突出成果。
在表演赛上,5名人气职业选手(重庆QGhappy.Hurt、成都AG超玩会.无痕、武汉eStarPro. 诺言、深圳DYG.小义,以及辰鬼),对阵“王者绝悟”。双方在王者峡谷里上演极限拉扯。
5名临时组建队伍的选手,面对高智力、高算力的王者绝悟,虽然最后遗憾落败,但是呈现了不少竞技高光时刻,比如人类队伍的干将莫邪打野隔墙收割,以及王者绝悟队伍的程咬金以一敌众,“一夫当关,万夫莫开”,让观众感受到了人工智能技术应用到电竞及游戏场景下的无限可能。
“王者绝悟”匹敌实力电竞选手的卓越表现,可以说是展现了人工智能在电子竞技行业中的丰富应用价值。
一方面,对电竞或游戏领域来说,“王者绝悟”能够为职业选手提供数据、战略与协作类实时分析与建议,及不同强度与级别的专业陪练,通过前沿科技促进电竞专业化发展,推动中国电竞在全球范围内保持领先。
另一方面,“王者绝悟”的自我强化学习,也能为前沿人工智能技术的核心研究领域的多智能体系统提供有效的参考范本,推动产业技术发展。
除此之外,为了普及人工智能的技术与应用,“王者绝悟”展区还特设“玩家对战舱”,让现场观众也能亲自感受AI独特的思考方式,了解产品背后的技术逻辑。不少观众体验后表示:“虽然曾经在游戏里和王者绝悟有过切磋,但是经过现场不少行业人士的分析和解说后,还是重新认识到王者绝悟,并且理解到其并不只是一个简单的游戏对手”。
搭建人工智能产学研体系,探寻下一个AI里程碑
一直以来,人工智能行业都在追求一个共同的目标:通用人工智能,试图教会AI像人类一样“思考”。从Deepblue到AlphaGo,一系列里程碑事件验证了AI在复杂环境中实时感知、分析、理解、推理、决策到行动的能力,也在业界形成了一个普遍共识 —— 下一个AI里程碑,很可能会在复杂的策略游戏中诞生。
作为“AI+游戏”领域的先行探路者,腾讯长期关注并持续投入资源与技术,推动相关产业的发展。而作为腾讯旗下的数字文化IP代表,王者荣耀正在积极联合各企业与单位,通过游戏探索突破人工智能研究瓶颈的可能性。“王者绝悟”正是王者荣耀与腾讯AI Lab在深度强化学习、多智能体决策等智能课题上的重要研究成果。
自2018年初次亮相电竞赛场以来,“王者绝悟”在对局中飞速成长,王者荣耀游戏机制高复杂度、高挑战性、强协作性等特征,满足了对高水平AI的研究需要,并且得到了国际认可,“王者绝悟”相关论文已先后被AAAI、NeurIPS等AI顶级会议收录。
对于不少研究人员和开发者来说,多智能体技术研究依然存在显著的现实困难,包括环境的不确定性、信息获取的局限性、个体目标与全局目标的一致性,以及对高算力的要求。
基于此,2019年8月,王者荣耀与腾讯 AI Lab携手共建“开悟”AI开放平台,利用双方核心技术,为研究者打造低成本的科研教学平台,推动多智能体人工智能算法研究、教学和验证,助力打通产学研联盟通路。
2020年,王者荣耀联合腾讯AI Lab、腾讯高校合作、腾讯游戏学院举行首次「王者荣耀·开悟AI+游戏大赛」,面向中科院、清华大学、北京大学等18所头部高校开放技术和脱敏数据资源,在“开悟”平台进行学术研究和交流。一年时间的实践,成功验证了王者荣耀游戏环境对人工智能技术的赋能思路。
2021年,在首届STAC科创联合大会上,“开悟”平台对AI研究与教育的推动作用受到广泛关注。 未来平台将进一步延展平台承载力,推进AI与教育融合,提高学生的创造力与研究才能,为生态贡献跨学科技术、跨界人才和多方资源。
再结合此次世界人工智能大会上,“王者绝悟”展区内的技术展示与行业交流,可以发现,在推动人工智能技术向前发展的路程上,王者荣耀并非“闭门造车”,而是广泛与各企业、单位、高校联合,以游戏场景为“试验田”, 推动产学研融合新布局,进而赋能人工智能底层技术研究以及人工智能应用场景拓展。
践行“科技强国”,腾讯推进AI技术融合创新
“科技兴则民族兴,科技强则国家强”,加快建设科技强国,是我国“十四五”期间的主要目标之一,其中以人工智能为核心的新一代信息技术正是实现创新发展的新动能,也是引领新一轮科技革命和产业变革的重要力量,发展人工智能行业已经上升为我国的国家战略。
在“科技向善”战略下,腾讯正在积极承担社会责任,在科技领域投入大量研究,以“AI+游戏”为切入点,推动人工智能技术的融合创新。
以“王者绝悟”为代表的科研成果,正逐渐发展出一套合理的行为模式,期间得出的经验、方法与结论,将快速推进游戏、电竞行业的技术发展。产学研联盟的构建也将进一步加速新应用、新技术的落地,加快创新型人才的培养。
“王者绝悟”的研究成果还将与更多行业有机结合,沉淀更多创新型算法,为医疗、制造、无人驾驶、农业、智慧城市等领域带来更深远影响。
随着产学研联盟的建立,阶段性成果的展出,可以想象:以“王者绝悟”为代表,腾讯在AI+游戏上的研究,也将成为攻克 AI 终极研究难题,探索通用人工智能的关键一步。
京东集团副总裁、京东科技智能客服产品部负责人——何晓冬
媒体:先从京东业务开始聊起,京东有很多技术赋能,在电商平台里人工智能、智能化这一块儿,京东人工智能、智能化应用到了什么层面?
何晓冬:大家对京东的第一印象是电商,对京东物流也会有印象。京东有非常广的业务,一般人对京东的零售、京东物流、京东云、京东供应链智能化感知比较多,一直都有大量人工智能的应用场景。
不同场景、不同行业有不同的应用方式,零售是千人千面、智能化服务、智能化供应链、智能化物流、智能化物流仓/物流车,这一系列应用京东都走在业界前面,京东有全国最大的物流仓,618大家买的东西都是从物流仓里发出来的。
所有企业都会有客服的要求,特别是ToC面向顾客的企业,这块儿的智能化有很大空间,京东也走在前面。零售有很多,比如说自动补仓供应链智能化京东做了很多。
京东比较特殊,有自营的,对零售链条每个环节都有深度的业务在里面,不光只是做平台,每个链条都有应用的地方。
媒体:很早就开始客服要使用智能化,减少招聘的人数。后来又说智能化后面还要提供同样多的就业,究竟这个平台怎样取得平衡?
何晓冬:首先,人工智能技术本身的意义并不是说可以取代人。产业落地时更加关心的是怎样提高价值,价值具化就是成本、体验、效率这几个方向。做智能客服不是为了纯粹把客服人数、话务员、接线员减少,这样会对体验、效率有影响。
京东智能客服是有一整套解决方案、一整套系统。其中包括了简单的无人应答机器人,直接面向客户服务。很大一块儿的包括怎么辅助人工客服更高效率地接待客户。
还可以迅速地理解用户的需求,把相关的背景知识调出来放在屏幕上,帮助话务员、客服小姐姐不需要再查知识库,就可以直接知道怎么回答这个问题。
再比如说,很多时候可以迅速地把对话用户诉求、具体需求总结成需求点,直接写入工单系统进行下一步追踪。某种程度上这一切是客户服务的数字化、智能化更贴切,而不只是客服机器人。
过去几年,AI技术在学术界突飞猛进,随后五年是在产业落地的机会,而产业落地要从价值出发,而不是从具体某一个单点的技术出发。
做客服是让顾客体验好,打电话在15秒之后迅速有人接起来有回复。再比如说当顾客情绪激动的时候,机器可以给相应的反馈。再比如说智能处理的时候,比如说退货、查询订单、换货的时候,让工单迅速执行,使需求得到满足。这一整套全自动化是我们真正想做的。
媒体:智能化客服在企业内部可以实现降本增效,但在用户端做退货等流程化也可以很快解决。但有很多个性化需要和沟通,通常在智能客服里得不到很好的解决,长时间智能客服反弹会让用户的情绪觉得越来越烦,我们接触到很多用户投诉都是这样的,打很久的电话都解决不了他想要解决的问题。这种情况不少,这种情况用户对平台的美誉度就会下降。
一方面,智能化让企业实现降本增效;另一方面,大量智能化使用反而会降低用户对平台的好感度。
何晓冬:我不知道你指的是哪个具体的平台,京东的价值是三个:成本、效率、体验。
体验在京东一直是最关键放在第一位的,但尽管在京东这么关注体验的情况下还是大量采用智能技术提升客服效果,在保证体验无下降的情况下提高效率。
具体而言,比如说怎样更精细化地识别用户的意图,在京东能识别超过3000个意图了,基本覆盖了99%很长尾的用户问题。
第二,新的技术不光是单点语音回复,包括历史(对话历史、购买历史),知道用户对哪个订单有问题,订单有哪些信息,背后有知识图谱的整体理解和数据支撑,在此基础上提出解决方案及进一步沟通。
京东一直很关注体验本身的提升,不单是成本的下降、效率的提升。如果放弃体验,光谈成本和效率是伪命题。
AI是个技术,怎么用AI跟使用方式有关,有些不太懂行的公司、不太注重体验的公司用的比较简单粗暴,就放个所谓的“应答机器人”,你直接找应答机器人,不管答的了还是答不了。坦白说,这样不是好的方式,对公司本身有伤害。
这个问题不光是AI的问题,更多是更高层面做Business的时候是从用户出发还是纯粹从成本出发。
一方面,技术在不停地提升,希望更高效率更精准地找到答案,更高效率地服务用户。
另一方面,使用技术的出发点很重要,至少京东还是很从体验出发的。这不是虚的,体验一直是京东的生命线,将近5亿的用户都是因为“京东体验”带来的。
所以,使用方需要真正理解技术的价值在什么地方,以及使用的范围在什么地方,AI的边界在什么地方,由此真正达到降本增效的同时提升体验。
媒体:所谓的“提升体验”目的下,人工客服和智能客服之间怎么协调?
何晓冬:从体验出发,技术必须跟使场景紧密结合,在特定的客服场景,人工智能技术和话务员/接线员的配合应该非常紧密。配合有很多种,很多时候问题是通过Message文本的形式进来,会先通过人工客服进行预处理、分流,跟用户交谈几句后理解用户的初步意图。
如果对话进行到一定层次,比较难需要更高授权的时候,需要把它转给某一个特定的有相应专业的客服人员处理,转过去的时候还需要做一系列的摘要、事件识别,进行提取,把过去刚聊过几句话的背景和历史进行提取,让接进来的话务员迅速了解当前谈到什么程度了。
对顾客来说是无感的,很自然的需求被处理了。但在后台机器和人有很清晰的协作方式。有可能聊了几句之后客服小姐姐和顾客商量出来好的解决方案了,客户也接受了。后面还有很多工作要做,把解决方案输入到工单系统里,这个工作可以交给机器,由机器自动解决。
过程中人和机器做了几次交换,人和机器之间互相交接了几次,但顾客来说是看到比较难的需求被顺利地解决了,还能有跟踪,形成全面的闭环,由此形成整体的解决方案。
媒体:您提到目的识别、摘要、情感识别等新功能,开发新功能的时候会不会有技术上的难题,怎么克服的?
何晓冬:确实有很多技术难题。
举一个例子像情感,常规学术界一般会把情感分成正面和负面两类,但对京东来讲这太粗糙了,不够的。
同样是负面情感,你是很焦急还是很愤怒是很不一样的。如果是很愤怒的话是你的东西搞坏了,东西寄丢了,那个时候你可能很愤怒,沟通的方式会不一样。很焦急的正常情况下是24小时能送到,但他可能下午就要要,很急,某种程度上客户希望我们做的很好,但他也可以理解如果实在做不到。不同的沟通方式给用户带来的效果也不一样。
某种程度上,顾客、商家、用户交流的时候有点像“博弈”的过程,语言只是媒介,博弈希望达到双赢,两边都可以满意。京东对智能客服的理解是从融合性技术、博弈决策智能角度来看问题的。
之前我有时候跟我别的同行一起聊,一般人觉得做智能客服关键技术是语音识别,先识别语音,但实际上真正的技术是远远超出语音识别的,如果只是认为语音识别做好了整个客服就做好了,就相当于图像识别做好了围棋就下好了一样,AlphaGo虽然也是从识别期盼开始的,但背后有一整套博弈和决策过程。
客服也是这个角度考虑,技术必须考虑到多轮的互相交锋,但交锋是善意合作型的,不是对抗型的。某种程度上还是博弈,最后达到双赢的效果。
从技术角度来说,AI系统最大的技术难点不光是识别语音、语义,而是我理解以后应该说什么,提出什么解决方案,这对知识智能、决策智能有很高的要求,需要我们花很多精力来做。
媒体:刚刚听您说京东也在向政府提供数字化改造方案,语音识别方面。
何晓冬:京东在政务、城市方面做了很多工作,“智慧城市”已经介绍一段时间了,都说智能城市、智慧城市。
“智慧城市”绝对不是只是建设本身城市,之前说“智慧城市”总觉得是硬件的设施,需要把城市做的有多智能,用摄像头、大服务器、传感器、监测系统来看城市的运作。但其实城市最重要的载体是人,市民是需要被服务的,基层的办事人员(街道办)怎样更高效率地服务市民,城市管理者需要对很多事情迅速决策、迅速判断。
围绕“市民服务”角度出发,有些地方提出“办证最多跑一次”,以及很多政务热线都合号变成12345热线,有任何问题都可以打这个号,真正为市民提供服务。
今年我们和大同市合作,怎样提供智能化的政府热线,让每一个市民有任何问题都可以随时打通,保证打得进,保证随时有人接,保证所有情况能有人跟办,接了记下来确实办下来了,并且有跟踪的闭环,给市民反馈处理意见。从这个角度出发建设大同的智能化政务“12345”热线。经过半年建设,效果还是不错的。
我们的出发点不是为了帮大同市节约几个话务员,这不是我们的初衷。
第一,想把服务环节全部数字化,在高峰期,市民有问题要反映抱怨的时候能打得进。市民的第一反馈是有问题的时候打电话打不进没人接,要等很长的忙音,这是很痛苦和愤怒的原因,而现在通过智能热线100%可以被接下来了。
第二,怎么提高服务效率?和零售场景差不多,怎样通过支持智能、决策智能,让话务员更好地服务市民,直接给出解决方案推荐,让市民满意,让话务员高效。
第三,数字化服务过程中,把市民诉求全部识别出来,把真正的点全部提取出来,从语音到语义理解到知识的匹配,做成结构化数据,进入政府大数据平台、市民服务数据平台。对共性的问题、突发热点问题更快更精准地检测到,还可以实时推送给管理者、市民服务热线主任、不同部委办管理者,让他们迅速地解决问题。
之后可以通过自动外呼回拨电话给相应的市民说你上次反映的问题我们追踪了,已经解决了,向你确认一下是否解决了。完善整个服务闭环,还可以做各种各样的归档等进一步分析,这一套数字化和智能化的市民服务会带来真正的体验提升和效率提升。
媒体:你对最近“数据安全”的问题怎么看?人工智能化背后需要大量的数据支撑,没有数据就没法智能,对“数据安全”越来越严格的规定,对人工智能行业发展有没有什么影响?
何晓冬:这个问题确实很关键,最近好几个类似的事情。从京东角度来说,这么多年我们一直很关心这个事情,所以倒不是额外的限制。用户隐私就是京东的生命线,所以一直保护的很好。
最近提到一些出行数据、地理数据,之前不知道是不是大家关注不够多还是怎样。我感觉数据的保护和数据治理并不是不用数据,而是以一种公开公平可控的方式使用。
之前好像只有某些公司因为某种特别的业务原因有这些数据,数据开始慢慢做起来,后来会形成某些层面的优势。大家会讨论是否通过立法、行业规范、行业标准的方式使得数据价值被更多人一起分享,不会形成某些垄断优势,这样数据本身就不会对商业活动造成太大额外的影响。
另一方面,安全性和隐私性需要清晰的法律规范,让大家知道边界在什么地方。换句话说,作为公司希望看到一个清晰的边界,虽然看起来有边界限制了我们发展,其实不然,有了边界反而使大家更好地在合规可控的情况下放心发展,是有利的事情。
是不是因为有了边界和数据保护使得公司发展速度放慢?我倒不是那么担心,所有的商业活动、科技活动在这个星球上都是被法律规范的。我想大家讨论这个事情更多关心的是公平性,而不是说一定要无限制地用所有的数据。
很多人会担心某些实体有了不可控的优势,使得我被迫落后了,这是很多人担心的(事情)。而不是因为数据不限制,人工智能就变烂了。
主持人:之前在北京做媒体专访的时候,媒体老师对多模态技术感兴趣,之前何博士讲过以前传统大家认为智能客服只是语音的交互,但后来数字人技术、多模态应用能让智能客服、颜值能听懂方言、辨情绪,这是人工智能领域比较前沿的技术,可以介绍一下。
何晓冬:稍微介绍一下。 刚刚说了大同市的热线,新一代智能化服务系统已经不光是通过语音文字和顾客交流,新技术往往通过综合的视觉、手势、语言、表情、语气等着重点一起进行交互。
明天的论坛上我会展示完全虚拟的栩栩如生的形象给顾客提供更好的服务,用APP的时候一点“联系客服”会出现真人的形象,而不只是干巴巴的形象说我是客服,你要什么。会出来一个小姐姐的形象问你有什么特别需要的地方,更加直接的情绪直接交流,不光只是语音交流。
内部对机器人、人机交互的期望走过几个台阶:
第一个台阶:希望机器人有一定的智商,机器人要足够聪明,能够听懂人的意图,有足够的知识回答人的意图。
第二个台阶:希望机器人有足够多的情商,当机器人听到顾客在愤怒的时候,你说话的方式、安抚的预期应该是不一样的,在情绪上产生交流和共鸣。
第三个台阶:颜值。比如说TPS合成语音是不是很温柔、很悦耳、很好听,形象是不是很美丽、很敏捷、交流很温柔?这一系列是为了提高用户体验,让用户感觉真正是很好的体验交流,而不是硬生生的把问题进行机械式的回答。
某种程度上这是新的发展方向,是很重要的发展方向。在商业上,提升用户体验才会提升体验价值。在技术上,提出新的多模态融合技术,视觉和语言怎样融合在一起?视觉表情和语言内容对齐交互Attention深度学习的方式,使得能够合成一个整体,在技术上、商业上有很大的潜力。 这是京东在努力做的方向。
说到数据,往往会说到隐私性和公平性,我呼吁更多人工智能技术不应该只是追求一味最顶尖的提升,而应该想到普适,要让所有人都用到。
像大同市真正打“12345”电话的市民往往是比较普通、比较一般的市民。很多年纪大的市民、文化程度不高的市民口音很重,说有很重方言口音的普通话,怎样让机器人理解这样的语言是很重要的。不能直接反映在某一个比赛识别率的数字上,不管得第一名、第二名,方言不是比赛大家关注的地方,但落地的话是很关注的地方。
很多老年人说话的时候中间习惯性会停顿很长时间,问题没说完会想半天再说下去。这对人不是困扰,但对传统的语音识别技术是困扰,机器人会等到人说完了再开始处理决定回复。一般会通过判断语音是不是停了,可能停了超过半秒就认为这个人说完了机器人就开始工作了。但老年人经常说话停半秒,停了一半说话没说完你就开始打断他了,对话就没法交流下去,识别率再高也没有用。
能不能加长,停1秒钟、2秒钟行不行?等很久。但另外的问题是等太长了,这边说完话了,这边2秒钟以后还没回应,还在确认的话会使体验比较差。
京东人工智能研究院提出新的算法,融合性地看到声学信号和语言语义信息,随时判断语义是否完整,通过声学信号和语义信息的完整度联合判断什么时候这个人说完话了,机器可以开始工作回复了。极大提升了用户体验,通过接通率、对话正确完结率来看到体验的提升。
这个提升很难在传统单点人工智能技术里看到,单点看语音识别的榜单、语义识别的榜单,很难看到哪个技术是优化这个点的。
但在落地使用的时候会发现这个点极大影响用户体验,会发明融合性智能技术,通过落地使用指标,像电话完结率、电话接通解决率来跟踪解决问题。这是未来几年人工智能落地的时候非常重要的地方。
未来五年是很有意思的窗口,过去五年发明了各种各样的人工智能技术,随后五年都可能在各个产业落地。但落地的时候一定要从融合度的角度出发,而不是执着于某一个单点技术。
主持人:这个技术除了政务之外,在金融领域会有应用吗?
何晓冬:很多时候银行要办理存款业务、办理对公转账,看到人跟你聊的话会更加放心、可信度会增加。
媒体:通过语音识别交互你的表情,识别你的表情之类的?
何晓冬:表情是情绪的一部分,会综合考虑脸部的表情、语气、语义三点来判断情绪。同时反馈你的时候也会通过表情和语调预期回馈情绪。
媒体:更加有情感化。
何晓冬:这里有技术的难点,技术难点不光只是在模型上,一般人工智能要成功的话往往需要大量人标注数据。
但情绪数据很难生成的,训练一个模型识别情绪需要带有情绪的数据,但带有情绪的数据很难通过外包数据公司生成的,很难让一个人写当你高兴的时候要怎么说话,这是很自然发生的。通过大量的反向数据挖掘、数据增强,在京东现有语料库里进行多次挖掘。从种子情绪数据开始,标注找相似的。
京东做了这么多年的客服,基本主要情绪都见过了,每个情绪都能通过各种方式挖出来,由此对情绪的识别会做的更加真实和精准。
电视录制:
媒体:何博士先从人机协同方面聊一下AI。
何晓冬:之前有人误解人工智能起来了会把人类的工作给取代掉,我们的出发点是人工智能是工具,主要是产生价值,价值可以从成本、效率、体验方面整合产生。
以效率举例,并不一定要用AI来取代人,以智能客服为例,不是用智能客服机器人取代客服人员,而是让客服机器人和话务员进行无缝协作。
比如说京东618很繁忙的时候,顾客打电话进来如果都找人工客服的话会排很长的队,所以会让机器进行初步的了解诉求。当对话进行到比较深的层次、问题比较困难需要人工接入的时候,会无缝把对话转给客服人员。
转的过程中不是简单的切换,而是转的同时会把当前已经聊过的情况、已经理解到的知识、用户的诉求总结出来一并转给客服人员,客服人员可以很快地接起来,具体和顾客商量具体的难题和解决方案。
当解决方案达到一定的程度双方都满意的时候还需要进一步工作,传统客服人员需要录入工单、解决方案,这时候如果有智能系统的话,客服人员可以把剩下的工作再交还给机器,让机器做自动的工单输入、工单跟踪、闭环确认。这里面人和机器在工作端交接了好几次,但在顾客体验端是无缝的,顾客的问题经过交流,得到闭环被完美地解决,这是人机协作的方式。
媒体:有没有调研这样会节省多少成本?
何晓冬:很难直接算,如果没有机器的话电话需要很长时间才能接待,有机器的话可以使在没有人的时候也可以很好地接待。具体的数字要查一下,由于人工智能的接待,在618高峰期可以超出人工客服的价值。
媒体:政务系统有普适性的概念,能不能再聊一下?
何晓冬:比如说在大同市落地了智能“12345”市民热线,12345是为了让市民向政府反馈问题、解决问题。之前是通过话务员接待的,但高峰期往往电话打不进来,所以通过智能化处理百分之百保证每个电话都可以接起来。
人工智能落地的时候遇到一些很有启发的点,希望智能系统被每一位市民使用,让每一位市民受益。实际落地的过程中会发现陕西大同市民说话有很强的口音,所以需要对带有很强口音文字也进行识别。
还有老年市民说话停顿时间比较长,基于声学的语音检测不能检测到市民是说完了还是没说完,这次通过更加融合性的智能技术,更好地检测顾客是否说完了,及时给予回复。
使得人工智能系统不光只是存在于实验室里,而是真正落地场景,使每一个市民普惠地享受到智慧的便利性。
媒体:通过数据再延伸让AI进行学习,更好地普惠市民。
何晓冬:对,数据使得AI学习到市民需求,反过来适应市民需求,给市民提供更好的服务。
媒体:谢谢!