MSCBSC 移动通信论坛
搜索
登录注册
网络优化工程师招聘专栏 4G/LTE通信工程师最新职位列表 通信实习生/应届生招聘职位

  • 阅读:590
  • 回复:0
看完这篇文章 你就知道Siri和小冰的差距在哪了
mao_mao
论坛副管
鎵嬫満鍙风爜宸查獙璇


 发短消息    关注Ta 

C友·铁杆勋章   管理·勤奋勋章   C友·进步勋章   管理·优秀勋章   C友·贡献勋章   “灌水之王”   纪念勋章·七周年   管理·标兵勋章   活动·积极勋章   财富勋章·财运连连   财富勋章·大富豪   财富勋章·小财主   专家·终级勋章   财富勋章·神秘富豪   C友·登录达人   纪念勋章·五周年   财富勋章·富可敌国   财富勋章·财神   财富勋章·富甲一方   财富勋章·钻石王老五   活动·第二届通信技术杯   纪念勋章·六周年   活动·摄影达人   纪念勋章·八周年   纪念勋章·九周年   纪念勋章·十周年   C友·技术大神  
积分 428951
帖子 85066
威望 2294343 个
礼品券 5423 个
专家指数 3621
注册 2009-4-24
专业方向  移动通信
回答问题数 1908
回答被采纳数 173
回答采纳率 9%
 
发表于 2018-08-01 09:52:02  只看楼主 

  微软在上周正式发布了第六代微软小冰人工智能机器人,人们不免将其与苹果的Siri再进行一番比较,而比较的结果几乎是一边倒的,那就是在小冰的面前,Siri实在是有点逊。

  在之前我们面对这样的结论,给出的理由更过是感官上的直接感受,而这一次我们试图通过一些技术层面的解析来搞清楚Siri和小冰之间到底存在哪些差距。

  这里我们主要引入两个概念:全双工语音和共感模型。在此之前我们想稍微聊聊Siri和小冰两者在设计意图上的不同,而这很有可能是导致二者差异的重要原因。

  Siri的设计目标是一个任务型人工智能,她的作用是帮助用户解决具体的问题的;而小冰则从开始就是一个聊天机器人,并不解决具体问题,就是陪人闲聊用的。

  因此,Siri在设计上是以IQ为优先的,而小冰则是以EQ为优先,从这一点上来看,与Siri和小冰的对话交互过程就有明显的区别。Siri更像是机器,而小冰则更像是人,但现在第六代小冰推出之后,也开始附加IQ特性,能够处理一些具体的事务了。

  就人工智能的发展来说,IQ,也就是数据处理方面的研发是相对简单的,而EQ,即情感认知则是相当大的难题,因此微软先EQ后IQ的模式显然更有优势。

  既然我们已经说到了人工智能的EQ塑造,那么小冰到底是通过哪些技术来实现这种情感交互的呢?

  大概在过去四五年前的时候,对话式人工智能成为业界的热门课题,并且绝大多数都选择了任务型或是知识传递型的对话系统,但这种人机交互实际却非常生硬,比如具体到开灯关灯、打开电器上,其实和语音命令之间的区别并不大。

  而全双工语音就是让小冰与其他人工智能交互截然不同的技术之一,这使得人们与小冰之间的交流不再局限于一问一答,而是更加自然的沟通过程。

  举一个例子,当你开着车出去郊游的时候,车载的不是Siri那种可以帮你干这个干那个的人工智能,而是通过全双工的方式进行交流的小冰。她除了会根据你的指令执行任务之外,还会对你的车载音乐发表观点。当你们交流时,她看到远处有一座山,就会和你说这个地方很漂亮,可以下次再来。

  这种感觉不是你在车上安装了一个机器人,而是多了一个真正的副驾驶陪你旅行。

  这就涉及到了一个问题,那就是小冰能够通过视觉捕捉环境信息,这是同样也是微软的研究项目,称为实时视觉,并有一个面向全程的对话引擎。

  值得一提的是,现在小冰的全双工语音已经支持群组功能,利用SpeakerID分类器来判断说话的人到底是谁,甚至听得出这些人的年龄、性别等信息,并以此来进行不同的对话和群聊。

  比如不同的家庭成员和小冰说“我的电话找不到了”,小冰能够区分的出来是谁,并且分别打到他们各自的手机上去。

  比如当一个小孩子对小冰说“打开电饭锅”,小冰能够识别出发出命令的是个小孩子,并由此拒绝执行指令,并劝说小孩远离电器。

  在这里,小冰不再单单是家里的一个智能语音工具,而是一个新的家庭成员,能够与家庭成员之间建立自然的联系。

微软小冰微软小冰

  虽然我们一直都在强调小冰的EQ情商,但大家都清楚人工智能本身是不可能产生感情的,因此小冰的EQ本质上是来自一个基本的情感计算框架。

  从理性的角度来说,一个对话式人工智能的情商,其实是可以控制一个对话全程的能力,能够去控制对话全程的走势,保持一个对话的长度。

  现在这个框架已经从去年的生成模型升级到了共感模型。生成模型就是让小冰可以自创她的回应,而不是像以前一样,从一个已有的语料库中间检索。当她能够自创回应的时候,她就可以有更好的能力去控制对话,有更好的上下文结合能力。

  而共感模型则更进一步,当小冰一方面进行回应的生成时,也同时在运用她的策略来判断是不是应该引导这个对话,然后去主动的进行观察,然后偷偷地进行求证,最后再去确证。比如不停地通过各种方式去反复的尝试人类最关注的兴趣到底是在哪个领域,而一旦确认了对方的兴趣点,在抓住了一个机会之后就可以引导对方在这个领域进行更加深入的交流。

  这个过程中也是保持全双工语音的,而不是你一轮我一轮的“对讲机式交互”,更重要的是这个过程中小冰对于对话是经过情感思考的。

  看到这里大家可能就能够看出,Siri之所以在体验方面与小冰相差甚远,本质上是指令性工具与情感交互系统之间的差距,而我们认为后者无疑才是未来人机交互的发展方向。

  现在的智能家居系统在命令集成方面已经做得不错了,但交互体验仍然不够自然,如果小冰能够更快地渗入这套系统,智能家居产品的体验无疑将变得更加动人。


扫码关注5G通信官方公众号,免费领取以下5G精品资料
  • 1、回复“hw10”免费领取《华为数字化转型之路
  • 2、回复“yys4”免费领取《中国5G频段(700M)及四大运营商竞争力深度分析
  • 3、回复“5gk16”免费领取《《邮电设计技术》2022年第2期论文合集
  • 4、回复“TXSP”免费领取《5G系列深度报告-天线射频篇
  • 5、回复“meta4”免费领取《【腾讯&复旦】2021-2022元宇宙报告
  • 6、回复“hw6g”免费领取《6G:无线通信新征程
  • 7、回复“wlw02”免费领取《物联网产业链全梳理
  • 8、回复“cm6g”免费领取《中国移动 6G 关键技术白皮书
  • 对本帖内容的看法? 我要点评

     
    [充值威望,立即自动到帐] [VIP贵宾权限+威望套餐] 另有大量优惠赠送活动,请光临充值中心
    充值拥有大量的威望和最高的下载权限,下载站内资料无忧

    快速回复主题    
    标题
    内容
     上传资料请点左侧【添加附件】

    {lang