杨一帆：万物互联时代智能化交互的目标及后续的探索-杨一帆1的专栏

杨一帆：万物互联时代智能化交互的目标及后续的探索

2022-05-20 12:32:18栏目：默认栏目 IP属地：IP未知

杨一帆

中国移动杭州研发中心AI产品经理

观点摘录：

信息处理更加综合、交互手段更加智能、交互过程可理解是智能化交互的目标。智能交互服务建设有助于整个万物互联生态的构建和各行业应用的推广。智能化的交互方式可以弥补传统交互在信息互通方面的不足，融合了多类技术的多模态拟人化的交互方式将成为智能交互发展的未来。

发言内容：

今天我们进入一个万物互联的时代，这时候信息的交互，不仅是人与人之间的信息交流，还涉及大量设备之间的信息的互动，对智能化的交互水平要求极高。

在一些家庭IoT以及一些语音交互、视觉交互方面，涉及几个关键的地方，主要总结出有信息处理更加综合、交互手段更加智能、交互过程可理解这三个主要的智能化交互的目标以及后续实施的办法。

第一个，就是信息处理更加综合。未来的物联网设备将会更加的智能、自动化，主要是用来替代更多的人力资源，用来解决效率问题。这些交互在互动的过程中，交互的信息就不仅仅是单个的，不仅仅是涉及语音，可能涉及语言、图像、数据输入等多维数据，现在城市大脑对交通信号灯的研究，通过判断车流量的情况，以及判断不同路口的堵塞情况，能够对路口交通进行更加人性化的灯光指示方案。再比如自动售货机在通过选择货物并支付的时候，在万物互联的时代，可以通过刷脸的方式关联用户自己的账号，刷脸完成之后用户可以拿走物品并进行自动的结算。

第二个，重点是交互手段更加智能。怎么评价智能化的水平？需要依托更加智能的语音交互或者自动驾驶等技术，目前来看，评价手段相对清晰。比如说语音交互已经不是简单的人机对话了，而是给用户一种可以进行思考的对话方式。目前在自动驾驶这边，也不是简单的通过加油踩刹车，以及方向盘这种方式，而是可以判断路况信息进行应急的一些处理，这些都是智能化的表达方式。

在评价智能化水平方面，中国移动与业界的厂商一起讨论，并在去年提出了智能家居人机交互AI能力评价标准这一项团体标准，在语音方面按照语音的采集与识别，语音理解、语音合成、语音播放、语音智能交互等方面，对智能语音的成熟度进行了等级划分。之前是提出了从无语音智能到辅助类语音智能，到部分语音智能，到条件语音智能，到高度的语音智能以及全部语音智能这五级分发。在这个分级上也通过在能力的主体，由原有的人类转换到人类与机器共同进行，作为能力主体，以及完全由机器作为主体进行能力的转换。在应用场景上也由原有的现定的一些场景到一些需要在危险情况下支持的语音交互场景，以及到一些所有场景都进行语音能力的交互。

第三个要重点攻关的地方是交互过程的可理解性。为什么要把交互过程的理解性放在这么重要的位置？因为目前智能化水平发展到一定阶段，对商业化在一些敏感的领域，比如说像自动驾驶、医疗等一些领域的时候。原有的商业逻辑以及商务业务的原因，对技术迭代过程产生了巨大的阻力，原因是在一些商业逻辑以及伦理法规上需要一个非常稳定以及可追踪的责任明细与分发，而传统的智能化系统相当于是一个黑盒子，无法同整个模型交互中获取任何信息。比如说用户在进行家电管控的时候，我们可能既管控了台灯，管控插座，管控空调。但如果用户语音能力推广力度扩大，在一些涉及危险性的家电，比如说煤气灶等一些更加广泛家电的时候，在一些场景追踪和分发路径上就需要对用户明确的反馈，以及可控的每一个路径，需要把智能化系统的结果是什么、过程怎么执行，要对用户有一个实时反馈。

业界为了解决智能化系统这个可理解的问题，也提出了可解释AI概念，可解释AI主要是为了解决用户面对智能化系统黑盒的问题，能够知道用户需要想知道AI系统，第一个是为什么这么做，第二个是AI系统什么时候可以智能成功，以及在什么场景下用户可以信任这个AI系统，以及用户要知道AI系统在执行过程中是因为哪一个环节做错了。

智能交互服务是为消费者提供可理解的自动化交互过程服务的，并需要在此过程中建立信任感。因为只有让用户在使用AI系统的时候具备一种信任感，他才能更加放心的使用智能化的交互工具，以及使用不同厂商，包括中国移动、小米、海尔、科大讯飞、华为等厂商提供的智能化的大脑，才能有助于整个万物互联生态的构建和智能化服务的推广。

智能化的交互方式可以弥补传统交互在信息互通方面的不足，在可预见的未来，包括对话的指令、视觉、语音互动等交互方式都会有各自的应用场景，后续会融合多类技术的多模态拟人化的交互将成为人机交互发展的未来。