多通道人机交互系统的需求与功能分析
详细研究车辆环境下的多通道交互设计。本章以氛围灯系统与交互系统的联动为出发点。要对基于氛围灯控制的多通道交互任务进行设计,首先必须了解用户的需求,确定产品的功能。由于多通道交互产品尚未普及,通过对使用传统座舱控制系统的用户群体的调研,挖掘目标用户群体在使用中遇到的问题及其对多通道交互的实际需求,作为后续设计的依据。经过用户调研,确定交互系统的总体功能需求,进行概念设计,结合现有氛围灯系统的使用流程,绘制系统的用户行程图,分析使用过程中可能遇到的痛点,并找出设计中的机会点和关键点。
3.1汽车驾驶环境与人体感官分布
车舱的人机交互系统一般需要包含视觉、听觉、触觉三类感官系统,驾驶者在驾驶过程中通过感官系统完成控制任务,达到交互目的。本章主要是研究和说明行车途中手势交互、语音交互以及眼动追踪的交互,不涉及触控感官系统,人体的各种感官系统在驾驶环境中的分布如图XX所示。
3.1用户调研
汽车的车内氛围灯和手势、语音等操作方式是较新的配件和功能,很多传统的汽车上没有安装和配置,需要另外选配。经过走访汽车4S店和参观上海车展发现,较为高端的汽油车和新能源汽车会将这些作为基本配置安装在车舱内,故本次用户调研的主要车型限定为乘用车的高配车型和新能源汽车。为了解用户对多通道交互系统的需求,采用用户访谈和实地观察的方式了解驾驶者的使用习惯和对新的操作方式的需求。本次调研共选取6名车主,其中男性3名,女性3名;年龄在28-45岁之间,驾龄均在3年以上,都曾经使用过氛围灯和语音控制功能。
3.1.2用户访谈
访谈的主要内容有用户是否了解氛围灯的功能、氛围灯带给用户的感觉是什么、和氛围灯的交互需求、使用语音交互功能时遇到的问题、用户对手势或语音交互的接收程度等,访谈的提纲如表XX所示。
序号
|
问题
|
1
|
你了解氛围灯吗?觉得氛围灯带给你什么感觉?你觉得氛围灯以后会成为汽车上的基本配置?
|
2
|
目前使用过氛围灯的哪些功能?还想氛围灯增加哪些功能?
|
3
|
使用氛围灯的过程中有没有感受到不方便的地方?有试过使用语音控制氛围灯或者其他的系统功能吗?
|
4
|
有没有体验过语音控制和手势控制的经历?说说你对这种新的交互方式的感受。
|
5
|
你平时驾车的状态是怎样的?出现过驾驶分心或者疲劳出现意外的状况吗?
|
6
|
你认为视线范围内的灯光变化和声音能让你从疲劳或分心状态中脱离吗?什么样的声音和光线对你的刺激比较大?
|
7
|
如果有一辆车可以使用手势和语音控制,能通过摄像头检测你的疲劳状态和分心程度,并通过氛围灯的灯光变化和声音来提醒你,你会有兴趣去体验吗?你对此有什么期待?
|
通过对用户的深度访谈的结果进行整理,得到以下要点:
(1)年轻的汽车用户和新能源车的用户对认为氛围灯是一个必要的汽车配件,选择安装氛围灯的原因是它能提升汽车的品质感,让人在驾驶过程中有更好的体验。年纪较大的用户认为氛围灯的功能可有可无,不会对驾驶过程产生明显影响,但在夜间行车途中会降低氛围灯亮度,担心车内光线干扰自己的视线。
(2)用户使用氛围灯程序复杂,需要多次点击界面命令。灯光的颜色和灯效单一,没有用户想要的灯光色彩和灯效变化。有些访谈对象希望通过氛围灯让自己的车变得更加有个性。
(3)除了触控操作方式,用户使用最多的是语音控制功能,手势控制功能基本没人用过,也不知道如何使用。认为未来的汽车操控方式会更先进,语音和手势是未来的发展趋势,但希望有简单易学的指南来学习这些新的操作方式。
(4)语音操作简单便捷,但容易被噪声干扰,识别率有时候也不高。用户经常是在开车过程中使用语音控制功能,因为开车途中不方便用手控制界面,担心视线离开路面会发生危险。
(5)用户的驾车场景大多数是开车上下班以及周末开车出门放松,在车内有播放音乐习惯,有时候会接听电话和看手机信息,车内安装有车载氛围灯,设定了自己喜欢的氛围灯颜色,认为这种颜色会让自己心情愉悦。
(6)访谈者期待新的交互系统能更好的服务驾驶者开车,在分心的时候给予提醒,语音控制能准确识别用户指令,其他新的交互方式不需要占用太多的记忆资源,系统简单易学。希望氛围灯能有更多的功能,不仅仅体现在灯光颜色上,而能随着交互形式的变化而变化,带来更多的乐趣。
3.2用户画像
通过对目标用户群体的问卷调查和访谈,收集目标用户的行为特征,采用用户肖像法构建虚拟用户角色,从用户角度了解他们的痛点和需求。根据前面的分析和研究结果,构建了用户肖像。以下是用户肖像定义:
根据用户画像,本文模拟了费翟平时开车的驾驶情况,从中发现他在行车阶段会遇到的一些交互问题,并给出相应的设计建议,如图XX是模拟的行车路线图:
周五下午5点半,费翟结束了一周的工作,准备下班和朋友一起打球。来到停车位,启动汽车引擎,随着车辆启动,氛围灯随之点亮,费翟打开音乐,播放自己平时听的歌单,调节氛围灯亮度,开启导航,设定目的地,跟随导航的路线驾驶车辆,前方道路拥堵,费翟踩下刹车减速,并拿出手机浏览信息,通过拥堵路段,拨打电话给好友约他出来打球,两人在电话中互相商量好了时间和地点,放下手机后转向到另一条主干道,道路车辆众多,需要减速慢行,此时费翟想听最近的流行曲,左手扶方向盘,右手控制旋钮,视线注意力分散到中控界面选择歌单,新歌单设置完成,调节到合适的音量,重新将视线转移到路面,好友发来信息,费翟看了几眼手机,发现更改了集合地点,给朋友发语音询问新的地点,得知新地点后重新设定导航路线,顺利到达,停车,行程结束。
3.3驾车模拟实验
基于费翟这个角色,在上文中模拟了他平时的开车状况,驾车过程中的一些操作分散了费翟开车的注意力,加大了出现交通意外的概率。为了研究驾驶者的在驾驶过程中的分心情况,本文设置了驾驶分心模拟实验来检测人员的分心频率和时长。
3.3.1实验准备
模拟实验是利用摄像头捕捉眼球视线的方式来实现,运行原理可以参本文的2.3.3眼动交互部分。实验是在笔记本电脑上操作,使用Python语言进行编程,版本是Python3.7.9,运行内存16G,显卡是NVIDIA GTX1060,外置设备有高清摄像头和iPad平板电脑,电脑播放行车视频模拟开车,摄像头捕捉人眼图像,iPad模拟汽车的中控界面,实验场景如图XX所示。
3.3.2实验过程
从上文的访谈对象中选出3名被试者,准备好设备仪器,带领被试熟悉环境,告知被试者实验目的及流程,为其演示操作过程,让被试者能基本领略实验意图。
实验任务是按照模拟路线图中的7个任务展开测试,[此处需要查询<基于驾驶分心行为的车载信息装置测评研究>P44]Land的研究表明,专注时间和任务类型相关,最短平均专注时间为150ms。Reyner的研究表明,在阅读时,平均注视时间为225ms。因此,本文将驾驶员视线停留在目标区域大于250ms的片段定义为专注,驾驶员视线离开目标区域大于250ms的片段定义为分心。实验数据见表XX所示,危险等级根据分心时长和驾车场景来判断。
编号
|
操作内容
|
路况
|
分心平均时长
|
危险等级
|
1
|
调节氛围灯、打开音乐和设置导航
|
—
|
—
|
安全
|
2
|
浏览手机讯息、打电话给朋友
|
塞车路段
|
12.3s
|
较危险
|
3
|
切换歌曲、调节音量
|
正常行驶
|
6.1s
|
危险
|
4
|
看微信消息
|
正常行驶
|
1.71s
|
较危险
|
5
|
回复微信消息
|
正常行驶
|
4.76s
|
危险
|
6
|
等红灯时重新设置导航
|
停车等红灯
|
25.49s
|
较安全
|
7
|
到达后停车
|
—
|
—
|
安全
|
从上表中可以发现,用户在驾驶过程中的诸多操作有存在安全隐患,很多操作都会分散驾驶者的注意力,大大超过了分心的阈值,于驾驶安全不利。综合用户访谈和模拟实验的数据,在设计多通道交互系统时需要着重考虑以下几点:
(1)自然的交互过程和舒适的交互体验。传统的车内交互系统在使用过程中,收到技术条件限制,触控和按键过程需要用户分配更多的注意力,带来驾驶安全问题,多通道交互系统中的语音和手势交互则不需要占据用户太多的视觉资源,可以凭借“盲操作”实现对系统功能的控制,用户能以一种更加轻松的方式给自己的车发送指令,从而获得“享受服务”的体验感。
(2)操控感和乐趣性。根据访谈的反馈,用户注重交互过程中的乐趣性,车内的氛围灯可以作为提升趣味性的汽车部件,设置更多的灯效和互动效果,操作的形式和动作也应符合审美要求,给用户以未来感、科技感,吸引更多用户来体验和驾驶。
(3)多样、有效的警示功能。驾车最重要的就是安全性,能够让用户平安到达目的地,构建多通道交互系统应该有助于提升驾驶的安全性,而不能增加用户的记忆和操作负担,反而降低了用户的驾驶体验。良好的交互系统,应该是有完备的危险警示系统,帮助用户在行车过程中保持注意力在驾驶任务上。同时,可以监测用户的驾驶状态,通过声、光的形式告知用户危险和告警信息,为用户提供指导和帮助。
(4)简单易学的操作指南。使用应尽可能方便,学习过程简单,使用过程方便,学习成本不应过高,不应造成用户记忆资源的负担。
3.4总体功能分析和设计架构
3.4.1总体功能分析
通过对目标用户的深度访谈和刻画用户肖像,确定了车载多通道交互系统的主要功能需求,系统除了具备传统的触控和按钮控制方式外,还应具有手势控制、语音控制、疲劳分心检测,眼动追踪、灯光警示和警报声提醒功能,如图XX所示。
(1)手势控制功能:使用图像摄像头检测用户的手势变化,对特定的命令手势会运行相应的软件系统,能够做到对用户静态和动态手势的识别,可以用来控制音量变化、切换歌曲和切换界面等功能。
(2)语音控制功能:用户通过语音唤醒来唤醒此功能呢,并和系统进行对话,发出指令词,系统识别到指令词后触发相关的功能,可以用来控制音乐播放和音量控制。
(3)疲劳分心监测功能:用来监测用户是否处于驾驶疲劳状态,主要是通过辨别用户的非驾驶行为如抽烟、打哈欠、闭眼,当驾驶员有以上行为并超过时间阈值,通过灯光提示或声音警报功能提示驾驶员集中注意力。
(3)眼动追踪功能:追踪用户的眼球视线,监测用户的视线方向,当用户视线从路面移开超过阈值,提醒用户及时移回视线。
(4)灯光提示功能:利用车内分布的氛围灯变换灯光效果来提醒用户,可以根据危险程度变换模式。
(5)声音警报功能:与灯光提示功能互为补充,在用户视觉通道资源被占用的情况下,调动听觉通道来完成提醒的功能。
上述的主要功能在前文中已经描述过技术实现的细节,此处不做详细介绍,按照当前的深度学习的广泛应用和在线智能平台的成熟,这些功能的实现在技术上没有太大的难度。
3.4.2设计架构
根据对用户需求的调研和对系统的功能需求分析,多通道交互系统总体可以分为硬件平台和软件系统两大部分,硬件部分包括嵌入式开发平台、音箱、电容式麦克风、眼动追踪摄像头和疲劳分心监测摄像头,软件系统包括手势识别模块、语音识别模块、眼动追踪模块、疲劳分心监测模块和
CAN信号发射模块,总体构成如图XX所示。
为了全面展示系统的设计过程,下面将介绍系统的软件部分和硬件部分。
(1)软件模块
CAN信号发射模块是用来给氛围灯灯带发送控制指令,是嵌入式平台和灯带之间的通讯模块,其他模块识别到用户指令后,如果需要调动灯光效果,需要CAN信号发射模块发送特定的字符给灯带,然后灯带作出相应的变化效果。
手势识别、语音识别、眼动追踪和疲劳分心监测模块在第二章中都有详细介绍,此处不做过多解释。
(2)硬件设备
a) 嵌入式平台
NX是NVIDIA开发的模块系统,相当于一台小型计算机,可以为边缘系统提供超级计算机性能。NX拥有最高21TOPS的加速计算能力,可以并行运行现代神经网络,并处理来自多个高分辨率传感器的数据。虽然外形小,但性能强,能够满足系统开发的要求。
b) 电容式麦克风和音箱
麦克风和音箱是语音识别的输入和输出设备,为了保证录音的效果,选择了江实电容麦克风,可以有效减少噪声对用户语音指令的干扰,音箱的品牌是JBL,为用户提供立体声,实物图如图XX所示。
c) 摄像头
摄像头选用了罗技的高清摄像头,分辨率是720P,获取的图像清晰可分辨,对后面的深度模型的识别效果有利,后续在模拟台架上会用车规级摄像头替代,摄像头实物图如图XX所示。
d) 灯带
灯带主要是由LED灯珠组成,本文选用了光宝LTSA-G353作为LED灯珠,单条氛围灯由58颗LED灯珠串联组成,如图XX所示,每一颗灯珠都可以控制产生不同的光色变化,灯珠之间的明暗闪烁组成了灯带的炫目灯效。
3.5设计要点总结
在确定了系统的总体功能和系统软硬件组成后,绘制了用户体验图,从用户的角度描述了用户使用交互系统的全过程。根据以上问题和设计要点,绘制用户多通道交互流程图(图XX),为后续设计打下基础。
(缺少一幅用户交互过程图)
按照显示的驾乘过程,交互系统的使用分为驾驶准备、开始使用、塞车慢行、正常行车过程中、等待红灯、驾车结束7个阶段。
驾驶准备阶段,此阶段是用户开车前的准备阶段,从用户打开车门开始,氛围灯在地上投影出欢迎的字样,车内的灯光打开,启动迎宾效果,用户坐进驾驶舱后系上安全带,启动引擎,通过语音唤醒功能唤醒系统,系统在和用户对话时,会通过车舱前部的灯光律动效果和语音反馈给用户已接收到指令。用户通过语音设置导航目的地,驾车开始。
开始试用阶段,摄像头实时监测用户的面部状态和驾驶状态,捕捉用户的眼睛位置和闭合程度,检测是否有驾驶分心行为。当用户有抽烟、打电话的动作,系统依据分心时间给予提示,当时间超过阈值,视线前部的灯光变成代表警示的黄色并伴随律动效果,当时间过长处于危险状态时,视线前部的灯光变成代表危险的红色,律动效果更加急促并伴随警报声。
塞车慢行阶段,此阶段用户常常会有烦躁的情绪,氛围灯可以调整亮度和动效,安抚驾驶员的情绪[文献引用]。
正常行车阶段,车内一般会播放用户喜欢的音乐,此时车内氛围灯的灯效是根据音乐的律动而律动,当用户在行车过程中有切换音乐、调整音量之类的需求时,音乐功能可以通过语音和手势识别操控,可以用特定手势或者语音识别切换歌曲。
等待红灯阶段,用户会在等待过程中查看手机信息和回复讯息,容易分心时间过长,提示功能会让用户及时将视线和注意力移回。
驾驶结束阶段,用户到达目的地,准备下车,车内灯光展示送别效果并发出再见的提示音。
3.6本章小结
本章首先明确了对多通道交互系统有需求的目标用户群体,使用用户深度访谈的方式了解目标用户在使用现有的车内交互系统中遇到的痛点和设计机会点,通过模拟驾车路程和模拟实验发现了用户在驾车途中的交互操作可能出现的安全问题,确定了多通道交互设计应该注意的设计要点和设计需求,并搭建了系统的软硬件架构图,最后给出了设计后的用户交互过程,绘制出了用户多通道交互过程图,明确了多通道交互的设计优势,为下文的设计实践奠定了框架基础。