看看PC时代基于文本指令的DOS到基于图形界面的Windows的巨变,瞧瞧智能手机时代按键式功能手机到触屏式智能手机的转变,就能得出一个结论:
——交互方式的改变往往会重塑智能终端设备的格局。
对于AI座舱或智能空间这个新一代移动智能终端,其智能等级的跃迁也体现在交互方式的改变上。
目前,主流智能座舱的人机交互方式是依赖中控屏的触控交互+基于规则的语音交互。
但是,对于一些内部空间相当大的汽车来说,中控屏安装位置的固定性使得很多成员无法方便地使用中控屏,只有文本能力的语音助手根本无法精准理解用户的需求。
所以,当AI能力进一步增强以后,高等级智能座舱必然会走向多模态自然交互。
在这个迅猛发展的AI时代,交互方式的背后是AI模型,座舱越智能,人与座舱之间的人机交互就应该越接近人类的自然感知和交互方式。
AI模型也不可避免地要从单一模态的小模型进化为多模态的大模型。
更具体地说,便是包含视觉(摄像头)、听觉(麦克风)、文本(触摸屏)、触觉(毫米波雷达)多种模态的视觉语言模型VLM。新能源大牛说