图1-图4,是我遇到的「限流场景」,车流被引导出主路,紧邻的下个入口可以重新回到主路。
我、吉吉、摄像老师,通过几轮对话,看懂了这个场景。但对辅助驾驶、或者自动驾驶来说太难了。
如果导航不能自己更正,车会在辅路直行,不会重返主路。
我把这四张图(图3-图4,是一个时刻的车顶和车内)喂给了通义千问的VL视觉大模型、豆包、DeepSeek R1,都没能搞定。
后来我请帮忙,用他账号,试了gemini pro和chatgpt5,也没戏[笑cry]。所以让机器像人一样思考,完全理解这个场景,我们还有很长的路要走。
对这个内容感兴趣的朋友,可以看下这期节目: