你想要确定的Agent和Prompt,从根上就错了。 刚才我看到这样一个提问:

风吹柳絮飘满天 2025-10-09 22:49:37

你想要确定的Agent和Prompt,从根上就错了。 刚才我看到这样一个提问: 我们可以用integration tests和unit tests来保证代码功能。我们如何保证agent功能?假如我修改了一行prompt,如何保证这个修改不会带来bug? 核心意思就是希望能够检测大模型的输出结果,要一定符合预期。 这个问题的本质就是错的,大模型本质是一种用海量数据和计算学习世界规律的通用函数逼近器,既然是逼近,就不是确定。所以你的prompt一定是一定范围内的可控,是不可能实现完全精确。 所以你看现在大模型大范围的应用时生文、生图、生视频,这些本就无所谓对与错,而是准确不准确,即使是现在做的最好的编码辅助,仍然只是辅助,你想不懂编程让它全部自由发挥,大概率只是营销号的套路。 对于提出的prompt结果检测,唯一的办法是检测输出的数据,而不是测试prompt,如何检测,要看你具体输出什么,用确定的代码和规则检测不确定prompt的输出结果,保证一定范围内可控的正确性,或者保证一定没有错误,但是不能保证精确。 所以简单点说,你要精确就得传统编程,你要开放和模糊逻辑就Ai实现,最好的方式可能是根据你自己的业务,前端Ai+Agent输出结果,传统编程根据具体的垂直领域,精确检测。

0 阅读:1
风吹柳絮飘满天

风吹柳絮飘满天

只会拙笔垦史田,阡陌纵横,当心脚下路