谷歌大佬控诉大模型微调的十宗罪

一只产品汪啊 2024-07-11 19:06:20
1.切勿微调(Thou Shalt Not Fine-Tune):尽量写prompt,利用大模型本身的能力zeroshot,必要时辅以少量样本(few-shot examples)或检索增强生成(RAG)。 2.务必调prompt(Thou Shalt Write a Freaking Prompt):用一个prompt创建一个baseline,并通过写prompt证明这个场景或者任务是可行的。 3.好好搞数据(Thou Shalt Review Thy Freaking Data):如果必须微调,确保你完全理解你的数据。大力修正问题数据。数据质量直接决定模型质量。 4.用真实的数据(Thou Shalt Use Thy Actual Freaking Data):确保训练数据尽可能接近生产环境中模型将处理的数据。 5.必须保留测试集(Thou Shalt Reserve a Test Set):始终保留一部分数据用于测试,以评估模型的性能。 6.必须选择合适的模型(Thou Shalt Choose an Appropriate Model):根据任务和预算选择适当的模型。不要使用过大的模型,也不要使用过小的模型。规模和参数量要匹配任务难度。 7.必须小步快跑评估(Thou Shalt Write Fast Evals):编写快速计算的评估指标,可以自动化计算的指标,不管是来源于规则或者模型,以便快速迭代。 8.必须慢工细活评估(Also, Thou Shalt Write Slow Evals):花点时间编写更全面,更可靠的评估标准和评估指标,别管这些指标比较麻烦,设置要推理更大的reward模型,或者需要人工标注。 9.不要即发即弃(Thou Shalt Not Fire and Forget):不要执行一次性的模型训练后就结束。持续优化模型和pipeline。 10.别太认真(Thou Shalt Not Take the Commandments Too Seriously):不要死板地遵循这些建议。根据具体情形调整建议的适用性。

0 阅读:0

评论列表

SUBINGFENG

SUBINGFENG

2
2024-07-12 13:42

求ppt

撄宁

撄宁

2024-07-12 12:32

求PPT

小鱼儿与。。。

小鱼儿与。。。

2024-07-12 12:57

一键三连求ppt🙏

一只产品汪啊

一只产品汪啊

感谢大家的关注