回复31楼:真正的AI专家都心知肚明所谓的“蒸馏”只是在业界常用的“雕虫小技”,真正的AI专家都不屑拿出来谈论。以前AI大模型公司需要购买海量人工标注好的数据来训练,例如用1万张人工标注为狗的图片来训练大模型,然后用另外2千张标注为狗的图片来验证训练过的大模型来算准确率。所谓的“蒸馏”的方法是依靠已经训练好的AI大模型代替人工来“标注”图片用于训练、验证新的大模型,其好处是购买API的费用要远低于购买人工标注的数据,如果是自己的大模型就相当于免费。但是如果原始大模型有误判,那么新的大模型就会在错误的道路上一路狂奔得不偿失。所以一般业内一般会用“蒸馏”出来的数据做为验证之用,可以节省部分成本而已。哪怕DeepSeek“蒸馏”了OpenAI也是付了钱了,可以帮助OpenAI摊平购买原始数据的成本。其实OpenAI自己才是真正的恶劣,有内部“吹哨者”因为揭露OpenAI疯狂“白嫖”(蒸溜)出版社、网络作者的知识产权而“被消失”。