回复18楼:都快一个星期了,除了被打脸的行业竞争对手、无良反华政客及一帮无脑狗粮还在炒作所谓的“蒸馏”可能违法以外,没有一个AI顶级专家提出质疑甚至懒得谈论,因为所谓的“蒸馏”只是在业界常用的“雕虫小技”。以前AI大模型公司需要购买海量人工标注好的数据来训练,例如用1万张人工标注为狗的图片来训练大模型,然后用另外2千张标注为狗的图片来验证训练过的大模型来算准确率。所谓的“蒸馏”的方法是依靠已经训练好的AI大模型代替人工来“标注”图片用于训练或者验证新的大模型,其好处是购买API的费用要远低于购买人工标注的数据,如果是自己的大模型就相当于免费。但是如果原始大模型有误判,那么新的大模型就会在错误的道路上一路狂奔得不偿失。所以一般业内一般会用“蒸馏”出来的数据做为验证之用,可以节省部分成本。
其实OpenAI自己更加恶劣,有内部“吹哨者”因为揭露OpenAI疯狂“白嫖”剽窃了网络上大量公共知识产权,然后说这是自己的私人资源而“被自杀”。