陈伟霆曾舜晞九门浴池肉搏
大模型创业公司,为什么越来越多在往“小”做?_蜘蛛资讯网

微软的Phi系列是这条路上的标志性产品。Phi-3用3.8B参数做出了能对标 70B模型的部分能力,证明了“小模型 + 精选数据”路线的可行性。Meta的Llama 3.2在2024年下半年推出1B / 3B版本,明确标注“为端侧设计”。Google的Gemma系列走类似路线,开源出来供整个生态用。
; 这是反互联网常识的。过去二十年,规模意味着壁垒,规模也意味着利润。但大模型这门生意,规模意味着持续的算力消耗,因为每一次用户和 AI 的对话,背后都是真实的电费和GPU折旧。 更尴尬的是,这条曲线没有明显的下行点。模型再大、能力再强,单次推理的边际成本依然摆在那里
当前文章:http://v5g3mx.yueduge.cn/8ywp3/onzu.xlsx
发布时间:03:08:38











