大模型开源和闭源比较 (李彦宏开源模型会越来越落后)

两个阵营一场硝烟

近来,人工智能大模型的开源与闭源之争愈演愈烈。一边是谷歌、Meta、xAI等科技巨头,纷纷拥抱开源大潮,大手笔开源超级大模型;另一边则是百度、OpenAI这样的"闭源派",执着于闭源路线,力保技术优势。

这样的分野,也从侧面凸显出双方在商业布局上的矛盾。开源阵营希望借助全球化的开发力量,加速技术迭代,赢得更广阔的市场;而闭源派则寄希望于独占先机,垄断话语权,从中渔利。

大模型开源涨停,大模型开源和闭源是什么意思

开源军团蓄势待发

谷歌、Meta发起的开源进攻,可谓是呼啸而至。

5月,谷歌宣布将旗下超大型语言模型Gemini开源,号称"不逊色于GPT-4"。据悉,Gemini不仅在多项benchmark测试中胜过GPT-4,其支持数十种语言,且可应用于多种领域。

紧接着,Meta也火力全开,接连开源多款大模型。首款开源大模型LLaMA堪称万模型之祖,参数量最高达1.6万亿,技术实力不容小觑。

大模型开源涨停,大模型开源和闭源是什么意思

更重要的是,Meta还公布将在6月发布下一*开代**源大模型LLaMA 3,其参数量有望突破1400亿,向GPT-4直接宣战。业内人士分析,LLaMA 3将支持多模态能力,成为对标GPT-4的有力*器武**。

开源为王?并非绝对

大模型开源涨停,大模型开源和闭源是什么意思

面对开源大军压境,百度做出了与众不同的选择——坚持闭源。

李彦宏在内部信中解释了这一决策的原因。他认为,虽然开源大模型也相当出众,但终归"零零散散、小规模",缺乏大算力验证。反观闭源大模型,在算力和人才聚集的加持下,能力将持续领先。

大模型开源涨停,大模型开源和闭源是什么意思

"只要是同等能力,闭源模型的推理成本一定更低,响应更快。反之,在同等参数下,闭源模型也更强大。"李彦宏说。他相信,通过大模型降维压缩,闭源模型不仅在性能上优于开源,在成本效率方面也将占据上风。

不过,很多人对李彦宏的判断存有异议。 360董事长周鸿祎认为,美国开源大模型背后其实都有大公司支持,开源与闭源的技术差距已不太明显。他断言,开源大模型生态发展迅速,终将赶上甚至超越闭源模型。

大模型开源涨停,大模型开源和闭源是什么意思

赚钱至上的算盘

倘若技术实力暂时不及闭源,那么开源阵营为何仍觉"势单力薄"?答案或在于双方的商业算盘有别。

开源模型虽然能借助全球开发者的力量加速迭代,但如何变现并不明朗。李彦宏坦言,自家内部也曾考虑过开源,但最终放弃,因为"要维护开源版本,成本太高而且难以盈利"。

相比之下,百度的闭源大模型能更好地植入商业化应用,直接"拿钱办事"。李彦宏再三强调,文心大模型的功能最全、性价比最高,不会被取代。他巧妙地暗示,若创业者们都来用文心,百度自然就会赚大钱。

大模型开源涨停,大模型开源和闭源是什么意思

弃疑窥豹的机会?

对于百度的闭源路线,外界也有不少质疑。

首先,开源能否追赶上闭源,现在并无定论。科技日新月异,任何已成事实都可能被颠覆。过度自信于当下领先优势,未免有些短视。

其次,闭源也非保密码,难保核心技术不被逆向剖析。开源模型终将达到一定规模,凭借交互数据,很可能复现闭源模型的运作逻辑。

大模型开源涨停,大模型开源和闭源是什么意思

因此,百度若固步自封,未免是一种"见猎心喜"的思维,反而错过研究开源模型并从中受益的机会。

马拉松且行且珍惜

总的来说,开源与闭源阵营的较量,可谓硝烟弥漫,暂时难分伯仲。

双方各执一词,矛盾暂时难以调和。但不可否认,两种模式互有利弊,从不同侧面推进了人工智能的发展。

如同技术创新一样,开放与封闭其实并非对立,而是相辅相成,只有将二者结合,方能贯彻始终,赢得最终的马拉松胜利。