大模型百模大战 (百模大战已经发布的模型)

国产大模型仍然“涨势”喜人，已经达到74个（见表一），以这个速度，百模的目标指日可待！接下来需要思考的是如何评价各个大模型，以评出大模型的“百大排行榜”。另一方面，在持续增加的大模型中，北京的占有率依然保持在50%以上【见图一】，这波浪潮对北京来说，真宛若互联网浪潮那一波了！

本周新增的大模型中，有两个开源的基础大模型值得一说。

一个是百川智能开放了 baichuan-7B，在多个评测中号称中文第一。
另一个是智源开放了悟道天鹰的*载下**，也是7B参数规模的大模型。

国产大模型在开源开放的道路上走的越来越好了，但遗憾的是，目前国产大模型还继续走在吹牛的路上，好用的几个都是7B 这个规模的，这距离真正意义上的大模型（能够打好 AGI 基础的）还非常远。下一步是期待100B 以上的开源开放国产大模型。

说到这个，继续建议国家队入场，完成以下三个事情：

1. 国家主导训练一个1T（1万亿，GPT4的规模）参数规模或更大规模的国产开源开放基础模型，允许商用，最好是无限制的商用。

2. 大模型的智能水平（如认知科学或心智模型等）的评估，包括数据集和评估工具等。这个出发点是 AGI 的智力评估，类似对人的智力和专业能力的评估一样。

3. 开放符合社会主义价值观和中国公序良俗的训练数据集，包括大规模无监督的语料以及 SFT或 RLHF 的训练数据集等。

国家队搞基础模型、数据等既有助于追赶国际最高水平，同时也能够避免资源浪费，符合碳达峰碳中和的目标的。

说到 AGI，除了基础大模型之外，还需要做到以人为本，要尊重事实和知识，做到“知之为知之，不知为不知”。以人为本 AGI 则需要其他工具，比如知识图谱。这个论述此前说过多次，摘录如下“以人为本AGI=神经网络大模型 NN ⊕ 知识图谱 KG⊕ 强化学习RLHF。这里面的神经网络大模型负责理解语言，类似人的大脑【连接主义，图灵奖获得者Yoshua Bengio花书《深度学习》】；知识图谱则负责事实与知识，类似人类使用的百科全书【符号主义，王文广的珠峰书《知识图谱：认知智能理论与实战》】；强化学习负责从环境中学习，类似人类的吃一堑长一智实现进化【行为主义，Richard S. Sutton《强化学习》】。”

接下来是详细数据。首先是大模型列表，原始数据放在Github 上随时更新：https://github.com/wgwang/LLMs-In-China 。欢迎大家给 PR，给 Issue，或者评论里补充遗漏的大模型。V5版本的国产大模型观察见表一。按城市的数据统计见图一。

表一：国产大模型列表，V5版本，收录74个

序号

公司

大模型

省市

官网

百度

文心一言

北京

✔

科大讯飞

星火

安徽合肥

✔

达观数据

曹植

上海

✔

阿里云

通义千问

浙江杭州

✔

复旦大学

MOSS

上海

✔

清华大学

ChatGLM

北京

✔

华为

盘古

深圳

✔

智源

悟道·天鹰AQUILA

北京

✔

哈尔滨工业大学

本草

黑龙江哈尔滨

✔

贝壳

BELLE

北京

✔

百川智能

baichuan

北京

✔

OpenBMB

CPM

北京

✔

上海AI实验室

书生·浦语

上海

✔

云知声

山海

北京

✔

澜舟科技

孟子

北京

✔

深思考人工智能

Dongni

北京

✔

中科院

紫东太初

北京

✔

虎博科技

TigerBot

上海

✔

IDEA研究院

封神榜MindBot

广东深圳

✔

微盟

WAI

上海

✔

360

智脑

北京

✔

度小满

轩辕

北京

✔

华南理工大学

未来技术学院

扁鹊,

灵心SoulChat

广东广州

✔

西北工大+华为

秦岭·翱翔

陕西西安

✘

奇点智源

Singularity

OpenAPI

北京

✔

超对称技术公司

乾元

北京

✔

稀宇科技

MiniMax

上海

✔

西湖心辰

西湖

浙江杭州

✔

晓多科技+国

家超算成都中心

晓模型XPT

四川成都

✘

中科闻歌

雅意

北京

✘

北京语言大学

桃李

北京

✔

商汤科技

日日新

上海

✔

国家超级

计算天津中心

天河天元

天津

✘

星环科技

无涯、求索

上海

✘

慧言科技

天津大学

海河·谛听

天津

✘

宇视科技

梧桐

浙江杭州

✘

电信智科

星河

北京

✘

左手医生

左医GPT

北京

✔

智慧眼

砭石

湖南长沙

✘

好未来

MathGPT

北京

✘

数慧时空

长城

北京

✘

理想科技

大道Dao

北京

✘

硅基智能

炎帝

江苏南京

✘

中工互联

智工

北京

✘

创业黑马

天启

北京

✘

追一科技

博文Bowen

广东深圳

✘

网易有道

子曰

北京

✘

网易伏羲

玉言

广东广州

✘

昆仑万维

天工

北京

✔

知乎

知海图

北京

✘

医疗算网

Uni-talk

上海

✘

孩子王

KidsGPT

江苏南京

✘

中科创达

魔方Rubik

北京

✘

腾讯

混元

广东深圳

✘

拓尔思

拓天TRSGPT

北京

✘

乐言科技

乐言

上海

✘

清博智能

先问

北京

✘

智子引擎

元乘象

江苏南京

✔

拓世科技

拓世

江西南昌

✘

循环智能

盘古

北京

✔

印象笔记

大象GPT

北京

✘

第四范式

式说

北京

✔

字节跳动

Grace

北京

✘

出门问问

序列猴子

北京

✔

数说故事

SocialGPT

广东广州

✘

云从科技

从容

广东广州

✔

电科太极

小可

北京

✘

中国农业银行

小数ChatABC

北京

✘

麒麟合盛

天燕AiLMe

北京

✔

台智云

福尔摩斯FFM

台湾

✔

医联科技

medGPT

四川成都

✘

理想汽车

MindGPT

北京

✘

港中文深圳

华佗GPT

广东深圳

✔

长虹

长虹超脑

四川绵阳

✘