国产大模型仍然“涨势”喜人,已经达到74个(见表一),以这个速度,百模的目标指日可待!接下来需要思考的是如何评价各个大模型,以评出大模型的“百大排行榜”。另一方面,在持续增加的大模型中,北京的占有率依然保持在50%以上【见图一】,这波浪潮对北京来说,真宛若互联网浪潮那一波了!
本周新增的大模型中,有两个开源的基础大模型值得一说。
- 一个是百川智能开放了 baichuan-7B,在多个评测中号称中文第一。
- 另一个是智源开放了悟道天鹰的*载下**,也是7B参数规模的大模型。
国产大模型在开源开放的道路上走的越来越好了,但遗憾的是,目前国产大模型还继续走在吹牛的路上,好用的几个都是7B 这个规模的,这距离真正意义上的大模型(能够打好 AGI 基础的)还非常远。下一步是期待100B 以上的开源开放国产大模型。
说到这个,继续建议国家队入场,完成以下三个事情:
1. 国家主导训练一个1T(1万亿,GPT4的规模)参数规模或更大规模的国产开源开放基础模型,允许商用,最好是无限制的商用。
2. 大模型的智能水平(如认知科学或心智模型等)的评估,包括数据集和评估工具等。这个出发点是 AGI 的智力评估,类似对人的智力和专业能力的评估一样。
3. 开放符合社会主义价值观和中国公序良俗的训练数据集,包括大规模无监督的语料以及 SFT或 RLHF 的训练数据集等。
国家队搞基础模型、数据等既有助于追赶国际最高水平,同时也能够避免资源浪费,符合碳达峰碳中和的目标的。
说到 AGI,除了基础大模型之外,还需要做到以人为本,要尊重事实和知识,做到“知之为知之,不知为不知”。以人为本 AGI 则需要其他工具,比如知识图谱。这个论述此前说过多次,摘录如下“以人为本AGI=神经网络大模型 NN ⊕ 知识图谱 KG⊕ 强化学习RLHF。这里面的神经网络大模型负责理解语言,类似人的大脑【连接主义,图灵奖获得者Yoshua Bengio花书《深度学习》】;知识图谱则负责事实与知识,类似人类使用的百科全书【符号主义,王文广的珠峰书《知识图谱:认知智能理论与实战》】;强化学习负责从环境中学习,类似人类的吃一堑长一智实现进化【行为主义,Richard S. Sutton《强化学习》】。”
接下来是详细数据。首先是大模型列表,原始数据放在Github 上随时更新:https://github.com/wgwang/LLMs-In-China 。欢迎大家给 PR,给 Issue,或者评论里补充遗漏的大模型。V5版本的国产大模型观察见表一。按城市的数据统计见图一。
表一:国产大模型列表,V5版本,收录74个
|
序号 |
公司 |
大模型 |
省市 |
官网 |
|
1 |
百度 |
文心一言 |
北京 |
✔ |
|
2 |
科大讯飞 |
星火 |
安徽合肥 |
✔ |
|
3 |
达观数据 |
曹植 |
上海 |
✔ |
|
4 |
阿里云 |
通义千问 |
浙江杭州 |
✔ |
|
5 |
复旦大学 |
MOSS |
上海 |
✔ |
|
6 |
清华大学 |
ChatGLM |
北京 |
✔ |
|
7 |
华为 |
盘古 |
深圳 |
✔ |
|
8 |
智源 |
悟道·天鹰AQUILA |
北京 |
✔ |
|
9 |
哈尔滨工业大学 |
本草 |
黑龙江哈尔滨 |
✔ |
|
10 |
贝壳 |
BELLE |
北京 |
✔ |
|
11 |
百川智能 |
baichuan |
北京 |
✔ |
|
12 |
OpenBMB |
CPM |
北京 |
✔ |
|
13 |
上海AI实验室 |
书生·浦语 |
上海 |
✔ |
|
14 |
云知声 |
山海 |
北京 |
✔ |
|
15 |
澜舟科技 |
孟子 |
北京 |
✔ |
|
16 |
深思考人工智能 |
Dongni |
北京 |
✔ |
|
17 |
中科院 |
紫东太初 |
北京 |
✔ |
|
18 |
虎博科技 |
TigerBot |
上海 |
✔ |
|
19 |
IDEA研究院 |
封神榜MindBot |
广东深圳 |
✔ |
|
20 |
微盟 |
WAI |
上海 |
✔ |
|
21 |
360 |
智脑 |
北京 |
✔ |
|
22 |
度小满 |
轩辕 |
北京 |
✔ |
|
23 |
华南理工大学 未来技术学院 |
扁鹊, 灵心SoulChat |
广东广州 |
✔ |
|
24 |
西北工大+华为 |
秦岭·翱翔 |
陕西西安 |
✘ |
|
25 |
奇点智源 |
Singularity OpenAPI |
北京 |
✔ |
|
26 |
超对称技术公司 |
乾元 |
北京 |
✔ |
|
27 |
稀宇科技 |
MiniMax |
上海 |
✔ |
|
28 |
西湖心辰 |
西湖 |
浙江杭州 |
✔ |
|
29 |
晓多科技+国 家超算成都中心 |
晓模型XPT |
四川成都 |
✘ |
|
30 |
中科闻歌 |
雅意 |
北京 |
✘ |
|
31 |
北京语言大学 |
桃李 |
北京 |
✔ |
|
32 |
商汤科技 |
日日新 |
上海 |
✔ |
|
33 |
国家超级 计算天津中心 |
天河天元 |
天津 |
✘ |
|
34 |
星环科技 |
无涯、求索 |
上海 |
✘ |
|
35 |
慧言科技 天津大学 |
海河·谛听 |
天津 |
✘ |
|
36 |
宇视科技 |
梧桐 |
浙江杭州 |
✘ |
|
37 |
电信智科 |
星河 |
北京 |
✘ |
|
38 |
左手医生 |
左医GPT |
北京 |
✔ |
|
39 |
智慧眼 |
砭石 |
湖南长沙 |
✘ |
|
40 |
好未来 |
MathGPT |
北京 |
✘ |
|
41 |
数慧时空 |
长城 |
北京 |
✘ |
|
42 |
理想科技 |
大道Dao |
北京 |
✘ |
|
43 |
硅基智能 |
炎帝 |
江苏南京 |
✘ |
|
44 |
中工互联 |
智工 |
北京 |
✘ |
|
45 |
创业黑马 |
天启 |
北京 |
✘ |
|
46 |
追一科技 |
博文Bowen |
广东深圳 |
✘ |
|
47 |
网易有道 |
子曰 |
北京 |
✘ |
|
48 |
网易伏羲 |
玉言 |
广东广州 |
✘ |
|
49 |
昆仑万维 |
天工 |
北京 |
✔ |
|
50 |
知乎 |
知海图 |
北京 |
✘ |
|
51 |
医疗算网 |
Uni-talk |
上海 |
✘ |
|
52 |
孩子王 |
KidsGPT |
江苏南京 |
✘ |
|
53 |
中科创达 |
魔方Rubik |
北京 |
✘ |
|
54 |
腾讯 |
混元 |
广东深圳 |
✘ |
|
55 |
拓尔思 |
拓天TRSGPT |
北京 |
✘ |
|
56 |
乐言科技 |
乐言 |
上海 |
✘ |
|
57 |
清博智能 |
先问 |
北京 |
✘ |
|
58 |
智子引擎 |
元乘象 |
江苏南京 |
✔ |
|
59 |
拓世科技 |
拓世 |
江西南昌 |
✘ |
|
60 |
循环智能 |
盘古 |
北京 |
✔ |
|
61 |
印象笔记 |
大象GPT |
北京 |
✘ |
|
62 |
第四范式 |
式说 |
北京 |
✔ |
|
63 |
字节跳动 |
Grace |
北京 |
✘ |
|
64 |
出门问问 |
序列猴子 |
北京 |
✔ |
|
65 |
数说故事 |
SocialGPT |
广东广州 |
✘ |
|
66 |
云从科技 |
从容 |
广东广州 |
✔ |
|
67 |
电科太极 |
小可 |
北京 |
✘ |
|
68 |
中国农业银行 |
小数ChatABC |
北京 |
✘ |
|
69 |
麒麟合盛 |
天燕AiLMe |
北京 |
✔ |
|
70 |
台智云 |
福尔摩斯FFM |
台湾 |
✔ |
|
71 |
医联科技 |
medGPT |
四川成都 |
✘ |
|
72 |
理想汽车 |
MindGPT |
北京 |
✘ |
|
73 |
港中文深圳 |
华佗GPT |
广东深圳 |
✔ |
|
74 |
长虹 |
长虹超脑 |
四川绵阳 |
✘ |