自发布以来,ChatGPT作为一款类似人类的聊天机器人已经广为人知,它能根据用户输入的内容进行回应。
这款工具能够基于3000亿词汇和1750亿参数的数据集回答问题并生成回应。它势必将成为推动企业发展和最大化效率的关键工具。
我深入研究了一些2023年最新数据和报告中最有趣的ChatGPT统计数据和事实。
关键统计数据
• ChatGPT在发布后的第一周就获得了100万用户。
• ChatGPT网站目前每月预计有10亿网站访问量,其中约有1亿活跃用户。
• 该工具在消费者应用领域创下了用户增长速度最快的记录,仅用5天时间便获得了100万用户。
• OpenAI预测,到2023年底,ChatGPT的收入将达到2亿美元;到2024年底,收入将达到10亿美元。
• ChatGPT包含570 GB的文本数据,相当于整个《指环王》系列(包括《霍比特人》)词汇数量的164,129倍左右。
• 估计训练这个模型只需34天。
• 该工具在微软Azure云上的运行成本约为每天10万美元或每月300万美元,生成的每个单词的成本为0.0003美元。
• 2023年1月,该网站每天平均接收1300万独立访客,流量每天大约增长3.4%。
• OpenAI网站访问者中,62.52%的年龄在18岁至34岁之间,65.68%为男性,34.32%为女性。
• 平均有53%的人无法分辨出ChatGPT生成的内容是由AI生成的。
• 当GPT-3发布时,AI代币加密货币价格上涨了高达76.7%。
什么是ChatGPT?
ChatGPT(Chat Generative Pretrained Transformer,聊天生成预训练变换器)是一款聊天机器人,根据用户提供的输入生成类似人类的AI生成内容。它由OpenAI开发,并于2022年11月发布。
ChatGPT是如何工作的?
ChatGPT使用“变换器架构”,这是一种深度学习技术,通过处理包含数十亿词汇的兆字节数据来为用户输入的问题或提示创建答案。它是一种机器学习自然语言处理模型,称为大型语言模型(LLMs)。
在OpenAI首席执行官兼联合创始人Sam Altman在2023年的播客中谈论OpenAI的历史。他谈到了AI当前面临的挑战,他在其他方面描述了,当前的GPT版本主要是为了训练听起来连贯但不验证事实的能力。
ChatGPT何时发布?
原始版本GPT-1于2018年6月11日发布,最新版本GPT-4于2023年3月14日发布。

该工具的第一个版本,GPT-1,是使用大型BooksCorpus数据集进行训练的。这个版本能够获取大量具有不同文本序列的数据,并学习各种依赖关系。
GPT-2 使用了更大的数据集,参数更多(与GPT-1中的1.5亿相比,GPT-1为1.5亿),使其成为一个更丰富的语言模型。
2020年的GPT-3包含了更多的参数(大约是GPT-2的116倍),并且是比前几代更强大、更快的版本。
ChatGPT-4
2023年3月发布的ChatGPT-4是该工具的最新版本。自从使用GPT-4语言模型进行更新后,ChatGPT可以使用多达25,000个词汇(比前一个版本多8倍)进行响应,并且具有处理图像输入以及文本的能力,使其成为多模态的。
据估计,ChatGPT-4将在100万亿个参数上进行训练,这大约相当于人类大脑。这表明,最新版本的训练数据可能比用于ChatGPT-3的1750亿参数大571倍。
OpenAI报告称,最新版本能产生40%更多的事实回答,并且回应禁止内容请求的可能性降低了82%。
ChatGPT:GPT-3.5与GPT-4
GPT-3.5和GPT-4之间的关键区别是它们的能力,包括它们可以处理的信息量和类型。GPT-4有两个变体,一个是8K版本,其上下文长度约为8,000个令牌,另一个是32K,可以处理大约32,000个令牌。
这意味着该工具的最新版本可以处理更长的文档,创建更大的文本,并进行更长的对话,而不会丢失上下文。
|
模型 |
请求的最大上下文长度 |
英语单词数 |
单间距英文文本页数 |
输入类型 |
|
GPT-3.5 |
4,096 |
约3,000 |
6 |
文本 |
|
GPT-4-8K |
8,192 |
约6,000 |
12 |
文本和图像 |
|
GPT-4-32K |
32,768 |
约24,000 |
50 |
文本和图像 |
ChatGPT有多少用户?
ChatGPT在发布后的第一周就获得了100万用户,这创下了消费者应用程序史上增长最快的用户群纪录。
ChatGPT网站在过去一个月内估计接收了10亿次访问(比前一个月增长了62.5%)。当前活跃用户的确切数量尚不清楚,猜测是大约有1亿(假设10%的网站访问者注册免费服务)。
ChatGPT的用户遍布全球,最大的一部分(据估计为15.73%)来自美国。据推测,第二大用户群来自印度,约有7.1%的用户生活在这里。
|
国家 |
ChatGPT用户百分比 |
|
美国 |
11.72% |
|
印度 |
10.67% |
|
日本 |
4.29% |
|
法国 |
3.98% |
|
印度尼西亚 |
3.45% |
|
加拿大 |
3.04% |
|
其他国家 |
62.85% |
ChatGPT支持哪些国家?
据OpenAI称,ChatGPT目前支持161个国家。
除以下国家外,所有国家均可使用:
• 中国
• 俄罗斯
• 乌克兰
• 白俄罗斯
• 委内瑞拉
• 阿富汗
• 伊朗
ChatGPT支持哪些语言?
ChatGPT主要以英语为主,但是,据SEO.ai报道,它确实理解世界上其他95种语言,包括法语、西班牙语、德语和中文。
该模型主要是用Python计算机编程语言编写的。它能理解多种编程语言,包括:
• Python
• JavaScript
• C++
• C#
• Java
• Ruby
• PHP
• Go
• Swift
• TypeScript
• SQL
• Shell
与其他流行平台相比,ChatGPT增长得非常快。它在短短五天内达到了100万用户,比Instagram(第二快达到100万用户的平台)快了70天。

ChatGPT的基础设施
ChatGPT运行在图形处理单元(GPU)上,这是一种专用处理器,具有专用内存,旨在提高图形渲染速度。这种处理器由许多较小、更专业的内核组成。
据马里兰州的副教授Tom Goldstein介绍,一台NVIDIA A100 GPU可以在大约6毫秒的时间内运行一个拥有30亿参数的模型。以这个速度,一台NVIDIA A100 GPU可能需要350毫秒才能在ChatGPT上打印出一个单词。
ChatGPT的上一版本(3.5)拥有超过1750亿个参数,相当于800GB的存储数据。为了生成单个查询的输出,它需要至少五个A100 GPU来加载模型和文本。ChatGPT每秒能输出约15-20个单词,因此ChatGPT-3.5需要一台至少配备8个A100 GPU的服务器。
训练数据集和输出
OpenAI使用人类反馈强化学习(RLHF)训练模型。ChatGPT使用的训练数据集非常庞大。据Wired报道,它包含:
• 100万亿参数
• 3000亿单词
• 570GB的文本数据——这大约是包括《霍比特人》在内的整个《指环王》系列词汇量的164,129倍。(来源:Foster Grant)
ChatGPT无法访问互联网,仅能使用其训练数据集中收集到的信息。数据集的60%基于经过筛选的“常见抓取”数据。简而言之,这相当于从网页、文本和元数据中抓取的8年的数据。
训练ChatGPT花了多长时间?
据估计,如果使用一台NVIDIA Tesla V100 GPU训练该工具,使用当前数据集进行训练可能需要大约355年。但据报道,OpenAI使用了1,023台A100 GPU来训练ChatGPT。这意味着训练过程可能在短短34天内完成。
ChatGPT赚了多少钱?
OpenAI预测,到2023年底,ChatGPT的收入将达到2亿美元;到2024年底,它的收入将达到10亿美元。如果这些预测正确,那么这个工具在2023年每天将平均赚取547,945美元,在2024年每天将赚取2,732,240美元。
据Semafor称,微软计划向OpenAI投资100亿美元,这将使该公司估值达到290亿美元。
运行ChatGPT的成本
该工具每天的运行成本约为10万美元,或每月300万美元。微软的Azure云目前托管着ChatGPT,因此OpenAI不必购买并建立自己的实体服务器房。以微软每小时3美元的单个A100 GPU费率计算,ChatGPT生成的每个单词可能需要0.0003美元。
用户成本
自发布以来,ChatGPT一直免费使用,但在2023年2月1日,OpenAI开始了一项名为ChatGPT Plus的试点订阅计划,每月收费20美元。付费订阅的主要功能包括:
• 在高峰时期也可以通用地访问ChatGPT
• 相比免费使用,响应时间更快
• 优先获取新功能和改进的权限
ChatGPT Plus目前已经向用户开放,并计划将支持扩展到更多地区,
ChatGPT API的等待名单也已经推出,一旦发布,开发人员将能够访问官方的ChatGPT API。
ChatGPT网站流量统计数据
• 2023年1月,ChatGPT每天平均接收1300万独立访问者,是2022年12月的每日访问量的两倍多。过去一个月内,网站的流量每天平均增长3.4%。
• 2月份,ChatGPT估计接收到10亿访客,平均每天超过3500万访客。网站的流量从1月到2月增长了62.37%。
• 访问OpenAI网站的用户平均每次访问查看6.22个页面,每次访问的平均时长为8分钟24秒。
• 访问量最高的一天是1月31日,当天该网站接收到来自1570万独立访客的2800万访问量。

ChatGPT网页的流量来自多个来源,其中最主要的来源是直接流量,占69.43%,其次是推荐流量,占19.97%。
|
CHATGPT流量来源 |
流量百分比 |
|
直接 |
69.43% |
|
推荐 |
19.97% |
|
搜索 |
4.37% |
|
社交 |
3.87% |
|
邮件 |
2.33% |
|
展示 |
0.03% |
按流量份额排名的ChatGPT关键词
通过搜索引擎访问ChatGPT网站的访问者使用了多个关键词。以下是收集的数据,按流量份额排名的顶级关键词:
|
关键词 |
流量份额至ChatGPT网站 |
|
Chat GPT登录 |
290万 |
|
Chat OpenAI |
160万 |
|
OpenAI Chat |
836.2k |
|
Chat.OpenAI |
733.9k |
|
ChatGPT 登录 |
536.4k |
|
其他 |
8.8k |
这里排名的关键词让我们了解到ChatGPT是如何迅速崛起的,因为大多数顶级关键词都是直接提到ChatGPT的名称,而不是模糊的搜索词。Google趋势显示,2022年11月底,关于“ChatGPT”的趋势数据还没有出现,但到2023年2月,这个词在关注度上达到了最高点。
ChatGPT可以用来做什么?
ChatGPT可用于工作或个人使用的多种用途。ChatGPT的主要用途包括:
• 编写和调试代码——该工具可以提供完整的代码片段,并告诉您每个代码部分的功能。
• 撰写文案——输入您想要撰写的文案描述,ChatGPT可以创建文章、观点、博客文章以及许多其他类型的书面内容。在这里找到一些提示示例。
• 创建网站——ChatGPT可以帮助您创建网站,为您提供页面结构和特定内容的想法,找到适合SEO的关键词并撰写页面文案。
• 创建电子报——您可以使用ChatGPT制作电子邮件报告,它可以为您提供发布计划、提供创意,并为您创建电子报内容。
• 撰写简历和求职信——您可以输入您的资格和工作经验作为输入,模型将为您申请的工作生成个性化的简历。
• 生成文本的简化摘要——如果您没有时间阅读或理解长篇文档或文字,ChatGPT可以为您总结文档的关键细节和含义。
• 编写笑话、歌曲和诗歌——由于ChatGPT具有大量的源材料,因此它可以轻松地创作歌曲、故事、笑话、押韵诗歌等。它甚至可以模仿特定作家的风格。
• 聊天——除了生成不同类型的内容,ChatGPT还可用于简单的对话、提问和就您可能遇到的情况寻求建议。
• 起草合同和法律文件——该工具甚至可以编写法律合同和文件,为律师节省在重复任务上的时间。
ChatGPT和微软必应
微软最近宣布了他们使用ChatGPT的新一代AI搜索引擎必应。他们还确认,在短短48小时内,已有100万人加入了新的ChatGPT增强型必应的等待名单。目前,它已在有限的预览版本中向部分用户开放,但尚未发布详细信息。
AI在搜索中的应用
摩根士丹利计算了谷歌在搜索中使用AI的潜在成本。与标准关键字搜索相比,与大型语言模型(如ChatGPT)的交互在当前费率下可能更高出10倍。
谷歌的搜索AI叫做Bard。举个例子,如果仅仅有20%的搜索被AI聊天机器人替代,且每个查询输出75个单词,那么谷歌母公司Alphabet的额外支出将增加36亿美元。另一个问题是,用广告来盈利AI输出会更困难。

ChatGPT的局限性
虽然ChatGPT非常先进,但该工具还是存在一定的局限性。
• ChatGPT有时会生成看似合理但实际上没有任何意义的答案。对于OpenAI来说,解决这个问题是个挑战,因为当前的强化学习(RL)训练无法验证真相。更改模型以使其更加谨慎会导致它拒绝回答某些问题,而更多的监督训练可能会误导模型。
• 更改输入短语或多次使用相同的提示可能会影响工具。用户可以用某种方式提出问题,模型可能声称它不知道答案,但用不同的方式提问时,它可以正确回答。
• 当面对模糊不清的查询时,ChatGPT当前版本通常会猜测用户在问什么,而不是向用户询问澄清问题。
• 由于训练数据中的偏见,模型经常过度使用某些短语,例如,它反复声明自己是由OpenAI开发的语言模型。
• ChatGPT有时可能表现出有偏见的行为或对有害输入作出回应。OpenAI目前正在使用Moderation API发出警告或阻止可能不安全的某些类型内容。
安全缓解措施
OpenAI采用了一些缓解措施,以维护用户安全并保护用户免受有害内容的侵害。这些包括:
• ChatGPT没有被编程生成*力暴**或血腥的内容
• 当被问及一个包含错误信息的问题时,该模型没有被编程生成错误的答案。参见OpenAI关于克里斯托弗·哥伦布的例子。
• ChatGPT没有被编程回答类似于“如何欺负约翰?”的问题。相反,它会告诉你欺负别人是不对的。
读者能否分辨出ChatGPT和人类作家之间的区别?
我们在Tooltester进行的一个ChatGPT实验发现,超过一半的读者(53%)错误地认为关于金融、健康、科技、娱乐和旅行等主题的ChatGPT生成的内容是由人类创作或编辑的。当使用GPT-4.0模型时,这个数字上升到63.5%。
总的来说,普通大众无法分辨出ChatGPT和人类作家之间的区别,或者只是对AI写作的可能性不够了解,无法做出有根据的ChatGPT猜测。
总而言之,ChatGPT是一款强大的人工智能语言模型,可以用于各种用途,从编写代码到生成文案和法律文件。然而,它也存在一些局限性,例如生成听起来合理但实际上没有意义的答案,或对有害输入作出回应。尽管如此,该工具仍在不断发展,OpenAI正努力解决这些问题,以便为用户提供更好的体验。
目前,许多用户仍然很难区分ChatGPT生成的内容和人类作家的作品。这表明,虽然ChatGPT仍有待改进,但它已经足够先进,以至于普通大众很难辨别其与人类创作的差异。随着人工智能技术的进一步发展,我们可以期待更多令人印象深刻的应用和功能。

在健康类内容方面,ChatGPT被读者误认为是人类写作或编辑的比例最高,为56.1%。在技术领域,读者正确猜到ChatGPT生成的内容比例最高,有51%的读者能正确识别AI生成的内容。使用GPT-4.0语言模型时,技术内容被正确猜测为AI生成的比例也最高,为60.3%。
总的来说,年长的读者更具怀疑精神,比年轻人更容易识别出ChatGPT生成的文本。例如,18-24岁的人正确猜到ChatGPT生成的文本的比例为40.2%,而45-54岁的人正确猜到的比例为49.6%。
平均而言,研究发现,与GPT-3.5模型相比,GPT-4.0模型在说服人们其AI生成的内容是人类写作方面表现得更好,提高了16.5%。
关于ChatGPT和AI文案的公众观点
Tooltester的调查还发现,如果一个品牌在使用ChatGPT/AI生成的内容时没有明确告诉用户,那么71.3%的读者会对该品牌失去信任。
80.5%的公众认为,在线出版商只有在明确披露AI生成的内容时,才应该在在线文案中使用AI。2023年初,一些在线出版商因发布未告知用户的AI生成内容而受到批评。
ChatGPT的竞争对手
• OPT – 开放预训练变压器是Meta对ChatGPT的竞争对手。在零样本NLP评估方面,两者的准确率相当。
• Bard – 谷歌的Bard是一种基于LaMDA的对话AI服务,谷歌表示它旨在将世界知识与其大型语言模型的力量、智能和创造力相结合。
• Character AI – 这款AI聊天机器人能够模仿虚构人物和真实历史人物,让用户与著名人物和角色进行角色扮演。
使用GPT作为模型的最重要工具
让我们看一下使用与ChatGPT相同的GPT-3语言模型的一些AI写作工具。这些不一定是竞争对手,而是提供略有不同功能的ChatGPT替代方案。
• Content At Scale – 该工具专门使用语义分析、自然语言处理和3个AI引擎生成长篇博客文案。它还可以连接到互联网,实时获取来自谷歌搜索结果的信息。
• Copy.ai – 如果您想生成产品描述、博客文章、电子邮件等,Copy.ai将生成大纲并以您选择的写作风格自动撰写文案。然后,您可以使用其内置的文字处理器编辑生成的内容。
• ChatSonic – 一款具有不同质量级别的内容生成能力的聊天机器人,该工具还为您提供了在平台内编辑生成的内容的选项。
• Perplexity – 作为一种AI驱动的搜索服务,Perplexity处理查询并为您提供带有来源链接的回应,这是ChatGPT所做不到的。您还可以根据需要的信息,在“简洁”和“详细”回应之间进行选择。
关于ChatGPT母公司OpenAI的统计数据
让我们看一下ChatGPT的母公司OpenAI的一些统计数据。
• OpenAI是一家AI研究和部署公司。他们表示,其使命是确保人工智能通用性能造福全人类。
• 该公司成立于2015年12月11日。
• OpenAI的投资者包括Microsoft、Reid Hoffman的慈善基金会和Khosla Ventures。
• 截至2023年1月,该公司的估值为290亿美元,预计年收入为6730万美元。
• 该公司的总融资额为13亿美元。
• OpenAI推出的其他产品包括DALL.E 2、Whisper、Alignment和Startup Fund。
OpenAI受众分布
openai.com的受众构成为65.68%的男性和34.32%的女性。其访问者中有62.52%的人年龄在18至34岁之间。
人工智能市场规模
根据Precedence Research的数据,2022年,全球人工智能市场规模估计为1197.8亿美元。预测到2030年,市场规模将达到1,5971亿美元,2022年至2030年间的复合年增长率(CAGR)为38.1%。2021年,北美人工智能市场规模为1475.8亿美元。