ChatGPT的数据跨境安全风险及合规要点

近来,美国人工智能研究公司OpenAI开发的聊天机器人ChatGPT,迅速成为史上增长最快的消费级应用程序,引发广泛关注。在大型语言模型训练下,ChatGPT能够模仿人类思维和学习过程,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务,也可以编写和调试计算机程序,还可以进行文学、媒体相关领域的创作。未来,ChatGPT还可以拥有更为多样化的应用前景。

在此背景下,微软、Meta和谷歌等美国互联网巨头纷纷调整战略,致力于开发类似的AI产品或推动既有业务与ChatGPT的深度融合。在国内,百度、阿里等企业也计划在近年推出相类似的对话式人工智能产品。但在ChatGPT成为人工智能产业领域新风口的同时,ChatGPT给个人信息保护带来的风险与挑战不容忽视。本团队特撰写此文,试图从专业的视角分析ChatGPT潜在的侵犯数据安全风险,尤其境内企业在使用ChatGPT过程中可能涉及的数据跨境流动风险及其合规要点。

ChatGPT:人工智能产业的新风口

ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。从其本质来看,ChatGPT是Transformer和GPT等自然语言处理技术的集成,本质上是一个基于神经网络的语言模型。与以往的“人工智障”不同,ChatGPT在训练的过程中使用了“人类反馈强化学习”的训练方法,这种方法在AI训练的过程中使用人类反馈,以最大限度地减少无意义的、失真的或者存在偏见的输出。得益于这种训练方法,ChatGPT能够在对话过程中记忆先前使用者的对话讯息,即上下文理解,以回答某些假设性的问题。ChatGPT可实现连续对话,极大的提升了对话交互模式下的用户体验。

基于其智能的表现,ChatGPT的用户在短短几日内就突破百万,迅速成为史上增长最快的消费级应用程序,引发全球广泛关注。ChatGPT的出现也成为人工智能发展的新里程碑,推动各国科技创新进入新赛道。事实上,ChatGPT模型的出现对于文字/语音模态的AIGC(生成式AI)应用具有重要意义,会对AI产业上下游产生重大影响。如从上游增加需求来看,包括算力芯片、数据标注、自然语言处理(NLP)等。从下游相关受益应用来看,ChatGPT作为一款聊天机器人程序,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务,也可以编写和调试计算机程序,还可以进行文学、媒体相关领域的创作。未来,ChatGPT还可能应用于搜索引擎,数字人,银行、律所、各类中介机构、商场、医院、政府政务服务平台中的人机交互,智能汽车、智能家居(如智能音箱、智能灯光)等的交互及教育业等多个领域。同时,ChatGPT将会与更多的AI、云计算等信息技术的集成创新,将创造改变生产力曲线的工具,成为经济发展新动力。

作为人工智能领域的新浪,ChatGPT再一次点燃了资本市场对人工智能领域的投资信心与热情。2022年,ChatGPT和生成式 AI(AIGC)领域吸金超过26亿美元,共诞生出6家独角兽,估值最高的就是290亿美元的OpenAI。去年10月19日,主打文字生成的AIGC公司Jasper.ai宣布完成1.25亿美元的A轮融资,估值达到15亿美元。目前,投资机构纷纷看好ChatGPT和AIGC赛道的商业前景。红杉资本给出预测,未来预计能够产生数万亿美元的经济价值。

ChatGPT带来的数据跨境安全风险

大数据时代,数据好比石油资源,是市场中极为有力的竞争资源,乃至国家重要经济发展因素。2020年《*共中**中央、国务院关于构建更加完善的要素市场化配置机制的意见》便已提出加快培育数据要素市场的战略计划,要求加强数据资源整合和安全保护。2022年中央全面深化改革委员会第二十六次会议审议通过的《关于构建数据基础制度更好发挥数据要素作用的意见》也明确指出,数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。数据背后巨大的社会和经济价值,使其成为了我国五大生产要素之一。与此同时,信息技术打破了地域限制,数据得以在全球范围内跨境流动,但数据跨界在促进国际合作、经济增长、加速创新的同时,对数据主权、国家安全、个人信息保护等带来了严峻挑战。

根据ChatGPT的工作机制,作为生成式人工智能,ChatGPT本身即具备收集、储存和使用海量数据的功能。用户在输入端口提出问题后,用户与其对话的数据将会被存储在开发者美国人工智能公司OpenAI或使用的云服务提供商的数据中心。在人机交互问答中,提问者与ChatGPT分享的隐私和个人信息、商业秘密等数据可能被用于未来模型的迭代训练。在这样的一个过程中,中国公民或企业使用ChatGPT便是以数据的出境与入境作为服务的开端和结尾,都存在着数据跨境流动安全风险,如用户提问时可能涉及到个人信息、敏感信息甚至有关国家安全、经济运行、社会稳定、公共健康和安全的重要数据。

此外,根据我国《网络安全法》、《数据安全法》、《个人信息保护法》对数据出境的相关条文规定,数据出境活动的前提在于拟出境的数据是在境内运营过程中产生的,如《网络安全法》第三十七条规定,关键信息基础设施的运营者在中华人民共和国境内运营中收集和产生的个人信息和重要数据应当在境内存储。因业务需要,确需向境外提供的,应当按照国家网信部门会同国务院有关部门制定的办法进行安全评估;法律、行政法规另有规定的,依照其规定。

在考虑ChatGPT使用过程中带来的数据跨境安全风险时,首先应判断相应数据是否在境内运营过程中产生和收集的。显然,OpenAI并未向中国大陆提供有关服务,故难以将OpenAI的行为认定为境内运营行为。但ChatGPT作为当前人工智能领域的前沿技术代表,在国内,不仅百度、阿里等企业也计划推出相类似的对话式人工智能产品,更有不少企业向OpenAI公司抛出橄榄枝,试图将ChatGPT的服务引入到自己的应用软件或网页中,还有不少企业在业务运营过程中使用ChatGPT,由此极易触发数据跨境安全风险。如果这些企业不能依法规制ChatGPT运行中的数据跨境安全风险问题,依照目前我国现行法律规定,企业将可能面临严厉的行政责任乃至刑事责任,具体如下图所示:

ChatGPT数据跨境的合规要点

针对上述企业在引入ChatGPT服务及使用ChatGPT过程中可能带来的数据跨境安全风险,做好数据跨境的合规是企业拓展该业务领域必须进行的前置性工作。目前,对于数据跨境,我国已形成了以《网络安全法》、《数据安全法》、《个人信息保护法》三部法律为基本指导,《数据出境安全评估办法》、《个人信息处境标准合同办法》等规章为具体指引的法律规范体系。根据以上法律规范内容,在合规语境下,目前数据可以通过三种方式出境,即数据安全评估、保护认证、标准合同,这三种数据出境方式的合规要点存在较大差异。

(一)数据出境安全评估

首先,关于数据出境安全评估的适用范围。《网络安全法》第三十七条规定,关键信息基础设施的运营者在中华人民共和国境内运营中收集和产生的个人信息和重要数据应当在境内存储。因业务需要,确需向境外提供的,应当按照国家网信部门会同国务院有关部门制定的办法进行安全评估。《个人信息保护法》第四十条规定,关键信息基础设施运营者(CIIO)和处理个人信息达到国家网信部门规定数量的个人信息处理者,应当进行数据本地化存储并需通过安全评估才可向境外提供。《数据出境评估办法》进一步细化安全评估的适用范围,规定仅“(一)数据处理者向境外提供重要数据 ;(二)关键信息基础设施运营者和处理100万人以上个人信息的数据处理者向境外提供个人信息 ;(三)自上年1月1日起累计向境外提供10万人个人信息或者1万人敏感个人信息的数据处理者向境外提供个人信息”需进行安全评估。

其次,关于数据出境安全评估的具体方案。跨境活动的安全评估实际上包含数据出境风险自评估及申报数据出境安全评估两项活动。

第一项,《数据出境评估办法》规定。在安全评估前,数据处理者应先进行风险自评估,同时将自评估报告作为安全评估的审核内容之一。《申报指南》对风险自评估提出了更为具体的要求,例如要求自评估活动需在申报前3个月内完成,报告出具主体可以为数据处理者或第三方机构,但需保持评估责任主体的独立性。从风险自评估的重点来看,有两个 :第一,数据出境活动的整体情况,从数据出境的业务出发,包括出境数据的处理目的、范围和方式及其合法性、正当性和必要性,境内数据传输方与境外数据接收方的基本情况,到其安全保障能力,以及数据出境后的双方应履行的数据安全保护责任和义务。第二,拟出境活动的风险分析, 不仅需从数据本身出发,考虑数据规模、 范围、种类和敏感程度,更须从数据遭到篡改、破坏、泄露等的风险,特别是其中可能对国家安全、公共利益、个人或者组织合法权益带来的风险考虑,例如数据总量、数据收集频率和范围等。

第二项,数据出境安全评估。完成风险自评估后,数据处理者可以开始向所在地省级网信部门申报数据出境安全评估。但由于安全评估中涉及对CIIO、重要数据、 国家安全风险等的判断,省级网信部门只负责材料完备性的检查,而真正实施评估的主体由国家网信部门负责组织。

(二)标准合同

此种跨境方式在适用范围上局限于个人信息的出境活动,在排除了应当进行安全评估的场景后,其余场景均可采纳此种方案。2023年2月3日通过将于2023年6月1日起施行的《个人信息出境标准合同办法》第四条规定,同时符合非关键信息基础设施运营者、处理个人信息不满100万人的、自上年1月1日起累计向境外提供个人信息不满10万人的、自上年1月1日起累计向境外提供敏感个人信息不满1万人的个人信息处理者可以通过订立标准合同的方式向境外提供个人信息。需注意的是,标准合同实际上是一类格式合同,且其条款受到强监管,如《个人信息出境标准合同办法》第六条明确规定,标准合同应当严格按照本办法附件订立。国家网信部门可以根据实际情况对附件进行调整。个人信息处理者可以与境外接收方约定其他条款,但不得与标准合同相冲突。标准合同生效后方可开展个人信息出境活动。这意味着合同相对方较为固定,内容并不能轻易被修改或是变更,而且其条款优先于其他合同条款。

从标准合同式跨境的具体方案来看,数据处理者需进行个人信息保护影响评估,并与境外数据接收方签订一份数据跨境标准合同。个人信息保护影响评估与风险自评估相比,存在以下两点不同:

第一,风险评估重点不同。个人信息保护影响评估仅需评估对个人信息权益带来的风险,而无需评估对于国家安全、公共利益等的风险。

第二,境外国家的法律制度关注重点不同。个人信息保护影响评估关注境外国家个人信息保护法律法规对标准合同履行的影响,而风险自评估关注对出境数据的整体影响。至于标准合同的订立,《个人信息出境标准合同办法》中提供的一份标准合同模板可供使用。该合同中综合了我国目前对于个人信息保护的相关规定,提供了更为明确和严格的义务和个人信息权益。如个人信息主体需为合同第三方受益人,境外接收方有接受监管机关监督管理的义务,将合同争议解决和诉讼管辖权置于中国等。此外,合同内容并无过多修改空间,尤其是在个人信息传输双方责任义务的规定上,仅在争议解决、技术和管理措施方面提供可供合同双方决定的有限选项。

此外,标准合同式跨境虽仅需备案,但网信部门依然需要对合同内容是否切实履行进行持续监管。如果出现可能影响个人信息的权益的情况,如向境外提供个人信息的目的、范围、种类、敏感程度、方式、保存地点等变化,均需重新签订标准合同并备案。

(三)保护认证

与标准合同出境方式相同,保护认证方式也仅适用于个人信息出境。区别于强制性安全评估,个人信息保护认证属于国家推荐的自愿性认证,在一定期限内可以作为连续性的跨境数据处理活动的合法性依据。认证的适用有一定局限性,《网络安全标准实践指南——个人信息跨境处理活动安全认证规范》第一条规定了适用情形,包括 :跨国公司或是同一经济、事业实体下属子公司的个人信息跨境处理活动,以及关联公司之间的跨境处理活动;在境外处理境内自然人个人信息的活动,以向境内自然人提供产品或者服务为目的,或分析、评估境内自然人的行为。

个人信息保护认证除以《个人信息保护法》为依据外,还将《信息安全技术个人信息安全规范》作为合规标准。认证的基本要求是提供具有法律约束力的协议、明确的个人信息跨境处理规则和个人信息保护影响评估,并且有一定的组织管理架构。以认证为个人信息跨境方案,可以实现较为稳定的个人信息跨境路径,因而在公司内部传输数据的种类和处理方式相对固定的情形下,认证是最佳方式。与此同时,认证强调内部个人信息保护机制,此外也要求专业机构对跨境活动进行评估,其便利性和效率较标准合同而言仍存不足。

结语

为防控ChatGPT使用带来的数据跨境安全风险,企业应当严格落实数据跨境合规的主体责任,严格落实《网络安全法》、《数据安全法》、《个人信息保护法》等相关规定。在数据出境方式的选择上,不同出境方式所适用的场景和合规要求亦有所不同。对此,企业应依据自身数据出境的实际情况选择更优的出境路径。

本文作者:阮紫晴 上海申浩律师事务所 孙俊律师团队实习律师,苏州大学刑法学硕士研究生。主要研究领域为行政刑法、刑事合规、数据犯罪等领域。

孙俊 上海申浩律师事务所合伙人,上海交通大学法律硕士研究生,香港大学财务与投资管理硕士。2016年开始关注区块链方面的政策与法律,并购买了大量的比特矿机和莱特矿机进行挖矿。2017年在区块链行业从事投资收购工作,收购金额达到百亿。2018年-至今专注因为电信诈骗和网络赌博引起的洗钱风险研究以及处理过很多大型的经济金融领域的刑事犯罪,参与过很多解冻卡业务。