本期汉盛-Techlaw周三沙龙针对网络爬虫的法律风险及规制开展了两次讨论会,第一次讨论人员主要以律所内部人员为主,第二次讨论会邀请了专业技术人员参与探讨。
两次讨论会主要以案例为切入点,对“酷米客”诉“车来了”不正当竞争案、全国首例爬虫技术侵入计算机系统案以及全国首例涉大数据权利归属权案件进行了深入的讨论,律师和程序员专家都对案例中的相关争议焦点和网络爬虫相关问题发表了看法。现总结如下:
1、与网络爬虫相关的案件涉及的案由主要有什么?
从刑事角度看,对网络爬虫的不当使用可能会构成非法侵入计算机信息系统罪、破坏计算机信息系统罪、侵犯商业秘密罪、侵犯公民个人信息罪、非法获取计算机信息系统数据罪、侵犯著作权罪等。从民事角度看,对网络爬虫的不当使用可能构成不正当竞争、侵犯人格权、与知识产权相关的侵权案件(包括侵犯著作权,侵犯信息网络传播权,侵犯商业秘密等。
2、网络爬虫罪与非罪的界限
爬虫作为一种计算机技术,就决定了它的中立性,爬虫本身并不被法律所禁止,重点是利用爬虫获取怎样的数据,获取数据时抱有何种主观故意,获取数据后又是怎么使用,爬取的行为(侵入行为、破坏行为),这一些是具有违法甚至犯罪风险的。可供参考的思考点:天眼查、企查查等APP是否有侵权风险?
3、数据权利问题
网络爬虫在网络上主要爬取的就是各种数据,数据权利就显得尤为重要,数据的所有者是谁?爬虫爬取的数据是否侵犯数据所有者的数据权利?一般认为,爬取公开的信息数据不构成侵权,如果该数据是需要登录之后才能获取的,则认为构成侵权;如果对数据进行过收集、整理、汇编、积累等工作,使其成为具有竞争优势的数据,此时应认为该数据具有经济价值。结合深圳中院的这个案子,公交车的实时运行路线、运行时间等信息仅系客观事实,但当此类信息经过人工收集、分析、编辑、整合并配合GPS精确定位,作为公交信息查询软件的后台数据后,其凭借预报的准确度和精确性就可以使“酷米客”APP软件相较于其他提供实时公交信息查询服务同类软件取得竞争上的优势。“酷米客”APP后台服务器存储的公交实时类信息数据具有实用性并能够为权利人带来现实或潜在、当下或将来的经济利益,其已经具备无形财产的属性。谷米公司系“酷米客”软件著作权人,相应的,也就对该软件所包含的信息数据的占有、使用、收益及处分享有合法权益。未经谷米公司许可,任何人不得非法获取该软件的后台数据并用于经营行为。
针对淘宝诉安徽美景科技有限公司的这个案例,法院认为淘宝收集并使用网络用户信息的行为是正当的,“生意参谋”数据产品中的数据虽然来源于原始用户数据,但经过淘宝公司的深度开发,已经形成了网络大数据产品。淘宝经过大量的智力劳动成果投入,深度开发与系统整合,数据产品已经成为淘宝一项重要的财产权益。被告美景公司未付出自己的劳动创造,将“生意参谋”作为直接获取商业利益的工具,构成不正当竞争,应当承担赔偿责任。
综上,在认定数据权利的时候应关注数据的来源,是否对数据进行加工、积累使其具有智力成果,数据的拥有者是否对该数据采取保密措施、防护措施等。
在涉及数据权利的案件中,数据的价值标准如何界定也是一个很重要但没有明确衡量标准的问题。一般很难举证权利人因侵权遭受到的实际损失,也很难举证侵权人因侵权获得的利益的具体情况。基本上是法院基于各类事实综合考虑侵权行为发生的范围,造成的影响以及持续的时间,发挥自由裁量权酌情定出的数额。
4、实施爬虫的员工的职务行为抗辩是否成立
在网络爬虫相关涉诉案件中,经常出现职员受老板的指示做出涉嫌违法的数据爬取行为,一般认为此种行为属于职务行为,但是在判断的时候还应当参考行为的利益归谁这一标准。例如“酷米客”诉“车来了”一案中,车来了的法定代表人以及四名职员均被判处非法获取计算机信息系统数据罪。但在民事责任的承担上,法院认为四名职工的职务行为抗辩成立,无需承担民事责任。
可供参考的思考点:站在公司角度,公司应当如何合理维护公司权益?个人与公司应当平衡彼此的权利义务?在刑事方面是构成个人犯罪还是单位犯罪?在民事方面,双方应如何承担责任?
5、在网络爬虫相关案件中,经济损失赔偿数额应当怎么认定?原告方为支持这一诉讼请求应当如何举证?
关于经济损失数额赔偿一般有三种思路,即参考被告的获益、原告付出的相应成本、在前两者无法确定的情况下法官酌定。与知识产权相关的案件,想从逻辑层面准确推断损失是很难的。因为很多情况下,并不存在直接的经济损失,但是可能会影响流量或者影响该公司上市,这类情形下带来的间接损失就很大,但是如何认定又是一个大问题。本案中原告提出的赔偿数额为3000万,最后判赔的数额仅为50万,即使这其中有巨大的差距,但是律师在举证的过程中还是应该以3000万的判赔金额的标准充分举证,从不同角度把相应的点都列上去。
6、在与程序员专家的沟通中,专家们提出了自己在工作中遇到的如下困惑:
A:我就打个比方啊,像我们公司的这些业务,用户在我们这注册的时候有一些授权协议,我们可能会利用这些协议和爬虫技术去收集一些用户个人信息。我们内部也开了很多会去讨论这个事情有没有什么法律风险,以及有风险的话应该如何去规避。
B:比如说爬取接口之类的,有没有什么法律风险?爬取数据的时候会有什么法律风险,利用这些数据能不能去做一些运营推广?
C:涉及到征信的问题,我们会依靠一些第三方的征信公司,类似他们的通话记录等都是必须要有第三方的授权。我们公司在这方面还是比较谨慎的。
D:我们本身就是做爬虫的嘛,我们目前就是帮助运营商把他想要的东西爬出来,我们目前是仅作技术层面的,没有关注法律风险,因为我们是帮助第三方把想要的数据爬出来。
7、对robots协议性质的探讨
Robots协议用来告知搜索引擎哪些页面能被抓取,哪些页面不能被抓取;可以屏蔽一些网站中比较大的文件,如:图片,音乐,视频等,节省服务器带宽;可以屏蔽站点的一些死链接。方便搜索引擎抓去网站内容;设置网站地图连接,方便引导蜘蛛爬取页面。
程序员专家们在讨论中提出,光靠robots协议肯定是达不到反爬的效果的,目前国内在爬取数据之前一般都不会去关注robots协议,只关注自己需要爬取的数据。程序员在使用爬虫技术爬取自己需要的数据的时候,一般不会看robots协议,都是直接抓取自己需要的数据。
法院在已有的判决中,对robots协议的性质做出过界定。法院认为Robots协议是技术规范,并非法律意义上的协议;Robots协议系网站服务商或所有者在自行编写,属于单方宣示;无论他人爬虫是否遵守,Robots协议不是强制禁止访问的技术措施;Robots协议已经成为了一种国内外互联网行业内普遍通行、普遍遵守的技术规范;《自律公约》并非法院可以直接参照适用的法律法规或规章,但其反映和体现了行业内的公认商业道德和行为标准,法院对于《自律公约》所体现出的精神予以充分考虑。目前我国司法尚未承认Robots协议单独能够成为具有法律约束力的合同。而仅仅是将其作为业内普遍遵守的“公认的商业道德”。
8、从技术的角度,怎样的措施才算是采取了保密措施?
从程序员的角度来看,采用爬虫技术的话,其实就是获取数据快一点。一个人可能一秒只能爬一条,但是用爬虫技术的话可能能够爬到几千条。反爬技术不是保护用户的信息,而是让爬虫能像一个自然人一样去使用电脑。比如说给出验证码,上面有四个数字,人是可以直接识别的,但是计算机可能不行,如果计算机可以的话,那么它也能进入这个网站。从程序员的角度来看,爬取数据这件事情是不大道德,对人家经过努力达到的成果直接不劳而获。如果大家都无限制地去对方服务器拿数据,那对方的服务器就忙不过来了,所以对方采取各种措施,是为了限制你去爬取的速度。当对方是需要采用账户密码才能登录网站的情况下,再去爬取,就会涉及到严重的问题了。
9、上海市晟品网络科技有限公司是否构成非法获取计算机信息系统罪?
在本次讨论会中,与会者对(2017)京0108刑初2384号上海晟品网络科技有限公司、侯明强等非法获取计算机信息系统数据罪一案提出了不同的看法。
主持人:这是抓取了对方的视频资料,用于自己商用。所以说,我们认为如果本身是互联网上公开的信息,那么爬取问题不大,但是如果对方已经采取了一定的反爬取措施,那么这个问题就比较严重。如果你们在爬取的过程中,对方采取了反爬虫措施,那么你们是会放弃,还是继续尝试呢?分享嘉宾1:肯定会啊,不然就交不了成果了。比如你们把简历发在51job之类的网站,爬虫软件会很快把这份简历爬到各个地方。但这个手段都是基于正常的服务器交互。分享嘉宾2:反爬技术不是保护用户的信息,而是让爬虫能像一个自然人一样去使用电脑。比如说给出验证码,上面有四个数字,人是可以直接识别的,但是计算机可能不行,如果计算机可以的话,那么它也能进入这个网站。那怎么来界定这样一个行为是违法还是非法,以及罪与非罪的问题?分享嘉宾1:采用技术的话,其实就是获取数据快一点。一个人可能一秒只能爬一条,但是用爬虫技术的话可能能够爬到几千条。我们可以看到海淀区法院可能认为这采取的不是爬虫措施,而是侵入了他人的系统。分享嘉宾1:要看拿的方式。从判决书可以看出这个tt-spider是一个典型的爬虫,但是这个两万元的损失是?它没有损伤对方的服务器。这是一个很有意思的点,从技术我们不认为这是犯罪。分享嘉宾1:我们主要是应运营商的要求来爬取一些数据。从我们的角度来看,这个事情是不大道德,就直接获得人家经过努力达到的成果。如果大家都无限制地去对方服务器拿数据,那就忙不过来了,所以对方采取各种措施,是为了限制你去爬取的速度。分享嘉宾3:就像很多公司提供优惠的措施,很多用户去薅羊毛。主持人:怎样的措施才算是采取了保密措施?你们从技术的角度来看?如果你们认为这些措施只是为了降低访问速度,那就不能认为这是一个保密措施了。分享嘉宾3:比如你登录淘宝网,需要账户密码。如果这种情况下你再去爬取,就会涉及到严重的问题了。主持人:所以就是说要看这个数据本身是不是公开的。律师A:我个人也认为这不是一个刑事犯罪。这无非就是一个过程是否被放大的问题。爬虫其实没有在攻破。所以这个案子这么判是有问题的。主持人:我们能不能认为我国刑事法律对这条罪规定的还是比较宽泛的?律师A:我国的刑事法律现在还在使用其他情形来兜底,这就是刑法可怕的地方。分享嘉宾2:我有一个问题,我们这里说的是视频,但是如果是文字呢,我们复制粘贴有什么问题么?分享嘉宾1:文字和视频其实就是一个数据大小的问题,视频比较大,文字比较小。但是有一些网站上,文字也是不让你复制的。
附:三个案例的情况简介
1、“酷米客”诉“车来了”不正当竞争案例介绍
“酷米客”和“车来了”是两款实时公交出行 APP。酷米客是深圳谷米科技有限公司在2012年推出的,通过在公交车上安装GPS获得了海量的实时公交位置数据,具有定位精度高、实时误差小等优势,迅速吸引了大批市场用户。 2015 年 “车来了”为了提升市场份额和信息查询准确度,授意五位员工利用爬虫软件获取酷米客公司服务器的公交车行驶信息、到站时间等实时数据,日均达 300-400 万条。酷米客花费了巨大人力、时间和经济成本获得的信息被同行窃取了,还直接挤压了自身的竞争优势和交易机会,2016 年酷米客将车来了告上了法庭。18年 5 月,法院裁定车来了立即停止获取、使用酷米客实时公交位置数据的不正当竞争行为,并赔偿其经济损失。
2、全国首例爬虫技术侵入计算机系统案
“海淀区人民检察院诉上海市晟品网络科技有限公司非法获取计算机信息系统罪”案例介绍
被告单位上海晟品网络科技有限公司,主要是经营计算机网络科技领域内相关业务。2016年至2017年间被告人张洪禹、宋X、侯明强共谋,采用技术手段抓取被害单位北京字节跳动网络技术有限公司服务器中存储的视频数据,并由侯明强指使被告人郭辉破解北京字节跳动网络技术有限公司的防抓取措施,使用“tt_spider”文件实施视频数据抓取行为,造成被害单位北京字节跳动网络技术有限公司损失技术服务费人民币2万元。判决被告单位上海晟品网络科技有限公司犯非法获取计算机信息系统数据罪,判处罚金人民币二十万元。四名被告人均犯非法获取计算机信息系统数据罪,根据情节轻重判处不同的有期徒刑和罚金。
3、首例涉大数据权利归属权案件
“生意参谋”是淘宝开发运营的零售电商数据的软件。该产品在搜集网络用户的行为痕迹所产生的原始数据的基础上,经过分析处理、整合加工,为淘宝网、天猫商家提供趋势图、排行榜、占比图等形式的预测型、指数型、统计型数据信息,为商家的店铺运营提供数据化参考。美景公司开发和运营“咕咕互助平台”软件和“咕咕生意参谋众筹”网站,教唆、引诱已订购淘宝公司“生意参谋”产品的淘宝用户*载下**“咕咕互助平台”软件,通过该软件分享、共用子账户,并从中牟利。法院判决美景公司需停止涉案不正当竞争行为并赔偿淘宝公司经济损失及为制止不正当竞争行为所支付的合理费用共计200万元。
(注:本文初次刊登于汉盛律所微信公众号:汉盛律师,属原创作品,未经允许,请勿擅自用于商业性转载,非商业性转载请注明来源。)
本文作者简介:
夏海波 :汉盛律师事务所高级合伙人、律师、专利代理人
汉盛科技中心主任、汉盛知识产权中心副主任、上海市律师协会互联网业务研究委员会委员,毕业于复旦大学法学院 获硕士学位。