查看原文
其他

【数据与法】王磊:从数据属性视角看数据商业化中的使用规则

王磊 大数据和人工智能法律研究 2022-11-09

B D A I L C 

 欢 迎 关 注 


       随着网络的进一步扩张,越来越多的信息以数据的形式汇聚在互联网之中,形成大数据,此类数据具有体量大、类别大、价值密度低等特点。而基于数据分析技术的发展,使得利用如此庞杂的数据资源成为可能,因此数据的商业化趋势不可避免。在商业实践中企业对数据利用依据性质可以主要分为身份数据、行为数据、内容数据。数据商业化规则、个人信息保护与数据利用之间的利益平衡、信息流动与不正当竞争之间的边界等是数据商业化的主要问题。因此,需要在把握数据属性及商业规则的基础上,从相关案例中总结经验,考量多方利益进而找到合适的数据商业化利用途径。


© 方济众




从数据属性视角看数据商业化中的使用规则

文 / 新浪集团高级法律顾问 王磊




当今我们已处于数据爆炸的时代,随着互联网技术的发展,数据之间的交互和共享变得越来越便捷。移动端和云服务的出现,突破了人们使用计算机浏览网络的局限,智能手机等移动通讯设备的高频率使用和社交网络等新沟通方式的出现,使得数据在共享过程中又不断产生新数据。这些数据种类丰富,包含文字、图片、视频、音频等各种形式的信息,数据的爆发式发展也使得大数据产业迎来了新的机遇。《华尔街日报》将大数据时代、智能化生产和无线网络革命称为引领未来繁荣的三大技术变革。奥巴马政府在2012年公布了“大数据研发计划”(Big Data Research and Development Initiative),以增强联邦政府收集海量数据、分析萃取信息的能力,迎接新的挑战。我国也将推进大数据发展作为国家战略,布局下一代互联网[1]。大数据已在网络通信、医疗卫生、农业研究、金融市场、气象预报、交通管理、新闻报道等方面广泛应用。以数据整合、分析与挖掘为表现形式的数据整合与数据控制能力已经远超以往。越来越多的数据被收集,越来越多的数据产品被利用和加工,而且越来越多的针对数据的产品更为有效地改变我们日常的生活。随之而来的是数据的定义模糊化,对于数据的定义和权益界限尚未明确。这种未明确的数据权属也为大数据产业的发展带来了不确定性;同时,由于数据蕴含巨大的商业价值,与之一并产生的地下产业也让有序推进数据开发的主体无法有效保护其数据产生的商业模式带来的利益以及其平台用户的权益。数据纠纷之所以出现,对于各平台公司来说,是出于他们在大数据时代对于自身商业利益进行维护的必要。对数据保护,各平台公司目前除了采取技术对抗措施外,在法律层面主要依据《反不正当竞争法》提出保护诉求[2]。本文从数据利用规则角度,通过现阶段已经确定的典型生效判决来分析探究数据商业化利用的基本规则。




一、数据的特性

在谈论数据利用规则之前,我们需要了解数据的概念,本文讨论的数据,区别于在计算机及网络上流通的在二进制的基础上以0和1的组合而表现出来的比特形式的数据,也区分于日常生活中各种纸面统计数据及相关以账号和密码形式存在的数据或虚拟财产,本文中数据,指通过互联网收集的大数据,具有体量大、类别大、价值密度低等特点的身份数据、内容数据和行为数据。对于数据的定义,可以从多个角度来进行划分,数据其实无处不在,记录信息内容,身边的笔记,通讯录,黄页信息等都是数据,但现阶段商业化的数据是通过互联网和移动端收集的数据,可以分为身份数据、行为数据以及内容数据。

当下社会基于互联网和移动端的发展,使得数据收集和创造变得便捷,且通过互联网数据分析技术的突破性发展,使得分析利用数据和并依照分析结构预测成为可能[3]。数据本身是信息流动的产物,数据分析利用已在网络通信、医疗卫生、农业研究、金融市场、气象预报、交通管理、新闻报道等方面广泛应用。正如Facebook的副总工程师杰伊·帕瑞克所言,“如果不利用所收集的数据,那么你所拥有的只是一堆数据,而不是大数据”[4]

那么,我们对于数据和大数据来看,数据是收集的样本,而大数据是对于数据潜在价值的挖掘和分析,是种类多样的数据集合。从系统论的角度来说明数据的这一特性,其来源可能是千千万万的用户提交和收集,但对于数据分析和利用结果,通常是海量数据中极小的一个片段,但这个片段本身却以海量的数据为基础样本分析,这也是“整体涌现性”[5]的一个体现。分析结果离不开海量的样本数据,但结果价值和方式却高于样本数据。正因为数据本身散乱的来源,因此需要通过大数据分析技术将数据加以“提纯”,而这也是数据本身“价值密度低”,但“商业价值高”的表现方面。

数据可能有很多来源且与许多种信息相关联。但是,它们都具有以下共同特征。

(1)无损性。无损性也是数据本身传播过程中的重要特性。在复制和传播信息方面,数据与知识产权的性质很像。对于数据提供方和数据使用方来说,数据流转与传统民法中物的流转方式不同,它可以通过多次的复制提供,且不因为多次的提供和交易而减损自身的内容。

(2)多渠道性。数据可以被多个主体获得或使用,有时甚至是同时获得使用。一个主体有可以很容易获得某些数据的渠道,不代表其他主体没有同样或类似的渠道。而且,对于数据来源的不同,以及存在网式、环式或链式的交易结构,对于上下游之间的数据开发和处理方来说,可能又成为各自下游利用方的数据分析样本。

(3)时效性。数据的“时效性”要求很高,数据可能很快过时,因此可能在很短时间内失去价值。数据收集过程中,需要持续性的投入,以保障数据样本更新和时效性。当然,“失去时效”的数据并非没有价值,只是在数据发掘和数据开发的过程中,数据对分析结果的影响可能随着时效性的降低而随之降低。

(4)扩容性。数据利用与开发后形成的衍生数据和分析结果,同样可以反馈回原生数据,并同时丰富原生数据的内容,使得数据本身扩容进而提供更多可分析数据样本。数据的这一特性也体现了数据流动的基本价值,通过数据主体之间的双向和多向流动来创造更多数据。

(5)多样性。同样的数据分析后,产生的内容和分析结果可以完全不同,而这种不同的数据结果导致数据的体量和内容更加丰富。同样的数据可以发展出不同的应用场景,且每个场景之间可以互动互通,也可以各自独立。

针对数据所存在的各方面特征,所产生的法律效果也是不同的,以数据利用过程中对于极具商业价值的分析结果来说,要从价值的贡献角度考虑数据各方主体的作用,进而分析其可能存在的权益划分。在收集环节,通过协议或数据交易获得的数据,在得到合法授权后又进行分析产生衍生数据,以及针对衍生数据指引形成的数据分析结果,将会形成不同的法律效果和法律关系。同时,本文中所讨论的数据主要基于个人使用所产生的身份数据、行为数据和内容数据,因此在讨论中应当对于个人属性紧密联系的部分进行区分,但这同时对现阶段数据的商业应用提出了课题,数据应用的“千人千面”为了提供更好的个性化服务,必然会结合与个人属性相关的数据作为参数进行考量,但如何在不侵害个人合法权益的基础上实现商业目的,也是数据未来发展的重要方向。



二、数据使用中的案例与思考

数据本身的权利体系目前尚存在一定争议,《中华人民共和国民法总则(草案)》(以下简称草案)中曾将数据列入知识产权项下,但在《民法总则》通过稿中将数据与虚拟财产置于第127条中加以规定[6],列于第126条“其他民事权利和利益”之后。欧盟委员会在2015年12月发布了一个提案,有关合同提供数字内容的相关问题[7](就是之后的“数字内容提案”)。这个提案涉及消费者与数字内容提供者关系的合同问题。数字内容提案强调了“个人数据越来越被市场参与者认为,具有和货币相当的价值。”相应地,在消费者以个人数据或其他数据,而不是钱来作为对等物进行交易时,这个提案也可适用[8]。这个提案也规定了(个人)数据的商品化。随后一些学者个人数据的“属性化”以及创设一种针对个人的数据财产权(对物权)。[9]这种推论与大数据环境密切相关,因为在大数据分析的框架中,可以对个人数据进行更普遍的分析。

与数据权属探讨的争议不同,对于数据本身代表的利益与价值已达成普遍共识。数据与商业价值本身密不可分,对于商业平台利用的数据[10]本身,依据其性质不同,可以分为三个部分,一是身份数据,二是行为数据,三是内容数据。其中数据在商业化利用过程中,由于目前没有明确的权利加以保护,通常维权和解决纠纷的做法为适用《反不正当竞争法》第二条加以保护。大多数竞争法来源于公司具有有形资产的时代,在当时,即使公司没有规定具体细节,他们或多或少也会提供一些有着明确的目的、价值、消费者的商品或服务。但是现在“数据”发展成为了一种新商品。大量的数据可以定义公司的价值,数据可以交易,可以用于利用新的产品或服务。同时,数据本身带来的用户流量,在公司运营和资本市场中体现出巨大的商业价值,各互联网公司平台用户的流量代表了其收集信息的能力[11]。为此,在下文将通过对实践中发生的案例介绍来具体分析现阶段对于数据的主要纠纷及表现形式。


(一)   身份数据——微博诉脉脉不正当竞争案

2013年9月11日至2014年8月15日,北京微梦创科网络技术有限公司(微博服务提供商,以下简称“微博”)与北京淘友天下技术有限公司、北京淘友天下科技发展有限公司(脉脉服务提供商,以下简称“脉脉”)签署《开发者协议》,约定脉脉在合同规定期间可以利用合同中约定的微博系统开放接口(OPENAPI),获取微博用户信息资料用于脉脉应用的使用。但在合作过程中发现脉脉应用非法获取的微博用户教育信息和职业信息等内容。微博于2016年向北京市海淀区人民法院提起诉讼,起诉脉脉在未得到用户授权和微博授权的前提下非法搜集微博用户信息,并将非法获取的信息与自身应用搜集到的信息非法关联等行为[12],法院一审判决两被告构成不正当竞争,共同赔偿原告微博公司经济损失二百万元及合理费用二十万八千九百九十八元[13];经过北京知识产权法院二审判决[14],驳回上诉,维持原判。

微博诉脉脉案件,作为大数据领域纠纷的首案,对如何归纳和形成数据利用规则具有现实意义。身份数据,是指通过平台提供服务,由接受服务的用户提交的信息所收集而成,或通过收集阶段进行整合分析,通常每个用户在注册阶段,依照各注册字段进行的填写内容,如昵称、姓名、性别、电子邮箱、联系方式、教育背景、职业背景等内容。平台通过字段的性质进行划分,目前针对数据整理和后续分析,通常的做法是形成各数据接口,通过数据接口进行数据分析利用,如OPEN API数据开放接口[15]

其中微博诉脉脉案件的启示主要在于几个方面:

1、终审判决中指出“信息资源日益成为重要的生产要素和社会财富”,“在信息时代,数据信息资源已经成为重要的资源,是竞争力也是生产力更是促进经济发展的重要动力”[16]。通过法院判决,确认了信息时代的数据包含一定的商业价值,是反不正当竞争法中应当保护的商业利益。

2、在判决书中强调第三方平台使用授权平台所收集的用户数据的“三重授权原则”,即对于API平台在收集用户数据应当经过用户授权,API数据合作方之间的权限应当经过平台授权,而在API中数据调取和使用平台在使用用户数据中应当经过用户的再次授权。

3、明确了网络平台作为信息提供方可以在用户同意的前提下基于自身经营活动收集并进行商业性使用的用户数据信息主张权利,这进一步认可了数据的重要作用,数据的获取和使用,不仅能成为企业竞争优势的来源,更是数字经济中的重要的基本要素。


(二)  行为数据——朱某诉百度隐私权纠纷案

朱某在利用家中和单位的网络上网浏览相关网站过程中,发现利用“百度搜索引擎”搜索相关关键词后,会在特定的网站上出现与关键词有关的广告。2013年5月6日,朱某将北京百度网讯科技有限公司(以下简称“百度网讯公司”)诉至南京市鼓楼区人民法院。朱某起诉称,本人长期形成上网浏览网页、看电影等网络生活习惯,百度网讯公司利用网络技术,未经朱某的知情和选择,记录和跟踪了朱某所搜索的关键词,将朱某的兴趣爱好、生活学习工作特点等显露在相关网站上,并利用记录的关键词,对朱某浏览的网页进行广告投放,侵害了朱某的隐私权,影响了正常的工作和生活。

一审法院经审理认为[17],朱某的网络活动踪迹属于个人隐私的范围,百度网讯公司利用cookie技术收集朱某信息,并在朱某不知情和不愿意的情形下进行商业利用,侵犯了朱某的隐私权。为此,判决百度网讯公司于判决生效之日起十日内向朱某赔礼道歉(如百度网讯公司未按判决进行赔礼道歉,法院将通过相关媒体公告判决书的内容,由此产生的费用由百度网讯公司承担);百度网讯公司于判决生效之日起十日内赔偿朱某公证费损失1000元;驳回朱某的其他诉讼请求[18]

随后百度公司提起上诉,在二审法院审理过程中,法院认为百度网讯公司在提供个性化推荐服务中利用的是未能与个人身份信息对应识别的数据信息,该数据化信息的匿名化特征不符合“个人信息”的可识别性要求[19]。首先,百度网讯公司个性化推荐服务的终端是浏览器,并未定向识别浏览器的网络用户身份,在事实上提供个性化推荐服务并无必要将搜索关键词记录和朱某的个人身份信息联系起来;其次,百度网讯公司利用网络技术向朱某使用的浏览器提供个性化服务不属于《最高人民法院关于审理利用信息网络侵害人身权益民事纠纷案件适用法律若干问题的规定》第十二条规定的侵权行为;再次,百度网讯公司提供个性化推荐服务并未侵犯网络用户的知情权和选择权[20]。综上,二审法院判决撤销一审判决,并驳回一审原告朱某全部诉讼请求。

互联网技术一方面给用户带来了便捷,但同时也需要考虑其中与个人隐私之间的边界,朱某与百度网讯公司基于互联网个性化推荐服务引发的纠纷为平台收集数据提供了实践的参考。行为数据,通过对用户在网站或应用程序的用户行为,如使用或浏览方式进行收集整理分析,达到通过行为进行用户画像(personas)[21]的目的,而用户画像本身是基于一系列用户数据,如用户社会属性、消费习惯、个人喜好等真实数据所形成的数据模型。对于用户画像的利用,最常见的方式是通过对于用户的个人喜好和消费习惯形成不同类型的精准广告推送,达到“千人千面”的效果,而通常主要的做法是通过cookie技术进行收集,其中不得以侵犯用户安宁权和选择权为前提,不得侵害用户个人的隐私为红线。


(三)  内容数据——大众点评诉百度地图不正当竞争案

大众点评网(www.dianping.com)的运营公司上海汉涛信息咨询有限公司(以下简称汉涛公司)诉称北京百度网讯科技有限公司(以下简称“百度网讯公司”)运营的“百度地图”及“百度知道”大量复制了大众点评网上的用户点评等信息,给汉涛公司造成重大损失,构成不正当竞争,一审诉至上海市浦东新区人民法院,要求认定不正当竞争行为并赔偿经济损失9000万元及其他合理费用453,470元[22]

上海市浦东新区人民法院一审审理过程中,对于大众点评网与“百度地图”和“百度知道”提供的服务是否构成竞争关系,以及使用大众点评网的信息是否导致流量减少,进而构成实质性竞争的损害,同时对Robots协议抓取大众点评网的信息与不正当竞争之间的关系[23]进行了认定。经一审法院审理后,认定大众点评网与“百度地图”和“百度知道”提供的服务构成竞争关系,且通过“百度地图”和“百度知道”与大众点评网争夺网络用户,可以认定百度网讯公司与汉涛公司存在竞争关系,且通过技术手段,从大众点评网等网站获取点评信息,用于充实自己的“百度地图”和“百度知道”。百度公司此种使用方式,实质替代大众点评网向用户提供信息,对汉涛公司造成损害。此外,百度网讯公司的搜索引擎抓取涉案信息并不违反Robots协议,但这并不意味着百度网讯公司可以任意使用上述信息,百度网讯公司应当本着诚实信用的原则和公认的商业道德,合理控制来源于其他网站信息的使用范围和方式[24]。基于以上理由,一审法院判决百度网讯公司构成不正当竞争,承担赔偿汉涛公司经济损失300万元及为制止不正当竞争行为所支付的合理费用23万元,驳回汉涛公司其他诉讼请求。

百度网讯公司在一审宣判后提起了上诉,诉至上海知识产权法院,二审法院经审理认定大众点评网上用户评论信息是经营者付出大量资源所获取的,且具有很高的经济价值,这些信息是汉涛公司的劳动成果。百度网讯公司未经汉涛公司的许可,在其“百度地图”和“百度知道”产品中进行大量使用,这种行为本质上属于“未经许可使用他人劳动成果”。同时提出当某一劳动成果不属于法定权利时,对于未经许可使用或利用他人劳动成果的行为,不能当然地认定为构成反不正当竞争法意义上的“搭便车”和“不劳而获”,这是因为“模仿自由”,以及使用或利用不受法定权利保护的信息是基本的公共政策,也是一切技术和商业模式创新的基础。但是,随着信息技术产业和互联网产业的发展,尤其是在“大数据”时代的背景下,信息所具有的价值超越以往任何时期,愈来愈多的市场主体投入巨资收集、整理和挖掘信息,如果不加节制地允许市场主体任意地使用或利用他人通过巨大投入所获取的信息,将不利于鼓励商业投入、产业创新和诚实经营,最终损害健康的竞争机制[25]。经二审法院审理,驳回上诉,维持一审判决。

从大众点评网诉百度网讯公司不正当竞争案,可以看出其区别与身份数据和行为数据,更多关于长时间积累的用户评论(UGC)[26]所形成的内容数据信息。内容数据,这里是指基于数据中的信息内容进行数据整理,如各种视频、声音、图片、文字等,与受众产生互动,从而得到了有价值的交互数据。通过对这些交互数据的筛选、挖掘、分析,得到有价值的数据,从而对后期内容的生产和发行形成指导和信息交易。而对于内容数据的应用,其中对于数据的长时间的积累和基于商业模式上对于必要的收集所进行的投入,是竞争和产业发展过程中的必经阶段,因此通过技术利用他人劳动成果的行为,是属于不正当的竞争行为。




三、数据商业化使用的规则

通过对于数据的性质的分析和实际中的案例,应当认识到数据作为数字经济中的新的“生产资料”,应当充分考虑其特殊性,在使用数据的过程中,进行商业化利用应当充分考虑其特性。因为数据本身权属的复杂性,目前司法实践中对于数据之间的纠纷采取适用《反不正当竞争法》进行规制,这也导致对于数据的利用与维权之间通常都是利用个案解决,很难形成具有指引性和规范性,但同时贸然将数据纳入某个权利体系中也很难形成普遍共识。

对于数据的商业化利用而言,商业主体在数据使用中的合规性判断有时会先于法律而形成行业共识,在判断使用用户数据信息是否存在滥用和存在不正当竞争,应当考虑以下几个维度:


(一)  数据使用的行为符合产业整体发展

数据收集和使用应当遵守现有商业秩序。市场经济的效能竞争和商业模式的信息流通均以秩序为共同前提。由于数据价值的与日俱增,市场中有越来越多的主体参与到数据的商业化利用中,而目前数据保护体系尚未完善的情况下,通过反不正当竞争法进行规制只能是个案现象,且由于数据使用具有时效性、隐蔽性,对于通过诉讼手段进行维权的主体来说存在举证责任和证明效力的多方困难,且考量技术进步和保护利益之间应当从全局进行考量。正当的商业目的和数据使用的出发点,应当是创新和发展而非是“搭便车”和“捡便宜”,鼓励市场形成良性竞争机制。

市场经济鼓励的是效能竞争,通过商业模式的升级和创新来提高社会总成本,而非通过阻碍他人竞争,扭曲竞争秩序来提升自己的竞争能力[27]。如果经营者是完全攫取他人劳动成果,提供同质化的服务,单纯通过技术抓取进而降低对于数据信息的积累的投入与时间成本,这种行为对于创新和促进市场竞争没有任何积极意义,且从长远来看必然导致积极投入进行数据信息积累的企业利益得不到保护进而侵害整个数据产业的利益,破坏产业生态的行为必然会伤害消费者和社会的整体利益。


(二)  数据的商业性使用应当结构化考虑权益分布

《民法总则》将数据与虚拟财产置于“其他民事权利和利益”之后,对数据权属的认定尚处于模糊阶段。数据权益往往与知识产权、人格权、财产权、隐私权等密切相关,多重属性决定了其需要多层次的规制,尽管权益尚未明确,但从实践中对于数据应用的场景已经不断创新和突破,对此应当如何考虑应当进行结构化分析,即符合现有权利体系保护内容的与尚未明确的商业权益可以并行不悖,且应当以不侵害个人权益为前提和红线。

在大众点评网与百度网讯案中,用户数据信息的获取付出了巨大的劳动,具有可获得法律保护的权益,而百度公司的竞争行为亦具有一定的积极效果,在此情况下应当对两者的利益进行一定平衡。如进行数据的利用本身商业化模式创新的必要条件,应当充分的考虑数据收集积累过程中的投入,并在商业利用过程中的方式加以必要的限制,如在使用数据信息的方式、展示形式等方面进一步明确并获得相应的授权,这里的授权不应当局限于数据的平台授权,如涉及著作权或个人信息等内容应当一并加以考虑。

针对于数据收集,基于互联网的公开共享特性,非法的数据收集行为往往具有隐蔽性和维权难的特点。第三方借由网络爬虫等工具攫取他人劳动成果,在不经授权的情况下对平台数据进行非法抓取和利用,将阻碍他人进行正当的商业行为,破坏现有商业秩序,制造数据行业恶性竞争和交易乱象。此外,基于收集、处理和分析的数据,对于数据在商业利用上的许可,应当充分考虑平台的授权。企业可以在数据商用的过程中对数据进行加工,以剥离可能与其它权属产生冲突的成分。例如在数据商业化利用中,对数据信息进行脱敏后产生的数据权益,可以有效规避如基于个人收集的数据在商业化利用对个人用户造成的侵害和数据滥用。


(三)  技术创新应当考虑合理性边界

“技术中立”是数据行业或新兴产业发展过程中经常在竞争关系中为自身辩解的重要理由,但并不是任何技术本身都可以作为豁免法律责任的依据,例如搜索引擎中垂直搜索和现阶段数据抓取中的爬虫技术,其技术在应用层面的合理性以及商业模式是否构成不正当竞争并不因为技术或算法没有人为干预而豁免其应用层面可能存在的不正当行为。更有甚者,通过“技术”手段来进行如对合法商业环节的突破和破解,更是互联网行业需要打击的黑灰产业链。

 技术作为一种工具手段在价值上具有中立性,但这并未意味着可以通过技术进而突破原有的商业模式来进行违背商业道德的恶性竞争,在信息技术大发展的今天,在商业模式上的“同理心”同样重要,即技术提供者或使用方是否在应用技术之初就存在对侵害他人合理商业模式的主观故意,对于技术在商业模式中的作用,是创新性的突破的“助手”,还是侵权和恶意竞争的“帮凶”,在于应用技术的主体,而不能仅仅以技术中立的名义突破竞争和商业的合理界限。




四、结语

对于数据商业利用的规则目前通常以个案的形式出现,尚缺乏明确有效的法律指引,但对于数据产业本身发展的创新性和多样性,同时考虑到法律制定的严谨性、程序性和权威性,因此法律规范一般情况不可能发生朝令夕改的现象。法律不可能一次性规定出所有的数据信息保护的适用规则和侵权后的惩罚措施,而且就目前社会发展进程而言,一旦发生数据信息侵权现象,由于法律的相对滞后性,需要有强大的技术支持来进行数据删除等相关数据维护工作。强调对于个人信息数据的保护,并非禁止合理使用个人数据,在《民法总则》第111条对自然人的个人信息进行规定后,后续的民法典编纂工作中必然会对个人信息进一步明确和规定。

数据作为数字经济时代的重要资源,其商业利益与保护的范围并不是一成不变,它会随着社会的发展、技术的变革甚至个人授权的变更等因素而发生相应的变化,切勿僵硬地适用保护政策,也不要因为需要保护就矫枉过正。同时对于数据的使用,在考虑商业化使用的前提,必然需要考虑商业各方主体在数据生成中的作用,如对于基础数据的加工,对于衍生数据或数据规则的利用(征信服务),为此各方平台提供了大量的人工和物料的投入,同时为了维护平台或数据的有效运营提供了必要的物质条件,因此在对此类数据进行处理的情况下,需要考虑个人信息及隐私与商业数据开发之间的利益平衡,同时也要考虑信息流动与不正当竞争之间的边界。

对于数据的使用,更多的应从商业化利用的基本使用规则角度来进行讨论,即数据的利用更多的应当考虑其财产属性和商业利用价值,但应当充分考虑数据自身特性及原有权利,并进行结构化区分对待。同时,考虑到后续维权的成本和便捷性,以及由于数据“价值密度低”所导致的个人基于数据进行维权的成本和收益差距过大,从民法层面设立数据环节中商业主体的权益划分,充分发挥数据商业利用主体的积极性,进而有效维护数据产业的有序发展。




参考文献

(请向下滑动)


[1] 2015年10月29日,中国共产党第十八届中央委员会第五次全体会议通过《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》,其中首次提出“实施国家大数据战略,推进数据资源开放共享。完善电信普遍服务机制,开展网络提速降费行动,超前布局下一代互联网。”

[2]我国针对《反不正当竞争法》进行过多次修订。2017年8月28日,全国人大常委会审议修订《反不正当竞争法》二审稿,9月初公布二审稿,11月4日修订通过,规定于2018年1月1日起正式施行生效,其中对互联网领域不正当竞争通常适用的第二条进行了修订,并在第十二条增设了互联网领域专门的不正当竞争条款。

[3]本文中数据,指通过互联网收集的大数据,具有体量大、增长速度快、类别大、价值密度低的特点。

[4]参见维克托·迈尔·舍恩伯格、肯尼思·库克耶:《大数据时代》,盛杨燕、周涛译.浙江人民出版社2013年,第113页。

[5]整体涌现性,系统科学把这种整体才具有、孤立部分及其总合不具有的性质称为整体涌现性(whole Emergence);涌现性就是组成成分按照系统结构方式相互作用、相互补充相互制约而激发出来,是一种组分之间的相干效应,即结构效应。参见(美)冯·贝塔朗菲著.一般系统论——基础发展和应用[M].林康义等译,清华大学出版社,1987年第51页,转引自魏巍、郭和平:关于系统“整体涌现性”的研究综述,《系统科学学报》2010第1期。

[6]《中华人民共和国民法总则》第127条规定:法律对数据、网络虚拟财产的保护有规定的,依照其规定。

[7] Commission, 'Proposal for a directive of the European Parliamentand of the Council on certain aspects concerning contracts for the supply ofdigital content' COM(2015) 634 final.

[8] Commission, 'Proposal for a directive of the European Parliamentand of the Council on certain aspects concerning contracts for the supply ofdigital content' COM(2015) 634 final, art 3(1).

[9] Rafał Mańko, 'Contracts for Supply of Digital Content. A LegalAnalysis of the Commission's Proposal for a New Directive' ,(EPRS 2016) 15.

<http://www.europarl.europa.eu/RegData/etudes/IDAN/2016/582048/EPRS_IDA(2016)582048_EN.pdf>,2017年10月5日访问。

[10]对于数据的分类,这里讨论的是商业数据中与用户有关的数据,该类数据可以依照性质不同进行划分。此外在数据应用领域中还有一部分是基于公共信息收集的数据如天气情况、地理信息等形成的数据,

这里暂不进行讨论。

[11] Facebook公司2017年第三季度财报显示,截至2017年9月30日,Facebook的平均每日活跃用户人数为11.8亿人,比去年同期增长17%;腾讯公司2017年度第三季度财报显示,微信和WeChat的合并月活跃账户数达到9.8亿,比去年同期增长15.8% ,日发送的消息数约达380亿条,同比增长25%,月活跃公众号350万个,而公众号月活跃关注用户数为7.97亿,同比分别增长14%及19%;2017年度微博公司第三季度财报,截至9月底,微博平均日活跃用户数较上年同期净增约3300万,达到1.65亿;月活跃用户较上年同期净增约7900万,增长至3.76亿。

[12]一审起诉状诉求内容还包括模仿微博“大V”形式,侵害微博经济利益,构成不正当竞争,并且,脉脉以公告形式恶意抹黑微博,构成商业诋毁。

[13]参见北京微梦创科网络技术有限公司诉北京淘友天下技术有限公司、北京淘友天下科技发展有限公司不正当竞争案,(2015)海民(知)初字第12602号。

[14]参见北京淘友天下技术有限公司、北京淘友天下科技发展有限公司与北京微梦创科网络技术有限公司不正当竞争上诉案,(2016)京73民终588号。

[15]所谓(Open API)是服务型网站常见的一种应用,网站的服务商将自己的网站服务封装成一系列API(Application Programming Interface应用编程接口)开放出去,供第三方开发者使用,这种行为就叫做开放网站的API,所开放的API就被称作OpenAPI(开放API)。 参见谭晨辉、刘青炎:“OpenAPI出现、起源与现状” ,《程序员》2008年第7期。

[16]参见北京淘友天下技术有限公司、北京淘友天下科技发展有限公司与北京微梦创科网络技术有限公司不正当竞争上诉案,(2016)京73民终588号。

[17]《最高人民法院关于审理利用信息网络侵害人身权益民事纠纷案件适用法律若干问题的规定》中第十二条第一款中规定:“网络用户或者网络服务提供者利用网络公开自然人基因信息、病历资料、健康检查资料、犯罪记录、家庭住址、私人活动等个人隐私和其他个人信息,造成他人损害,被侵权人请求其承担侵权责任的,人民法院应予支持”,参见朱某诉百度网讯侵犯隐私权案,(2013)鼓民初字第3031号判决。

[18]参见朱某诉百度网讯侵犯隐私权案,(2013)鼓民初字第3031号判决。

[19]参见百度网讯与朱某侵犯隐私权上诉案,(2014)宁民终字第5028号。

[20]同注释18。

[21]用户画像:是指建立在真实数据之上的目标用户模型或用户标签化信息。在交互设计/产品设计领域,通常将用户画像界定为针对产品/服务目标群体真实特征的勾勒,是一种勾画目标客户、联系客户诉求与设计方向的有效工具。参见库珀,《交互设计之路》,电子工业出版社,2006年第10页;郝胜宇,陈静仁,《大数据时代用户画像助力企业实现精准化营销》,中国集体经济2016( 4)。

[22] (2015)浦民三(知)初字第528号中另一被告上海杰图软件技术有限公司,在一审判决中认定不构成共同侵权,因此未承担责任。原告汉涛公司在诉求中同时提出消除影响的诉求,经一审法院审理未获支持。

[23]大众点评网诉百度网讯公司不正当竞争案中,大众点评网未对百度进行Robots协议限制,但法院认定其中未进行Robots协议限制抓取,并不代表同意使用信息且不构成不正当竞争。参见(2015)浦民三(知)初字第528号。

[24]  (2015)浦民三(知)初字第528号中涉及汉涛公司关于百度网讯公司构成虚假宣传的主张、使用“大众点评”等标识构成擅自使用知名服务特有名称的内容未予支持。

[25]参见北京百度网讯科技有限公司与上海汉涛信息咨询有限公司等不正当竞争纠纷上诉案,(2016)沪73民终242号。

[26]“User-Generated Content”(UGC)是指“用户生成内容”,除了比较常用的“UGC”以外,还有“User-Created Content(UCC)”、“ConsumerGenerated Media”等表达方式。UGC这个术语在2005年由网络出版和新媒体出版界最先提出。现在关于还没有一个公认的定义,其中较有影响力的界定是由世界经济合作与发展组织(OECD)在2007年的报告中提出的。该定义描述了的三个特性①Internet上公开可用的内容②此内容具有一定程度的创新性③非专业人员或权威人士创作。参见OECD. Participative Web and User-Created Content: Web 2.0, Wikis andSocial Networking.

http://www.oecd.org/document/40/0,3343,en_2649_34223_39428648_1_1_1_1,00.html,访问时间2017年8月20日。

[27]在2017年8月的HiQ诉领英案(Case No. 17-cv-03301-EMC)中,HiQ公司在联邦地区法院加利福尼亚北区申请初步禁令获得支持,其中数据的利用方式是通过数据进行后台分析,且案件本身基于反垄断层面加以考量,而非大众点评网与百度网讯案中的前台重现与复制,且HiQ诉领英案中并未进行实体性判断,仅对禁令的必要性进行了分析。




本文载于《网络信息法学研究》2018年第1期

感谢作者对本公众号的授权

本文仅作学习交流之用


© 方济众 





往期荐读







编辑:钟柳依


欢迎点击“阅读原文”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存