分析:移动互联网、大数据时代下的隐私保护与电子数据
很高兴有这个机会跟大家分享一下大数据时代下的司法问题,大数据这个名词现在变得非常流行,到底什么是大数据?简单给大家一组数据来显示一下,据谷歌的估计,在整个互联网的数据时代,五乘以十的十八次方,而IBM每天产生新的数据,包括互联网数据。而且根据这个数据来分析,我们每天所有的数据,90%的数据是最近两年内产生的。不光是系统企业的数据,同时最近几年个人的数据也急剧增加,大家都知道从Web1.0变到Web2.0,个人可以大量的分析数据,用户从一个普通的原来的数据获取者使用者变成数据的创始人。举个例子是Facebook为,每天产生的评论等是27亿跳的基础上增长,我相信在中国的企业,比如说像淘宝、新浪,他们的数据量大概是这个样子的。也就是说在这个过程中很多数据别企业收集和应用到了。
大数据…比如说高速度,数据的产生非常快,需要我们在很短的时间内能够收到数据进行处理,得到的知识对实际进行指导。还有一个是多样性的并不仅仅是数据大,而且是当前的数据来源变得多样化,它们有不同的类型和不同的质量,比如说对企业来说需要对不同的数据进行整合,进行连接和分析,而变成有用的信息。
大数据的集成应用非常广泛,我们都听了很多的报道,大家也有很多的实践,比如说在金融业、商业、营销广告、医疗、健康、科学创新或者是国家安全上都有很大的大数据方面的应用。另外一方面,大数据也对个人隐私产生了很大的影响,很多人担心因为大数据的研究,是不是可能对个人隐私受到很大的侵犯。我们都知道隐私权是一个基本人权之一,各国都有很多关于隐私保护的法律框架,隐私问题一直是个数据管理的重大挑战,今天因为有大数据,它又更大的影响了隐私保护的范围和方式,有多个方面,比如说数据本身方式的改变,还有是对数据的分析有很多结果,可能是涉及到个人的隐私或者是怎么样,对这些衍生的结果进行保护,还有一个是法律适用范围的问题。
给大家举两个例子,一个例子是去年2012年的时候有一个报告,Target是美国的一个零售商,像沃尔玛一样,他就报道说为什么这个零售商知道这个女孩怀孕了而她的父亲不知道,就是因为这个厂商对这个用户的购买行为进行分析,推导出来这个女孩怀孕了,然后就寄一些怀孕的优惠券之类的东西,这个父亲就很奇怪。结果是她女儿怀孕了。所以这个例子告诉我们一些不起眼的很平常的数据经过大数据的分析和其他的数据整合可以能够分析出很多很敏感的个人信息,这就涉及到一个隐私保护。
刚才我们还谈到法律界限的问题,现在有一个法律在美国叫做HIPPA,是一个关于健康保险,或者是健康医疗方面个人隐私的保护法案,在大数据之前这个法案的适用主体是比较清楚的,如果你是医院、诊所、保险公司,可能会受到用户的隐私信息、健康信息,这些法律适用在这些。但是在今天大数据的情况下,尽管看起来是没有关系的执法商,可能也会收集到有关的信息。比如说刚才的例子,我既然分析出来你怀孕了,这是你的健康信息,是不是这个法律可以适用在你这上面。还有我们现在在手机上用很多的应用,比如说你跑步的信息、位置信息,这些信息加起来综合在一起,也可能涉及到你自己的健康信息,是不是说明这些应用也要受到HIPAA的管理?这就使得应用主体变得非常模糊了。
国际上有一些关于隐私保护的公认原则,比如说收集限制、数据质量、目的确定等等的原则,在大数据时代下,我们都要对这些原则进行思考,是不是改变了原则的适用性和是否有新的挑战,使这些原则得到很好的维护。由于时间关系我挑几条来做一个分析,第一条是收集限制原则,意思是个人信息收集应该合法和公开透明,不应该对个人财产造成伤害,而且要用户有知情权或者是同意。但是在大数据的情况下,这条原则变得模糊,比如说我推算出来的信息算不算个人隐私?如果是推算出来的信息我怎么样能够让用户知道我推算出来的是隐私的信息?而且由于大数据分析的能力,原来一些大家认为不可识别的信息,比如说我买的一些东西,如果只是说那个人买了东西,我并不知道那个人是谁。但是在大数据情况下,当这些信息和其他的信息进行整合分析之后,这些不可识别信息变成可识别信息了,它所适用的法律条款就不一样了。而且现在由于数据收集无所不在,你和任何一个网站进行交互的时候,很多数据都会收集起来,使得用户的知情权很难得到维护,大家在不知情的情况下数据就被收集走了。
再来讲一个原则叫做使用限制原则,这个基本原则的意思是说如果你收集了我的信息,你要告诉我为什么要收集这个信息,你收集以后的使用情况和你当时所明确的目的性应该是一致的。但是这个原则在大数据时代也变得非常困难,因为通常情况下你收集的数据在大数据分析之后就会发生改变,收集时候并不确切地知道将来会用于什么目的,如果说只能用于这些数据收集之后用于原来提供的目的的情况下,很多新的有价值的分析服务就不能实现了,比如说医疗研究、诈骗预防或者是信用评估,国家安全等等。也许我们需要改变它整个的结构,原来是一个白名单的结构,收集数据,你要做市场分析,做交易完成,现在有可能要变成一个黑名单结构,就是说我收集你的数据不会用来侵犯你的隐私,不会用来判断出你在某个时间段在某个地点,其他所有的看起来合法的应用目的都可以来进行使用。
还有一个比较重要的原则是个人参与原则,这个原则就是说如果你的被收集到,个人有权知道哪些数据被收集到了,而且可以知道是否正确,可以根据法律来要求修改和删除这些数据。这个原则在大数据下有很大的实践挑战,首先因为对一个企业来说他收集到的个人数据数量非常庞大,用户区域也非常大,如果每个人都向企业提这样的要求,对企业来说很难满足每个人的要求。而且尤其是数据收集的渠道非常多,对每个个人来说,他都不知道你的数据被收集了,也不知道被谁收集了,所以一个用户很难真正向一个企业说我希望看我的数据是什么样的,然后提出更改或者是删除的要求。而且在这种情况下,对一些衍生数据,推断出来的数据是不是适用这个范围?对于商家来说,我推论出来的信息是我企业推论的结果,我怎么可以把这个东西告诉你?但是对用户来说你推算出来我的信息我应该知道这些信息,这样就产生了矛盾。
(编辑:ASP站长网) |