寻找隐藏的关联

作者:三联生活周刊

(文 / 小贝)

寻找隐藏的关联0( 《数据分析》 )

美国《商业周刊》记者斯蒂芬·贝克在《数据分析》一书中说,人类一直在制造大量信息。每打一次电话、每买一包口香糖或香烟都会增加关于我们的信息。但直到目前,大部分信息都消失了。我们写下的文字在纸上褪色,我们的移动没有被追踪。信息可以数字化之后,只要把它们放进模型,就可以破解出零散、随机的信息中隐藏的关联。

贝克描写了几位数据分析师的工作。开广告公司的摩根追踪人们上网冲浪的过程。一度那些经常点击租车广告的人让他很纳闷,在这些人中,人数最多的一组都去看过一个讣告列表网站。他说这可能是因为,有人去世了,你要飞过去参加葬礼,然后需要租一辆车。不知什么原因,很多喜欢看爱情片的人也点击了租车广告。

“43岁的摩根头发被推向一侧,好像小时候他妈妈用梳子蘸了一点水,给他梳了一下头,从此他的头发就待在那儿了。他在宾夕法尼亚西部的一个小镇长大。每年2月2日的土拨鼠日,该镇会有一群人围拢在一只关在笼子里的老鼠周围,研究老鼠对它自己的影子的反应。根据古老的凯尔特人的传说,这一数据能告诉他们春天会很快到来还是将延迟到3月底(如果那天多云,土拨鼠看不到自己的影子,将会有一场温暖的春雨,冬天将结束;如果是晴天,土拨鼠看到了自己的影子,就预示着严冬还没结束)。摩根把这一传说的预测推向了极致。”

贝克想象,将来我们的电子邮件、博客、信用卡、日用品消费、我们的脉搏和面部表情,甚至我们身体的运动都会反馈给一帮数据分析师,随后他们告诉我们个人化的购物选择、实时的医疗警告、合适的约会对象。如果你是个窃贼或恐怖分子,一群数据分析警探将总结出你的行为模式,把你搜查出来。如果你会患上帕金森症或老年痴呆症——也许你在电子邮件中的用词不再那样汪洋恣肆了,他们会比医生更早知道。贝克预言,我们将会有一个仪表板,担当我们生活的控制面板,连接到我们身体上的传感器将提供关于我们健康状况的数据。虽然这种技术刚刚起步,但终将造福我们的生活。

财经记者罗杰·罗文斯坦对数据分析技术表示怀疑:“数据分析将人们定义成仅仅是数据的总和。对手持锤子的人来说,任何人看起来都像钉子。对数据分析师来说,我们的一举一动都成了数字化市场的钉子。但人的性格真的可以解构成数据吗?可不可以将人还原成数字?最后一个问题是,这种技术是否可靠?”比如,搜索博客上提到的芳香剂和啤酒真的能预测博客主人的行为和口味吗?贝克并未宣称数据分析技术已经很完善,他写道,曾经有一次,一个电子感应器报告说一位病人的体重突然显著增加,结果发现是因为她的猫爬到了她身上。贝克承认这种技术还需要改进。

很多人担心数据分析能改善我们的生活,但也会侵犯隐私。对此贝克说,在人类历史的大部分时间内,我们都没有多少隐私可言。在20世纪中叶之前,大部分人都居住在很小的社区里,人们看得到我们所有的活动。杂货店老板知道我们买什么样的食物,理发师知道我们的个人生活。后来我们开始在超市买东西,我们有了汽车,以各种方式相互隔离。现在,由于很多东西都数字化了,我们只能尽力在牺牲自己的一些隐私时为自己争取一些好处。比如,在获得超市的会员卡时你牺牲了隐私,你就跟他们讨价还价:“我告诉你我每个星期吃什么,作为交换,你要给我一些折扣。”有两家超市正在测试一种智能购物车,从理论上说,它可以根据顾客的消费记录和他们已经放进购物车里的东西用折扣诱使顾客购买更多的商品。数据分析师会根据顾客的消费记录对他们进行分类,预测他们会对智能购物车屏幕上显示的特殊优惠信息做何反应,他们能够判断出某位顾客是不是在省钱或节食。德国也在开发类似的智能购物车,但由于保护隐私的规定更加严格,所以前景不是很广阔。据贝克说,美国是来自全世界的数据分析师的避风港,美国人乐于向公司提供个人信息以换取优惠,向国土安全部提供信息以换取安全感。

他也告诉读者如何保护自己的隐私:“我在把数据透露给公司时,我会用这样一个妙招,把这个公司的名字的第一个字母作为我的中间名的首字母。比如《经济学家》以为我名叫斯蒂芬·E.贝克。这样,我能够看出他们把我注册时提供的数据卖给了谁。”■ 关联数据分析大数据

下一篇: 无之道