注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

非叙事@魏英杰的博客

时事评论、文化批评、书评随笔

 
 
 

日志

 
 
关于我

专栏作家、时事评论员 声明:本博仅代表个人意见,与所在机构无关,转载请联系本人。

网易考拉推荐

“大数据”是一把双刃剑   

2013-12-24 19:26:37|  分类: 时事评论 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

“大数据”是一把双刃剑

 

/魏英杰

 

大概是为了推广手机淘宝的“生活圈”功能,淘宝网近日公布了一组“奇葩”数据:

 

国内最爱吃鸭脖子的生活圈是杭州市的日晖新村,这里全年共花费6万多元买鸭脖子;

 

最“重口味”的生活圈是位于镇江市的花山湾生活圈,这里用户一年买了5000多个榴莲;

 

过去一年暨南大学的整个生活圈一共购买了1万多箱方便面,整体支付金额接近150万……

 

这真是一件奇妙的事情。打开手机淘宝,就可借助地理位置和收货地址,鉴定自己所在生活圈的网络消费特征。这之所以成为可能,应是拜“大数据”技术所赐,而在以往,用户数据均为商家(平台)掌握,视为“核心秘密”。当然,淘宝网开发或者说开放这项功能,一方面固然迎合了消费者的“八卦”心理,另一方面,却也是为了创造出更多消费需求。

 

但这么做却又是一件非常冒险的事情。这种做法不仅会遭人质疑,搞不好还可能惹上麻烦。上面披露的数据还不够劲爆,下面这些数据也许会让人在大乐之余生出些许担忧:

 

我们正在前往性福生活最和谐的生活圈,温州XX大厦,全年共花费3910448元买TT(安全套);

温州龙湾区XX路附近,全年人均购买25380元情趣内衣;

宁波海曙区XX家园,人均年“淘宝”消费金额达2.8万元以上,是目前国内在淘宝上消费“最土豪”的小区;

义乌XX二区全年共花费2973939元买Bra(文胸),是中国2013Bra消费量最大的生活圈;

杭州XX新村全年共花费9636426元购买金条,是中国2013年金条消费量最大的生活圈……

 

不能再转引了,否则满屏都是XX。这些XX是我打上的,淘宝网公布数据时并未进行技术处理。我为什么这么做,读者应该能够理解。你说这个小区喜欢吃鸭脖子也就罢了,另外这组数据却可能让身处该“生活圈”的人浑身不自在。假如我住在其中一个小区,平时既不买TT也不买金条,甚至不知道淘宝是什么东东,有一天同事却走过来调侃:你们小区买那么多TT(金条),是不是也有你的贡献?这时候,我该作何感想?

 

是的,淘宝这么做,哪怕没有违反什么规定,也会让人感觉被冒犯了。这种针对一个群体的生活信息披露,等于把该群体所有人都送到了聚光灯下。淘宝是否有权公开类似信息,能不能这么公开,显然是一个不可忽视的问题。

 

何况,即便这些数据不会有假,结论也是非常可疑的。一座大厦花费391万元购买TT,这是什么概念?按照每只TT价格3元计算,这意味着大厦全年消费TT共计130多万只。“臣妾做不到啊!”而据媒体实地调查,这座大厦为商住两用楼,住户仅180户。可以肯定,大厦产生巨额的TT交易量,与住户“性福生活”完全没有关系。发生巨额消费,既有可能因为小区里驻有淘宝网商,也可能只是有人在收货地址上填写了该地址。(或许意识到这一点,淘宝网页面已删除TT相关数据)上面提到的其他事例,也可以此类推。

 

淘宝的数据库无疑很强大,一旦有需要,它可以精确无误地统计各种消费数据。小到你在淘宝买了什么,花了多少钱,大到一个地区的淘宝交易量、消费特征,都能够直观、及时、准确地呈现。这正是“大数据时代”的魅力所在。大数据就是“全部”,它不需通过抽样问卷调查,不需要人工计算,便可还原一个社会的运作痕迹。但正如《大数据时代》作者维克托·迈尔-舍恩伯所揭示的,在“大数据”面前,精确度、因果关系不再是最重要的追求,关键是探索事物之间的相关性,发现其中的潜在价值。

 

淘宝网公布这组数据,由于仍然延续传统的逻辑思维,再加上试图从中得出迎合营销需要的结论,结果破绽百出,闹出了笑话。可以说,这是一个失败的“大数据”运用案例。这个案例也暴露出“大数据时代”的一个隐忧:只要你在网上活动,不论是搜索、浏览、购物还是别的什么,都将被“记录在案”,而且不知什么时候会以何种方式被人抖落出来。更悲催的是,除非运营商自我规范,否则目前用户无从对此说“不”。

 

“大数据”是一把双刃剑,如何才能既得其利又不受其害,这已经是必须面对的问题。

 

20131219

 

  评论这张
 
阅读(96923)| 评论(12)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017