当前位置:主页>科 研>学术交流>

大数据到底在用什么姿势塑造我们?

从庞杂的数据背后挖掘、分析用户的行为习惯和喜好,找出更符合用户「口味」的产品和服务,并结合用户需求有针对性地调整和优化自身,就是大数据的价值。



 

  元数据(Metadata)的概念

简单说,元数据是对数据本身进行描述的数据,它不是对象本身,它只描述对象的属性。

比如,一幅画本身,是数据。而这幅画的作者、完成时间、尺寸、价格、类型等等,就是它的元数据。元数据的价值,第一是能够从侧面描述对象;第二点就是可以结构化、信息化。

什么意思呢?

比如,我们要判断一幅画的价值,除了专家直接通过画的艺术性来评价,还可以通过元数据来判断。这幅画是名家的还是二流画家的?这幅画是作者在他创作鼎盛时期的作品,还是在年轻时的作品?这幅画是作者擅长的类型还是他不熟悉的?用这些描述的信息,我们就能把这幅画的价值算得八九不离十。虽然肯定会存在误差,但同样是科学合理的方法。

那用元数据而非数据本身描述对象的意义何在?

这就是在大数据上产生的价值了:对于非结构化的、非量化的对象本身,结构化的元数据可以用以快速计算和判断。

  大数据应用的第一阶段:辅助产品

最初的应用比较简单,就是用以辅助产品人员和市场人员做判断。

过去的实体产品做一次调研很麻烦。比如饮料公司,调研人员要用各种方式观看他们喝饮料的场景和步骤。问卷是最常见的,但不够准确。所以会组织各种各样专业的现场试验,要搭建环境(一般是有单面玻璃或摄像头的)、邀请志愿者,然后引导他们按照日常的习惯去完成一些操作。

显然这种办法非常笨重。

而现在的互联网产品则根本无须这么麻烦。用户所有的使用数据、行为,都是记录在案的,想知道什么,瞬间就能分析出来。过去想知道用户有没有做一件事,有没有用过这个功能,实在太难了。

现在呢,想知道点击这个行为点击了几下、点击在哪里、什么时候点的、甚至这是在什么地方点的,都一清二楚。平时用户用不用这个功能、怎么用这个功能,也就一目了然。

对于产品设计者来说,这是至关重要的数据。而且,这是完整的数据!如果是互联网产品,那么我知道的是所有用户的数据,不是过去传统行业产品的样本数据。

腾讯知道所有微信用户有多少用朋友圈、知道这些用户每天都发几条朋友圈、知道这些用户每天都发了什么。每一个数据都是真实可用的。



 

(过去发行量再大的报纸也很难知道读者性别,然而现在再小的微信公众号也可以实时获取)

在实体产品的行业,随着未来整个产品从生产-销售-使用的信息化,大数据也会渐渐起到更大的作用。过去我卖的一瓶水,可能到某个超市就断掉了,我不知道这瓶水被谁买走了。

但现在我在天猫卖的一瓶水,我知道对方这个用户是每个月买十箱水的,他的地址是某个高档餐厅,那我就知道这瓶水的目标受众是谁了。

这是元数据的价值所在。

(责任编辑:安博涛)

分享到:

更多
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
  • 微笑/wx
  • 撇嘴/pz
  • 抓狂/zk
  • 流汗/lh
  • 大兵/db
  • 奋斗/fd
  • 疑问/yw
  • 晕/y
  • 偷笑/wx
  • 可爱/ka
  • 傲慢/am
  • 惊恐/jk
用户名: 验证码:点击我更换图片
资料下载专区
图文资讯

我要用1T带宽DDoS你:这句话竟然拿到了10万

我要用1T带宽DDoS你:这句话竟然拿到了10万美

利用DDoS攻击威胁企业以勒索金钱,是一件太有利可图的事情,以致于一个网络犯罪团伙在...[详细]

这种密钥真得破不了:量子密码学研究新突破

这种密钥真得破不了:量子密码学研究新突破

通过同一个光子分流器输出端口的光子无法继续分离 剑桥大学和东芝欧洲研究分会的研究...[详细]

什么是SS7?黑客是如何滥用SS7的?

什么是SS7?黑客是如何滥用SS7的?

一谈及到网络安全问题,用户们总是觉得很头疼。除去要记住你的每一个账号以及对应的密...[详细]

针对物联网设备的攻击过程概述

针对物联网设备的攻击过程概述

分享到:据了解,Avast公司的安全研究人员入侵了一台Vizio智能电视,并成功获取到了目...[详细]

漏洞与补丁不是一回事 打上补丁也会有漏洞

漏洞与补丁不是一回事 打上补丁也会有漏洞

漏洞和补丁之间存在相互作用关系,它在任何大型机构的信息安全活动中都是必不可少的部...[详细]

返回首页 返回顶部