财新传媒
财新传媒
1111111
财新通行证
观点

数据融合:大数据分析的瓶颈

2016年03月23日 09:29
T中
数据处理新工具使数据科学家从数据准备的繁琐工作中解放出来,但如何根据每个数据分析项目量体定制,融合多源数据以形成有效的分析数据集仍是数据科学家必须面对的一个更具挑战性的瓶颈

  【财新网】(专栏作家 张小彦)利用互联网购物的营销数据来追踪和勾画消费行为并以此为据促销是大数据应用的成功典型案例。有些人已此将大数据吹得神乎其神,好像它能成为万能药。其实,这只是大数据应用中的很小一部分。作为智能决策的支持手段之一,大数据在企业、事业、政府、社会管理和发展上的应用是更重要的挑战。在这里,多源数据的融合就成为大数据分析中的瓶颈。

  每个亲身参加过大数据项目的数据科学家、数据分析师、数据库管理员都会告诉你,项目的80%的时间和经费花在数据的准备工作上。这其中多源数据的融合是最耗费资源的任务之一。难怪最近纽约时报惊呼:“数据科学家把高达 80%的时间用于数据准备而不是用来发现新的商业智能”。

责任编辑:张帆
版面编辑:刘潇

观点频道所发布文章及图片之版权属作者本人及/或相关权利人所有,未经作者及/或相关权利人单独授权,任何网站、平面媒体不得予以转载。财新网对相关媒体的网站信息内容转载授权并不包括上述文章及图片。文章均为作者个人观点,不代表财新网的立场和观点。

推荐阅读

马斯克“意外”访华 会推动FSD落地吗?(附视频)

车展观察|“红情绿意”触动中国车企流量焦虑

北京物流仓储租金多年来首次下降 不同区域现分化

重庆燃气调查发现多计收337.9万元 多地开展“三表”督查

雪松泡沫破了|编辑荐读

财新移动
说说你的看法...
分享
取消
发送
注册
 分享成功