大数据是万能的神?NO,那么如何避免数据科学的「货物崇拜」?

百家 作者:原力AI学院 2017-08-17 10:24:20

原作者:Richard Weiss  本文为36大数据独家翻译  译者田倩云


数据科学正在被当做货物一样崇拜


数据科学已经逐渐成为各个行业公司的重要竞争优势。随着越来越多的公司开始引进数据管理的新模式,公司内部就可能会产生所谓的“货物崇拜”,即去学习模仿一系列行为而不去了解其中动机的现象。在数据科学的应用方面,公司很可能会照搬数据科学背后的技术体系,而忽略了建立数据驱动型的组织文化。这种情况颇为常见,对此我想分享一下解决之法。

数据科学是一种强大的工具,其优势在于:


  • 自动决策

  • 辅助人为决策


虽然有许多公司已经认识到了数据科学的重要性,但他们往往没有匹配上有效的数据能力。个人认为这源于对数据科学的根本性误解,这种误解让人们在忽略自身的基础上进行数据科学的技术构架。


其他的领域也存在相似的问题。本文阐述了我对于规避此类现象的最佳办法以及如何从数据科学投资领域获得更多价值的思考。


一个典型的数据科学项目


绝大多数数据科学项目和其他的IT项目一样,遵循以下的发展轨迹:


  • 上层管理者同意立项,组员们踌躇满志,饱含希望;

  • 初始原型看似前途无量,项目本身也似乎能解决一个非常重要的组织问题;

  • 项目中期效果不佳,没能完成既定目标;

  • 同时,公司管理层不再关心项目的进展,项目推进受阻;

  • 项目结束,但是没有能实现最初承诺的组织变革。

对于数据项目而言,这个流程本身就是有问题的。因为数据项目意味着引入新的管理方法和组织行为。与许多传统的IT项目不同,数据项目是对现有流程的改进,并且旨在改变组织整体的运行模式。


这个项目为什么失败了?多数人,尤其是数据科学家,会归咎于技术缺陷或是管理不当。然而在我看来,早在初始设计没能理清项目完成后要如何适应组织运作的时候,失败就已成定局。


数据科学的人性面


就我的经验来看,一个“数据驱动型组织”要做的远不止分析和测量。从根本上说,要成为一家数据驱动的公司,就需要让数据成为公司员工日常工作生活的一部分。


这与上述项目形成了鲜明对比,那些项目更注重技术应用而非达成目标,是种典型的货物崇拜行为,例如最为常见的“企业数据湖项目”。许多公司认为数据仓库是必须品,但建立这样的分析项目却并不会改变公司的内部文化,其问题就在于项目是以技术引进而非人文影响的形式推进的。


值得注意的是我们对此类项目涉及到的技术有非常清楚的认识,它很可能涉及到:


  • 一个大型SQL数据库

  • ETL工具

  • 一个前端(工具),可以是tableau之类的

  • 以及一堆经理不会去读的报告。


相比之下,一个可以功能为“用于选择手机销售策略工具”的优秀数据项目能帮我们了解项目本身在组织内合适的位置:


  • 我们知道这可能是家电信公司

  • 该工具仅面向零售

  • 我们知道这个工具提供了销售建议

  • 它可能会检测销售结果并自我优化。这毕竟是一个数据项目。它可能使用了一个数据仓库进行操作,并以tableau呈现结果。


因此,为了避免对于数据的盲目崇拜,公司不应再着重于技术,而应与有经验的技术人员合作,应用技术解决现有的组织问题。


一个成功的数据项目


上述的手机销售工具是怎样成形的?


  • 电信公司聘用了数据经验丰富的战略制定者

  • 他们确定了销售计划中的平均水平,这可以通过统计工具轻松解决

  • 他们与利益相关者密切合作:

    • 企业高管,了解项目和公司目标之间的关系,同时制定项目目标

    • 零售商,了解他们的需求

    • 零售经理,了解零售商为什么会被强制要求完成超额的销售计划

    • 考虑了全部的因素后,设计出一个技术含量并不高深的最佳解决方案用于提供决策建议和监测反馈。一切都并不复杂。

    • 最后,确保零售商实现了“最小客户流失”而不是“最大销售数量”的目标。


    该项目的最大特点在于它表现为组织的一部分,提出了一个明确的问题,然后构建了一个解决方案。找出组织能力范围内可以被轻松区分并且能被数据科学分析的部分是很重要的,接下来我将对此进行解释。


    传播数据科学


    当数据科学出现的时候,我曾一度以为它将席卷所有公司。这是个很天真的想法。理由也很简单:任何掌握了数据科学的人都能证明自己的努力比同事有更优质的结果。这是有回报的,由于竞争压力,数据科学讲很快成为每个人内部需求。


    然而,这个想法假定了一个做分析性演示的人会比一个做出说服力不够演示的人更受欢迎。简单来说,我假定了数据驱动文化是存在的,然而现实是企业仍在努力创建这样的文化。


    这就是为什么我之前的建议是选择一个小的,甚至可以是组织中独立的一部分。这样做可以更便于将该组人员转化为数据驱动和分析的部分。同时也能最大程度地减少数据驱动小组的业务和公司其他业务之间的矛盾,让衡量小组的项目完成指标变得更加简单。


    “边界最小化”的另一个优点是,组织的层级管理结构倾向于让数据科学在小组单元中实现。老板找经理们要数据分析的结果,管理们找同事,以此类推,最终会回归到项目小组这里。


    结论


    数据科学最好被看作公司文化的一种呈现形式,而不是一组成套的技术。然而,许多公司试图通过采用数据科学来创造一种新的企业文化,而不是改变原有的企业文化。


    这是可以理解的:企业文化是很难改变的,但数据科学与其他的文化有一些细微的差别。我认为传播一种数据驱动文化的最佳方向是自上而下,从要求分析性报告开始。这么做意味着企业各个部门都必须做到数据驱动,并要求他们的下级这样执行,以此类推。对于那些试图提高分析能力的公司而言,这也意味着以获取技术为初始目标的解决方案(“我们将建一个数据仓库”或“让我们研究一个AI出来”)很可能失败。


    帮助衡量和提高公司部分绩效的解决方案(“我们将帮助您衡量营销投资回报率”或“我们将引入预测性维护措施”)会得到好评并成为长期的组织优势。


    所以总结一下:


    • 寻找那些注重组织本身而非技术的解决方案

    • 事实上,我对于技术优先的解决方案保持怀疑态度——他们真的解决了你真正的问题吗?

    • 将解决方案和问题配对,以便用数据驱动解决方案切实地评估问题。


     End 

    阅读排行榜/精华推荐
    1
    入门学习

    如果有人质疑大数据?不妨把这两个视频转给他 

    视频:大数据到底是什么 都说干大数据挣钱 1分钟告诉你都在干什么

    人人都需要知道 关于大数据最常见的10个问题

    2
    进阶修炼

    从底层到应用,那些数据人的必备技能

    如何高效地学好 R?

    一个程序员怎样才算精通Python?

    3
    数据源爬取/收集

    排名前50的开源Web爬虫用于数据挖掘

    33款可用来抓数据的开源爬虫软件工具

    在中国我们如何收集数据?全球数据收集大教程

    4
    干货教程

    PPT:数据可视化,到底该用什么软件来展示数据?

    干货|电信运营商数据价值跨行业运营的现状与思考

    大数据分析的集中化之路 建设银行大数据应用实践PPT

    【实战PPT】看工商银行如何利用大数据洞察客户心声?              

    六步,让你用Excel做出强大漂亮的数据地图

     数据商业的崛起 解密中国大数据第一股——国双

    双11剁手幕后的阿里“黑科技” OceanBase/金融云架构/ODPS/dataV

    金融行业大数据用户画像实践


    讲述大数据在金融、电信、工业、商业、电子商务、网络游戏、移动互联网等多个领域的应用,以中立、客观、专业、可信赖的态度,多层次、多维度地影响着最广泛的大数据人群

    36大数据

    长按识别二维码,关注36大数据


    搜索「36大数据」或输入36dsj.com查看更多内容。

    投稿/商务/合作:dashuju36@qq.com


    点击下方“阅读原文”查看更多

    ↓↓↓

    关注公众号:拾黑(shiheibook)了解更多

    [广告]赞助链接:

    四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
    让资讯触达的更精准有趣:https://www.0xu.cn/

    公众号 关注网络尖刀微信公众号
    随时掌握互联网精彩
    赞助链接