聊聊数据中台

今天不知道写点什么,就来聊聊「数据中台」吧。

什么是中台

现在到处都在说中台,企业中台,技术中台,移动中台,研发中台,这个已经被用烂了的词,但是没有人告诉我到底什么是中台。

所谓「中台」,从字面意思上理解就是居于前台和后台之间的工作,引述一段美军作战阵型的演变来帮助大家理解中台:

美军在二战时,以军来为单位作战;到了越战时,以营为单位作战;到了中东战斗的时候,以7人或者11人的极小班排去作战,这是今天最灵活的军事组织,也是核心竞争力和打击能力最强的一个组织。而美军之所以能灵活作战,敢放这么小的团队到前方,是因为有非常强的中台能力,这些能力包括战斗直升机、舰炮远程支援、战术导弹系统、战斗机支援体系等,这些能力能支持小团队快速做判断,并且引领整个炮火覆盖和定点清除。

中台不是具体系统,是一个技术架构,可以从以下几个方面理解:

  • 中台提供一种数据聚合服务,介于前台和后台之间
  • 企业应用会依赖很多第三方服务和数据,需要一个中间层做数据互通
  • 为了降低频繁更换核心系统的风险,后台系统逐渐只关注某个业务场景的具体实现,需要消除和外部数据的过多接口,这些数据对接工作逐渐抽离出来放到一个服务层中

什么是数据中台

数据中台不是一套软件系统,也不是一个标准化产品,只能说,站在企业的角度上,数据中台更多地指向企业的业务目标,也即帮助企业沉淀业务能力,提升业务效率,最终完成数字化转型。

数据中台解决的问题可以总结为如下三点:

  • 效率:为什么应用开发增加一个报表,就要十几天时间?为什么不能实时获得用户推荐清单?当业务人员对数据产生一点疑问的时候,需要花费很长的时间,结果发现是数据源的数据变了,最终影响上线时间。
  • 协作问题:当业务应用开发的时候,虽然和别的项目需求大致差不多,但因为是别的项目组维护的,所以数据还是要自己再开发一遍。
  • 能力问题:数据的处理和维护是一个相对独立的技术,需要相当专业的人来完成,但是很多时候,我们有一大把的应用开发人员,而数据开发人员很少。

一个企业的数据要能够充分发挥价值,很重要的一个前提条件就是这个企业的数据结构和数据资产目录是对整个企业开放的。所有人都能够通过这个资产目录了解公司有哪些类别的数据、包含什么属性、源数据由谁管理,这样就可以快速搞清楚这些数据是不是自己需要的。但数据本身可以不开放,因为数据是有隐私信息和安全级别的。

数据中台需要汇聚企业的内部数据、公开数据、线上数据和线下数据:

  • 内部数据包含企业的各业务系统中实时产⽣的数据,如CRM、ERP等系统,记录企业⽇常 ⾏为数据。
  • 公开数据主要是通过爬⾍等⽅式抓取的数据,如电商⽹站商品、社交⽹站的⽤户评论等。
    线上数据指通过SDK等⽅式获取的数据,主要是移动设备上的⽤户⾏为数据、LBS位置数 据等。
  • 线下数据指⼀类是通过WIFI、蓝⽛探针获取的数据,另⼀类是公安、运营商、银联等⾼价 值数据。

基于数据中台有三种应⽤⽅式:数据集,如数据标签、⽤户画像等;数据模型,融合了数据和算法,如销量预测、⻛风控建模等;数据应⽤,将数据能⼒和软件能⼒封装,形成最终数据产品, 如选址、⽤户账户管理等。如个推通过服务第三⽅移动 APP,可以获取移动设备使⽤ APP 的时 ⻓长,从⽽推断出该设备⽤户的⽤户画像,最终⽤于⼴告营销。

推荐阅读

The Why·Liam·Blog by WhyLiam is licensed under a Creative Commons BY-NC-ND 4.0 International License.

WhyLiam创作并维护的Why·Liam·Blog采用创作共用保留署名-非商业-禁止演绎4.0国际许可证

本文首发于Why·Liam·Blog (https://blog.naaln.com),版权所有,侵权必究。

本文永久链接:https://blog.naaln.com/2019/05/data-center/