集成平台、数据中台、大数据平台
carpe diem: 各位,请问数据中台和集成平台的区别在哪里,除了名字不一样?
游卓: 个人理解,数据中台只是汇聚数据,业务模块还是各自的; 集成平台则是集成业务模块到一个框架里。 carpe diem: 这么说来,数据中台与数据仓库差不多?
筱澜工作室: 每个厂家的定义都不一样。 现在流行概念,有数据湖、数据中台、集成平台。 我认为集成平台是定义一个标准,推动数据利用; 而数据中台就是在这个标准下利用数据。
最初不相识: 个人理解,集成平台是一个接口中转器,数据中台是数据能力提供者。
carpe diem: 数据能力提供者怎么理解?
璞玉: 个人感觉,集成平台侧重于提供接口的多样性,数据中台侧重于提供服务,简化上层应用。
游卓: 集成平台主要还是框架的集成,数据中台在于数据的共享互用。
carpe diem: 汇聚这些数据用来做科研分析? 还是有其他用处?
筱澜工作室: 建立数据湖的步骤: 第一步,“挖个大坑”,建立中央存储库; 第二步,“持续灌水”,连接数据源,转换和导入数据。 数据湖就是个“坑”,反正有了大坑(中央存储库),又有了各种水管(ETL工具和连接器),什么样的数据都可以囤起来。 这种湖,浪太大,水太浑,数据量巨大,数据价值密度却不高,更适合面向数据科学、机器学习等场景。 但实际用得怎么样不知道了,没见过成功的场景。 湖建好了,预算花了,价值却并没有发挥出来,数据湖就像垃圾桶,啥数据都往里倒,最终变成了“数据沼泽”。 不知道对不对?
carpe diem: 这么说的话,我感觉数据中台和大数据平台感觉差不多呢,感觉都是抽取利用分析呢?
薛万国 : 看了各位的发言,说点个人认识: 集成平台的目的是实现异构系统的互联互通,大数据平台的目的是为开展数据的二次分析利用,数据中台的目的是对数据进行加工、供业务信息系统使用(为业务赋能)。 三者的目的、技术都不同。
筱澜工作室: 我又迷糊了,感觉大数据平台和数据中台好像没有太多的区别了?
薛万国: 一个是随机分析,一个是固化分析。
筱澜工作室: @薛万国 ,能不能举例说明一下,我有点似懂非懂的感觉?
薛万国: 大数据平台就是面向数据的挖掘分析。 比如,临床科室提出一个临床假设“肺癌和吸烟不相关”,可以通过大数据平台检索病例、处理数据、建立分析模型,得出结论。 这样的数据挖掘分析随问题而异,整个过程在大数据平台上进行。 而数据中台的本质是为业务赋能。 比如,我们在业务中需要进行VTE(静脉血栓栓塞症)筛查,多个系统都要用到此功能,而这个功能又需要对数据进行分析处理后评分。 这个功能就可以在数据中台上实现,然后各系统共享。 大数据平台上的数据分析通常是随机问题,而数据中台是“制式”问题。 前者不一定要实时,而后者实时性较强。
天柱: 有点明白了,是不是三个系统有交集(都能对接多个异构系统),但是三者都有各自的作用和目的,不是单纯的包含关系?
薛万国: 大数据平台和数据中台在一定程度上会重合,但与集成平台之间则是风马牛不相及。 集成平台侧重流程集成,因此重点是数据交换,但不做数据存储。
天柱: 难怪现在大数据平台被公司用得好的场景主要是BI、报表、大屏,而不是书里说的数据最后能反作用于业务系统,提高业务系统能力。 原来是这样。
carpe diem: 薛主任您好,听完您的讲解,受益颇深,同时也有个问题想请教一下: 是否可以理解为大数据平台是临床业务需求驱动数据进行数据利用并分析? 数据中台这个例子是指中台利用更趋向于行业内规范化的标准驱动业务? 那么在刚刚的例子中,中台实际应用场景实现共享后,厂商获取到数据后会去做数据的实际应用,还是说中台只是驱动业务的规范化?
薛万国: 一般来说,数据中台应该是信息系统的一部分,是一种信息系统的架构模式。 而大数据平台是信息系统之外的另一个设施。 数据中台和信息系统属于异构的情况还比较少。
筱澜工作室: @薛万国 ,大数据平台和数据仓库有什么区别? 现在概念太多了,薛主任能不能讲讲?
薛万国: 那就试着再说一下。 数据仓库是围绕主题对数据的再组织,比如围绕收入,把数据按照科室、月份、项目等维度组织成多维立方体,便于数据的联机分析(On-Line Analytical Processing,OLAP)。 而大数据平台,包括前面也有网友提到的数据湖,一般是一个数据模型,来组织数据,不面向特定主题的数据组织,也不一定支持OLAP。
筱澜工作室: @朱小兵@HIT专家网 朱总这个平台好,有大神,授业解惑。
朱小兵@HIT专家网: 爬楼学习,保存经典。
(上述内容来源于“HIT专家网-医信工程师交流群”讨论,HIT专家网整理,未经发言者本人审核确认)
Odin文章评论: