持续定义Saas模式云数据仓库+BI

云数据仓库概述


今天和大家一起探讨一下我们Saas模式下云数据仓库加上商业智能BI能有什么新的东西出来。我们先来看一下云数据仓库的一些概述。预测到2025年, 全球数据增长至175ZB, 中国数据量增长至48.6ZB。数据量暴涨这个前提下,我们看一下BI市场规模的增长。预测到2023年,我们中国BI软件市场年复合增长率为32%。云计算也同样在增速发展,2019年第四季中国云数据市场的增长率已经达到66.9%。



云数据仓库可以让企业几分钟内创建并开始使用数据仓库服务,在更低的成本下,专注业务,通过对大规模数据进行多样化的处理、挖掘、分析,快速获得业务洞察。它有四大特点:大规模数据分析,高性能,灵活扩容,低成本。



BI使用场景与趋势

商业智能(BI,Business Intelligence)是一种以提供决策分析性的运营数据为目的而建立的信息系统。随着我们社会发展以及数据量的爆发,在这么大量的数据支持之下,企业希望能快速从这些数据里边挖掘出更科学的一些数据,然后对我们的企业有一个科学化和数据化决策的帮助力。同时,BI也会助力企业用到一个精细化运营,客户关系维护,还有成本控制等。
我们看一下商业智能建立一个信息系统它主要的一个流程。首先是数据接入,将分散于我们企业内外各种数据集成和进行整合。然后再进入一个数据准备阶段,就是一个ETL的阶段。然后再到一个数据分析的阶段,最后将这些成果交给决策层,决策层就可以通过这数据进行一些决策。不管是精细化运营,还是客户维护关系,还是成本控制,都可以从这些数据里边得到一些助力。



随着数据量的暴涨,我们的业务快速的增长,产生了各种分析需求。不仅仅是分析多样,而且还想要实时的,比如说秒级的即时查询。同时在这么大量的数据基础上,数据的安全合规也越来越受到重视。所以需要快速的整合多系统数据和实现信息透明,以及构建一个统一的简单易用的可视化分析平台,提高制表效率。这已经成为BI系统的新的趋势。



基于MaxCompute云数仓+BI的特性

MaxCompute(原ODPS)是一项大数据计算服务,它能提供灵活快速、完全托管、高性能、低成本、安全的PB级数据仓库解决方案,使您可以经济并高效的分析处理海量数据。基于MaxCompute云数据仓库的基本架构如下图所示。底层的集群是MaxCompute本身搭建好的,用户无需感知。再往上,有多种的计算引擎。引擎之上提供各种的API,还有深度的集成了一个一站式大数据智能云研发平台DataWorks。在云数据仓库的这么一个体系下,可以做数据准备,进行各种清洗、加工、分析之后,就可以进入一个数据消费的阶段。



总结一下MaxCompute云数仓的特性。第一,是一个开箱即用的在线服务。免平台运维,总体拥有成本低。第二,极致弹性能力。弹性扩展,无需容量规划即可应对业务规模的快速变化。第三,简单易用,多功能计算服务。多种计算模型,多种数据通道,外部数据源联邦计算。第四,企业级安全能力。多租户安全保障机制,细粒度授权,数据加密、脱敏,备份恢复。第五,生态融合。支持多样数据源、生态工具和标准。



基于MaxCompute云数据仓库,我们和BI工具是如何对接的呢。MaxCompute主要是一个存储和计算服务,加上一个数据开发平台DataWorks,组成了一个离线的云数据仓库。在这之上,深度的集成了一个阿里云的Quick BI。它是一个分析报表工具,直接连接一MaxCompute的数据表即可以自己对这个表进行分析。还有第三方的一些工具,帆软,Tableau。同时我们在生态这一方面,JDBC同样也是支持。还有一些企业、一些客户对于商业智能这一块有更加多样化的一个需求或者个性的需求,现有对接的这些工具有可能不支持,那么它也可以通过SDK的方式来连接,从而实现基于MaxCompute云数据仓库对接的一个商业智能的信息平台。



我们看一下MaxCompute离线数仓是怎么实现一个高性能低延迟的分析查询。它可以直接读取离线数仓,支持多样化的查询分析,包括一些简单的查询、复杂的查询、点查询、联邦查询等等。它底层也可以有丰富的数据源,通过MaxCompute + Hologres组成一个交互式分析。这么一个大数据生态下,它都可以无缝的对接。比如说Quick BI,Tableau,帆软。所以它可以做到很快的上手,通过这么一个组合我们可以很快速的实现一个企业的信息平台。



实践案例

接下来我们看一下几个实践案例。

展开阅读全文

本文系作者在时代Java发表,未经许可,不得转载。

如有侵权,请联系nowjava@qq.com删除。

编辑于

关注时代Java

关注时代Java