他在第一时间联系了集团CTO,希望将各部门数据在一天内导出给他。
这时候,CTO犯难了:
公司现有的资源池可自如应对TB级数据量,而小张要的数据量粗略估计达到了PB级,大大超出了公司现有资源池承受范围,只能以时间为代价导出;而为了不常见场景扩大公司资源池,整体的成本太高。
面对小张遇到的棘手问题,云湖湖推荐了一款华为云大数据查询分析神器——数据湖探索(DLI)服务;一个DLI即可撬动EB级数据量联合查询,每CU仅需0.35元/小时(1CU=1Core4G Mem),1CU包月仅需150元。
数据湖探索(DLI)服务 2.0是完全兼容Apache Spark和Apache Flink生态的Serverless大数据计算分析服务,用户仅需使用标准SQL或程序即可查询分析各类异构数据源。
DLI服务架构——Serverless
DLI是无服务器化的大数据查询分析服务它的优势在于:
(1)按量计费:真正的按使用量(扫描量/CU时)计费,不运行作业时0费用。
(2)自动扩缩容:根据业务负载,对计算资源进行预估和自动扩缩容。
DLI Serverless架构就可轻松解决小张成本、资源不足和临时性业务需求的问题。
1、DLI核心引擎——Spark+Flink
Spark是用于大规模数据处理的统一分析引擎,聚焦于查询计算分析。DLI在开源Spark基础上进行了大量的性能优化与服务化改造,不仅兼容Apache Spark生态和接口,性能较开源提升了2.5倍,在小时级即可实现EB级数据查询分析。同时,DLI也提供用于实时处理的Flink引擎。
2、DLI王牌功能——跨源分析
DLI支持云上多种云服务、自建数据库以及线下数据库,可直接实现多数据源跨库分析,构建企业的统一视图。
小张将线下数仓A与数仓B同时接入DLI,就可直接在DLI上进行联合查询。避免了两仓数据迁移再重新建仓进行联合查询的过程,轻松搞定跨库查询。
1.数据库分析+DLI 2.0 :一键建仓 保留数据库的易用体验
痛点:
(1)数据库多无法做全量分析
(2)数据库复杂关系无法查询
(3)影响在线其他数据业务
解决方案:
仅使用标准SQL即可完成大数据查询分析
2.精准营销+DLI 2.0:电商智能推荐 跨库跨源海量数据秒级查询
痛点:
(1)数据源太多怎么联合分析
(2)智能推荐需要短时间内实现
解决方案:
DLI跨源能力,轻松打破数据孤岛。现已支持10类数据源和线下自建数据。
3.日志分析+DLI 2.0:公司必备场景 按量计费成本更低
痛点:
(1)日志分析时间跨度大
(2)资源空闲大利用率低
解决方案:
本文系作者在时代Java发表,未经许可,不得转载。
如有侵权,请联系nowjava@qq.com删除。