【数智化案例展】苏商银行——全场景数据统一极速多维即席分析底座建设


db6b782baff2ccec4b13c6e17e16f284.jpeg

镜舟科技案例

本项目案例由镜舟科技投递并参与数据猿与上海大数据联盟联合推出的《2024中国数智化转型升级创新服务企业》榜单/奖项”评选。

4b034b8420b59a2ec5e56c8feb55d2a1.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


在 2017 年建行之初,江苏苏商银行股份有限公司(以下简称“江苏苏商银行”)确定“依托数据服务业务,科技立行”的宗旨,依托 Hadoop 生态体系搭建数仓,使用 Hive 进行数据加工处理。随着近 2 年数据量快速增长、业务场景多样化发展,该方案逐渐无法适应,暴露的尖锐痛点主要有:

1.数据链路加工复杂,导致数据开发和维护成本高。长链路下的数据口径容易发生不一致,导致业务数据应用不准确、用数需求的反馈通常需要T+1天,难以得到及时满足

2.大规模数据下的查询性能不足,随着外部竞争的激烈,前台业务人员对于数据的用数时效要求不断提高。尤其重点核心的贷款类业务,从之前的T+1时效,变为T+0.5,到现阶段的2小时内必须数据加工完成。导致科技研发和业务之间的沟通壁垒以及相互抱怨逐渐加深

基于以上2个核心诉求,江苏苏商银行迫切的希望,能够全面实现数据从源头的业务系统,到末端分析界面准实时的呈现,同时在数据湖上建仓,加速数据访问全面实现大规模下数据秒级查询分析。

时间周期:

开始时间:2023年10月

里程碑1:深入分析痛点,全面整理数据加工处理全链路环节耗时,江苏苏商银行发现在查询请求多、且数据量大的情况下,查询性能会出现明显瓶颈。后经过调研、比对业内如ClickHouse、kylin、Presto、StarRocks等数据库,最终确定采用StarRocks来构建高性能查询底层OLAP分析引擎;

里程碑2:全面升级现有BI系统。原有系统界面老旧,使用不灵活,难以适应业务多样化展示诉求;

里程碑3:联合消金、客户分析、微商、财富等部门,全面收集分析业务痛点及诉求。打通Mysql、Oracle、Hive、Kafka 等多种异构数据源之间数据实时同步链路。

截止时间:2024年3月

数智化需求

随着技术创新和科技发展,各商业银行从信息化阶段迈向数字化阶段,提高数据的处理和应用的价值成为数字化转型发展的关键。

在此过程中,江苏苏商银行也积极面向自身业务,推动数据与技术的升级,全面发挥数据要素价值。其数智化转型升级需求主要体现在以下几个方面:

1.数据管理成本与应用效率:随着用户和业务从线下网点向线上迁移,银行的数据量呈爆发式增长,传统数据仓库已无法满足要求,江苏苏商银行需要能够高效处理和存储大量数据的系统,以减少数据存储冗余和管理成本。

2.技术升级与架构优化:客户需要采用先进的技术架构来提升数据查询性能,实现高并发下的极速响应,并具备横向扩展能力,以适应数据量的快速增长。客户希望通过构建统一的数据服务平台,实现数据的统一管理和服务,从而优化现有的技术架构。

3.敏捷开发与响应:随着数据需求的爆发式增长,数据研发在面对业务需求时,需要更加及时、稳定、准确交付,配合业务方快速响应市场变化和业务需求,提高数据开发效率,保证数据研发交付服务能够顺利投产、稳定运行。

面临挑战

在项目实施中,江苏苏商银行面临一个非常突出的挑战:实时 OLAP 架构的升级改造,涉及非常多的业务线,且原有的业务数据加工处理链路长,加工逻辑复杂。在实现打通全行 200+ 业务系统的实时链路,实现数据的统一流转、统一管控、统一审核、数据容错等能力建设的同时,该如何尽可能的减少对行内现存系统的冲击,甚至无感切换适配。

这个挑战对于整个项目实施的成功与否至关重要,甚至起决定性作用。此外,各个业务方不确定架构改造带来的价值和潜在未来收益,因此都保持谨慎态度。

针对这个挑战,江苏苏商银行做了以下几个措施,概括如下:

1.对于实时链路的升级改造。江苏苏商银行引入实时数据同步系统,基于开源 Flink CDC 组件,实现源端数据到目标端的异构数据源的秒级同步。业务系统的实时数据同步需求,历史的操作手段是,通过业务系统抛送数据到 Kafka 消息队列,目标数据系统再通过消费 Kafka 来实现数据的同步链路交互。引入实时数据同步工具之后,江苏苏商银行对整体链路架构进行了简化,不再通过 Kafka 进行异构数据源的流转,统一采用实时数据同步工具进行统一处理管控。

2.对于各个业务系统负责人的疑虑。项目团队在前期和各个业务团队充分交流,并收集了当前实时数据的痛点,同时也多次组织进行项目价值的宣导和讲解。最终各个团队配合改造意愿达成一致。

数据支持

基于全行的业务数据和外部数据,依托数据底座提供的公共能力,江苏苏商银行构建了自己的数据湖体系,打造了湖仓一体的数据架构。通过在数据湖集市层,引入基于全场景 MPP 分析引擎 StarRocks 研发的镜舟湖仓分析引擎,实现极速统一的数据分析。

项目范畴:覆盖全行 200+ 系统及所有业务线,提供数据口径统一的、一站式的数据探查服务,使大量分布在消金、微商、财务等业务领域的实时数据,可以集中统一处理,对业务营销响应从原来的 2 天缩短到秒级。

项目亮点/效果:

实时数据场景下,通过打通标签、UC、埋点、存贷款核心、资损防控等 5 大业务场景的实时数据链路,实现企业报表产出由原来 n+6小时缩短到秒级,使管理决策用数效率从T+1天缩短到秒级。

最新贷款等业务数据的实时查询,首次实现秒级响应。实时存贷款报表应用中,存贷款的对账时效从 2 小时缩短到 30 秒内,效率提升1000倍+。此次架构升级改造,江苏苏商银行的整体数据运维成本降低60%+,相关人力成本综合核减每月400人天。

应用技术与实施过程

领克汽车选择与火山引擎签署战略合作协议,针对三大痛点设计解决方案。火山引擎汽车数字营销解决方案核心项目包括APP咨询、CDP及MA。

ebed0f8698bb7404c0d6eb7ec77ea8c1.png

项目启动之初,团队将整体数据底座架构重新进行梳理、优化升级,旨在满足各个业务团队的快速、高效、稳定的用数需求。其中,实时数仓架构以镜舟湖仓分析引擎为核心,支持高并发和低延迟的数据处理需求。

1、总体架构

江苏苏商银行整体数据底座架构如下:

ebfec50407c8582390820bb0f9b7ddc1.png

具体逻辑过程如下:

第一,对于外部的数据,首先通过离线和实时的数据交换集成同步工具,抽取到数据层进行统一管理存储,其中可存储的数据类型涵盖大规模分布式文件系统hdfs、半结构化存储mongdb、列式存储hbase、分布式账本、对象存储ceph等。

第二,在数据计算层,通过基于spark、hive、flink等开源组件,构建的流批一体化计算平台,对数据存储层的落库数据进行ETL加工处理,加工之后的数据最终存放到数据资源中心,形成全行的数据资产,也就是行内的数据湖产品。

第三,依托数据湖的底层数据资产,在数据服务中心提供RestfulAPI、WebService、RSF等各种形式的数据接口,提供可对外服务的数据服务。

第四,最后,构建数据服务总线,涵盖批量数据服务、实时无边界数据服务、DataAPI服务的形式统一对外暴露。最终服务各个业务系统,赋能业务数字化。

在整个数据底座垂直的数据流转体系中,在横向维度,江苏苏商银行进行了数据治理、保障体系、数据资产管理管控等拓展,尤其在数据流转的溯源排查上,通过全链路的数据血缘分析能力。可以快速的分析定位数据问题,赋能数据治理有了一个强力的数据分析抓手,系统截图如下:

c35d0f817f0251d72b2e9fabd2e22256.png

数据血缘分析

2、实时数仓架构

根据业务现状,江苏苏商银行规划如下实时数仓架构

d3ca001a644648404a16de32982a10f8.png

其中,中间部分的实时数仓是整个实时能力的核心部分,借助镜舟湖仓分析引擎的高性能分析。

(1)上游通过实时同步系统实时同步过来的数据,一条链路同步到Kafka,借助行内自研的大数据平台实时Flink消费到镜舟湖仓分析引擎;

(2)一条链路是直接同步到镜舟湖仓分析引擎。下游业务方主要有2大业务域,一个是BI系统,主要实时报表。另外一个是客户营销,通过行内配置化的统一数据API系统,对下游提供熔断、限流、安全管控的API能力

3、数据服务总线架构

99aa9add91f8fd55fc653a2eea332c40.png

在数据服务总线整体架构设计中,江苏苏商银行规划了如下3大能力,实现将API开发周期从天单位缩短到小时级,并由统一API管控、复用。

(1)构建离线批量敏捷API服务的能力

(2)构建直连库表敏捷API服务的能力

(3)构建实时流敏捷API服务的能力

4、数据湖架构

21df00d600125f7ceb543761ff2cabba.png

5、镜舟湖仓分析引擎集群划分

镜舟湖仓分析引擎集群区域划分整体架构设计如下:

8cc0cd0fef489ac1e3c1a4b51addd327.png

(1)批量存储DB区域

通过T+1离线数据同步到镜舟湖仓分析引擎数据集,主要承载的是各个业务条线的集市数据集;

(2)实时存储区DB区域

承载财富、消金、支付、风险、微商等实时业务诉求;

(3)临时存储区DB区域

设置7天、1天、3个月等不同维度的临时存储,主要为了满足业务方临时数据探查诉求;

商业变化

1、使大量分布在消金、微商、财务等业务领域的实时数据,可以集中统一处理,对业务营销响应从原来的 2 天缩短到秒级。

2、整体架构在数据湖之上引入 StarRocks ,搭建加速分析层,可分析数据集市的千万级、亿级数据量,时效从原来的 30分钟 -- n 小时的分析时效区间,缩短到秒级。

3、整体取数运维成本降低60%+。

4、智能运营增长平台可以实时监控触达转化数据;管理驾驶仓能实时查看时点存款、时点贷款的余额、实时总客户数的排名情况,辅助业务人员进行实时的分析决策。

关于企业


·镜舟科技

北京镜舟科技有限公司是一家专注开源商业化的中国公司,由 StarRocks 项目核心成员于2022年创立。

基于开源项目 StarRocks ,镜舟打造了符合国家标准并适配国内外生态体系的企业级分析型(OLAP)数据库,在行业适配度、场景成熟度、产品稳定性等方面有着卓越表现。

作为 StarRocks 社区中国最大贡献者,镜舟大力参与社区推广工作,未来也将持续与各大头部厂商一起创造世界顶级的开源项目,为社区发展贡献力量。

点击文末左下角“阅读原文”链接还可查看“镜舟科技”官网

·苏商银行

江苏苏商银行股份有限公司,是全国第一家O2O银行、国家高新技术企业、江苏首家民营银行,于2017年6月16日由多家知名企业发起设立,注册资本为人民币40亿元。江苏苏宁银行从诞生之初就融入了科技创新的基因,秉承“科技使金融更简单”的经营理念,聚焦微商金融、消费金融、科创金融、产业链金融、财富管理和支付金融六大核心业务,产品突出“O2O”与“科技驱动”的定位,将自身定位于银行业市场的“补位者”,将长尾客户定位为目标客群。 

以上由镜舟科技投递申报的项目案例,最终将会角逐由数据猿与上海大数据联盟联合推出的《2024中国数智化转型升级创新服务企业》榜单/奖项

该榜单最终将于7月24日北京举办的“2024企业数智化转型升级发展论坛——暨AI大模型趋势论坛”现场首次揭晓榜单,并举行颁奖仪式,欢迎报名莅临现场:

da88a7b0272ad54b7ae0e0b9a258c4ed.jpeg

e72ab977f7dfeb29710e95b4b557442f.png

9ba5195ddcb1e85c448f491d57536e00.png

411e22181c68f7047f7a22f1eac3b2d7.jpeg

03ed129482466c34f21cf543cb6fbd11.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/766627.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【软件测试】单元测试、系统测试、集成测试详解

🍅 视频学习:文末有免费的配套视频可观看 🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快 一、单元测试的概念 单元测试是对软件基本组成单元进行的测试,如函数或一个类的方法…

解析Kotlin中的内联函数,inline、noinline、crossinline【笔记摘要】

用编译时常量的概念,引出本文要讲内联函数inline: 1.编译时常量 Java的编译时常量 Compile-time Constant 它有四个要求:1.这个变量需要是 final 的  2.类型只能是字符串或者基本类型  3.这个变量需要在声明的时候就赋值  4.等号右边…

西部智慧健身小程序+华为运动健康服务

1、 应用介绍 西部智慧健身小程序为用户提供一站式全流程科学健身综合服务。用户通过登录微信小程序,可享用健康筛查、运动风险评估、体质检测评估、运动处方推送、个人运动数据监控与评估等公益服务。 2、 体验介绍西部智慧健身小程序华为运动健康服务核心体验如…

文心一言 VS 讯飞星火 VS chatgpt (294)-- 算法导论21.4 3题

三、根据练习 21.4-2 的结论,对于每个结点x,需要多少位(bit)来存储x.rank?21.4-2 的内容是:“证明:每个结点的秩最多为 ⌊lgn⌋ 。”。如果要写代码,请用go语言。 文心一言: 在问题21.4-2中&a…

YOLO-world论文阅读笔记

论文:https://arxiv.org/abs/2401.17270 code: https://github.com/AILab-CVC/YOLO-World 1、为什么要做这个研究(理论走向和目前缺陷) ? 之前的开集检测器大多比较慢,不利于部署。 2、他们怎么做这个研究 (方法&…

C++编程(九)异常处理机制、模板、容器库

文章目录 一、异常处理机制(一)概念(二)语法格式(三)使用示例(四)异常处理机制库 二、模板(一)概念(二)函数模板1. 语法格式2. 函数模…

zxing-cpp+OpenCV根据字符串生成条形码

编译构建 需要使用到 CMake、Git、GCC 或 MSVC。 github 链接:https://github.com/zxing-cpp/zxing-cpp 编译之前请确保: 确保安装了 CMake 版本 3.15 或更高版本。 确保安装了与 C17 兼容的编译器(最低VS 2019 16.8 / gcc 7 / clang 5)。 编译构建…

Linear Regression线性回归

目录 前言 Housing Price Prediction Linear Regression Loss/Cost Function Learning Rate 作业 前言 在本专栏中,我们将学习机器学习的知识。 Housing Price Prediction 在开始线性回归的研究之前,我们先来考虑一个实际的问题:房屋…

茗鹤APS高级计划排程系统,在集团多工厂协同生产下的应用

随着业务规模的扩大和市场的全球化,越来越多的企业选择“总部多工厂基地”的模式,此种模式大幅提升企业的产能与产量,有效分散风险。然后,与之而来的是对企业的管理提出更高的管理要求。多个生产基地不仅面临集团下发的周期性计划…

electron教程(一)创建项目

一、方式① 根据官网描述将electron/electron-quick-start项目克隆下来并启动 electron/electron-quick-start地址: GitHub - electron/electron-quick-start: Clone to try a simple Electron app git clone https://github.com/electron/electron-quick-start…

回溯 | Java | LeetCode 39, 40, 131 做题总结

Java Arrays.sort(数组) //排序 不讲究顺序的解答,都可以考虑一下排序是否可行。 39. 组合总和 错误解答 在写的时候需要注意,sum - candidates[i];很重要,也是回溯的一部分。 解答重复了。是因为回溯的for循环理解错了。 class Solutio…

JavaSE简易版扫雷小游戏

描述:用户输入二维雷区的高和宽,输入确定地雷数,随机在地雷区生成地雷。用户输入横竖坐标进行挖雷,挖到地雷游戏以失败结束,并让用户选择是否再次游戏;没挖到雷,显示该区域8个方向地雷数。如果8…

去中心化社会的崛起:探索区块链对社会结构的影响

随着区块链技术的发展和应用,我们正逐步迈向一个去中心化的社会结构。本文将深入探讨区块链技术如何影响社会结构,从经济、政治到文化等多个方面进行探索和分析,揭示其可能带来的革命性变革。 1. 区块链技术的基本原理回顾 1.1 分布式账本与…

放大器的输入电容Cin对放大电路的影响

1、OPA859构成的放大电路的设计 图中OPA859的增益G设定为1.16 ,OPA859的增益带宽积GBP 900M , 放大器的带宽BW GBP / Acl 900 / 1.16 775.86M。 图:OPA859放大电路 由于需要在放大电路上加带宽的限制,所以在OPA859放大电路上有个低通限…

Elasticsearch基础(二):阿里云Elasticsearch快速入门

文章目录 阿里云Elasticsearch快速入门 一、资源领取 二、访问实例 三、创建索引 四、插入数据 五、搜索数据 1、全文搜索 2、按查询条件搜索 六、删除数据 阿里云Elasticsearch快速入门 一、资源领取 这里资源领取只针对新用户,如果是老用户按需购买&am…

vue3.0(十六)axios详解以及完整封装方法

文章目录 axios简介1. promise2. axios特性3. 安装4. 请求方法5. 请求方法别名6. 浏览器支持情况7. 并发请求 Axios的config的配置信息1.浏览器控制台相关的请求信息:2.配置方法3.默认配置4.配置的优先级5.axios请求响应结果 Axios的拦截器1.请求拦截2.响应拦截3.移…

太阳辐射系统日光全光谱模拟太阳光模拟器

太阳光模拟器是一种用于评估太阳能电池性能的重要设备。它能够模拟太阳光的特性,通过测试电池的短路电流、开路电压、填充因子和光电转化效率等关键指标,来评估电池的性能优劣。 设备型号:KYF-GC004品牌制造商:科迎法电气太阳光模…

bigNumber的部分使用方法与属性

场景:最近做IoT项目的时候碰到一个问题,涉及到双精度浮点型的数据范围的校验问题。业务上其实有三种类型:int、float和double类型三种。他们的范围分别是: //int int: [-2147483648, 2147483647],//float float: [-3402823466385…

idea xml ctrl+/ 注释格式不对齐

处理前 处理后 解决办法 取消这两个勾选

【C++题解】1456. 淘淘捡西瓜

问题:1456. 淘淘捡西瓜 类型:贪心 题目描述: 地上有一排西瓜,每个西瓜都有自己的重量。淘淘有一个包,包的容量是固定的,淘淘希望尽可能在包里装更多的西瓜(当然要装整个的,不能切开…