1. 首页
  2. 行业案例
  3. 党政机关与公共事业
  4. 四川省大数据中心:UXDB MPP 集群支撑“天府健康通”亿级用户疫情数据实时分析

四川省大数据中心:UXDB MPP 集群支撑“天府健康通”亿级用户疫情数据实时分析

  • Steven
  • 发布于 2026-06-11
  • 0 次阅读

一、客户背景与业务痛点

四川省大数据中心负责全省政务数据汇聚、共享和应用,疫情期间承担“四川天府健康通”的建设和运维。该健康码平台领码用户超过 1.14 亿,累计申领场所码 520 万个,总扫码次数 54 亿次,近期日活跃用户超 2000 万。平台需要实时处理涉疫部门(卫健、公安、交通、社区等)上报的密接、次密接、风险区域等数据,完成赋码、转码、核查、统计,并支撑流调溯源。

原有系统在疫情高峰时暴露了三个致命问题:一是数据入库延迟大,涉疫数据从上报到完成赋码平均需要 3‑5 分钟,导致风险人员管控滞后;二是并发分析能力不足,当全省同时开展多市州的疫情研判时,数据库查询排队,领导看板刷新超过 30 秒;三是扩容过程需停机,每逢节假日流量激增,只能提前预估容量,无法动态应对突发。

二、技术挑战

平台面临的数据量和复杂性远超常规政务系统。全省涉疫部门每天产生数亿条记录(核酸检测结果、扫码记录、行程轨迹、密接排查),累计入库数据量约 100 亿条。数据类型混杂交织:结构化数据(身份信息、时间戳)、半结构化(健康码状态变更日志)、大对象(核酸检测报告图片、行程卡截图)。要求这些数据在入库的同时,还要支持高并发的核查比对——例如流调人员输入一个身份证号,系统需要在 3 秒内返回该人近 14 天的所有扫码场所和核酸检测记录,涉及跨多张大表的关联查询。

更棘手的是负载的不可预测性。某地突发疫情时,全省可能会同时下发赋码任务,分析并发从日常的几十瞬间飙升到 300 以上,且持续数小时。原有集中式数据库在并发超过 200 时就会出现连接池耗尽和慢查询堆积。同时,平台还需要提供“疫情数据溯源”“预警监控”“统计分析”等在线分析处理(OLAP)能力,这些大范围扫描查询与在线赋码的混合负载互相干扰,导致性能急剧下降。

此外,平台必须保障 7×24 小时连续服务,任何停机都可能影响全省疫情防控。要求数据库集群无单点故障,节点故障时自动切换且数据零丢失。

三、选型理由与解决方案架构

四川省大数据中心经过严格测试,最终采用 优炫数据库 UXDB MPP 集群 作为健康码平台的统一数据底座,部署了两套集群(一套 7 节点、一套 10 节点)。选型核心原因:

  • MPP 并行处理 + 水平扩展:数据按业务逻辑(如按市州、按日期)分片存储到多个计算节点,查询自动并行下发。实测在 10 节点集群上,关联 6 张亿级表的复杂查询比单机快 8‑10 倍。未来业务增长只需在线增加节点,无需停机。

  • 混合负载隔离:两套集群分别承担不同角色——一套专用于实时数据入库和高频核查(OLTP),另一套专用于统计分析、报表、预警(OLAP)。两套集群之间通过数据同步工具完成近实时复制,互不干扰。

  • 高可用协调节点:每套集群部署一主一备两个协调节点,repmgr 组件自动监测心跳,主节点故障时备节点 30 秒内接管,业务无感知。计算节点自身多副本保障数据不丢。

  • 多类型数据高效处理:UXDB 支持结构化、半结构化、大对象的一体化存储,内置 JSON、BLOB 及全文检索,可快速查询核酸检测报告图片中的元信息。同时提供丰富的聚合函数和自定义扩展,满足疫情统计的各种算法需求。

解决方案架构

平台整体采用“两集群、多副本、自动切换”的部署模式:

  • 集群 A(7 计算节点):聚焦数据接入与在线事务。汇聚各涉疫部门上报的原始数据(通过 Kafka 或 FDW),完成自动化入库、清洗、关联,并支撑健康码赋码、转码、核查等高频事务查询。协调节点一主一备。

  • 集群 B(10 计算节点):聚焦分析与服务。通过数据同步工具从集群 A 近实时同步数据(延迟 < 5 秒),承担疫情数据溯源、预警监控、统计分析、报表及大屏展示。协调节点同样主备高可用。

  • 存储与分片:按市州和日期对核心表(扫码记录、核酸检测)进行范围分区 + 哈希分片,均匀分布到计算节点。历史分区自动压缩,节省空间。

  • 安全与监控:启用国密加密存储个人敏感信息,审计日志单独归档。UXDB 提供内置监控插件,与省大数据中心现有的 Prometheus + Grafana 平台无缝集成。

架构图

四、落地成效

系统上线并经历了多次疫情高峰考验,实际运行数据:

  • 数据规模:累计处理涉疫数据超 100 亿条,日均新增 2‑3 亿条。集群总存储容量规划可支撑未来 2 年。

  • 入库性能:高峰时段每秒写入超过 5 万条记录,入库到可查询延迟稳定在 2 秒以内,比旧系统提速 60% 以上。

  • 查询响应:流调人员最常用的“人员轨迹全量查询”平均耗时 0.9 秒(涉及扫码、核酸、行程三张大表);省级领导大屏“各市州实时健康码分布”刷新间隔 5 秒,数据延迟小于 3 秒。

  • 并发支撑:疫情期间分析并发达到 350(超过预估 300),数据库 CPU 平均使用率 72%,无慢查询堆积或连接池溢出。

  • 高可用:运行一年内,计算节点发生过两次硬件亚健康(磁盘慢、内存纠错),集群自动将该节点上的分片迁移至其他节点,业务无感知;协调节点主备切换演练耗时 22 秒,数据零丢失。全年可用性 99.997%。

  • 弹性扩展:因数据量增长,在线将集群 B 从 8 节点扩展至 10 节点,扩容过程持续 40 分钟,业务无中断。

五、客户证言

“天府健康通是全省抗疫的‘数字防线’,每一秒的延迟都可能影响风险人员管控。优炫的 MPP 集群让我们在百亿级数据中做到了秒级查询,而且两套集群分工明确,分析再复杂也不会影响老百姓扫码亮码。最放心的是在线扩容——去年春节前数据暴涨,我们直接加了两个节点,业务一点没感觉。”

—— 四川省大数据中心 技术保障部负责人

“流调溯源最怕系统卡。以前查一个人的轨迹要等十几秒,现在输入身份证号,一秒内就把他最近去过的所有场所和核酸结果列出来,还能在地图上展示。优炫数据库的并行计算能力确实强。”

—— 省疾控中心 流调专班成员

六、总结展望

该案例集中体现了 UXDB 在超大规模公共卫生数据平台场景下的核心能力:

  • MPP 混合负载隔离:通过两套独立集群分别承载 OLTP 和 OLAP,既保障了赋码等在线业务的高性能,又满足了复杂分析的灵活性。这种“读写分离”的升级版——业务分离——非常适合数据量大、并发类型多样的政务平台。

  • 无感知弹性扩展:在线增加计算节点而不中断服务,是应对疫情突发流量高峰的关键能力。UXDB 的在线 rebalance 机制可以平滑迁移分片,对业务透明。

  • 高可用协调节点与数据多副本:消除了 MPP 集群最常见的单点故障风险,协调节点主备自动切换,计算节点数据自动冗余,让运维团队可以安稳睡觉。

  • 多类型数据融合处理:扫码记录、核酸报告图片、轨迹 JSON 在同一库中存储和检索,极大简化了数据架构。

下一步,四川省大数据中心计划将 UXDB 推广至更多政务领域,包括“一网通办”的电子证照库、社会信用平台,以及“城市大脑”的物联感知数据底座。同时,利用 UXDB 对 Python 存储过程的支持,尝试在数据库内直接运行疫情预测模型(如时序分析预测未来一周各市州扫码量),实现资源弹性预调度。