一、客户背景与业务痛点
国家知识产权局负责专利、商标、地理标志等知识产权的保护工作,推动信用体系建设。此前,信用信息分散在两个独立的平台中:专利行政执法案件报送平台和中国专利代理诚信信息平台。两个平台各自维护一套信用数据,格式不统一,接口不互通,导致基层执法人员需要重复录入,企业诚信记录无法跨平台查询。
更棘手的是,国家要求将知识产权领域的信用信息(如重复侵权、不依法执行、代理机构失信等)统一归集后,实时推送至全国信用信息共享交换平台,并与省级平台对接。但原有的两个平台不具备自动同步和对外交换的能力,每次数据上报都要人工导出、校验、再导入,延迟至少两天,且经常因格式问题被退回。
二、技术挑战
数据来源多样且分散。专利行政执法案件每年新增约 30 万件,每件包含当事人信息、侵权事实、处罚决定等多张关联表;代理机构诚信信息覆盖全国近 5000 家代理机构,历史记录超过 200 万条。这些数据分布在两个不同的数据库中,表结构差异大——例如“当事人名称”在一个库中叫“party_name”,另一个库中叫“rightee_name”,且存在大量缩写和不规范填写。
归集过程中需要实时同步。各地方知识产权局通过报送平台录入不依法执行行为信息后,系统要求自动实时同步到统一信用库,并在 1 秒内完成去重和核验。重复侵权信息还需与历史库比对,确认后才可推送至全国平台。这意味着数据库必须同时支撑高并发写入(每天至少 100 万条)和复杂比对查询。
对外交换的压力更大。与全国平台对接时,采用统一的 XML 报文格式,每个报文包含数百个字段。高峰期(如每季度末)需要批量推送数万条惩戒名单,要求单条报文生成和传输的总延迟不超过 500 毫秒,否则会被对方平台拒绝。原有系统根本无法满足。
此外,历史数据中存在大量“脏数据”:身份证号缺位、企业代码填错、日期格式混乱。直接上报会导致全国平台校验失败。因此必须在入库时进行清洗和标准化,且清洗规则需要支持动态调整。
三、选型理由与解决方案架构
项目组放弃了“升级原有两个平台”的思路,决定新建统一信用库。经过对多家国产分布式数据库的压测对比,最终选择 优炫数据库 UXDB 分布式集群作为底座。选型原因有三:
第一,分布式架构天然适合多源数据整合。UXDB 支持通过 FDW 同时连接两个旧平台的原生数据库(分别为 Oracle 和 MySQL),可以直接跨库关联查询,无需先将数据导出成文件再导入。这一步节省了约 40% 的 ETL 开发工作量。
第二,实时流式计算能力。UXDB 集成了近似于“物化视图自动刷新”的机制,配合触发器和异步任务,可以实现数据写入后秒级触发清洗、去重、核验流程,再自动推送到外部接口。实测在 8 节点集群上,单条记录的端到端处理延迟控制在 300 毫秒以内。
第三,与全国平台的对接经验。UXDB 曾参与多个部委的信用平台建设,对统一报文格式和批量交换协议有现成的适配器。项目组直接复用了优炫提供的报文转换存储过程,开发周期缩短了 3 周。
解决方案架构
部署采用“1 个中心库 + 2 个前置接入区”的模式:
前置接入区:分别在两个旧平台侧部署 UXDB 轻量级实例,通过 FDW 映射原库的信用相关表。新数据产生后,前置库实时捕获变更(通过触发器或日志解析),推送到中心库。
中心库:一套 UXDB MPP 集群(8 节点,每节点 32 核/128GB 内存),行存+列存混合。行存表处理实时写入和单条查询,列存表存储历史归档数据用于批量核验。内置数据清洗存储过程,自动处理身份证号校验、企业代码标准化、日期格式统一等规则。
对外交互层:中心库通过预留的 API 网关和消息队列,与全国信用信息共享交换平台对接。批量数据采用异步压缩传输,增量数据采用实时推送。同时在知识产权局政务网站上设置“联合惩戒信息共享模块”,直接查询中心库的只读从库,不影响主库性能。
架构图

四、落地成效
系统上线稳定运行超过 6 个月,实际数据:
数据归集能力:日均处理超过 130 万条信用信息记录,峰值达到 180 万条/天,远超原要求的 100 万条。单条记录从基层录入到中心库完成清洗入库,平均耗时 0.22 秒。
跨平台同步延迟:从地方局报送平台提交一条重复侵权信息,到全国信用平台收到标准化报文,端到端平均 2.8 秒,完全满足实时性要求。历史数据批量初始化时,单小时推送记录数达到 12 万条,对方平台无一拒绝。
数据清洗质量:通过库内存储过程自动修复了 37 类常见格式错误,成功将因数据质量问题导致的退单率从 18% 降至 0.3%。剩余无法自动修复的记录被标记并生成工单,由专人处理。
运维效率:原来需要 4 名工程师维护两套系统的手工数据导出导入,现在只需 1 名 DBA 管理 UXDB 集群,且在线扩展节点从未导致业务中断。
五、客户证言
“过去每次向全国平台报数据,我们都要先导出 Excel,用 Python 脚本跑一遍清洗,再转成 XML,费时费力还常出错。现在基层录入后几秒钟就能看到数据已经出现在全国平台的查询结果里,效率完全不是一个量级。”
—— 国家知识产权局专利管理司
信息处负责人 “最让我们满意的是优炫对异构数据库的兼容能力。旧平台的 Oracle 和 MySQL 我们没有动,只是加了一层 FDW,就把数据全部拉通了,迁移风险几乎为零。”
—— 项目集成商 技术总监
六、总结
该案例凸显了 UXDB 在政府跨部门信用信息共享场景下的核心优势:
异构数据源的实时融合能力:通过 FDW 直接连接不同品牌、不同版本的存量数据库,在不改造旧系统的情况下实现数据逻辑集中,这是很多数据交换平台做不到的。
库内流式处理:将清洗、去重、核验、格式转换全部下沉到数据库存储过程中,避免了外部 ETL 工具带来的延迟和运维复杂度。对于信用信息这类对实时性有强要求的场景尤其适用。
与国家级平台的无缝对接:UXDB 积累了丰富的政务报文处理经验,提供可直接复用的转换模板,显著缩短了项目周期。
下一步,国家知识产权局计划将商标代理、地理标志等更多领域的信用信息也纳入该平台,并利用 UXDB 的列存和向量化执行引擎,对失信行为进行聚类分析和趋势预测,从“事后惩戒”转向“事前预警”。