传统行业信息化改造逐渐完善,各行各业的大数据建设正在如火如荼的进行。通过大数据平台的建设,各企业、集团能够将自己所拥有的数据加以整合。结合内外部数据进行充分的发掘与分析,可以为业务部门、外部需求方提供更丰富的数据支持与服务。

大数据在提高了生产效率的同时,也涵盖了大量的敏感数据。在对这些数据流通和使用的过程中,必须保证对广大用户敏感隐私数据的可靠保护。数据脱敏,又称数据漂白、数据去隐私化或数据变形,是对敏感数据实施保护的可靠手段。

为了实现对敏感数据的有效脱敏、漂白处理,共识数信耗时数月,由开发主管率领一组开发团队根据市场反馈的需求,推出一款完全自主研发的产品——数据脱敏平台(数敏平台)。在本次对数敏平台的迭代更新中,考虑到生产环境中数据环境复杂,以及数据应用场景多变,数敏平台支持灵活的任务配置以及对动态数据脱敏的支持。

产品特点

数敏平台为用户提供了敏感数据接入、敏感数据发现、脱敏算法匹配、脱敏任务执行四大步骤的可视可控数据脱敏全套服务。并能够结合共识数信咨询方案达到最佳脱敏效果。同时共识数信提供咨询服务,根据客户现场的数据环境定制化数据脱敏方案。

数敏平台使得企业(数据源)能够对自身数据进行脱敏处理,从而满足《网络安全法》、《个人信息安全规范》等相关法律法规的要求,为合法合规的数据共享、数据商业化服务打下坚实基础。



服务对象与客户

数敏平台致力于服务金融、医疗、交通、互联网、政府机构等拥有大量敏感数据并希望对数据安全保证、价值挖掘、商业化应用的企事业单位。

新版本特色

动态脱敏

       在本次迭代数敏平台中,最大的特点是支持了动态数据脱敏。在数据脱敏的领域中,脱敏方式一般由使用场景来划分为两类:静态脱敏、动态脱敏。所谓的数据使用环境,主要是指数据获取的方式,以及脱敏之后的数据在哪些环境中使用来判断。一般可分为生产环境和非生产环境(开发、测试、外包、数据分析等)。

       共识数信在数敏平台1.0版本中对静态脱敏支持的基础上,增加了对数据动态处理的支持。当业务系统通过动态脱敏请求数据时,数敏平台实时筛选请求数据内容,依据预先定义的脱敏规则屏蔽敏感数据,同时限制响应一个查询所返回的数据量。

动态脱敏首先要解决的问题是业务系统的普通用户访问应用系统时对数据权限的控制。正常情况下,业务系统开发时会依据用户身份标识进行身份验证后,对不同的用户进行限制数据的访问。如业务用户在访问某行数据时,只需要查看客户个人信息的姓名、电话等信息,而不需要查看身份证号或家庭住址,故对身份证或家庭住址的显示信息实行*号或其他方式进行脱敏处理。

对于遗留系统(改造成本较高、无法升级改造)以及开发时未考虑《网络安全法》中要求的个人隐私保护问题,如若重新更改代码过于复杂,只能依赖于外部技术实现数据的隐私保护,这个时候通常需要使用动态脱敏技术完成系统数据安全级别的提升。

数据源支持

  • Kafka数据支持:

在数敏平台中,数据源支持对接Kafka类型的流数据源,Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。该项目的目标是为处理实时数据提供一个统一、高吞吐、低延迟的平台。




  • 文件支持:

在部委、企业等某些公司的信息化系统的数据中,存在很多数据以文件的形式存储(json、csv等)。对此数敏平台也进行了适配兼容,通过配置文件的绝对路径来实现对文件的解析。




输出模式更新

       共识数信本次对数敏平台的更新中,优化了数据输出模式。对数据输出方式、输出格式均支持用户自定义的灵活配置。

  • 输出方式:支持选择全量数据输出、仅脱敏数据输出。

       全量数据输出:将用户选定的数据源中的数据,经过脱敏处理后,按照原数据结构输出到目的数据库/地址。

       仅脱敏数据输出:系统将敏感数据依照算法脱敏后,仅输出脱敏后数据成果。

  • 输出格式:支持选择CSV格式、Json格式文件输出。根据数据使用场景,导入目标数据库的基础上支持将脱敏后的数据按照json、csv格式进行文件输出。

功能概述

数据源配置


系统支持传统数据库连接,配置相关连接信息即可完成配置:

  • MySQL:数据库名称、地址、端口号、用户名/密码

  • Oracle:数据库名称、地址、端口号、用户名/密码

  • Hadoop:数据库名称、地址、端口号、用户名/密码


系统也支持消息、文件型的数据源:

  • Kafka:Kafka名称、IP地址、Topic、端口号、组ID

  • json:数据文件路径

  • csv:数据文件路径



敏感数据发现

数敏平台采用自动识别为主,人工纠正为辅的敏感数据发现策略。对于相对固定的业务数据,可以采用自动甄别,明确指定哪些列、哪些库的数据需要脱敏,这些数据一般数据结构和数据长度不会有变化,大部分为数值型和固定长度的字符。比如:单位代码、户号、户名、用电地址等标识列,针对这些数据可以通过指定脱敏规则和不同的数据访问策略,保证敏感信息不被泄漏。


       对于敏感数据发现的匹配模式,数敏平台支持自定义添加。根据具体的脱敏场景,以及需要脱敏的敏感数据,设定对应的匹配模式。

脱敏算法配置

通过敏感数据发现,系统可为自动识别的敏感数据类型,经过人工纠正得到完整脱敏字段。系统根据敏感数据的类型,自动匹配最优(推荐)脱敏算法。同时脱敏算法支持由人工自定义调整。

动态脱敏配置

数敏平台集成了动态脱敏配置的生成。由用户在系统内根据选定的数据源可配置针对字段(键)的脱敏模式与算法。系统生成针对该数据源的动态脱敏SDK,通过业务系统调用SDK实现在日常业务进行的过程中,业务数据的动态脱敏输出。

业务系统在调用SDK对数据脱敏处理、输出的过程中,其时间损耗与网络延迟相比可以忽略,可实现对现有业务系统无感知的功能升级。


 

联系我们

电话/Tel:010-52384255

电子邮件/E-mail:cty@cdtrust.com

地址/Add:北京市东城区安定门东滨河甲1号大象投资大厦208


×