银监会发布的《银行业金融机构数据治理指引》中,要求银行业金融机构加强数据应用,并强调数据应当成为经营管理尤其是风险管理的重要依据;银行业金融机构应适应大数据时代需要,强化数据安全意识,依法合规采集数据,防止过度采集、滥用数据,依法保护客户隐私。
现状与难点
数据价值、尤其是银行数据的“高含金量”特征,令其成为黑客们的主要目标之一,无论是盗取贩卖、入侵勒索还是恶意破坏,一旦数据遭到泄露或破坏,不仅将对银行用户的人身财产安全构成威胁,还会导致银行自身信誉的严重损害,并产生不可估量的经济损失乃至社会恐慌。因此,对数据的安全防护与管理现已成为银行业关注的焦点,然而问题并没那么简单:
· 金融行业监管日趋严厉,对自身数据资产情况不清晰、对敏感信息分布不明确,可能引发一系列安全问题;
· 对数据、尤其是敏感数据的使用及相关操作行为缺乏系统、充分、高效的监督与审查;
· 缺少自动化数据脱敏机制,采用人工执行脚本等方式导致脱敏效率低下、准确度不足;
· 复杂的业务数据难以通过脚本方式脱敏,因而无法满足银行在开发测试系统过程中对数据的使用需求。
可以看到,银行在敏感数据的管理与使用过程中面临着多种难点,需要从管理流程层面对数据的申请、审批、使用等环节制定体系化、规范化的标准和要求,建立起一个稳定、可靠、高效的数据脱敏管理机制,用以提升脱敏质量和效率,减少监管审查风险,保障数据使用安全。
需求与思路
凯发k8游戏基于对银行现有运维相关的系统及应用场景等的分析梳理,结合数据脱敏和数据资产梳理两款产品,提出如下关于银行业数据脱敏管理的六点思路:
1、数据资产梳理
银行的数据资产管理具有一定基础,但是资产变动频繁且不对管理人员透明。通过数据资产梳理系统实现数据资产的自动发现与敏感数据的自动识别——扫描网段信息及数据库端口段,发现网段中数据库的ip、端口、数据库类型等信息;凭借系统内置的多种敏感数据发现规则,从大量数据库表中自动发现所需的敏感数据,并形成数据资产及敏感信息清单,为银行数据资产与敏感数据的管理工作提供基础技术支撑,降低管理难度。
2、采用双节点部署
银行的生产环境与测试环境采用物理隔离架构,导致脱敏系统无法与两侧通讯,如果部署单台脱敏设备会增加人工导入导出的环节。针对此点,可以部署两台数据脱敏设备形成“a节点数据抽取、脱敏 b节点数据发放”的模式,解决银行在生产环境网络与测试环境隔离的情况下,数据的流通问题,同时又符合物理隔离要求。
3、与现有运维相关的系统集成
银行现有运维相关的系统中存有大量工单信息,与数据脱敏系统集成后,可自动发起并执行数据脱敏流程——现有运维相关的系统发起工单申请,调用a节点脱敏系统的webservice接口,执行脱敏任务;脱敏后数据经压缩加密,再传送给b节点脱敏系统。
4、字段表达式脱敏
银行对于测试数据质量要求很高,其一就是关联关系的保持能力,在多次脱敏或跨库、跨表脱敏时需要保持字段之间的关联性。通过定义字段表达式,可将字段脱敏规则配置为数学运算关系或函数运算关系,保证脱敏后字段运算关系不变,解决用户测试数据中对数据运算关系的业务依赖需求。
5、lob字段处理
银行生产数据会遇到一些质量不高或无法脱敏的数据,为了保障脱敏工作的顺利执行,在数据脱敏过程中,可通过对lob字段进行“置空、迁移和样本替换”等配置,在满足银行对lob字段处理要求的同时,减少数据脱敏对系统资源占用过高的问题,提升数据处理性能。
6、数据回收管理
对于高敏感级别数据,即使经过脱敏处理,银行依然对其有极高的安全要求,在数据使用后必须要进行清理或销毁。但在实际工作中,很难在第一时间通过人工方式对使用后的数据进行安全处理。针对此点,数据脱敏系统需要提供自动化机制加以解决——通过对数据的回收范围、回收时间、回收用户权限等进行策略配置,对脱敏至目标库的数据表进行数据回收管理,同时记录回收日志并生成回收报告,有效保证脱敏后数据的安全。
价值与效果
· 实现了对银行生产库业务数据的数据资产梳理和敏感数据发现;
· 数据脱敏系统与银行现有运维相关的系统实现流程对接,提升了数据脱敏效率,保证了数据使用安全;
· 数据脱敏系统双节点部署,实现了数据脱敏与数据传输处理的分离;数据脱敏算法、策略的自动生成以及对复杂业务数据脱敏的支持,实现了姓名、地址、联系电话、身份证号码、卡号、企业名称、机构代码等个人信息和组织机构信息的数据脱敏需求;
· 针对开发、测试环境中的敏感数据的合理使用及管理建设工作,起到了关键作用。
是一款面向生产数据进行数据抽取、数据漂白和动态掩码的专业数据脱敏产品。dms可以满足测试、开发、培训、数据分析和数据共享场景的脱敏需求。dms符合金融、保险、能源、政府、医疗、教育等行业敏感数据防护的政策合规性需求。
是一款通过扫描嗅探、流量及日志分析技术,协助用户摸清敏感数据分布、理顺敏感数据使用情况,并辅助进行敏感数据分类分级的数据安全产品。dacs能帮助用户发现网内数据库和其中的敏感数据,对数据资产进行不同类别和密级的划分,以便实现对敏感数据有差别和针对性的防护。
试用申请