随着数字经济蓬勃发展,数据不仅成为了国家基础性战略资源,也成为推动经济社会创新发展的关键生产要素。国家和各行业相继出台数据安全法律法规和相关政策,数据价值进一步提升,数据成为企业和个人的重要资产。在海量数据中最核心的是敏感数据,敏感数据多数是个人隐私数据和企业核心业务数据,一旦发生数据泄露事件,企事业单位不仅是信誉受损和业务受影响,还可能面临监管单位的处罚,损失不可估量。
为最大程度挖掘利用数据的价值,数据在不同的安全域流转。当数据从高安全域流动到低安全域,数据安全风险加剧。因数据敏感级别不变,低安全域缺少完整的安全保障措施,极易造成数据泄露。数据流动场景主要存在以下安全风险:
● 开发测试环节:生产数据流动到开发测试环境,开发测试场景更加真实有效。但开发测试环境一般限制少,缺少安全管控手段,容易导致复用的生产数据泄露。
● 教育培训环节:生产数据流动到教育培训环境具有更好的教育效果。但教育培训环境一般管理较乱,缺少安全管控手段,极易造成数据泄露。
● 数据分析环节:生产数据流动到数据分析环境,最大程度挖掘数据的价值。但分析环境缺少安全管控手段,开发人员安全意识不足,数据容易被违规流转或被恶意利用,增加数据泄露的风险。
数据静态脱敏系统对数据进行脱敏,同时根据开发需求保留数据的特性和关联性,避免影响数据的二次挖掘利用,满足数据流动的安全要求,最大程度发挥数据的价值。
数据静态脱敏系统是一款专业的数据安全脱敏系统,系统可自动发现源数据中的敏感数据,并对敏感数据按需进行漂白、变形、遮盖等脱敏处理,避免敏感数据泄露。系统规则自动分析源数据,识别数据库、大数据平台、文件中存在的敏感信息字段,并抽取其中符合业务逻辑的数据集合,同时对敏感数据进行漂白、变形、遮盖等脱敏处理,随后分发到其他环境。数据脱敏后保持源数据特性、数据业务逻辑性、数据关联性,保证脱敏数据的实用性,提高数据利用的效率和质量。
● 开发测试场景
针对开发测试、监督管理等场景,自动发现生产环境中的敏感数据,按脱敏规则进行变形、漂白、遮盖等处理,数据脱敏后加载到开发测试等环境,防止在使用过程中敏感信息泄露。
● 教学培训场景
针对学术分享、教学分析、医学培训等场景,将生产数据如影像文件、电子病历、个人隐私信息等进行敏感识别和数据脱敏,并保持数据一致性和关联性,防止在教育培训过程中出现敏感信息泄露。
● 分析挖掘场景
针对分析挖掘场景,识别多数据源中的敏感数据,结合分析挖掘场景的具体应用需求(如教育科学决策、医疗质量安全、临床科研分析、运营收入分析等),进行特定的数据类型和字段去隐私化处理,防止在分析、挖掘过程中出现敏感信息泄露。
● 数据上报提取场景
根据不同行业的数据上报要求,将上报数据中不需要监管分析的部分进行漂白或者匿名化脱敏处理,保证最小数据上报要求,减少敏感数据泄露。
某金融行业数据脱敏项目
● 客户背景:
业务系统多、数据规模大,提高业务系统的开发代码质量,开发测试工作需要在高度仿真环境中进行,大量测试数据都来源于生产数据。原有人工脱敏方式无法满足银行内部的多样化数据脱敏要求,如Dump 至数据库的脱敏等;根据《网络安全法》以及中国银监会印发《银行业金融机构数据治理指引》要求,根据行业特征,数据治理工作需要将数据在测试环境进行验证。