数据水印数据安全防护
传统的数据安全防护是努力的建设安全环境,将数据牢牢的锁在”“中,就好像一个的人被关在屋子里,一旦数据要共享出去,则意味着这个人被曝光了,而数据脱敏则是为这个人穿上了一件衣服,从根本上保障数据安全。脱敏支持结构化数据(企业ERP、财务系统、数据库)和非结构化数据(像企业经营活动中存储或处理的图片、视频、文档、邮件等)保护,对于半结构化数据(XML和JSON)及非结构化数据,所需要的安全防护策略更为复杂,需要针对各个数据泄露途径展开防护。
什么是数据水印?
金融业机构开展金融数据安全防护工作过程中,越来越多的数据库数据通过网络进行存储和发布,这些数据往往包含有各类敏感信息,即使经过脱敏后仍然有巨大的社会价值与经济价值,一旦出现数据泄露,后果也是无法想象的。
因此,需要使用数据水印技术在数据交换及数据使用中的分发共享、委托处理等环节标明数据的所有者、数据分发对象、分发时间、分发途径及使用范围等信息。
数据库水印算法一方面需要更好地将水印标识信息隐藏到数据库中,另一方面需要满足嵌入后的透明性——仅允许一定范围内失真,因此它本质上可看成一个带约束条件的优化问题。从信号角度来看,数据库水印嵌入过程可看成一个大信号叠加了一个小信号,经过有噪信道后,如何检测到小信号——小信号的编解问题。根据水印嵌入过程是否需要改变原始数据库的元组的属性值和格式,嵌入方法主要可分为两大类:
1) 基于元组修改的水印嵌入算法:实质上,任何水印信息可编码转换成一连串由“0”和“1”组成的比特字符串。针对元组的数值属性(如年龄、时间戳)和类别属性(如地址信息等)两种类别,嵌入方法可再分为两种子类别:0”或“1”两种水印比特。为了保留数据可用性,修改应满足一定的约束条件(如统计特性)。简单的方式,是在数值属性值的很低有效位(Least Significant Bit, LSB)进行替换,比如在年龄18(二进制“10010”)很小LSB位嵌入“0”变为18( “10010”),嵌入“1”变为19(二进制“10011”)。其他可以在小数点后进行嵌入,或者使用不同的量化索引等嵌入机制。类别属性的嵌入方法:类别属性不能直接修改数值编码,一种思路是嵌入数据库用户不易察觉的字符或标点,比如通过在类别属性值末尾嵌入回车符、换行符表示“0”“1”,以及嵌入不同的空格数量等,常见嵌入规则如表1所示;另一种思路是基于语义的近义词进行嵌入,首先构建关键词的近义词库并确立顺序,嵌入过程根据约定规则嵌入“0”或“1”比特。