水印提取主要用来对泄露数据进行快速的溯源,数据溯源是数据嵌入的逆过程,当信息泄露时,可以第一时间从泄露的数据中提取水印标识,通过读取水印标识,实现数据溯源追责。
· 水印的提取对上传泄露文件数据的行数存在要求,数据量过少可能会由于信息提取不全导致溯源失败,要求溯源数据的行数不少于200行。 · 为了防止过大的文件在提取过程中可能会产生诸多不便,因此对于溯源文件大小超过10M的,需要进行手动的截取,然后在进行文件的上传。 |
当发生数据泄露时,需要获取到泄露的数据,放入TXT、CSV或Excel表格中,然后通过水印提取任务,获取水印信息。
在顶部导航栏中选择[数据运营/数据安全],进入数据安全模块面。
单击左侧导航树中的[数据水印/水印提取]菜单项,进入水印提取页面。
在页面中,单击列表左上方的<新建>按钮,进入创建水印提取任务页面。
配置水印提取任务,配置信息说明参考下表。
表-1 水印提取参数说明
参数名称 |
说明 |
任务名称 |
水印提取任务名称 |
任务描述 |
水印提取任务描述 |
源文件 |
上传需要进行提取溯源的泄露文件,只能上传txt/csv/Excel文件,且不超过10M |
分隔符 |
选择或者输入数据的分隔符,分隔符的长度不能超过10个字符 |
是否包含列头 |
选择上传的源文件是否包含列头信息,如果选择不包含,那么在选择主键列或者嵌入列的时候,只能根据列的序号进行选择 |
主键列 |
可选信息,指定主键列信息会根据依赖主键列策略算法遍历进行水印信息的提取,否则会使用不依赖主键列策略算法进行提取 |
嵌入列 |
可选信息,指定嵌入水印的列,如果指定那么只在指定列上面进行水印信息的提取 |
单击<执行>按钮,开始进行任务的提取分析。
对于提取成功的任务,在水印提取页面中,单击任务后面的<结果查看>按钮,可以查看溯源结果,溯源结果可能存在多条,结果信息包含嵌入列、水印标识、匹配度。
嵌入列:提取出水印信息的嵌入列。
水印标识:实际嵌入的水印信息。
匹配度:提取出水印匹配度。
匹配度表示在对应的嵌入列上面提取到的水印编码占总编码的百分度,因此匹配度越高代表在该列上提取到的水印编码信息越多,其他没有匹配到的位置编码只是从已有数据中没有提取出来,并不表示是提取的错误编码。 |