构建数据分析匿名化流水线
杜春晓 译
出版时间:2021年08月
页数:184
数据使用,如何才能做到既保护个人隐私,又能让数据分析有用处、有意义?数据架构师和工程师可从本书学习到如何以可持续方式,建立安全和可复用的匿名化流水线,并将其整合到数据流和分析工作中。
本书作者在解决真实业务需求所用采集模型和应用场景的基础上,探讨设备和物联网数据匿名化的端到端解决方案。书中示例来自人们对其有着迫切需求的数据环境,如卫生保健,这些示例所用方法都已经过时间的检验。
● 制定多种匿名化解决方案,覆盖多种应用场景,满足对可识别性的不同要求。
● 解决方案跟所用数据、数据接收方和分析目标相匹配。
● 为数据采集模式量身定制匿名化流水线,覆盖不同业务需求。
● 为原始数据生成匿名化版本或用分析平台生成匿名化输出。
● 检查匿名数据使用的伦理问题。
- 前言
- 第1章 简介
- 可识别性
- 术语介绍
- 匿名化作为数据保护措施
- 匿名化落地
- 小结
- 第2章 可识别性范围
- 法律环境
- 披露风险
- 重识别科学
- 总体可识别性
- 小结
- 第3章 风险管理实用框架
- “五个安全”匿名化框架
- “五个安全”框架落地
- 小结
- 第4章 明识数据
- 需求收集
- 从主要到次要用途
- 小结
- 第5章 伪匿名数据
- 数据保护和法律权威
- 匿名化第一步
- 重新反思“从主要到次要用途”
- 小结
- 第6章 匿名数据
- 再思考可识别性范围
- 源头匿名化
- 汇总匿名数据
- 反哺源头匿名化
- 小结
- 第7章 安全使用
- 信任基础
- 信任算法
- 负责任AIML技术的原则
- 管理和监督
- 小结
书名:构建数据分析匿名化流水线
译者:杜春晓 译
国内出版社:中国电力出版社
出版时间:2021年08月
页数:184
书号:978-7-5198-5673-1
原版书书名:Building an Anonymization Pipeline
原版书出版商:O'Reilly Media
Luk Arbuckle
Luk Arbuckle是Privacy Analytics公司首席方法官,为负责任地使用和分享数 据提供策略指导,为隐私增强技术和方法提供创新。Luk曾担任加拿大隐私专员办公室主任。
Khaled El Emam
Khaled El Emam是Replica Analytics公司 合伙人和CEO,该公司致力于开发合成数据。他还是加拿大渥太华大学医学院教授、东安大略儿童医院研究所资深研究员。
本书封面的动物是松鸦(学名Garrulus glandarius,英文名Eurasian jay)。该鸟在欧洲和亚洲大部均有分布,多生活在森林和靠近人类定居点的地区。
松鸦羽毛整体近粉褐色。其冠白色,有黑斑。黑色胡须状条带从其喙根部向下延伸。其翅膀连接身体的部位,有鲜亮的蓝色块斑和一个红三角,翅膀整体为黑色,只不过飞行时,露出一条白色块斑。有趣的是,松鸦的羽毛可反射紫外线。
松鸦主要生活在树上,偶尔会下到地面觅食。其生活地点通常较为固定,尽管它们要到其他区域觅食。作为“机会杂食动物”,松鸦找到什么食物就吃什么,但主要以橡子为食。该鸟社交行为复杂,它们的一种表演很有代表性,可能与其逃离主要捕食者鹰有关。
松鸦使用多种视觉表现和啼叫来交流,模仿能力惊人,其叫声可包含它们听过的所有声音,婴儿啼哭声、其他鸟的叫声,甚至还有割草机的声音,它们都能模仿。当前松鸦的保护级别为低危级。O’Reilly图书封面上的很多动物都是濒危物种,它们对全世界都很重要。
本书封面插图是Jose Marzan根据British Birds一书中的黑白版画绘制而成。