构建数据分析匿名化流水线
Luk Arbuckle, Khaled El Emam
杜春晓 译
出版时间:2021年08月
页数:184
数据使用,如何才能做到既保护个人隐私,又能让数据分析有用处、有意义?数据架构师和工程师可从本书学习到如何以可持续方式,建立安全和可复用的匿名化流水线,并将其整合到数据流和分析工作中。
本书作者在解决真实业务需求所用采集模型和应用场景的基础上,探讨设备和物联网数据匿名化的端到端解决方案。书中示例来自人们对其有着迫切需求的数据环境,如卫生保健,这些示例所用方法都已经过时间的检验。
● 制定多种匿名化解决方案,覆盖多种应用场景,满足对可识别性的不同要求。
● 解决方案跟所用数据、数据接收方和分析目标相匹配。
● 为数据采集模式量身定制匿名化流水线,覆盖不同业务需求。
● 为原始数据生成匿名化版本或用分析平台生成匿名化输出。
● 检查匿名数据使用的伦理问题。
  1. 前言
  2. 第1章 简介
  3. 可识别性
  4. 术语介绍
  5. 匿名化作为数据保护措施
  6. 匿名化落地
  7. 小结
  8. 第2章 可识别性范围
  9. 法律环境
  10. 披露风险
  11. 重识别科学
  12. 总体可识别性
  13. 小结
  14. 第3章 风险管理实用框架
  15. “五个安全”匿名化框架
  16. “五个安全”框架落地
  17. 小结
  18. 第4章 明识数据
  19. 需求收集
  20. 从主要到次要用途
  21. 小结
  22. 第5章 伪匿名数据
  23. 数据保护和法律权威
  24. 匿名化第一步
  25. 重新反思“从主要到次要用途”
  26. 小结
  27. 第6章 匿名数据
  28. 再思考可识别性范围
  29. 源头匿名化
  30. 汇总匿名数据
  31. 反哺源头匿名化
  32. 小结
  33. 第7章 安全使用
  34. 信任基础
  35. 信任算法
  36. 负责任AIML技术的原则
  37. 管理和监督
  38. 小结
书名:构建数据分析匿名化流水线
译者:杜春晓 译
国内出版社:中国电力出版社
出版时间:2021年08月
页数:184
书号:978-7-5198-5673-1
原版书书名:Building an Anonymization Pipeline
原版书出版商:O'Reilly Media
Luk Arbuckle
 
Luk Arbuckle是Privacy Analytics公司首席方法官,为负责任地使用和分享数 据提供策略指导,为隐私增强技术和方法提供创新。Luk曾担任加拿大隐私专员办公室主任。
 
 
Khaled El Emam
 
Khaled El Emam是Replica Analytics公司 合伙人和CEO,该公司致力于开发合成数据。他还是加拿大渥太华大学医学院教授、东安大略儿童医院研究所资深研究员。
 
 
本书封面的动物是松鸦(学名Garrulus glandarius,英文名Eurasian jay)。该鸟在欧洲和亚洲大部均有分布,多生活在森林和靠近人类定居点的地区。
松鸦羽毛整体近粉褐色。其冠白色,有黑斑。黑色胡须状条带从其喙根部向下延伸。其翅膀连接身体的部位,有鲜亮的蓝色块斑和一个红三角,翅膀整体为黑色,只不过飞行时,露出一条白色块斑。有趣的是,松鸦的羽毛可反射紫外线。
松鸦主要生活在树上,偶尔会下到地面觅食。其生活地点通常较为固定,尽管它们要到其他区域觅食。作为“机会杂食动物”,松鸦找到什么食物就吃什么,但主要以橡子为食。该鸟社交行为复杂,它们的一种表演很有代表性,可能与其逃离主要捕食者鹰有关。
松鸦使用多种视觉表现和啼叫来交流,模仿能力惊人,其叫声可包含它们听过的所有声音,婴儿啼哭声、其他鸟的叫声,甚至还有割草机的声音,它们都能模仿。当前松鸦的保护级别为低危级。O’Reilly图书封面上的很多动物都是濒危物种,它们对全世界都很重要。
本书封面插图是Jose Marzan根据British Birds一书中的黑白版画绘制而成。
购买选项
定价:58.00元
书号:978-7-5198-5673-1
出版社:中国电力出版社