17. PolicyLint: Investigating Internal Privacy Policy Contradictions on Google Play

17.1 论文信息

  • 作者:Benjamin Andow et al.
  • 年份:2019年
  • 会议:USENIX Security Symposium
  • 研究机构:North Carolina State University, UIUC
  • 主要内容:提出了一种检测隐私政策内部矛盾的方法 PolicyLint,能够推理否定陈述和不同粒度表达之间的冲突。

17.2 问题分析

现有隐私政策分析方法存在以下局限性:

  1. 语义粒度差异导致理解困难;
  2. 否定陈述检测不准确;
  3. 未能识别隐私政策中的矛盾,造成误判。

17.3 研究方案

1. 本体生成

  • 使用 NER 提取数据对象和实体;
  • 提取包含关系;
  • 构建本体图,解决循环和一致性问题。

2. 政策声明提取

  • 构建 DED 树(Data and Entity Dependency Tree);
  • 识别 SoC 动词(Sharing/Collection/Usage);
  • 处理例外条款和否定情绪。
图17.2 DED树生成示例

图17.2 DED树生成示例

3. 隐私政策矛盾分析

(1)政策简化

将原始政策声明(CPS)转化为简化形式(SPS):p = [e, c, d]

图17.3 转换规则

图17.3 转换规则

(2)矛盾定义

  • 逻辑矛盾(C1~C5):可能导致误解;
  • 缩小定义(N1~N4):先声明收集广泛信息,又声明不收集特定数据。
图17.4 矛盾类型

图17.4 矛盾类型

(3)矛盾识别流程

  • 提取候选矛盾语句;
  • 使用启发式规则过滤;
  • 最终由分析师验证。

17.4 优缺点

优点

  1. 能有效发现隐私政策中的潜在矛盾;
  2. 考虑了实体和负面情绪声明;
  3. 使用 [actor, action, data object, entity] 四元组表示隐私政策内容。

缺点

无明显技术缺陷描述,但可用于改进隐私政策解析方式。