Detecting Poisoning Attacks on Machine Learning in IoT Environments abstract。

Architecture

arch

具体贡献有:

  • 一个新型算法检测和过滤污染数据
  • 两个基于溯源信息的变体防御:部分可信和完全不可信
  • evaluation

部分可信的防御方法 Defences for Partially Trusted Data

具体输入如下:

  • 一个有监督机器学习算法
  • 为了训练机器学习算法采集的数据集,包含可信和不可信两部分
  • 一个安全可信的溯源数据集,描述不可信部分中每个数据点的溯源和沿袭的源数据组成
  • 溯源特征,表征污染数据如何聚集在数据集的不可信部分中

给定以上输入后,具体方法如上图所示。

全部不可信的防御方法 Defences for Fully Untrusted Data

存在一些场景下无法确认数据是否可信,为了将本方法应用到非可信数据集上,提出以下步骤:

  • 根据选择的溯源特征分段
  • 对于每个段,随机将一部分数据分配给训练集,将其余数据分配给评估集。
  • 对于每个所选特征中的签名:
    • 训练两个模型,一个包含所有训练数据,一个删除训练数据中相应的段
    • 在评估集上评估两个模型,并删除相应的段
    • 如果在没有该段的情况下模型表现更好,则永久从训练和评估集中删除这些片段