Detecting Poisoning Attacks on Machine Learning in IoT Environments
Detecting Poisoning Attacks on Machine Learning in IoT Environments abstract。
Architecture
具体贡献有:
- 一个新型算法检测和过滤污染数据
- 两个基于溯源信息的变体防御:部分可信和完全不可信
- evaluation
部分可信的防御方法 Defences for Partially Trusted Data
具体输入如下:
- 一个有监督机器学习算法
- 为了训练机器学习算法采集的数据集,包含可信和不可信两部分
- 一个安全可信的溯源数据集,描述不可信部分中每个数据点的溯源和沿袭的源数据组成
- 溯源特征,表征污染数据如何聚集在数据集的不可信部分中
给定以上输入后,具体方法如上图所示。
全部不可信的防御方法 Defences for Fully Untrusted Data
存在一些场景下无法确认数据是否可信,为了将本方法应用到非可信数据集上,提出以下步骤:
- 根据选择的溯源特征分段
- 对于每个段,随机将一部分数据分配给训练集,将其余数据分配给评估集。
- 对于每个所选特征中的签名:
- 训练两个模型,一个包含所有训练数据,一个删除训练数据中相应的段
- 在评估集上评估两个模型,并删除相应的段
- 如果在没有该段的情况下模型表现更好,则永久从训练和评估集中删除这些片段
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.