个人技术分享

在这里插入图片描述
本文由CSDN点云侠原创,原文链接。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫。

一、算法原理

1、算法概述

   使用Z分数法,可以找出距离平均值有多少个标准差值:

在这里插入图片描述

上图为正态曲线下面积及标准差所占面积。

  • 68%的数据点位于 +1 或 -1个标准差之间
  • 95%的数据点位于 +2 或 -2个标准差之间
  • 99.7%的数据点位于 +3 或 -3个标准差之间

参考自异常值的检测与处理(附python代码及实例)