任何从事机器学习或数据科学工作的人都将从本书中受益。异常检测是一项常见的任务,对于在这些领域工作的任何人来说,都可能不时出现;这是一项重要的技能。理解异常检测也有助于从业者更好地理解机器学习的其他领域,如预测、聚类和降维。
对于任何从事数据分析工作的人来说,异常检测都非常有用。事实上,可以认为,在努力理解数据集时,两个主要任务是首先理解数据中的一般模式,其次是理解这些模式的例外情况:也就是异常值。
此外,任何在审计、安全、医疗保健、机器人检测、科学研究或任何其他领域工作的人,在这些领域中,理解可用数据并理解其中的异常情况都非常有用,他们会发现这本书非常有用。
异常检测的想法相当简单:找到数据集中最不像其他项目的项目。但是,在实践中,以有效和高效的方式做到这一点通常非常困难,尤其是在您感兴趣的细微异常值的情况下。执行后,很难确定标记为最异常的项目是否真正是最异常的。事实上,甚至很难具体识别标记的项目为何异常。