这几个概念有点抽象,这里直接举例:
假设一个班级有100个学生,其中男生70人,女生30人。如下图,蓝色矩形表示男生,橙色矩形表示女生。
又假设,我们不知道这些学生的性别,只知道他们的身高和体重。我们有一个程序(分类器),这个程序可以通过分析每个学生的身高和体重,对这100个学生的性别分别进行预测。最后的预测结果为,60人为男生,40人为女生,如下图。
TP:实际为男生,预测为男生;
FP:实际为女生,预测为男生;
FN:实际为男生,预测为女生;
TN:实际为女生,预测为女生;
可以看到,上面的预测结果并不是很好。假设我们优化了程序后,再次进行预测。预测结果为:
各项指标都比第一次高,说明预测效果更好。从图上也能看出来,预测为男生的范围与实际男生范围更接近。