2.3 性能度量
查准率与查全率
查准率 / 准确率(precision):P = TP / (TP + FP)
查全率 / 召回率 / 灵敏度(recall):R = TP / (TP + FN)
F1 系数:
综合查准率与查全率
多次测试与训练的F1 系数
泛化误差的评估
测试误差,评估方法有3种:
1、留出法:
2、交叉验证法:--K折交叉验证法
3、自助法:
留出法与交叉验证法的训练集数据少于样本数据
参考模型就是实际分类结果,
样本对SS与SD:
S--Similar, D--Different
前者表示在聚类结果(成对出现)中是不是同一个簇;后者表示在参考模型中是不是同一个簇;
如果结果一个是0,另一个是0,就是S
如果结果一个是0,一个是1,就是D
SS: 在预测结果和实际结果中都是同一个簇
SD: 在预测结果是同一个簇,但在实际不是同一个簇
逻辑回归不是回归算法吧
Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.
sklearn
按住crtl键出来
缺失值可以用所有值的均值替代
熵
信息增益
属性信息增益最大作为根节点!