sklearn库的datasets模块集成了部分数据分析的经典数据集,可以使用这些数据集进行数据预处理,建模等操作。
datase模块常用数据及德加载函数与解释如下
load_boston 回归
fetch_california_housing 回归
load_digits 分类
load_breast_cancer 分类,聚类
load_iris 分类,聚类
load_wine 分类
使用sklearn进行数据预处理会用到sklearn提供的统一接口——转换器。
加载后的数据集可以视为一个字典,几乎所有的sklearn数据集均可以使用data,target,feature_names,DESCR分别获取数据集的数据,标签,tezhengmingcheng