1、
2、
3、
1、
2、
3、
数据预处理
数据清洗:
重复值处理
相关性分析:
import pandas as pd
data = pd.read_cxcel('')
data.corr().T
data.corr()['铁板豆腐']
1、
1、
1、组与组不要重叠
1、、离中趋势度量(极差,标准差,变异系数,四位数间距)
2、
数据特征分析;
1.集中趋势度量(均值,中位数,众数)
异常值校验方法三;箱型图分析
1、
异常值校验;
1、
2、
3、
4、
5、
6、
异常值校验:
1、
2、
缺失值校验:
1、
2、
3、
数据校验:
1、
2、
3、
4、
5、
6、
7、
1、
2、
3、
4、
5、
6、
7、
1、
2、
3、
4、
5、
6、
7、
8、
9、
10、
1、
2、
3、
4、
5、
6、
7、
1、
2、