对于库存数据的预处理
重复值判断:日期+商品名称为一个组合进行判断
1、合并字符串---concatenate,双击鼠标左键填充
在合并时日期被合并为文本格式,默认从1900年1月1号开始,到单元格日期的间隔天数。
2、筛选查找重复值
找重复值:开始-样式-条件格式-突出显示单元格规则-重复值
筛选:按颜色进行排序,使重复值明显
3、删除重复项
数据-数据工具-删除重复值-只勾选合并项
对于订单数据的预处理
1、商品名称---缺失值处理
选中商品名称列-数据-筛选-取消勾选全选-勾选空白-确定-选中空白行-删除行-取消筛选
2、商品类别、出货状态---去重、异常值处理
出货状态(出货成功、出货中、未出货、出货失败)除了出货成功其他均为异常值,若异常量不大可做去除处理,用countif函数
(1)查看异常量:出货状态列复制-去除重复值[当前选定区域]-出货成功后一个单元格countif(出货状态列,出货成功单元格)-回车-实心+拖到出货状态最后一个
(2)删除异常值:出货状态列筛选-取消全选-选择异常值-确定-删除行-取消筛选
商品类别
筛选查看字段值,发现异常值0,选中,删除行
3、日期时间---提取
text函数(要提取单元格,提取字符串格式)
日期
时间