0人评价
(0)人学习
互联网虚假流量,是指通过特殊的方式,模仿人类浏览行为生成的访问流量。例如通过设置程序,每分钟访问一次某网站的主页,这样的流量就属于虚假流量。一般而言,浏览量的增加,的确能促进销售量的增加,因此多数广告主是基于浏览支付广告费的。换句话说:同等条件下,流量大的网站收取的广告费用更高。部分网站受利益的驱使,通过作弊方式产生流量。
与传统的电视广告、户外广告采买相比,流量作弊一直以来被看作互联网广告特有的弊病。虚假流量的存在给广告主带来了严重的损失,一方面虚假流量提高了广告费用,直接损害了广告主的利益。另一方面,广告监测行为数据被越来越多地用于建模和做决策,例如绘制用户画像,跨设备识别对应用户等。作弊行为,恶意曝光,甚至是在用户完全无感知的情况下被控制访问等产生的不由用户主观发出的行为给数据带来了巨大的噪声,给模型训练造成了很大影响。
本案例将使用广告检测流量数据,分别采用决策树算法和随机森林算法建立分类模型,识别出流量数据中的作弊流量,减少投放广告的客户损失。