一、课程简介
进入新世纪以后,互联网技术得到巨大的发展,信息的传播途径随之丰富起来。今天,互联网的信息流通量已经远超过电视、广播、报纸等传统媒体。随着互联网使用人群基数不断增大,使用网络媒体对商品进行广告宣传也广泛应用。部分网站受利益的驱使,为吸引更多广告主的注意,提高自己广告位的价值,通过作弊方式产生虚假流量,以牟取暴利!虚假流量的存在给广告主带来了严重的损失。
本案例的主要分析目标如下。
(1)建立互联网虚假流量识别模型,精准识别虚假作弊流量记录。
二、技术点
Hive、Spark MLlib、决策树、随机森林。
三、建议前置课程