一、课程简介
通过学习本案例,可掌握使用pandas模块对数据进清洗的主要方法,熟悉大数据挖掘的基本流程,能够根据实际的业务需求构建对应的挖掘模型,并且可以对模型的效果进行有效的分析,为后续相关课程学习及将来从事数据挖掘工作奠定基础。 随着互联网的高速发展,网络新闻已经成为人们获取信息的重要途径。传统的新闻门户虽然拥有海量信息,却只是扮演信息集合的角色。用户只能被动式地浏览网站提供的信息,查找需要的内容。如何为每个用户提供快捷准确,满足个人实际需要的信息,已成为众多业内人士日益关注的问题,而新闻推荐系统能有效的解决上述问题。本案例基于新闻用户浏览的网页信息,通过清洗、拆分等数据处理操作,构建相应的模型对新闻用户实现智能推荐服务。
本案例的主要分析目标如下。
(1)探索新闻用户的浏览情况。
(2)针对不同的用户推荐相关的新闻网页。
二、技术点
pandas数据处理;相似度矩阵;pyplot绘图。
三、建议前置课程