一、课程简介
通过学习本案例,可掌握网络数据爬虫技术、文本去重、文本分词和模型构建的主要方法和技能,并为后续相关课程学习及将来从事数据分析工作奠定基础。 消费者需要在没有看到真正的产品实体、做出购买决策之前,根据其他购物者的评论了解产品的质量、性价比等信息,为购物抉择提供参考依据。本案例运用数据分析技术对爬虫获取的数据进行分析,然后对原始数据进行处理,从而获得消费者的意见和评价。
本案例的主要分析目标如下。
(1)收集用户的评论数据,挖掘评论中的关键信息。
(2)分析商品的优点与不足并提供改善建议。
二、技术点
文本去重;文本分词;LDA模型。