文本挖掘和可视化案例：基于文本内容的垃圾短信分类 - 泰迪云课堂 - 大数据培训_大数据就业培训班

25人加入学习

文本挖掘和可视化案例：基于文本内容的垃圾短信分类

价格 ¥ 199.00

学习有效期长期有效

扫一扫扫二维码继续学习二维码时效为半小时
分享
已收藏
收藏

该课程属于赛前指导：武汉船舶职业技术学院【2020.3.16】请加入后再学习

课程介绍

一、课程简介

通过学习本案例，可掌握文本去重、分词、停用词过滤、词云图绘制、朴素贝叶斯算法构建文本分类模型的主要方法和技能，并为后续相关课程学习及将来从事数据分析工作奠定基础。垃圾短信泛滥，已经严重影响到人们正常生活、运营商形象乃至社会稳定，也是亟待解决的问题。案例通过建立合理的短信识别模型，对垃圾短信进行识别，解决运营商和手机用户等困扰。以常见文本挖掘任务文本分类为主线，分步介绍了文本预处理技术、文本向量化表示、常见文本分类器、分类模型性能评估等内容，完整介绍了文本分类的总体流程。其中文本预处理技术涉及分词原理与实现、正则表达式、停用词处理与词云绘制。
本案例的主要分析目标如下。
（1) 了解垃圾短信识别的背景知识，分析步骤和流程。
（2) 掌握Jieba分词、去停用词等文本预处理方法与应用。
（3) 掌握文本数据的向量表示方法。
（4）掌握朴素贝叶斯分类算法的原理与应用。