一、课程简介
通过学习本案例,可掌握Word2vec、One-hot表达、CBOW词向量生成、深度学习算法构建文本主题识别模型、模型优化的主要方法和技能,并为后续相关课程学习及将来从事数据分析工作奠定基础。 文本数据最广泛存在的数据形式之一,案例的最终目标为利用深度学习算法根据文本内容识别新闻所属主题。 。
本案例的主要分析目标如下。
(1)了解数据基本情况,然后学习word embedding。
(2)通过案例学习实现word2vec。
(3)学习构建RNN网络模型实现新闻主题识别。
二、技术点
词嵌入word embedding、RNN网络、词向量训练。
三、建议前置课程