tensorflow
4人加入学习
公众健康问句分类
价格 ¥ 299.00
教学计划
课程介绍

一、课程简介

      通过学习本案例,可掌握文本处理的相关方法、text CNN的多标签文本分类模型的原理和模型评价的相关方法,并为后续相关课程学习及将来从事数据分析工作奠定基础。 疫情期间,第三方互联网服务平台如:平安好医生、阿里健康、好大夫在线等,访问量同比增长了20倍,用户已经逐渐养成使用线上健康平台进行健康咨询的习惯。作为自动问答系统的核心模块之一,问句分类任务的准确性直接影响到系统的性能。本案例基于自动问答系统给出的与健康医疗相关的中文问句,对问句的主题进行分类,准确判断医疗健康问句所属主题类别,使得医疗问答系统在交互过程中能够清楚了解用户问题的意思,准确返回用户需要的答案。
      本案例的主要分析目标如下。
      (1)数据读取:读取与健康医疗相关的中文问句。
      (2)数据预处理:对中文问句进行文本处理操作。
      (3)特征构建:对分词的结果序列化以及使用Tencent_AILab_ChineseEmbedding的预训练词向量作为文本特征。
      (4)模型构建:构建textCNN分类模型,对中文问句进行多标签分类识别。
      (5)模型评估:构建指标评估模型性能。

 

二、技术点

      中文分词;词向量;textCNN的多标签文本分类模型;F1-score。

 

三、建议前置课程

授课教师

数据挖掘金牌讲师

课程特色

视频(9)
下载资料(1)

最新学员

学员动态

滕婕1 加入学习
唐文萍 加入学习
何勰绯 加入学习
杨福华 加入学习