127人加入学习
第四课 数据采集与处理实战:农产品信息采集与分析
价格 ¥ 449.00
课程介绍

一、课程简介

      通过学习本案例,可掌握网页数据获取、提取网页数据关键信息、对获取的数据进行处理以及可视化分析的主要方法和技能,并为后续相关课程学习及将来从事数据分析工作奠定基础。

      在粮食危机和人们生活水平日益增长的双重压力下,育种学家和稻米种业长期以来致力于培育“高产优质”型超级水稻新品种。为了高效、精准、定向的培育水稻,需了解历年培育的水稻样本信息,掌握近年水稻的培育情况和研究方向。本案例主要是爬取国家水稻数据中心网站历年审定的水稻样本数据,依据网站不同部门的划分,探索不同部门网址的特点与规律,依次爬取所有部门的水稻样本数据,并从不同的角度分析水稻样本审定的信息。
      本案例的主要分析目标如下。
      (1)采集国家水稻数据中心网站历年审定的水稻样本数据。
      (2)分析近年水稻的培育情况和研究方向,从而高效、精准地培育水稻。

 

二、技术点

      Selenium爬虫;XPath网页解析;数据保存;pyplot图形绘制。

 

三、建议前置课程