为推广我国高校数据挖掘实践教学,培养学生数据挖掘的应用和创新能力,增加校企交流合作和信息共享,提升我国高校的教学质量和企业的竞争能力,第十一届“泰迪杯”数据挖掘挑战赛(以下简称挑战赛)将于2023年3月举行。


   举办挑战赛的目的在于以赛促学,激励学生学习数据挖掘的积极性,提高学生分析、解决实际问题的综合能力;以赛促教,推动数据挖掘技术在高校的推广和应用;以赛促研,为高校相关智力资源转化,为推进国家大数据战略的生产力提供合作平台。
    赛前指导:
    林长旭-泰迪智能科技(高级大数据开发工程师)
    对Hadoop生态圈相关组件技术有深入理解,熟悉HDFS分布式文件系统存储结构,熟练掌握Hadoop环境部署和Hadoop核心计算框架MapReduce编程。
    对非结构化数据库HBase和结构化数据库Hive有深刻的了解。掌握Spark原理及编程,熟悉Spark底层运行机制,并熟练使用Spark SQL查询引擎和Spark MLlib算法库。
    曾负责《Hadoop大数据开发基础(第2版)(微课版)》课程录制;负责韩山师范学院线上《Spark大数据技术应用》培训课程;负责多次师资培训大数据开发专题线上答疑指导工作;负责西京学院、佛山科技学院、黑龙江工业学院等多个高校大数据方向学生的在线实习和毕设指导工作。
    案例剖析1:
    主题:基于广电用户信息的数据仓库设计
    时间:3月9日19:00:00-20:00:00
    会议ID:998-261-060

   
赛前指导录播课程(2月25日-4月14日)
    阶段一
    Python编程基础
    Python数据分析与应用
    MySQL数据分析基础
    Python网络爬虫实战
    阶段二
    O2O优惠券特征构建
    市财政收入分析及预测
    百货商场用户画像描绘与价值分析
    阶段三
    第十一届“泰迪杯”挑战赛赛题讲解
    模块1:
    A题赛题背景解读
    B题赛题背景解读
    C题赛题背景解读
    模块2:赛前指导直播录屏
    基于广电用户信息的数据仓库设计
    铁路客流量预测
    竞赛网站智能推荐服务
    从竞赛到论文编写
    赛前注意事项