第一课 Python机器学习实战 - 泰迪云课堂 - 大数据培训_大数据就业培训班_大数据培训平台

38人加入学习

第一课 Python机器学习实战

价格 ¥ 319.00

学习有效期截止：2023-06-15 （随到随学）

扫一扫扫二维码继续学习二维码时效为半小时
分享
已收藏
收藏

该课程属于【2023年第1期】（专题十一）全国高校大数据与人工智能骨干师资研修班-深度学习推荐系统实战请加入后再学习

排序：最新笔记
- 最新笔记
- 点赞最多

TP: T表示预测正确；P表示预测正例

FT:F表示预测错误的；N表示预测饭粒

赫敏 · 2023-01-09 · 2.3性能度量 0

紧密性越小越好，间隔性越大越小

yinyunxia · 2023-01-08 · 5.5聚类结果的性能度量 0

kmeans算法流程案例

yinyunxia · 2023-01-08 · 5.3K-Means聚类分析算法介绍 0

定量：比如38，47

定性：比如男女

简单匹配系数适用于01取值型数据

余弦相似系数

余弦相似系数适用于文档型数据，比如几篇文档，里面出现若干词，求文档之间的相似系数

yinyunxia · 2023-01-07 · 5.2相似性度量 0

常见算法

K-meANS

yinyunxia · 2023-01-07 · 5.1聚类分析概述 0

决策树算法案例

yinyunxia · 2023-01-07 · 4.5泰坦尼克号生还者预测—数据预处理 0

ID3算法不是最优算法，不能处理非离散型值

C4.5按照信息增益率来选择节点选择

C5.0算法是对C4.5修订

CART算法：GINI系数

yinyunxia · 2023-01-07 · 4.4决策树算法家族 0

对于一个确定性事件来说，熵值为0

比如，14天都确定打球，14/14，对应的熵值为0

熵值越小越好

对纯度提升的程度为信息增益

yinyunxia · 2023-01-07 · 4.3决策树拆分属性选择 0

决策树是规则的集合

yinyunxia · 2023-01-07 · 4.2明天适合打球吗 0

逻辑回归：因变量只有0或1

广义线性模型：

y'=ln y

y'=wx+b

ln y/(1-y) 为对数几率

yinyunxia · 2023-01-07 · 3.4逻辑回归介绍 0

线性模型

单变量：

多变量

最小二乘法

yinyunxia · 2023-01-07 · 3.1线性回归基本形式 0

性能度量第一种方式：回归任务，均方误差

错误率与精度

错误率：分类错误样本数占总样本数比例

查准率与查全率

查准率/准确率(precision): P=TP/(TP+FP)

查全率/召回率/灵敏度(recall) R=TP/(TP+FN)

不是只关心查全率

yinyunxia · 2023-01-06 · 2.3性能度量 0

训练集与测试集

目标：对于模型、学习器的泛化误差进行评估

专家样本：训练集+测试集

训练集：训练误差

测试集：测试误差

独立同分布&互斥

用测试误差近似表示泛化误差

测试误差与泛化误差：

留出法：训练集+测试集互斥互补

训练集训练模型，测试集测试模型

合理划分、保持比例

单词留出与多次留出

交叉验证法

K折交叉验证：将专家样本等份划分为K个数据集，轮流用K-1个用于训练，1个用于测试

缺点：改变了初始数据集的分布

yinyunxia · 2023-01-06 · 2.2评估方法 0

真实值与预测值

训练误差

泛化误差

错误率

精度：1-错误率

真实值与预测值

目标：得到泛化误差小的模型、学习器

实际：新样本未知

以经验误差代表泛化误差

模型从训练样本中学得适用于所有潜在样本的“普遍规律"

过拟合与欠拟合

yinyunxia · 2023-02-09 · 2.1经验误差与过拟合 0

机器学习属于归纳

yinyunxia · 2023-01-06 · 1.3假设空间&归纳偏好 0

机器学习术语

yinyunxia · 2023-01-06 · 1.2基本术语 0

Python机器学习实战-T

Python机器学习实战-T

0 0

Python数据分析与应用-T

Python数据分析与应用-T

2 0

Python编程基础-T

Python编程基础-T

0 0

人工智能案例：基于Seq2Seq注意力模型实现聊天机器人

人工智能案例：基于Seq2Seq注意力模型实现聊天机器人

64 0

授课教师

张敏

数据挖掘与人工智能金牌讲师

赵云龙

数据挖掘资深讲师

admin

管理员

课程特色

视频(30)

下载资料(1)

最新学员

学员动态

李兰兰1108 加入学习

钱卓涛完成了 6.2 并行集成算法-Bagg...

钱卓涛开始学习 6.2 并行集成算法-Bagg...

钱卓涛开始学习 6.5 Stacking算法流...

钱卓涛完成了 5.5聚类结果的性能度量