跟着迪哥学python电⼦书pdf-跟着迪哥学Python数据分析与机
学习实战
本书结合了机器学习、数据分析和Python语⾔,通过案例以通俗易懂的⽅式讲解了如何将算法应⽤到实际任务。
全书共20章,⼤致分为4个部分。第⼀部分介绍了Python的⼯具包,包括科学计算库Numpy、数据分析库Pandas、可视化库Matplotlib;第2部分讲解了机器学习中的经典算法,例如回归算法、决策树、集成算法、⽀持向量机、聚类算法等;第3部分介绍了深度学习中的常⽤算法,包括神经⽹络、卷积神经⽹络、递归神经⽹络;第4部分是项⽬实战,基于真实数据集,将算法模型应⽤到实际业务中。
本书适合对⼈⼯智能、机器学习、数据分析等⽅向感兴趣的初学者和爱好者。
·⽹易云课堂、51CTO、CSDN⼈⽓培训讲师迪哥唐宇迪⽼师多年实战经验汇总
·30万学员共同的选择
·⾯向零基础,沉浸式学习体验,打通从算法原理、数学推导到实例操作的疑难点,快速⼊门⼈⼯智能领域。
1. 通俗易懂,快速⼊门
对机器学习经典算法结合数学推导进⾏形象解释,实例演⽰。
2. Python主导,实⽤⾼效
使⽤数据领域主流语⾔Python及其分析与建模库作为课程核⼼⼯具。
3. 案例为师,实战护航
基于真实数据集,从零开始结合Python⼯具与机器学习算法完成整个案例实战。
唐宇迪,计算机专业博⼠,⽹易云课堂⼈⼯智能认证⾏家,51CTO学院讲师,CSDN博客专家、讲师。拥有多年⼈⼯智能领域培训经验,带领课程研发团队累计开发AI课程60余门,覆盖当下⼈⼯智能热门领域。丰富的教学讲解经验,通俗易懂的授课风格,⽤接地⽓的⽅式帮助同学们进军⼈⼯智能领域。
第 1章 ⼈⼯智能⼊学指南
1.1 AI时代⾸选Python
1.1.1 Python的特点
1.1.2 Python该怎么学
1.2 ⼈⼯智能的核⼼――机器学习
1.2.1 什么是机器学习
1.2.2 机器学习的流程
1.2.3 机器学习该怎么学
1.3 环境配置
1.3.1 Anaconda⼤礼包
1.3.2 Jupyter Notebook
1.3.3 上哪资源
本章总结
第 2章 科学计算库(Numpy)
2.1 Numpy的基本操作
2.1.1 Array数组
2.1.2 数组特性
2.1.3 数组属性操作
2.2 索引与切⽚
2.2.1 数值索引
2.2.2 bool索引
2.3 数据类型与数值计算
2.3.1 数据类型
2.3.2 复制与赋值
2.3.3 数值运算
2.3.4 矩阵乘法
2.4 常⽤功能模块
2.4.1 排序操作
2.4.2 数组形状操作
2.4.3 数组的拼接
安娜贝尔的照片2.4.4 创建数组函数
2.4.5 随机模块
2.4.6 ⽂件读写
本章总结
第3章 数据分析处理库(Pandas)3.1 数据预处理
3.1.1 数据读取
3.1.2 DataFrame结构
3.1.3 数据索引
3.1.4 创建DataFrame
3.1.5 Series操作
3.2 数据分析
3.2.1 统计分析
3.2.2 pivot数据透视表
3.2.3 groupby操作
3.3 常⽤函数操作
3.3.1 Merge操作
3.3.2 排序操作
3.3.3 缺失值处理
3.3.4 apply⾃定义函数
3.3.5 时间操作
3.3.6 绘图操作
3.4 ⼤数据处理技巧
3.4.1 数值类型转换
3.4.2 属性类型转换
本章总结
第4章 数据可视化库(Matplotlib)
4.1 常规绘图⽅法
4.1.1 细节设置
4.1.2 ⼦图与标注
4.1.3 风格设置
4.2 常⽤图表绘制
4.2.1条形图
4.2.2 盒图
4.2.3 直⽅图与散点图
4.2.4 3D图
4.2.5 布局设置
本章总结
第5章 回归算法
中国好声音丁丁
5.1 线性回归算法
5.1.1 线性回归⽅程
5.1.2 误差项分析
5.1.3 似然函数求解
5.1.4 线性回归求解
5.2 梯度下降算法
5.2.1 下⼭⽅向选择
5.2.2 梯度下降优化
5.2.3 梯度下降策略对⽐
5.2.4 学习率对结果的影响
5.3 逻辑回归算法
5.3.1 原理推导
5.3.2 逻辑回归求解
本章总结
写给爸爸的话第6章 逻辑回归项⽬实战――信⽤卡欺诈检测
6.1 数据分析与预处理
6.1.1 数据读取与分析
6.1.2 样本不均衡解决⽅案6.1.3 特征标准化
6.2 下采样⽅案
6.2.1 交叉验证
6.2.2 模型评估⽅法
6.2.3 正则化惩罚
6.3 逻辑回归模型
6.3.1 参数对结果的影响
6.3.2 混淆矩阵
6.3.3 分类阈值对结果的影响6.4 过采样⽅案
6.4.1 SMOTE数据⽣成策略6.4.2 过采样应⽤效果
项⽬总结
第7章 决策树
7.1 决策树原理
7.1.1 决策树的基本概念
7.1.2 衡量标准
7.1.3 信息增益
7.1.4 决策树构造实例
7.1.5 连续值问题
7.1.6 信息增益率
7.1.7 回归问题求解
7.2 决策树剪枝策略
7.2.1 剪枝策略
7.2.2 决策树算法涉及参数本章总结
第8章 集成算法
8.1 bagging算法
8.1.1 并⾏的集成
8.1.2 随机森林
韩庚和李小璐8.2 boosting算法
8.2.1 串⾏的集成
8.2.2 Adaboost算法
8.3 stacking模型
本章总结
第9章 随机森林项⽬实战――⽓温预测
9.1 随机森林建模
9.1.1 特征可视化与预处理
9.1.2 随机森林回归模型
9.1.3 树模型可视化⽅法
9.1.4 特征重要性
9.2 数据与特征对结果影响分析
9.2.1 特征⼯程
9.2.2 数据量对结果影响分析
9.2.2 特征数量对结果影响分析
9.3 模型调参
9.3.1 随机参数选择
9.3.2 ⽹络参数搜索
项⽬总结
第 10章 特征⼯程
10.1 数值特征
10.1.1 字符串编码
10.1.2 ⼆值与多项式特征
10.1.3 连续值离散化
现在做什么赚钱
10.1.4 对数与时间变换
10.2 ⽂本特征
10.2.1 词袋模型
10.2.2 常⽤⽂本特征构造⽅法
10.3 论⽂与benchmarkpdf电子书制作
本章总结
第 11章: 贝叶斯算法项⽬实战――新闻分类11.1 贝叶斯算法
11.1.1 贝叶斯公式
11.1.2 拼写纠错实例
11.1.3 垃圾邮件分类