模块一Python编程【夯实基础】Python编程入门1、Python环境搭建 下载、安装与版本选择。2、如何选择Python编辑器IDLE、Notepad、PyCharm、Jupyter…3、Python基础数据类型和变量、字符串和编码、list和tuple、条件判断、循环、函数的定义与调用等4、常见的错误与程序调试5、第三方模块的安装与使用6、文件读写I/O7、实操练习Python进阶与提高1、Numpy模块库Numpy的安装ndarray类型属性与数组的创建数组索引与切片Numpy常用函数简介与使用2、Pandas模块库DataFrame数据结构、表格的变换、排序、拼接、融合、分组操作等3、Matplotlib基本图形绘制线形图、柱状图、饼图、气泡图、直方图、箱线图、散点图等4、图形样式的美化颜色、线型、标记、字体等属性的修改5、图形的布局多个子图绘制、规则与不规则布局绘制、向画布中任意位置添加坐标轴6、高级图形绘制3D图、等高线图、棉棒图、哑铃图、漏斗图、树状图、华夫饼图等7、坐标轴高阶应用共享绘图区域的坐标轴、坐标轴刻度样式设置、控制坐标轴的显示、移动坐标轴的位置8、实操练习模块二特征工程数据清洗1、描述性统计分析数据的频数分析统计直方图数据的集中趋势分析算数平均值、几何平均数、众数、极差与四分位差、平均离差、标准差、离散系数数据的分布偏态系数、峰度数据的相关分析相关系数2、数据标准化与归一化为什么需要标准化与归一化3、数据异常值、缺失值处理4、数据离散化及编码处理5、手动生成新特征6、实操练习变量降维1、主成分分析PCA的基本原理2、偏最小二乘PLS的基本原理3、案例实践4、实操练习特征选择1、常见的特征选择方法优化搜索、Filter和Wrapper等前向与后向选择法区间法无信息变量消除法正则稀疏优化方法等2、案例实践3、实操练习群优化算法1、遗传算法Genetic Algorithm, GA的基本原理以遗传算法为代表的群优化算法的基本思想是什么粒子群算法、蜻蜓算法、蝙蝠算法、模拟退火算法等与遗传算法的区别与联系2、遗传算法的Python代码实现3、案例实践一一元函数的寻优计算4、案例实践二离散变量的寻优计算特征选择5、实操练习模块三回归拟合模型线性回归模型1、一元线性回归模型与多元线性回归模型回归参数的估计、回归方程的显著性检验、残差分析2、岭回归模型工作原理、岭参数k的选择、用岭回归选择变量3、LASSO模型工作原理、特征选择、建模预测、超参数调节4、Elastic Net模型工作原理、建模预测、超参数调节5、案例实践6、实操练习前向型神经网络1、BP神经网络的基本原理人工智能发展过程经历了哪些曲折人工神经网络的分类有哪些BP神经网络的拓扑结构和训练过程是怎样的什么是梯度下降法BP神经网络建模的本质是什么2、BP神经网络的Python代码实现怎样划分训练集和测试集为什么需要归一化归一化是必须的吗什么是梯度爆炸与梯度消失3、BP神经网络参数的优化隐含层神经元个数、学习率、初始权值和阈值等如何设置什么是交叉验证4、值得研究的若干问题欠拟合与过拟合、泛化性能评价指标的设计、样本不平衡问题等5、极限学习机Extreme Learning Machine, ELM的工作原理6、案例演示 7、实操练习模块四分类识别模型KNN、贝叶斯分类与支持向量机1、KNN分类模型KNN算法的核心思想、距离度量方式的选择、K值的选取、分类决策规则的选择2、朴素贝叶斯分类模型伯努利朴素贝叶斯BernoulliNB、类朴素贝叶斯CategoricalNB、高斯朴素贝叶斯besfGaussianNB、多项式朴素贝叶斯MultinomialNB、补充朴素贝叶斯ComplementNB3、SVM的工作原理SVM的本质是解决什么问题SVM的四种典型结构是什么核函数的作用是什么什么是支持向量SVM扩展知识如何解决多分类问题SVM除了建模型之外还可以帮助我们做哪些事情4、案例实践5、实操练习决策树、随机森林、LightGBM、XGBoost1、决策树的工作原理微软小冰读心术的启示什么是信息熵和信息增益ID3算法和C4.5算法的区别与联系决策树除了建模型之外还可以帮我们做什么事情2、随机森林的工作原理为什么需要随机森林算法广义与狭义意义下的“随机森林”分别指的是什么“随机”体现在哪些地方随机森林的本质是什么怎样可视化、解读随机森林的结果3、Bagging与Boosting的区别与联系4、AdaBoost vs. Gradient Boosting的工作原理5. 常用的GBDT算法框架XGBoost、LightGBM6、案例实践7、实操练习模块五聚类分析算法K均值、DBSCAN、层次聚类1、K均值聚类算法的工作原理2、DBSCANDensity-Based Spatial Clustering of Applications with Noise聚类算法的工作原理3、层次聚类算法的工作原理4、案例讲解5、实操练习模块六关联分析算法关联规则、协同过滤Apriori算法1、关联规则算法的工作原理2、协同过滤算法的工作原理3、Apriori算法的工作原理4、案例讲解5、实操练习模块七总结与答疑讨论信息检索与常用科研工具1、如何无障碍地访问Google、YouTube等网站谷歌访问助手、VPN等2、如何查阅文献资料怎样能够保证对最新论文的追踪3、Google Scholar、ResearchGate的使用方法4、应该去哪些地方查找与论文配套的数据和代码5、文献管理工具的使用Endnote、Zotero等6、当代码出现错误时应该如何高效率解决7、实操练习总结与答疑讨论1、SCI不同分区的论文差别在哪些地方你知道你的论文为什么显得很单薄吗2、从审稿人的角度看SCI期刊论文需要具备哪些要素审稿人关注的点有哪些如何回应审稿人提出的意见3、如何提炼与挖掘创新点如果在算法层面上难以做出原创性的工作如何结合自己的实际问题提炼与挖掘创新点开启送礼物
Python数据挖掘与机器学习实战教程(含Python编程、特征工程、回归拟合、分类识别及GA算法/PCA降维案例)
模块一Python编程【夯实基础】Python编程入门1、Python环境搭建 下载、安装与版本选择。2、如何选择Python编辑器IDLE、Notepad、PyCharm、Jupyter…3、Python基础数据类型和变量、字符串和编码、list和tuple、条件判断、循环、函数的定义与调用等4、常见的错误与程序调试5、第三方模块的安装与使用6、文件读写I/O7、实操练习Python进阶与提高1、Numpy模块库Numpy的安装ndarray类型属性与数组的创建数组索引与切片Numpy常用函数简介与使用2、Pandas模块库DataFrame数据结构、表格的变换、排序、拼接、融合、分组操作等3、Matplotlib基本图形绘制线形图、柱状图、饼图、气泡图、直方图、箱线图、散点图等4、图形样式的美化颜色、线型、标记、字体等属性的修改5、图形的布局多个子图绘制、规则与不规则布局绘制、向画布中任意位置添加坐标轴6、高级图形绘制3D图、等高线图、棉棒图、哑铃图、漏斗图、树状图、华夫饼图等7、坐标轴高阶应用共享绘图区域的坐标轴、坐标轴刻度样式设置、控制坐标轴的显示、移动坐标轴的位置8、实操练习模块二特征工程数据清洗1、描述性统计分析数据的频数分析统计直方图数据的集中趋势分析算数平均值、几何平均数、众数、极差与四分位差、平均离差、标准差、离散系数数据的分布偏态系数、峰度数据的相关分析相关系数2、数据标准化与归一化为什么需要标准化与归一化3、数据异常值、缺失值处理4、数据离散化及编码处理5、手动生成新特征6、实操练习变量降维1、主成分分析PCA的基本原理2、偏最小二乘PLS的基本原理3、案例实践4、实操练习特征选择1、常见的特征选择方法优化搜索、Filter和Wrapper等前向与后向选择法区间法无信息变量消除法正则稀疏优化方法等2、案例实践3、实操练习群优化算法1、遗传算法Genetic Algorithm, GA的基本原理以遗传算法为代表的群优化算法的基本思想是什么粒子群算法、蜻蜓算法、蝙蝠算法、模拟退火算法等与遗传算法的区别与联系2、遗传算法的Python代码实现3、案例实践一一元函数的寻优计算4、案例实践二离散变量的寻优计算特征选择5、实操练习模块三回归拟合模型线性回归模型1、一元线性回归模型与多元线性回归模型回归参数的估计、回归方程的显著性检验、残差分析2、岭回归模型工作原理、岭参数k的选择、用岭回归选择变量3、LASSO模型工作原理、特征选择、建模预测、超参数调节4、Elastic Net模型工作原理、建模预测、超参数调节5、案例实践6、实操练习前向型神经网络1、BP神经网络的基本原理人工智能发展过程经历了哪些曲折人工神经网络的分类有哪些BP神经网络的拓扑结构和训练过程是怎样的什么是梯度下降法BP神经网络建模的本质是什么2、BP神经网络的Python代码实现怎样划分训练集和测试集为什么需要归一化归一化是必须的吗什么是梯度爆炸与梯度消失3、BP神经网络参数的优化隐含层神经元个数、学习率、初始权值和阈值等如何设置什么是交叉验证4、值得研究的若干问题欠拟合与过拟合、泛化性能评价指标的设计、样本不平衡问题等5、极限学习机Extreme Learning Machine, ELM的工作原理6、案例演示 7、实操练习模块四分类识别模型KNN、贝叶斯分类与支持向量机1、KNN分类模型KNN算法的核心思想、距离度量方式的选择、K值的选取、分类决策规则的选择2、朴素贝叶斯分类模型伯努利朴素贝叶斯BernoulliNB、类朴素贝叶斯CategoricalNB、高斯朴素贝叶斯besfGaussianNB、多项式朴素贝叶斯MultinomialNB、补充朴素贝叶斯ComplementNB3、SVM的工作原理SVM的本质是解决什么问题SVM的四种典型结构是什么核函数的作用是什么什么是支持向量SVM扩展知识如何解决多分类问题SVM除了建模型之外还可以帮助我们做哪些事情4、案例实践5、实操练习决策树、随机森林、LightGBM、XGBoost1、决策树的工作原理微软小冰读心术的启示什么是信息熵和信息增益ID3算法和C4.5算法的区别与联系决策树除了建模型之外还可以帮我们做什么事情2、随机森林的工作原理为什么需要随机森林算法广义与狭义意义下的“随机森林”分别指的是什么“随机”体现在哪些地方随机森林的本质是什么怎样可视化、解读随机森林的结果3、Bagging与Boosting的区别与联系4、AdaBoost vs. Gradient Boosting的工作原理5. 常用的GBDT算法框架XGBoost、LightGBM6、案例实践7、实操练习模块五聚类分析算法K均值、DBSCAN、层次聚类1、K均值聚类算法的工作原理2、DBSCANDensity-Based Spatial Clustering of Applications with Noise聚类算法的工作原理3、层次聚类算法的工作原理4、案例讲解5、实操练习模块六关联分析算法关联规则、协同过滤Apriori算法1、关联规则算法的工作原理2、协同过滤算法的工作原理3、Apriori算法的工作原理4、案例讲解5、实操练习模块七总结与答疑讨论信息检索与常用科研工具1、如何无障碍地访问Google、YouTube等网站谷歌访问助手、VPN等2、如何查阅文献资料怎样能够保证对最新论文的追踪3、Google Scholar、ResearchGate的使用方法4、应该去哪些地方查找与论文配套的数据和代码5、文献管理工具的使用Endnote、Zotero等6、当代码出现错误时应该如何高效率解决7、实操练习总结与答疑讨论1、SCI不同分区的论文差别在哪些地方你知道你的论文为什么显得很单薄吗2、从审稿人的角度看SCI期刊论文需要具备哪些要素审稿人关注的点有哪些如何回应审稿人提出的意见3、如何提炼与挖掘创新点如果在算法层面上难以做出原创性的工作如何结合自己的实际问题提炼与挖掘创新点开启送礼物