AI入门与基础

By | 2018年12月13日

AI入门与基础

目录一

 

python 与 数据库

一、Python基础与数据持久化

1.1 python入门基础 
1.2 python入门—练习题 
1.3 python+csv/Excel—数据持久化 
python爬虫 
1.4 python爬虫(Re/requests/BS4) 
1.5 python爬虫-scrapy框架 
1.6 python 爬虫—selenium (切换frame以及滚动条操作) 
1.7 python爬虫—练习题(文字/图片/音乐) 
1.8 python爬虫—(豆瓣top250) 
1.9 python爬虫—scrapy练习题

二、MySQL 关系型数据库

2.1 MySQL数据库的基本语法 
2.2 pyMySQL操作MySQL数据库 
2.3 pyMySQL+Excel—练习题

三、MongoDB 分布式数据库

3.1 MongoDB安装及基本语法结构 
3.2 pymongo操作MongoDB数据库 
3.3 pyMongo+Excel—练习题

四、Numpy 与Scipy

4.1 Numpy基础+进阶+高级 
4.2 Numpy—练习题 
4.3 Scipy 基础+进阶(linalg) 
4.4 Scipy 高级(tushare)

五、数据可视化

5.1 Matplotlib 初级—数据可视化 
5.2 Matplotlib 高级—综合演练 
5.3 Matplotllib—绘制复杂函数以及三维图 
5.4 matplotlib + pandas—数据可视化 
5.5 Python + PyEcharts—数据可视化

六、Pandas

6.1 Pandas 基础(创建与查看) 
6.3 Pandas 进阶一(数据处理) 
6.4 Pandas 进阶二(字符串、时间戳) 
6.5 pandas 高级一(函数与运算) 
6.6 pandas 高级二(分组,筛选;文件读取) 
6.7 pandas 高级三(数据变形–分组与聚合) 
Pandas练习与综合 
6.8 pandas—练习题一 
6.9 pandas—练习题二 
6.10 pandas+matplotlib—习题一 
6.11 pandas+matplotlib—习题二 
6.12 pandas+matplotlib—习题三 
6.13 Pandas-Matplotlib-PyEcharts—综合案例 
附:Anaconda环境搭建 
附:Markdown表格—合并单元格—设置颜色 
附:Git 连接并提交文件到 GitHub

算法与基础理论

七、数理统计

7.1 向量与矩阵 
7.2 极限-导数-微积分 
7.3 概率论—随机变量 
7.4 无穷级数

八、算法理论

8.1 最大熵模型 
8.2 统计学习方法之一 
8.3 协方差矩阵—黑塞矩阵—正定矩阵 
8.4 EM算法 
8.5 混合高斯模型 
8.6 PageRank算法 
8.7 凸优化(拉格朗日乘子法)—SVD分解原理 
8.8 基础算法图解 
8.9 隐马尔科夫模型(HMM) 
8.10 梯度下降法——专题 
8.11 最小二乘法—牛顿法 
8.12 条件随机场(CRF)

机器学习理论

九、特征工程

特征工程—特征构造 
特征工程—数据降维 
特征工程—特征转换 
特征工程—特征选择

十、机器学习

机器学习概况 
sklearn—Orange安装-机器学习-准备 
sklearn—数据预处理 
sklearn—Pipeline 机制 
机器学习—决策树 
机器学习—决策树(信息熵—GINI)计算习题 
机器学习—贝叶斯算法 
机器学习—支持向量机(SVM) 
机器学习—SVM超平面推导 
机器学习—KNN(K近邻) 
机器学习—逻辑回归(logistic regression) 
机器学习—逻辑回归(LR) 
机器学习—朴素贝叶斯算法 
聚类分析—K-means算法 
关联规则—Apriori算法—FPTree 
集成学习 
集成学习—多算法融合 
集成学习—Adaboost 
集成学习—Xgboost 
集成学习—随机深林(RF) 
集成学习—GBDT 
专题 
距离专题 
聚类专题 
最小二乘法—梯度下降优化专题 
交叉验证 
分类模型—评估指标(收益曲线 -ROC曲线和AUC ) 
回归模型—评估指标 
欠拟合、过拟合——解决方法

项目与实战

基础代码类:

LeetCode练习 
机器学习—SVM_SVC_code演示 
机器学习—KNN_Classifier_Regression_code演示 
机器学习—tree_DecisionTreeClassifier_code演示 
机器学习—K-mean_sklearn_cluster_MiniBatchKMeans 
机器学习—naive_bayes_code 
机器学习—RandomForestClassifier—code

图像类:

图像处理—OpenCV读取图片—颜色空间(RGB,HSV,Lab) 
基于OpenCV、随机森林算法实现的图像分类识别系统

文字类

自然语言处理(NLP)——分词统计可能用到的模块方法

自然语言(NLP)处理—分词—word2vec 
自然语言(NLP)处理流程—IF-IDF统计—jieba分词—Word2Vec模型训练使用 
基于NLP自然语言构建的文档自动分类系统(搜狐娱乐)—word-of-bag模型 
基于NLP自然语言构建的文档自动分类系统(搜狐娱乐)—word2vec模型 

基于FP-growth算法-新闻网站点击流量分析系统 
基于LVD、贝叶斯模型算法实现的电商行业商品评论与情感分析案例

预测与推荐

基于 RFM 模型实现的零售精准营销响应预测系统 
基于 SVD 协同过滤算法实现的电影推荐系统 
基于物品—SVD餐馆评分估计值 
基于聚类(Kmeans)算法实现客户价值分析系统 
房价预测 
基于Kaggle的经典AI项目:预测房价系统 
基于Kaggle的经典AI项目一—数据理解与整体探索 
基于Kaggle的经典AI项目二—数据清洗 
基于Kaggle的经典AI项目三—特征转换、衍生 
基于Kaggle的经典AI项目四—特征筛选 
基于Kaggle的经典AI项目五—模型训练 
Titanic号 
预测Titanic号上的乘客生存概率-01-code 
预测Titanic号上的乘客生存概率-02-(LR_SVM_KNN_DTree_RF) 
预测Titanic号上的乘客生存概率-03-优化训练集 
预测Titanic号上的乘客生存概率-04-分类模型评估和验证

发表评论