本工程主要记录小组在机器学习算法上的一些尝试练习,主要依托和解决部分Kaggle比赛项目
- kaggle 房价预测数据
- kaggle 泰坦尼克号生存问题
- spambase 邮件分类数据集
- dota2Datas Dota2游戏胜负预测
- kaggle mnist手写题识别
- wine_quality 白葡萄酒质量数据集
- lendingclub 信贷违约数据集
- 一元线性回归
- 对数几率回归
- 多元线性回归
- 对数线性回归
- 线性判别分析
- sk-learn解决分类问题
- sk-learn解决回归问题
- 决策树实现
- 预减枝决策树实现
- 后减枝决策树实现
- sk-learn多层感知机
- 实现线性回归的神经网络
- 实现对数几率回归的神经网络
- 实现三层感知机
- 改良优化算法(学习率)
- 使用sk-learn学习贝叶斯分类器(GaussianNB,BernoulliNB,MultinomialNB)
- 实现高斯朴素贝叶斯分类器
- 实现带有拉普拉斯修正的朴素贝叶斯分类器
使用sk-learn学习支持向量机,理解软间隔和核函数,完成分类和回归问题
- 使用sk-learn学习聚类方法(DBSCAN,GaussianMixture,KMeans,AgglomerativeClustering)
- 实现K-means
- 实现层次聚类(TODO)
- 实现KNN算法
- PCA降维方法
- LLE降维方法
- kaggle 房价预测数据清洗
- kaggle 泰坦尼克号生存问题数据清洗