Skip to content

本工程主要记录小组在机器学习算法上的一些尝试练习,主要依托和解决部分Kaggle比赛项目

Notifications You must be signed in to change notification settings

YihanHu-2022/-MachineLearningTraining

 
 

Repository files navigation

-MachineLearningTraining

本工程主要记录小组在机器学习算法上的一些尝试练习,主要依托和解决部分Kaggle比赛项目

数据集选择

  • kaggle 房价预测数据
  • kaggle 泰坦尼克号生存问题
  • spambase 邮件分类数据集
  • dota2Datas Dota2游戏胜负预测
  • kaggle mnist手写题识别
  • wine_quality 白葡萄酒质量数据集
  • lendingclub 信贷违约数据集

学习方法

线性回归模块

  • 一元线性回归
  • 对数几率回归
  • 多元线性回归
  • 对数线性回归
  • 线性判别分析

决策树模块

  • sk-learn解决分类问题
  • sk-learn解决回归问题
  • 决策树实现
  • 预减枝决策树实现
  • 后减枝决策树实现

神经网络模块

  • sk-learn多层感知机
  • 实现线性回归的神经网络
  • 实现对数几率回归的神经网络
  • 实现三层感知机
  • 改良优化算法(学习率)

贝叶斯分类器模块

  • 使用sk-learn学习贝叶斯分类器(GaussianNB,BernoulliNB,MultinomialNB)
  • 实现高斯朴素贝叶斯分类器
  • 实现带有拉普拉斯修正的朴素贝叶斯分类器

支持向量机模块

使用sk-learn学习支持向量机,理解软间隔和核函数,完成分类和回归问题

聚类模块

  • 使用sk-learn学习聚类方法(DBSCAN,GaussianMixture,KMeans,AgglomerativeClustering)
  • 实现K-means
  • 实现层次聚类(TODO)
  • 实现KNN算法

降维方法模块

  • PCA降维方法
  • LLE降维方法

数据清洗模块

  • kaggle 房价预测数据清洗
  • kaggle 泰坦尼克号生存问题数据清洗

About

本工程主要记录小组在机器学习算法上的一些尝试练习,主要依托和解决部分Kaggle比赛项目

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 94.5%
  • HTML 5.5%