弥勒佛

让天下没有难做的大数据模型！

现有的机器学习框架/软件包存在几个问题：

弥勒佛项目的诞生就是为了解决上面的问题，在框架设计上满足了下面几个需求：

安装/更新

go get -u github.com/huichen/mlf

下面是弥勒佛框架解决的问题类型，括号中的斜体代表尚未实现以及预计实现的时间

监督式学习：最大熵分类模型（max entropy classifier），决策树模型（decision tree based models，2014 Q1）
非监督式学习：聚类问题（k-means，2014 Q1）
在线学习：在线梯度递降模型（online stochastic gradient descent）
神经网络（2014 Q2/3）

项目实现了下面的组件

多种数据集（in-mem，skip）
多种评价器（precision，recall，f-score，accuracy，confusion）和交叉评价（cross-validation）
多种优化器：协程并发L-BFGS，梯度递降（batch, mini-batch, stochastic），带退火的学习率（learning rate），L1/L2正则化（regularization）
稀疏向量（sparse vector）以存储和表达上亿级别的特征
特征辞典（feature dictionary）在特征名和特征ID之间自动翻译

Name	Name	Last commit message	Last commit date
Latest commit huichen 测试 RBM hidden units 作为特征训练 LR 分类器 Dec 13, 2015 afed897 · Dec 13, 2015 History 6 Commits
clustering	clustering	第一发	Jan 13, 2014
contrib	contrib	纠正多类 classifer 无法正确计算 accuracy 的错误	Dec 13, 2015
data	data	第一发	Jan 13, 2014
dictionary	dictionary	修正一个bug，maxent分类器训练时间减少45%	Jan 17, 2014
doc	doc	第一发	Jan 13, 2014
eval	eval	纠正多类 classifer 无法正确计算 accuracy 的错误	Dec 13, 2015
nn	nn	第一发	Jan 13, 2014
online	online	第一发	Jan 13, 2014
optimizer	optimizer	添加深度学习模型 RBM	Dec 13, 2015
rbm	rbm	测试 RBM hidden units 作为特征训练 LR 分类器	Dec 13, 2015
supervised	supervised	修正一个bug，maxent分类器训练时间减少45%	Jan 17, 2014
testdata	testdata	添加深度学习模型 RBM	Dec 13, 2015
tool	tool	测试 RBM hidden units 作为特征训练 LR 分类器	Dec 13, 2015
util	util	第一发	Jan 13, 2014
README.md	README.md	Update README.md	Jan 13, 2014
license.txt	license.txt	第一发	Jan 13, 2014
mlf.go	mlf.go	第一发	Jan 13, 2014