大数据机器学习框架(弥勒佛) MLF

码农软件 · 软件分类 · 大数据 · 2020-02-13 16:57:35

软件介绍

让天下没有难做的大数据模型!

功能

下面是弥勒佛框架解决的问题类型,括号中的斜体代表尚未实现以及预计实现的时间

  • 监督式学习:最大熵分类模型(max entropy classifier),决策树模型(decision tree based models,2014 Q1

  • 非监督式学习:聚类问题(k-means,2014 Q1

  • 在线学习:在线梯度递降模型(online stochastic gradient descent)

  • 神经网络(2014 Q2/3

项目实现了下面的组件

    现有的机器学习框架/软件包存在几个问题:

  • 无法处理大数据:多数Python,Matlab和R写的训练框架适合处理规模小的样本,没有为大数据优化。

  • 不容易整合到实际生产系统:standalone的程序无法作为library嵌入到大程序中。

  • 模型单一:一个软件包往往只解决一个类型的问题(比如监督式或者非监督式)。

  • 不容易扩展:设计时没有考虑可扩展性,难以添加新的模型和组件。

  • 代码质量不高:代码缺乏规范,难读懂、难维护。

    弥勒佛项目的诞生就是为了解决上面的问题,在框架设计上满足了下面几个需求:

  • 处理大数据:可随业务增长scale up,无论你的数据样本是1K还是1B规模,都可使用弥勒佛项目。

  • 为实际生产:模型的训练和使用都可以作为library或者service整合到在生产系统中。

  • 丰富的模型:容易尝试不同的模型,在监督、非监督和在线学习等模型间方便地切换。

  • 高度可扩展:容易添加新模型,方便地对新模型进行实验并迅速整合到生产系统中。

  • 高度可读性:代码规范,注释和文档尽可能详尽,适合初学者进行大数据模型的学习。

本文地址:https://www.codercto.com/soft/d/25536.html

我是一只IT小小鸟

我是一只IT小小鸟

胡江堂、李成、唐雅薇、秦琴、蒋宇东、刘未鹏、居振梁、刘帅、温卫斌、张弦、张凯峰、庄表伟、宋劲杉、程露、黄小明、易晓东、简朝阳、林健、高昂、徐宥、辜新星 / 电子工业出版社 / 2009 / 29.80

一群IT小小鸟—— 来自十几所院校,或男生,或女生;或科班,或半路转行。 分布在不同的公司,或外企,或国企,或民企,老板有土有洋。 有失意,有快意;有泪水,有欢笑。在失望中追求希望,在迷茫中辨别方向。 他们用自己的成长故事,告诉在校的师弟师妹们: 青春太宝贵,千万别浪费;要想不浪费,万事早准备。一起来看看 《我是一只IT小小鸟》 这本书的介绍吧!

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

URL 编码/解码
URL 编码/解码

URL 编码/解码

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具