原文:
www.kdnuggets.com/2015/12/top-10-machine-learning-github.html/2
5. Pattern
用于 Python 的网络挖掘模块,提供抓取、自然语言处理、机器学习、网络分析和可视化的工具。
Pattern是一个基于 Python 的网络挖掘工具包,源自安特卫普大学的计算语言学与心理语言学(CLiPS)研究中心。在此背景下,它提供了用于抓取、机器学习、自然语言处理、网络分析和可视化的工具。Pattern 还可以轻松从几个知名的网络服务中挖掘数据。该项目声称文档齐全,并包括大量示例和单元测试。
一个受脑部启发的机器智能平台,基于皮层学习算法的生物学准确神经网络。
NuPIC实现了层次时间记忆(HTM)机器学习算法。HTM 试图模拟新皮层的计算,重点在于存储和回忆空间和时间模式。NuPIC 非常适合与模式相关的异常检测。
Vowpal Wabbit 是一个机器学习系统,通过在线学习、哈希、全局归约、减法、学习 2 搜索、主动学习和交互学习等技术推动机器学习的前沿。
Vowpal Wabbit旨在快速建模大规模数据集,并支持并行学习。该项目最初在 Yahoo!启动,目前由微软研究院开发。Vowpal Wabbit 利用外存学习,并已被用于在 1000 个计算节点上在一小时内学习一个 TB 特征数据集。
8. aerosolve
为人类打造的机器学习包。
aerosolve 试图与其他库不同,专注于提供用户友好的调试功能、用于训练的 Scala 代码、用于轻松图像排名的图像内容分析引擎,以及为用户提供灵活性和控制功能的特征转换语言。aerosolve 实现了基于 thrift 的特征表示,其中特征按逻辑分组,用于对整个特征组应用转换或促进组间的交互。
9. GoLearn
适用于 Go 的机器学习。
GoLearn 是一个为 Go 开发的活跃的机器学习库。其目标是为 Go 开发人员提供一个功能全面、易于使用且可定制的包。GoLearn 实现了许多人熟悉的 Scikit-learn 的 fit/predict 接口,使更换估计器变得容易,并实现了像交叉验证和训练/测试拆分这样的“辅助函数”。
10. 黑客的机器学习代码
伴随《黑客的机器学习》一书的代码。
该库包含 O'Reilly 书籍《黑客的机器学习》的代码。所有库代码都是 R 语言编写的,依赖于众多 R 包,涵盖的主题包括分类、排序和回归等常见任务,以及主成分分析和多维尺度分析等统计程序。
- 根据 GitHub 搜索中“机器学习”查询的返回结果确定,按星标数量排序,截止至 2015 年 12 月 10 日下午 1:00 EST。
相关:
-
前 20 个 Python 机器学习开源项目
-
拓扑数据分析 - 开源实现
-
掌握 Python 机器学习的 7 个步骤
1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 支持你所在的组织的 IT