H2O是为数据统计、机器学习、大数据计算方面服务的工具,是一个Web的图形界面,开发人员可以自行编写数据转换和数据处理模型。
详细介绍 »
Mahout 是 Apache Software Foundation旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。
详细介绍 »
Apache Spark是一种快速、通用的集群计算系统,为Java、Scala,、Python和 R 提供了高级的API及优化引擎。
详细介绍 »
DeepDive是一个混乱数据中抽取有效数据的系统。DeepDive帮助从非结构化数据中抽取数据并整合到已有的结构化数据库中。
详细介绍 »
Apache Flink是分布式大数据处理平台,其核心是提供数据分发、通信、分布式计算的流媒体数据流引擎。
详细介绍 »
Apache™ Hadoop®是一个可靠的、可扩展、分布式计算的开源软件项目,通过计算机集群使用简单的编程模型对大型数据集进行分布式处理。其本身被设计成在应用层检测和处理故障,在计算机集群之上提供高度可用的服务,并且能够自动将失败的任务重新分配。
详细介绍 »
QuickML是一个功能强大,简单易用的机器学习库。该库采用Java语言编写,类库组织上完全遵照标准Java API规范。该库实现了高效健壮的决策树学习器(Decision Tree Learner),随机森林(Random forests),并提供交叉验证(Cross validation)和元参数优化器功能(Meta-parameters optimizer)。
详细介绍 »