Hadoop大数据分析获本地R语言支持

云计算 Hadoop
随着大家对大数据分析越来越感兴趣,软件供应商Revolution Analytics改进了其R语言统计功能旗舰产品,使它能够与Hadoop数据处理平台运行。

随着大家对大数据分析越来越感兴趣,软件供应商Revolution Analytics改进了其R语言统计功能旗舰产品,使它能够与Hadoop数据处理平台运行。

这个新的Revolution R Enterprise 7(RRE 7)还能够使R在Teradata数据库内运行。

R语言提供了一种方法来对一组数据运行常用统计测试(例如线性和非线性建模、时间序列分析、分类和聚类),通常结果是以图形的形式出现。

R越来越多地用于复杂的数据分析,即那些超出标准商业智能程序包范围的数据分析。Revolution Analytics公司预计全世界有超过200万人在使用R。

RRE7包含R算法库——可以跨多个节点并行运行,这与Hadoop管理大数据集的方式相同。RRE7可以被添加到Cloudera CDH3和CDH4 Hadoop发行版,以及Hortonworks数据平台1.3。

这个新的R库保护最常用的统计和预测分析算法,用于数据处理、数据采样、描述性统计、统计测试、数据可视化、仿真、机器学习和预测模型等任务。

通过分析节点内的数据,而不是移动数据到其他位置进行分析,基于R的数据分析可以更快地进行。它还允许对一整组数据进行分析,而不是数据的子集或者摘要--企业数据仓库(EDW)通常是采用这样的方式。

Revolution Analytics希望将R加入到Hadoop和Teradata数据库可以拓宽该语言的使用范围。该公司还设计了一个新的工作流程界面,其中不需要知道如何部署特定的R算法。这缓解了使用Java或者其他语言编程R的麻烦,让其在Hadoop平台运行。

除了支持这些新的平台,RRE7还采用了一些新的算法和流程。其一是建立Decision Forests的模型集,Decision Forests是用于预测未来结果的机器学习技术。新的Stepwise Regression功能还可以帮助我们自动化选择用于预测模型中最重要的变量。新的Decision Tree可视化可以提供图形化的方式来描述数据集内复杂的关系和相关性。

责任编辑:王程程 来源: 网界网
相关推荐

2014-03-12 10:17:22

R语言Hadoop

2013-05-22 08:55:14

R语言

2020-07-09 15:21:58

大数据RStudioR语言

2011-09-02 10:59:02

大数据数据分析Hadoop

2016-12-22 09:52:13

Hadoop大数据分析

2013-04-28 10:01:28

HDInsightWindows AzuHadoop

2012-08-08 09:53:23

HadoopMapReduce

2012-05-30 11:29:14

Hadoop大数据

2020-05-26 16:25:33

Hadoop下载安装

2019-04-23 15:35:53

Hadoop大数据数据处理

2018-06-05 12:06:20

Hadoop开源工具

2013-10-30 09:13:35

微软Hadoop AzurWindows Azu

2017-09-18 17:59:23

Hadoop数据分析

2015-08-14 10:28:09

大数据

2020-05-15 15:09:51

R语言数据分析

2015-08-11 15:52:52

大数据数据分析

2021-10-12 15:25:08

大数据数据分析

2022-03-29 14:49:14

大数据数据分析

2013-04-09 09:28:20

大数据大数据全球技术峰会

2015-07-23 09:34:57

大数据数据分析
点赞
收藏

51CTO技术栈公众号