大数据框架对比:Hadoop、Storm、Samza、Spark和Flink
大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的……

数商 1775 0 0 0 2017-05-03

Apache Spark介绍及案例展示
作者:RADEK OSTROWSKI 2013年年底,我第一次接触到Spark,当时我对Spark所使用的Scala语言产生了较大的兴趣。一段时间后,我做了一……

数商 762 0 0 0 2017-04-15

Spark Cookbook|Spark书籍
Spark Cookbook Over 60 recipes on Spark, covering Spark Core, Spark SQL, Spark S……

陆勤 1545 0 0 0 2016-08-03

使用Spark MLlib训练和提供自然语言处理模型
严禁修改,可以转载,请务必注明出自[数据人网](http://shujuren.org "数据人网")和原文链接。 Idibon位于旧金山的一家专注于自然语言处……

陆勤 1758 1 0 0 2016-07-29

Spark学习经历
Spark是一个基于内存计算的框架,Spark快速、高效、分布式处理。 大数据时代里面,大规模数据分析和处理,需要机器学习,也就是一种大规模机器学习。Spark……

陆勤 1431 0 0 0 2016-01-01