搜索到 9 条结果

您可能要找:

Spark学习经历
Spark是一个基于内存计算的框架,Spark快速、高效、分布式处理。 大数据时代里面,大规模数据分析和处理,需要机器学习,也就是一种大规模机器学习。Spark非常擅长做这个事情,因此,有必要学习、钻研和应用Spark。 Spark学习和……
陆勤 2016-01-01
用Spark 和DBSCAN对地理定位数据进行聚类
严禁修改,可以转载,请注明出自[数据人网](http://shujuren.org "数据人网")和原文链接。 机器学习,特别是聚类算法,可以用来确定哪些地理区域经常被一个用户访问和签到而哪些区域不是。这样的地理分析使多种服务成为可能,比如……
陆勤 2016-07-24
使用Spark MLlib训练和提供自然语言处理模型
严禁修改,可以转载,请务必注明出自[数据人网](http://shujuren.org "数据人网")和原文链接。 Idibon位于旧金山的一家专注于自然语言处理(NLP)的创业公司。从海量非结构化数据中识别关键信息或是定制化实时交互是一些……
陆勤 2016-07-29
Spark Cookbook|Spark书籍
Spark Cookbook Over 60 recipes on Spark, covering Spark Core, Spark SQL, Spark Streaming, MLlib, and GraphX libraries 书……
陆勤 2016-08-03
Hadoop和Spark框架的异同
Hadoop和Spark框架的异同 谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是停留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同。 1 解决问……
陆勤 2016-09-02
一文读懂Hadoop、HBase、Hive、Spark分布式系统架构
一文读懂Hadoop、HBase、Hive、Spark分布式系统架构 机器学习、数据挖掘等各种大数据处理都离不开各种开源分布式系统,hadoop用户分布式存储和map-reduce计算,spark用于分布式机器学习,hive是分布式数据……
陆勤 2016-09-04
Apache Spark介绍及案例展示
作者:RADEK OSTROWSKI 2013年年底,我第一次接触到Spark,当时我对Spark所使用的Scala语言产生了较大的兴趣。一段时间后,我做了一个预测泰坦尼克号船上人员生存概率的数据科学项目。事实证明这是一个更深入了解Spa……
数商 2017-04-15
大数据框架对比:Hadoop、Storm、Samza、Spark和Flink
大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性、规模,以及价值在最近几年才经历了大规模扩展。 在之前的文章中,我们曾经介……
数商 2017-05-03
Windows7系统搭建单机版Spark开发环境
Windows7系统搭建单机版Spark开发环境,具体步骤如下: 1 安装JDK JDK8 下载链接: http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloa……
陆勤 2018-09-04