搜索到 197 条结果

您可能要找:

Spark学习经历
Spark是一个基于内存计算的框架,Spark快速、高效、分布式处理。 大数据时代里面,大规模数据分析和处理,需要机器学习,也就是一种大规模机器学习。Spark非常擅长做这个事情,因此,有必要学习、钻研和应用Spark。 Spark学习和……
陆勤 2016-01-01
R语言可视化基础
之前我曾经翻译过一篇文章,标题为“为什么我们要开始学习数据化及其操作”,它讲到了我们为什么要首先学习,其次再学习相关的操作。在文章里面,作者是这样说的:“这里有几个原因可以解释我为什么会推荐首先学习数据可视化操作,不过,最重要的,我给出的……
firedata 2016-03-20
R语言实战读书心得导论
在分享我读《R语言实战》时的所见所闻之前,我想先和大家简单的聊一聊大数据这个词语,因为R语言是一门开源的统计类语言,它拥有强大的统计分析能力,而如今我们人类已经生活在信息时代,甚至我们又提出了大数据的时代;据统计,未来5年所产生的数据总量……
firedata 2016-03-16
R语言与Tableau集成之可视化应用
Tableau是一款非常棒的数据可视化商业软件,通过拖拉拽的方式迅速的实现数据可视化。而且该软件可以连接任何一种数据库,在处理大型数据时一点都不逊色。下面展示几幅Tableau绘制的图形: 面积图、条形图的综合使用。 该图反映的是201……
lsxxx2011 2016-02-21
R语言之控制流的使用方法
一般在数据处理或建模过程中会使用到R语言中的控制流,控制流主要有以下三类,即 1)if或switch分支语句 2)for循环 3)while循环 下面就说说这几种控制流,并讲解我工作中的用法。 一、if或switch分支语句 首先看一下if……
lsxxx2011 2016-02-26
R强大秘笈—R扩展包
R好用,R开源,R适合做算法设计和验证,这一切都与R扩展包紧密关联着。 目录: R包是什么? R包分类? R扩展包如何管理? R包应用? R包是什么? 答:R包是一个集合体,它包括函数、数据集、文档、预编译代码等内容。 R包分类? 答:R……
陆勤 2016-01-04
R语言介绍
未来属于能够把数据转化为产品的个人和公司。 R是一个开源、免费的、适合于统计分析和可视化的软件和工具。 R官网,http://www.r-project.org ,关于R是什么,R软件下载,R包与相应任务,R资料和文档都有详细的介绍。 如……
陆勤 2016-01-01
R语言编码风格
标注及名称 文件名称 文件名称应当有意义,并且以 .R 作结。 # Good fit-models.R utility-functions.R # Bad foo.r stuff.r 如果是一系列文件,序列号应当在文件之前。 0-down……
Ewen 2016-04-17
R做你的第一个机器学习项目教程(二)
编者按:延续R做你的第一个机器学习项目教程(一),大家在阅读过程中有什么建议或者反馈,请给我们留言。 2载入数据 我们将要使用iris这个数据集。这个数据集是非常有名的,因为这是机器学习和统计学里的”hello world”类数据集,这对于……
陆勤 2016-02-26
用R演示逻辑回归过程-婚姻出轨案例
理论 Logistic回归适用于二值响应变量(0,1)。模 型 假 设Y服从二项分布,线性模型的拟合形式为: 其中,π= μ(Y)是Y的条件均值(即给定一系列X的值时Y =1的概率),(π/1-π)为Y=1时的优势比,log(π/1-π)……
结实 2016-04-27
如何学习R语言?
这里有无数的资源可以帮助你从不同的方面学R,然而对于初学者的你来说可能会觉得这样让你感到吃不消。而且R又是一门动态语言,它时刻都在变化,所以我们需要时常更新我们的工具以及技术到最新的版本。 这就是为什么R-bloggers和DataCamp……
陆勤 2016-01-01
R做你的第一个机器学习项目教程(三)
编者按:延续R做你的第一个机器学习项目教程(二),大家在阅读过程中有什么建议或者反馈,请给我们留言。 5.评估算法 现在,我们需要创建一些模型来对我们模型里一些未知的值进行精度的评估。 我们现在需要进行以下步骤操作: 1用10交叉验证建立测……
陆勤 2016-02-26
R做你的第一个机器学习项目教程(一)
你是否想要用R做机器学习,但又苦恼于怎么开始做? 在这篇文章里你将会用R完成你的第一个机器学习项目。 在这个逐步教程里,你需要做: 1 下载和安装R并且获取用做机器学习非常有用的R包。 2 导入一个数据集并且用统计分析和数据可视化来理解它的……
陆勤 2016-02-25
机器学习算法R常用函数总结
预测函数:predict() type="prob"判别该量度的昆虫归类为A、B和C的概率;type="response":判别该量度的昆虫的类别; 预测分类的概率的函数predict(…, type)参数type: R语音里面不同模型……
陆勤 2016-01-18
rattle:数据挖掘的界面化操作
R语言是一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。这里的统计计算可以是数据分析、建模或是数据挖掘等,通过无数大牛提供的软件包,可以帮我们轻松实现算法的实施。 一些读者觉得R语言零碎的东西太多了,无法记住那么……
lsxxx2011 2016-02-23