R语言中的机器学习评价标准
R语言中的机器学习评价标准 你要用什么标准来衡量机器学习算法呢? 本文将讨论如何使用一系列的规范的评价标准来衡量R语言中的机器学习算法。 让我们从这里开始。 R语言中的模型评价标准 R语言提供了许多可供你用来评价机器学习算法的标准。 当我们……
江南消夏 2016-04-18
使用ggrepel避免ggplot绘图标签重叠
ggplot绘图时,常用geom_text为标出数据点的文本标签。经常会遇到标签相互重叠的问题。本文介绍了一种可以使标签各自分开的方法。 library(ggplot2) ggplot(mtcars)+geom_point(aes(wt, ……
陆勤 2016-04-17
面板门限模型及R实现
在高级计量经济学导论的知识框架中,对于面板数据的分析与建模,通常我们会用到如下R包:(1)plm包(用于面板数据固定效应与随机效应);(2)phtest(用于面板Hausman检验);(3)pvcm用于面板数据变系数估计。本期将介绍一类极其……
kv750 2016-04-17
R语言编码风格
标注及名称 文件名称 文件名称应当有意义,并且以 .R 作结。 # Good fit-models.R utility-functions.R # Bad foo.r stuff.r 如果是一系列文件,序列号应当在文件之前。 0-down……
Ewen 2016-04-17
灵活的字符串处理包:stringr
在文本或非结构数据处理中往往需要正则表达式的强大功能,需要字符串的处理,下文就讲讲这几天梳理的stringr包中的函数。该包仍然由伟大的Hadley做贡献。 word(),从句子中提取词组(适用于英语环境下的使用) word(string,……
lsxxx2011 2016-04-01
R语言可视化基础
之前我曾经翻译过一篇文章,标题为“为什么我们要开始学习数据化及其操作”,它讲到了我们为什么要首先学习,其次再学习相关的操作。在文章里面,作者是这样说的:“这里有几个原因可以解释我为什么会推荐首先学习数据可视化操作,不过,最重要的,我给出的……
firedata 2016-03-20
R语言实战读书心得导论
在分享我读《R语言实战》时的所见所闻之前,我想先和大家简单的聊一聊大数据这个词语,因为R语言是一门开源的统计类语言,它拥有强大的统计分析能力,而如今我们人类已经生活在信息时代,甚至我们又提出了大数据的时代;据统计,未来5年所产生的数据总量……
firedata 2016-03-16
数值型数据的探索分析
数据分析过程中,往往需要对数据作基本的探索性分析,查看数据是否存在问题,如缺失值数量、是否存在明显的异常值、数据是如何分布的、数据的集中趋势和离散趋势等。 探索性分析一般包括三大部分,即数据的分布情况、数据的集中与离散趋势和数据的分布形态……
lsxxx2011 2016-03-08
R数据分析案例:逻辑回归
逻辑回归,也称之为逻辑模型,用于预测二分结果变量。在逻辑模型当中,输出结果所占的比率就是预测变量的线性组合。 这篇文章将要使用下面这几个包,而且你们需要保证在运行我所举的例子的时候,你已经把这些包都装好了。如果你还没装好这些包,那么,运行i……
firedata 2016-03-03
R做你的第一个机器学习项目教程(三)
编者按:延续R做你的第一个机器学习项目教程(二),大家在阅读过程中有什么建议或者反馈,请给我们留言。 5.评估算法 现在,我们需要创建一些模型来对我们模型里一些未知的值进行精度的评估。 我们现在需要进行以下步骤操作: 1用10交叉验证建立测……
陆勤 2016-02-26
R做你的第一个机器学习项目教程(二)
编者按:延续R做你的第一个机器学习项目教程(一),大家在阅读过程中有什么建议或者反馈,请给我们留言。 2载入数据 我们将要使用iris这个数据集。这个数据集是非常有名的,因为这是机器学习和统计学里的”hello world”类数据集,这对于……
陆勤 2016-02-26
R语言之控制流的使用方法
一般在数据处理或建模过程中会使用到R语言中的控制流,控制流主要有以下三类,即 1)if或switch分支语句 2)for循环 3)while循环 下面就说说这几种控制流,并讲解我工作中的用法。 一、if或switch分支语句 首先看一下if……
lsxxx2011 2016-02-26
R做你的第一个机器学习项目教程(一)
你是否想要用R做机器学习,但又苦恼于怎么开始做? 在这篇文章里你将会用R完成你的第一个机器学习项目。 在这个逐步教程里,你需要做: 1 下载和安装R并且获取用做机器学习非常有用的R包。 2 导入一个数据集并且用统计分析和数据可视化来理解它的……
陆勤 2016-02-25
rattle:数据挖掘的界面化操作
R语言是一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。这里的统计计算可以是数据分析、建模或是数据挖掘等,通过无数大牛提供的软件包,可以帮我们轻松实现算法的实施。 一些读者觉得R语言零碎的东西太多了,无法记住那么……
lsxxx2011 2016-02-23
R语言与Tableau集成之可视化应用
Tableau是一款非常棒的数据可视化商业软件,通过拖拉拽的方式迅速的实现数据可视化。而且该软件可以连接任何一种数据库,在处理大型数据时一点都不逊色。下面展示几幅Tableau绘制的图形: 面积图、条形图的综合使用。 该图反映的是201……
lsxxx2011 2016-02-21