使用ggrepel避免ggplot绘图标签重叠
ggplot绘图时,常用geom_text为标出数据点的文本标签。经常会遇到标签相互重叠的问题。本文介绍了一种可以使标签各自分开的方法。 library(ggp……

陆勤 1304 1 0 2 2016-04-17

面板门限模型及R实现
在高级计量经济学导论的知识框架中,对于面板数据的分析与建模,通常我们会用到如下R包:(1)plm包(用于面板数据固定效应与随机效应);(2)phtest(用于面……

kv750 1970 1 0 1 2016-04-17

R语言编码风格
标注及名称 文件名称 文件名称应当有意义,并且以 .R 作结。 # Good fit-models.R utility-functions.R # Bad f……

Ewen 1484 2 1 4 2016-04-17

灵活的字符串处理包:stringr
在文本或非结构数据处理中往往需要正则表达式的强大功能,需要字符串的处理,下文就讲讲这几天梳理的stringr包中的函数。该包仍然由伟大的Hadley做贡献。 w……

lsxxx2011 1110 0 0 1 2016-04-01

R语言可视化基础
之前我曾经翻译过一篇文章,标题为“为什么我们要开始学习数据化及其操作”,它讲到了我们为什么要首先学习,其次再学习相关的操作。在文章里面,作者是这样说的:“这里……

firedata 2224 2 0 3 2016-03-20

R语言实战读书心得导论
在分享我读《R语言实战》时的所见所闻之前,我想先和大家简单的聊一聊大数据这个词语,因为R语言是一门开源的统计类语言,它拥有强大的统计分析能力,而如今我们人类已……

firedata 1050 1 0 1 2016-03-16

数值型数据的探索分析
数据分析过程中,往往需要对数据作基本的探索性分析,查看数据是否存在问题,如缺失值数量、是否存在明显的异常值、数据是如何分布的、数据的集中趋势和离散趋势等。 探……

lsxxx2011 1129 0 0 1 2016-03-08

R数据分析案例:逻辑回归
逻辑回归,也称之为逻辑模型,用于预测二分结果变量。在逻辑模型当中,输出结果所占的比率就是预测变量的线性组合。 这篇文章将要使用下面这几个包,而且你们需要保证在运……

firedata 3003 2 0 3 2016-03-03

R做你的第一个机器学习项目教程(三)
编者按:延续R做你的第一个机器学习项目教程(二),大家在阅读过程中有什么建议或者反馈,请给我们留言。 5.评估算法 现在,我们需要创建一些模型来对我们模型里一些……

陆勤 1565 0 0 2 2016-02-26

R做你的第一个机器学习项目教程(二)
编者按:延续R做你的第一个机器学习项目教程(一),大家在阅读过程中有什么建议或者反馈,请给我们留言。 2载入数据 我们将要使用iris这个数据集。这个数据集是非……

陆勤 1408 0 0 2 2016-02-26

R语言之控制流的使用方法
一般在数据处理或建模过程中会使用到R语言中的控制流,控制流主要有以下三类,即 1)if或switch分支语句 2)for循环 3)while循环 下面就说说这几……

lsxxx2011 1744 0 0 1 2016-02-26

R做你的第一个机器学习项目教程(一)
你是否想要用R做机器学习,但又苦恼于怎么开始做? 在这篇文章里你将会用R完成你的第一个机器学习项目。 在这个逐步教程里,你需要做: 1 下载和安装R并且获取用做……

陆勤 1582 2 0 2 2016-02-25

rattle:数据挖掘的界面化操作
R语言是一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。这里的统计计算可以是数据分析、建模或是数据挖掘等,通过无数大牛提供的软件包,……

lsxxx2011 1921 1 0 2 2016-02-23

R语言与Tableau集成之可视化应用
Tableau是一款非常棒的数据可视化商业软件,通过拖拉拽的方式迅速的实现数据可视化。而且该软件可以连接任何一种数据库,在处理大型数据时一点都不逊色。下面展示几……

lsxxx2011 2410 0 0 1 2016-02-21

使用R绘制几种常用的双坐标轴图形
之前公众号推送了一系列关于使用ggplot2包绘制统计图形的文章,有网友询问是否可以绘制双轴的统计图形。很抱歉,Hradly在设计ggplot2包时就没有将双轴……

lsxxx2011 2441 1 0 2 2016-02-19