R做你的第一个机器学习项目教程(二)
编者按:延续R做你的第一个机器学习项目教程(一),大家在阅读过程中有什么建议或者反馈,请给我们留言。 2载入数据 我们将要使用iris这个数据集。这个数据集是非……

JackWang 1064 0 0 2 2016-02-26

R语言之控制流的使用方法
一般在数据处理或建模过程中会使用到R语言中的控制流,控制流主要有以下三类,即 1)if或switch分支语句 2)for循环 3)while循环 下面就说说这几……

lsxxx2011 1275 0 0 1 2016-02-26

R做你的第一个机器学习项目教程(一)
你是否想要用R做机器学习,但又苦恼于怎么开始做? 在这篇文章里你将会用R完成你的第一个机器学习项目。 在这个逐步教程里,你需要做: 1 下载和安装R并且获取用做……

JackWang 1204 2 0 2 2016-02-25

rattle:数据挖掘的界面化操作
R语言是一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。这里的统计计算可以是数据分析、建模或是数据挖掘等,通过无数大牛提供的软件包,……

lsxxx2011 1509 1 0 2 2016-02-23

R语言与Tableau集成之可视化应用
Tableau是一款非常棒的数据可视化商业软件,通过拖拉拽的方式迅速的实现数据可视化。而且该软件可以连接任何一种数据库,在处理大型数据时一点都不逊色。下面展示几……

lsxxx2011 1901 0 0 1 2016-02-21

使用R绘制几种常用的双坐标轴图形
之前公众号推送了一系列关于使用ggplot2包绘制统计图形的文章,有网友询问是否可以绘制双轴的统计图形。很抱歉,Hradly在设计ggplot2包时就没有将双轴……

lsxxx2011 1870 1 0 2 2016-02-19

如何使用R语言解决可恶的脏数据
在数据分析过程中最头疼的应该是如何应付脏数据,脏数据的存在将会对后期的建模、挖掘等工作造成严重的错误,所以必须谨慎的处理那些脏数据。 脏数据的存在形式主要有如下……

lsxxx2011 1242 1 0 3 2016-02-17

使用R绘制其他图形之热图及网络图
热力图是一种非常常用的统计图形,该图将两个变量(一般是离散变量)的交叉汇总信息以颜色的形式展现出来,而映射给颜色变量的是连续型数值变量,下面就以例子说明热力图的……

lsxxx2011 1377 1 0 2 2016-02-15

如何快速而又简便的进行数据图表操作
我们刚刚学习了利用data.table这个包进行R的数据框转换成运行速度更快,诸如SQL这样的格式。 这里,我们学到了一些非常好而且更能强大的语法结构。接下来,……

firedata 604 0 0 0 2016-02-08

总结近半年以来用R感言
随着互联网不断的发展,全球数据总量呈每年爆炸性的增长。所以,我们可以这样认为,当今社会就是一个大数据的社会,这个时代是大数据充当主角的时代,因为随着数据总量的不……

firedata 760 1 0 2 2016-02-07

用dplyr包进行数据操作
dplyr包是由Hadely Wickham编写的,并用于数据操作的包。这个包给我们用户提供了一个关于探索性数据分析以及操作中,一些功能强大,而且容易操作的函数……

firedata 940 0 0 1 2016-02-02

教你使用tidyr包进行数据预处理
之前介绍了如何使用data.table包、reshape包、plyr包和dplyr包进行数据预处理。 最后再跟大家介绍一下tidyr包。 有关data.tab……

lsxxx2011 1853 1 0 1 2016-01-28

用reshape2包进行数据操作
在这篇文章中,我会向大家展示如何使用reshape2包把从范围较广的数据转化成长格式,反之亦然。这篇文章由Hardely Wickham编写。 长格式与宽格式 ……

firedata 613 0 0 1 2016-01-26

手把手教你使用ggplot2进行数据分布探索
手把手教你使用ggplot2进行数据分布探索 数据探索过程中往往需要了解数据的分布情况,例如上下四分位数的位置、数据符合哪种分布等,下文将使用R的ggplot2……

lsxxx2011 2180 1 0 3 2016-01-23

R用tidyr包进行数据操作
大家好!在这篇文章中,我会向你们展示如何用tidyr包进行数据操作。Tidyr包是由Hadely Wickham先生创建的,这个包提高了整理原始数据的效率,而且……

firedata 989 1 0 1 2016-01-22