用R演示逻辑回归过程-婚姻出轨案例
理论 Logistic回归适用于二值响应变量(0,1)。模 型 假 设Y服从二项分布,线性模型的拟合形式为: 其中,π= μ(Y)是Y的条件均值(即给定一系列X的值时Y =1的概率),(π/1-π)为Y=1时的优势比,log(π/1-π)……
结实 2016-04-27
R语言做数据挖掘教程
引言 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科……
薛丽丹 2016-04-26
怎样入手学习R的算法
怎样入手学习R的算法 >R是目前学习R语言中应用最广泛的平台。当你认真起来学习R的时候你会找到学习R的窍门。 它之所以功能强大是因为很多机器学习的算法都是现有的。然而其中一个问题是这些算法都是由第三方提供的,这似乎让这些算法的使用看起来没……
陆勤 2016-04-25
Accelerate R applications by cuda on GPU讲座总结
[微课堂]Accelerate R applications by cuda on GPU 分享内容: 本次讲座会介绍在数据分析中用到的并行化技术,并以R为平台介绍如何开发移植和优化数据分析的各种算法,如深度学习,knn算法。GPU当今已成……
薛丽丹 2016-04-23
R语言中的机器学习评价标准
R语言中的机器学习评价标准 你要用什么标准来衡量机器学习算法呢? 本文将讨论如何使用一系列的规范的评价标准来衡量R语言中的机器学习算法。 让我们从这里开始。 R语言中的模型评价标准 R语言提供了许多可供你用来评价机器学习算法的标准。 当我们……
江南消夏 2016-04-18
使用ggrepel避免ggplot绘图标签重叠
ggplot绘图时,常用geom_text为标出数据点的文本标签。经常会遇到标签相互重叠的问题。本文介绍了一种可以使标签各自分开的方法。 library(ggplot2) ggplot(mtcars)+geom_point(aes(wt, ……
陆勤 2016-04-17
面板门限模型及R实现
在高级计量经济学导论的知识框架中,对于面板数据的分析与建模,通常我们会用到如下R包:(1)plm包(用于面板数据固定效应与随机效应);(2)phtest(用于面板Hausman检验);(3)pvcm用于面板数据变系数估计。本期将介绍一类极其……
kv750 2016-04-17
R语言编码风格
标注及名称 文件名称 文件名称应当有意义,并且以 .R 作结。 # Good fit-models.R utility-functions.R # Bad foo.r stuff.r 如果是一系列文件,序列号应当在文件之前。 0-down……
Ewen 2016-04-17
灵活的字符串处理包:stringr
在文本或非结构数据处理中往往需要正则表达式的强大功能,需要字符串的处理,下文就讲讲这几天梳理的stringr包中的函数。该包仍然由伟大的Hadley做贡献。 word(),从句子中提取词组(适用于英语环境下的使用) word(string,……
lsxxx2011 2016-04-01
R语言可视化基础
之前我曾经翻译过一篇文章,标题为“为什么我们要开始学习数据化及其操作”,它讲到了我们为什么要首先学习,其次再学习相关的操作。在文章里面,作者是这样说的:“这里有几个原因可以解释我为什么会推荐首先学习数据可视化操作,不过,最重要的,我给出的……
firedata 2016-03-20
R语言实战读书心得导论
在分享我读《R语言实战》时的所见所闻之前,我想先和大家简单的聊一聊大数据这个词语,因为R语言是一门开源的统计类语言,它拥有强大的统计分析能力,而如今我们人类已经生活在信息时代,甚至我们又提出了大数据的时代;据统计,未来5年所产生的数据总量……
firedata 2016-03-16
数值型数据的探索分析
数据分析过程中,往往需要对数据作基本的探索性分析,查看数据是否存在问题,如缺失值数量、是否存在明显的异常值、数据是如何分布的、数据的集中趋势和离散趋势等。 探索性分析一般包括三大部分,即数据的分布情况、数据的集中与离散趋势和数据的分布形态……
lsxxx2011 2016-03-08
R数据分析案例:逻辑回归
逻辑回归,也称之为逻辑模型,用于预测二分结果变量。在逻辑模型当中,输出结果所占的比率就是预测变量的线性组合。 这篇文章将要使用下面这几个包,而且你们需要保证在运行我所举的例子的时候,你已经把这些包都装好了。如果你还没装好这些包,那么,运行i……
firedata 2016-03-03
R做你的第一个机器学习项目教程(三)
编者按:延续R做你的第一个机器学习项目教程(二),大家在阅读过程中有什么建议或者反馈,请给我们留言。 5.评估算法 现在,我们需要创建一些模型来对我们模型里一些未知的值进行精度的评估。 我们现在需要进行以下步骤操作: 1用10交叉验证建立测……
陆勤 2016-02-26
R做你的第一个机器学习项目教程(二)
编者按:延续R做你的第一个机器学习项目教程(一),大家在阅读过程中有什么建议或者反馈,请给我们留言。 2载入数据 我们将要使用iris这个数据集。这个数据集是非常有名的,因为这是机器学习和统计学里的”hello world”类数据集,这对于……
陆勤 2016-02-26