R语言学习笔记 - 函数的使用
>最近在coursera上学习R语言,本博客主要是记录本人的从作业中收获到的一些内容,希望对R语言初学者有帮助。另:因为本人也是初学,博客中难免出现错误,希望各位批评指正。 这篇是关于function的一些介绍,有几个平时我没注意到的知识点……
R Tip:使用vtreat包进行数据准备
如果您正在使用R做预测建模或机器学习,那么这个R提示将为您节省大部分时间并为您的结果带来最大的改进 R提示:使用vtreat软件包在预测分析和机器学习项目中进行数据准备。 在尝试使用真实世界数据进行预测建模时,您会遇到超出机器学习课程中通……
陆勤 2018-09-11
R中的tidyverse入门
tidyverse是由RStudio首席科学家Hadley Wickham开发的R套装的集合。 这些包作为大数据分析管道的一部分可以很好地协同工作。要了解这些工具及其协同工作的更多信息,请阅读[R for data science](ht……
陆勤 2018-08-22
什么教育资源是好的?为什么?
在[本系列的第一篇文章](http://shujuren.org/article/662.html "本系列的第一篇文章")中,我们概述了在科学领域与R一起教学的教育者面临的一些共同挑战。在这篇文章中,我们将深入研究什么是“好”的教育资源可……
陆勤 2018-08-02
R语言教授科学有什么挑战?
>编者按:R语言教授科学有什么挑战?属于一个系列性文章,共有三篇。通过这3篇文章,回答挑战是什么以及如何面对这些挑战。 第一篇文章旨在总结教育工作者所面临的主要挑战,作为一种帮助他们思考他们对课程材料所做的决定的工具。第二篇文章解释了是什么……
陆勤 2018-08-02
决策树算法识别信贷风险
> 本文基于决策树算法设计和构建一个简洁的信贷审批模型,实现自动化和智能化量化和识别风险。 第一步:收集数据 本文使用UCI公开数据集German Credit Data。 这份数据集包括1000个样本,每个样本包括信贷和信贷人相关的数值……
陆勤 2018-07-17
Probit回归
>Probit回归可以用来解决二元分类问题,就像逻辑回归一样。 虽然逻辑回归使用累积逻辑函数,但是概率回归使用正态累积密度函数用于估计模型。 概率模型类似于逻辑回归,即使用glm()函数但将family参数设置为(link =“probit……
陆勤 2018-07-06
Rmarkdown使用教程
本文总结Rmarkdown的使用,主要回答以下问题: Rmarkdown是什么? 如何使用Rmarkdown? 如何使用Rmarkdown生成中文文档? Rmarkdown应用举例? Rmarkdown是什么? > Analyze. S……
陆勤 2018-07-05
scorecard:评分卡包
> 本文介绍评分卡包scorecard的使用。 scorecard包简介 scorecard包通过提供信息价值,变量过滤器,最佳woe分箱,记分卡缩放和模型性能评估等功能,以实现轻松高效地设计和开发信用风险记分卡。 scorecard包的……
陆勤 2018-07-01
woeBinning:woe分箱包
本文介绍woe分箱包-woeBinning,利用该包实现自动分箱和计算变量的IV值。 woeBinning包介绍 woeBinning包使数字变量和因子相对于二元目标变量的分箱过程自动化。 此外,它可视化已实现的分箱解决方案,可以表格化和部……
陆勤 2018-06-29
2018年数据科学前20名R包
在我们以前的文章中,我们已经讨论过Python和Scala中数据科学的顶级库。 但是,如果没有R,这篇文章列表将不完整。所有这些编程语言对于不同的数据科学任务和项目都很流行,并且有他们的支持者和反对者。 因此,在我们安排比较这些编程语言如……
陆勤 2018-06-17
如何在R中执行Logistic回归
> 逻辑回归是拟合回归曲线的方法,当y是分类变量时,y = f(x)。这个模型的典型用途是基于一组预测变量x预测y。预测因子可以是连续的,分类的或两者的混合。 通常,分类变量y可以采用不同的值。在最简单的情况下,y是二进制的,意味着它可以假……
陆勤 2018-06-09
R做信用评分Part3
系列之前:[R做信用评分Part2](http://shujuren.org/article/618.html "R做信用评分Part2") 2.3子集数据1-基于单变量和双变量分析 var_list_1 <- IV$Summary[……
陆勤 2018-06-09
R做信用评分Part2
系列之前:[R做信用评分Part1](http://shujuren.org/article/610.html "R做信用评分Part1") 2.2.9 个人身份与性别 A9<-gbpct(cdata$personal_status_……
陆勤 2018-06-09
R做信用评分Part1
1.介绍 这是试图展示一些使用德国信用数据的机器学习(ML)的实例。虽然我们在本文中选择了信用评分问题作为案例研究,但同样的过程将适用于范围广泛的分类或回归问题响应建模,风险管理,流失管理,交叉销售/提升销售,使用模式,净现值,生命时间周期……
陆勤 2018-06-06