R机器学习介绍
>这是我在德国海德堡大学于2018年6月28日所做的关于R的机器学习介绍的研讨会的幻灯片。整个研讨会的代码可以在视频下面找到。 研讨会介绍了机器学习的基本知识。通过一个示例数据集,我在R中使用caret和h2o包完成了一个标准的机器学习工作……
陆勤 2018-10-31
在Tidyverse用estimatr
> estimatetr以稳健的标准差进行快速的OLS和IV回归。 本文揭示estimatetr如何与RStudio的tidyverse软件包集成。 获得整洁 tidyverse的第一步是将模型输出转换为我们可以操作的数据。 tidy函数将……
陆勤 2018-10-25
R中你应该学习7种可视化
> 数据可视化,让你的数据讲故事。 随着数据量的不断增加,如果没有可视化,就不可能讲故事。数据可视化是一门如何将数字转化为有用知识的艺术。 R编程通过提供一组用来构建可视化和表示数据的内置函数和库,让您学习这种艺术。在可视化技术实现之前,……
陆勤 2018-10-20
Spatial Analysis
今天是Spatial Analysis上机实习课,平时学了很多统计分析的方法,但是没有具体跑过代码,上机就发现好多分析的结果有点看不懂,索性记录下来,供以后复习使用。 arr<-read.table("reg_data.tx……
为什么你应该从学习数据可视化和操作开始
当我与想要开始学习数据科学的人交谈时出现的最大问题之一是: 我不知道从哪里开始! 最近,我认为当你开始使用数据科学时,R是最好的编程语言。 虽然这有助于您选择编程语言,但它仍然没有告诉您要关注哪些技能。 就像选择编程语言一样,选择开始的技能……
陆勤 2018-10-13
R中用线性回归进行预测建模
预测模型对于预测未来结果和估算实际难以量化的指标非常有用。例如,数据科学家可以使用预测模型基于降雨和温度预测作物产量,或确定具有某些特征的患者是否更可能对新药物反应严重。 在我们具体讨论线性回归之前,让我们自己回顾一下典型的数据科学工作流……
陆勤 2018-10-06
用R介绍路径分析
> 路径分析是多元回归的扩展。 它帮助分析更复杂的模型。 想象一下,你要建立一个模型从汽车不同属性来预测汽车行驶里程。 你会怎么做? 最简单的方法是采用一个对行驶里程影响最大的参数或属性(选择哪一个属性可以成为一个无休止的争论的问题)建立回……
陆勤 2018-10-05
用R语言读取PDF文件中的table
Scientific articles are typically locked away in PDF format, a format designed primarily for printing but not so great f……
R Tip:数据集划分为训练集和测试集?
>问题背景:我们构建数据模型的时候,需要把数据集划分为训练集和测试集,训练集用来训练模型,测试集用来测试模型的泛化能力。本文总结R语言如何把数据集划分为训练集和测试集? 解决方案 结合实际工作,罗列4中解决方案。 1 使用smaple()函……
陆勤 2018-09-21
R语言:ggplot2包
我们将学习R中[最受欢迎](https://www.kdnuggets.com/2015/06/top-20-r-packages.html "最受欢迎")的软件包之一,它是ggplot2:图形语法的实现。 我正在使用R中提供的iris数据……
陆勤 2018-09-21
R语言学习笔记 - 函数的使用
>最近在coursera上学习R语言,本博客主要是记录本人的从作业中收获到的一些内容,希望对R语言初学者有帮助。另:因为本人也是初学,博客中难免出现错误,希望各位批评指正。 这篇是关于function的一些介绍,有几个平时我没注意到的知识点……
R Tip:使用vtreat包进行数据准备
如果您正在使用R做预测建模或机器学习,那么这个R提示将为您节省大部分时间并为您的结果带来最大的改进 R提示:使用vtreat软件包在预测分析和机器学习项目中进行数据准备。 在尝试使用真实世界数据进行预测建模时,您会遇到超出机器学习课程中通……
陆勤 2018-09-11
R中的tidyverse入门
tidyverse是由RStudio首席科学家Hadley Wickham开发的R套装的集合。 这些包作为大数据分析管道的一部分可以很好地协同工作。要了解这些工具及其协同工作的更多信息,请阅读[R for data science](ht……
陆勤 2018-08-22
什么教育资源是好的?为什么?
在[本系列的第一篇文章](http://shujuren.org/article/662.html "本系列的第一篇文章")中,我们概述了在科学领域与R一起教学的教育者面临的一些共同挑战。在这篇文章中,我们将深入研究什么是“好”的教育资源可……
陆勤 2018-08-02
R语言教授科学有什么挑战?
>编者按:R语言教授科学有什么挑战?属于一个系列性文章,共有三篇。通过这3篇文章,回答挑战是什么以及如何面对这些挑战。 第一篇文章旨在总结教育工作者所面临的主要挑战,作为一种帮助他们思考他们对课程材料所做的决定的工具。第二篇文章解释了是什么……
陆勤 2018-08-02