数据科学中的故事讲述艺术以及如何创建数据故事?
简介 讲故事的想法很吸引人, 采取一个想法或事件,并把它变成一个故事。 它将这个想法带入生活并使其更有趣。 这发生在我们的日常生活中。 无论我们讲述一个有趣的事件还是我们的研究结果,故事一直是从听众和读者那里引起兴趣的“向导”。 例如; 当……
陆勤 2018-05-20
拥抱 Tidyverse包
Hadley Wickham是[R for Data Science](http://r4ds.had.co.nz/ "R for Data Science")的合着者(与Garrett Grolemund合作)和RStudio首席科学家的……
陆勤 2018-05-13
R做线性回归
>本文解释了如何在R中运行线性回归。本教程将介绍线性回归的假设以及如果假设不满足如何处理。 它还包括拟合模型和计算模型性能指标以检查线性回归模型的性能。 线性回归是最流行的统计技术之一。 它已被使用了三十多年。 它几乎在每个领域都被广泛接受……
陆勤 2018-05-05
R构建数据科学工作环境
R语言构建数据科学工作环境,记录如下,以供后续查阅。 第一步:下载R软件和RStudio软件 R软件下载链接:https://cran.r-project.org/mirrors.html RStudio软件下载链接:https://ww……
陆勤 2018-05-04
使用ggplot2进行数据可视化
为了实现数据可视化,R通过内置图形和强大的软件包(如ggolot2)提供各种方法。 前者帮助创建简单的图形,而后者创建定制的专业图形。 在本文中,我们将尝试学习如何使用ggplot2软件包制作和修改各种图形。 [TOC] 什么是ggplo……
陆勤 2018-04-30
使用dplyr进行数据操作(30个实例)
dplyr软件包是R中功能最强大,最受欢迎的软件包之一。该软件包由最受欢迎的R程序员Hadley Wickham编写,他编写了许多有用的R软件包,如ggplot2,tidyr等。本文包括一些示例和如何使用使用dplyr软件包来清理和转换数据……
陆勤 2018-04-15
用R语言编码理解区块链
> 利用R语言实现一个小型区块链,以了解区块链是什么以及背后的一些核心概念。 现在人人都在谈论加密货币,这要感谢比特币的炒作。比起比特币是否存在泡沫更为有趣的问题是比特币这种技术实际是怎么运作的和比特币的价值是什么。比特币的故事开始于200……
陆勤 2018-04-09
那些年看过的R语言书籍
>“读史使人明智,读诗使人灵秀,数学使人周密,科学使人深刻,伦理学使人庄重,逻辑修辞使人善辩,凡有所学,皆成性格。” “读书不是为了雄辩和驳斥,也不是为了轻信和盲从,而是为了思考和权衡。” ——弗兰西斯.培根 思考环节: 你看过那些R语言……
陆勤 2018-02-17
R语言与数据可视化
R语言与数据可视化 > The simple graph has brought more information to the data analyst’s mind than any other device. —John Tukey……
陆勤 2018-01-21
2018年用R语言做好五件事
2018年用R语言做好五件事 > - 1 R语言开源,免费,跨平台。 2 R语言可以做[数据科学工作流](http://shujuren.org/article/490.html "数据科学工作流")各个环节的任务。 3 R语言深受数据科……
陆勤 2018-01-07
缺失值发现和处理
您在阅读中,关于缺失值发现和处理,有什么见解,请评论。 关于R语言更多内容,请阅读[R系列文章](http://shujuren.org/article/514.html "R系列文章")。 想加入数据人圈子,请加微信luqin360。 ……
陆勤 2017-12-29
聚合运算
>聚合运算可当作一种统计处理,具体包括单独聚合和分组聚合。 1 单独聚合 单独聚合,是对某一个连续变量进行聚合操作,例如求和,求平均值等,基于某种统计方法把多个数转化成一个数。 代码示范: library(magrittr) librar……
陆勤 2017-12-29
排序和去重
>排序为了更好地理解数据,去重删掉重复的观察或者变量。 1 排序 排序,基于某一个变量或者一组变量的值进行有序排列,方便友好地理解数据。 代码示范: # 加载R包 library(magrittr) library(dplyr) # 数……
陆勤 2017-12-28
添加新变量和删除变量
> 添加新的变量和删除变量,辅助解决衍生变量设计。 1 添加新的变量 添加新的变量,既可以用于设计或者衍生新的变量,又可以对原始数据做变换操作。 代码示范 # 加载R包 library(magrittr) library(dplyr) ……
陆勤 2017-12-28
数据选择行或者列
>选择适合您数据问题的数据,在数据准备环节是重要的事情。 1 数据选择行 数据选择行,理解为选择符合所需的对象或者观测或者样例。 代码示范: # 加载R包 library(magrittr) library(dplyr) # 数据导入 da……
陆勤 2017-12-15