用R语言实现对不平衡数据的四种处理方法
用R语言实现对不平衡数据的四种处理方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。那么,这种结果是为何发生的呢?到底是什么因素影响了这些算法的表现? 在不平衡的……
陆勤 2016-09-01
Beginning R|R书籍
Beginning R|R书籍 > 导读:由于R语言是免费开源的软件环境并且有大量用于数据处理和可视化的完整程序包,如今大数据的快速发展也使R的应用更加广泛。 书籍描述 - Beginning R offers anyone who ne……
R for Data Science|R书籍
R for Data Science|R书籍 >导读:学习和应用R语言来解决数据科学的一系列问题,遵循数据科学流程,完成数据相关工作。R语言是数据科学家们常用的语言之一,用它做统计分析、数据建模和数据可视化都很便利和有效。 书籍描述: ……
陆勤 2016-08-31
Deep Learning Made Easy with R|R书籍
Deep Learning Made Easy with R|R书籍 > 导读:轻松用R语言玩深度学习。深度学习(deep learning)是一种方法论,应用广泛,很多公司都在使用这个方法论从海量数据中学习到知识或者模式,利用这些有价值的……
陆勤 2016-08-24
R语言做数据分析|R书籍
R语言做数据分析|R书籍 R语言做数据分析,有很多优势。 R语言擅长做统计分析 R语言擅长做数据可视化 R语言做数据分析的资料丰富(有很多值得一读的书籍) R语言社区活跃,聚集了众人的智慧 小编给朋友们推荐《R语言做数据分析》这本书籍……
陆勤 2016-08-22
XML包导入和处理XML数据格式|R包
XML包导入和处理XML数据格式|R包 什么是XML? • XML 指可扩展标记语言(EXtensible Markup Language) • XML 是一种标记语言,很类似 HTML • XML 的设计宗旨是传输数据,而非……
陆勤 2016-08-18
data.table包|R包
data.table包|R包 “R包众多,如何选择?如何学习?如何应用?如同三把斧,摆在每位学R和用R的数据人面前,如何轻松自如挥舞,仁者见仁、智者见智!” 从今天开始,陆续推出一系列关于好用的R包的文章,欢迎各位数据人反馈、留言、投稿。……
陆勤 2016-08-18
R and Data Mining Examples and Case Studies|R书籍
R and Data Mining Examples and Case Studies ![R语言与数据挖掘例子](http://img.shujuren.org/pictures/MP/579f62a054533.png "R语言与数据挖……
陆勤 2016-08-01
自助法在分散式投资策略中的应用
可以转载,禁止修改。转载请注明数据人网和作者和原文链接。 先用人话来描述一下这个问题:有两个收益不固定的投资项目,如何将一笔固定的金额分开投资,才能使总投资风险最小? 再用数学语言来描述一下这个问题,对于两个收益分别为X和Y的金融资产,X、……
用mice包处理缺失值
1、数据准备 > Z1=read.table('clipboard',header=T) #读入数据 > head(Z1) #查看前六行 Age Gender Chol……
薛丽丹 2016-07-01
用R语言在地图上进行分析——基于一组美国肥胖数据
在这篇文章中,我将展示一个关于美国地区肥胖事件的地图分析表示: > library(ggplot2 )载入需要的包 > library(rvest) > library(ggplot2) > library(……
薛丽丹 2016-06-29
聚类分析(二)
因为上篇文章的理论铺垫,相信大家对软件实现的理解更快。也就是说,可以把jpg理解成gif的效果。 单个业务场景的数据分析过程,数据分析周期:需求→数据处理→数据分析→数据报告→结论→沟通→数据落地→再优化 。其中,不同颜色代表不同的数据过……
结实 2016-06-27
交叉验证示例
交叉验证思想 交叉验证用于模型选择,可以更好的来估计模型的试验误差。交叉验证的做法就是从训练数据集中是创建一系列分区数量的样本一部分作为验证集,其他部分作为训练集。在用训练集模拟一个适合训练集的模型之后,在验证集中来测试训练集得到的模型,并……
薛丽丹 2016-06-25
KNN算法在保险业精准营销中的应用
版权所有,可以转载,禁止修改。转载请注明作者以及原文链接。 一、KNN算法概述 KNN是Machine Learning领域一个简单又实用的算法,与之前讨论过的算法主要存在两点不同: 它是一种非参方法。即不必像线性回归、逻辑回归等算法一样……
用贝叶斯判别分析再次预测股票涨跌情况
可以转载,禁止修改。转载请务必注明作者以及出自[数据人网](http://shujuren.org "数据人网")和原文链接 注:本文是从贝叶斯分类器的角度来讨论判别分析,有关贝叶斯分类器的概念可参考文末延伸阅读第1-2篇文章。至于Fish……