圈子


关注微信公众号
关注微信公众号
转载 教育的未来:在线、免费和机器人老师?
也许虽然没有获得投资者的大量关注,但教育其实是美国最大的市场之一。 目前,美国拥有2000万在校本科生和300万研究生。2016-17学年,公立大学本科生的学费、住宿费和伙食费平均为17237美元,私立大学为44551美元。研究生教育的费用根据专业的不同而差异较大,但去年仅学费一项就达到平均24812美元。 降低费用 ……


转载 人工智能与伦理道德
2018年3月18日晚10点左右,伊莱恩·赫茨伯格(Elaine Herzberg)在亚利桑那州坦佩市骑车横穿马路,被一辆自动驾驶汽车撞倒,不幸身亡。虽然车上有安全驾驶员,但当时汽车完全由自动驾驶系统(人工智能)控制。和其他涉及人与AI技术交互的事故一样,这起事故提出了一系列的道德和原始法律问题:开发该系统的程序员在防……


原创 R语言数据科学入门
R语言是一个开源的软件和平台,适合做数据科学的事情。 随着硬件,软件,网络的不断发展,数据的数量,类型,增速都在加速地累积,而这一切都构成数据科学的“沃土”。对数据的处理和应用能力,不仅是个人的核心能力,也是企业的核心优势。 在这信息和资讯特别发达的时代,R语言做数据科学的资料琳琅满目,应有尽有。我们在寻找的过程中,发……


翻译 R语言数据科学入门附录A
A 统计背景 A.1 基本统计术语 A.1.1 均值 均值是度量中心最常用的量。尽管可能会引起一些歧义,但是它常被称为``平均数'',均值是所有数据求和然后除以元素的个数。如果我们有$n$个数据点,则均值如下: $$Mean=\frac{x_1+x_2+\cdots+x_n}{n}$$ A.1.2 中位数 中位数的计算……


原创 R免费电子书下载助你学习
> R是一种开源软件,有许多对R语言做贡献的人,以及创建可供下载的免费包的开发者。这种精神延续到R的学习材料中。虽然有一些优秀的书籍你可以购买来学习R(例如R Cookbook),如果你在找免费的资料,下面罗列了一些好的选择。 [R for Beginners](https://cran.r-project.org/d……


原创 移动和无线网络的深度学习综述(二)
> 我在[《移动和无线网络的深度学习综述(一)》](http://shujuren.org/article/810.html "《移动和无线网络的深度学习综述(一)》")的文章了分享了论文的摘要和Itroduction的内容。 在本文,你可以了解到: 论文的第二节,相关的论文和这篇综述的范围 论文的第三节,深度学习1……


原创 移动和无线网络的深度学习综述(一)
> 最近开始研究通信领域的先进机器学习技术,本科学的是通信工程,工作做的是机器学习,5G的到来,智能移动网络的需求和应用,预示着通信领域需要先进的机器学习技术,同时,也会带来新的挑战和机遇。 在阅读Chaoyun Zhang, Paul Patras, and Hamed Haddadi的论文《移动和无线网络的深度学习……


原创 LMM线性混合模型by nlme
介绍 线性混合模型是数据模型中一种重要的类别,它可以分析存在相关关系的数据,模型里面包含固定效应以及随机效应,随机效应描述的是在不同层次的不同水平中,各变量对总体观察变量的贡献。 数据导入 本文选择的数据来自Andrzej Gałecki • Tomasz Burzykowski的nlme的armd数据。 libra……


翻译 使用R和tidytext对Trustpilot 的评论进行主题建模
>在这篇和分析中,我们将主题建模应用于我目前的电信提供商丹麦Trustpilot对“3”(其他国家的“三个”)的评论。 我对他们的客户服务不满意,并认为这将是一个有趣的主题建模用例。 通过这种方法,我们可以尝试找出客户体验的哪些方面出现在积极和消极的评论中。 我使用[Python脚本](https://github.c……


翻译 使用spotifyr聚类Springsteen专辑
spotifyr包很棒,让我们来探索音乐的各个方面,如节奏、舞蹈性和化合价。在这篇文章中,我们将从相同点和不同点来探讨布鲁斯·斯普林斯汀的专辑。 # devtools::install_github('charlie86/spotifyr') library(spotifyr) library(tidyverse) ……


原创 一个数据人的2018
> 王阳明先生说:“知行合一:知之真切笃实处即是行,行之明觉精察处即是知。” 2018年的最后一天,我来写下一个数据人的2018。 2018年,上半年在新零售行业里面做着算法工程师,利用新零售的领域知识,统计学和机器学习的方法,文本分析和挖掘的手段,解决预测类,推荐类和画像类等相关问题。2018年下半年重新回归到金融……


原创 银行信贷数据集探索性数据分析
本文为了迭代一个探索性数据分析的通用模式,首先使用银行信贷数据进行探索性数据分析,希望能够得到一个通用的强大探索性解决方案。 数据导入 数据是来自klaR的GermanCredit数据. library(pacman) p_load(tidyverse,klaR) data(GermanCredit) GermanC……


翻译 进行机器学习和数据科学常犯的错误
> 我们研究了数据科学过程中的典型错误,包括错误的数据可视化、错误的缺失值处理、错误的分类变量转换等等。让我们学会如何避免。 这是这个系列的第2部分,请在这里找到第1部分—[如何从头构建数据科学项目](http://shujuren.org/article/803.html "如何从头构建数据科学项目")。 在抓取或获……


翻译 如何从头开始构建数据科学项目
> 使用柏林租赁价格分析的实例,包括如何从网络中抽取数据并进行清洗,获得更深入的见解,以及使用外部API设计特征等等。 有许多关于数据科学和机器学习的在线课程将指导您完成理论,并为您提供一些代码示例和对非常干净数据的分析。 然而,为了开始实践数据科学,最好是挑战现实生活中的问题。深入研究数据以便发现更深层次的见解。利用……


原创 Centos7服务器上安装R和Rstudio
> 为了增加计算力来处理和整合更多和更杂的数据集,运维同事给我们分配了服务器。服务器是用Centos7的Linux系统,为了完成数据科学任务,我们需要在服务器上面搭建R平台。 通过阅读本文,你可以获得: 服务器上面安装R和RStudio 服务器上面安装常用R包 1 准备工作 在CentOS 7上,R可以基于epel……


转载 目标函数的经典优化算法介绍
> 本文使用通俗的语言和形象的图示,介绍了随机梯度下降算法和它的三种经典变体,并提供了完整的实现代码。 目标函数是衡量预测值和实际值的相似程度的指标。通常,我们希望得到使代价尽可能小的参数集,而这意味着你的算法性能不错。函数的最小可能代价被称为最小值。有时一个代价函数可以有多个局部极小值。幸运的是,在参数空间的维数非常……