搜索到 210 条结果

您可能要找:

在Python和R中运行相同的任务
根据KDD调查,较少的受访者(按比例计算)在2017年仅使用R而不是2018年。同时,更多的受访者(按比例)在2017年仅使用Python而不是2016年。 让我们以此为借口快速了解当我们在两个系统中尝试任务时会发生什么。 对于我们的任务,……
陆勤 2018-10-12
R和Python:如何将两者的优点集成到您的数据科学工作流中
从执行业务领导到数据科学家,我们都同意一件事:数据驱动的转变正在发生。人工智能(AI)和更具体的数据科学正在重新定义组织如何从其核心业务中提取洞察力。我们正在经历组织的根本性转变。其中“到2019年,大约90%的全球大型组织都有首席数据官”……
陆勤 2018-10-12
R中你应该学习7种可视化
> 数据可视化,让你的数据讲故事。 随着数据量的不断增加,如果没有可视化,就不可能讲故事。数据可视化是一门如何将数字转化为有用知识的艺术。 R编程通过提供一组用来构建可视化和表示数据的内置函数和库,让您学习这种艺术。在可视化技术实现之前,……
陆勤 2018-10-20
学习R编程的好书籍
书籍,书籍,书籍 有很多书可以帮助你学习R编程。 但是,您如何知道选择哪本书来投入时间? 别担心。 这个简短的列表只有最好的R书,可以帮助你学习R编程。 开始了: R for Data Science 向大师学习! 向那些彻底改变我们如何编……
陆勤 2018-10-22
在Tidyverse用estimatr
> estimatetr以稳健的标准差进行快速的OLS和IV回归。 本文揭示estimatetr如何与RStudio的tidyverse软件包集成。 获得整洁 tidyverse的第一步是将模型输出转换为我们可以操作的数据。 tidy函数将……
陆勤 2018-10-25
Keras深度学习介绍
> 在本文中,我们将使用[Keras](https://keras.io/ "Keras")构建一个简单的神经网络。我们假设您对机器学习包(如[scikit-learn](http://scikit-learn.org/stable/ "s……
陆勤 2018-10-31
R机器学习介绍
>这是我在德国海德堡大学于2018年6月28日所做的关于R的机器学习介绍的研讨会的幻灯片。整个研讨会的代码可以在视频下面找到。 研讨会介绍了机器学习的基本知识。通过一个示例数据集,我在R中使用caret和h2o包完成了一个标准的机器学习工作……
陆勤 2018-10-31
1. Airflow 配置及使用 - 环境配置
AirFlow配置与使用 - 环境配置 注:本文为Linux下,Airflow使用的说明 Linux 环境为:CentOS 建议安装推荐的版本,避免不兼容的情况,如无特殊说明,以下命令均在命令行执行。 1.Linux系统 https:……
CLamdown 2018-11-01
用户画像系统的作业调度Airflow研究和应用
> 用户画像系统从业务入手,全面构建用户的标签体系。标签体系的设计和生成需要多个作业协同和有序工作。而用户画像系统的作业调度,就是用来保证多个作业能够协同有序工作。本文是对开源的作业调度系统Airflow的研究和应用探索。 Airflow环……
陆勤 2018-11-01
Python Tip:Jupyter notebook如何导出PDF文件?
> 问题背景:利用Jupyter notebook做好交互的数据分析或者模型后,想导出PDF文件作为简单版的报告或者交流的材料。如何从Jupyter notebook 导出PDF文件?并且对于有中文的情况,标题和正文都不含有乱码。 解决方案……
陆勤 2018-11-06
麋鹿分布图制作(二)—— 用Python和R在地图上打点
上期用Python调用百度API得到地点的经纬度, 今天就将这些点标注在地图上。 首先我们用R语言来标注。 文中用到的文件已上传到Github。 library(rgdal) library(ggplot2) library(mapproj……
小黑black_007 2018-11-14
论文管理工具,我用Zotero
> 工欲善其事,必先利其器 ——《论语.卫灵公》 君子生非异也,善假于物也——《荀子.劝学》 为了有效地阅读论文和管理论文,我用Zotero。(感谢黄海广博士推荐和帮助) 在这里,我记录自己使用这个工具的一点心得,也欢迎更多科研工作者和算……
陆勤 2018-11-16
使用RMarkdown沟通结果
在我作为顾问的培训中,我了解到,长时间的分析之后,通常也要花同样长的时间准备报告。我不得不将复杂的分析转化为建议,而我作为顾问的成功取决于我影响决策者的能力。我使用了各种各样的工具来表达我的见解,但随着时间的推移,我越来越依赖[R Mar……
陆勤 2018-11-17
GraphLab机器学习框架
> GraphLab是用c++编写的一种新的机器学习并行框架。它是一个开源项目,设计时考虑了真实世界数据的规模、多样性和复杂性。 1 GraphLab安装 首先,进入GraphLab官网。 https://turi.com/ 申请一个学术用……
陆勤 2018-11-22
利用Keras长短期记忆(LSTM)模型预测股票价格
> LSTMs在序列预测问题中非常强大,因为它们能够存储过去的信息。这在我们的案例中很重要,因为股票的前一个价格对于预测其未来的价格是至关重要的。 > 编者按:本教程演示了如何开始使用LSTM模型预测时间序列。股票市场数据是一个很好的选择……
陆勤 2018-11-23