麋鹿分布图制作(二)—— 用Python和R在地图上打点
上期用Python调用百度API得到地点的经纬度, 今天就将这些点标注在地图上。 首先我们用R语言来标注。 文中用到的文件已上传到Github。 library(rgdal) library(ggplot2) library(mapproj……
用户画像系统的作业调度Airflow研究和应用
> 用户画像系统从业务入手,全面构建用户的标签体系。标签体系的设计和生成需要多个作业协同和有序工作。而用户画像系统的作业调度,就是用来保证多个作业能够协同有序工作。本文是对开源的作业调度系统Airflow的研究和应用探索。 Airflow环……
陆勤 2018-11-01
1. Airflow 配置及使用 - 环境配置
AirFlow配置与使用 - 环境配置 注:本文为Linux下,Airflow使用的说明 Linux 环境为:CentOS 建议安装推荐的版本,避免不兼容的情况,如无特殊说明,以下命令均在命令行执行。 1.Linux系统 https:……
CLamdown 2018-11-01
如何成为数据科学家:权威指南
> 数据科学教育家Jose Portilla提供了关于成为数据科学家的权威性指南,其中包括从获取特定技能到寻找第一份工作,再到掌握面试机会的各种资源。 你好!我是Jose Portilla,Udemy的讲师,有超过25万名学生注册了各种各样……
陆勤 2018-10-20
基于机器学习的智能故障诊断
行业现状:近年来,华夏银行在智能运维研究方面加大力度,特别是在基于人工智能的故障诊断方面取得了一定研究成果。基于人工智能与机器学习故障诊断系统,不仅需要有强大的机器学习能力,还需要灵活匹配银行应用系统特性的算法,并结合强大的运维故障处理经验……
数商 2018-10-13
未来“名存实亡”的十种工作
未来30年内,人工智能可能带来太多人类目前还不理解的社会现象,不理解就可能会带来麻烦甚至是灾难。首当其冲的就是取代人类的工作,甚至会让部分人失去“生而为人”的意义。 当人工智能开始从实验室走向更为广泛的应用时,它就不再仅仅具有技术上的冲击力……
数据跨界 2018-09-26
大数据如何助力乡村振兴
当今时代,数字经济已成为拉动经济增长的强大动力,不少国家都希望依靠大数据推动质量变革、效率变革、动力变革。可以说,谁掌握了大数据的主动权,谁就赢得了核心竞争力。党的十九大报告提出实施乡村振兴战略,这对于解决好“三农”问题、加快推进农业农村现……
数据跨界 2018-08-31
精准营销不再是空话
随着互联网的深入发展,以及大数据分析技术的应用,营销“精准化、个性化、场景化”难题逐步破解,成为了营销发展新趋势,在大数据新时代,精准营销不再是空话。   目前,许多品牌企业和策划机构,仍然喜欢抽样调查等传统方式,研究和分析目标消费者,然后……
数据跨界 2018-08-30
信用评分卡:预测分析的业务整合
哥伦布 - 领导力课程 克里斯托弗·哥伦布 - 我在生命的各个阶段因各种原因而崇拜这个男人。七岁时,我很尊敬他,因为他的错误得到了掌声并成为了历史的一部分 - 哥伦布把美洲原住民错当成了印第安人,因为他认为他已经登陆亚洲而不是美洲。虽然我的……
陆勤 2018-08-27
让大数据创造大价值
大数据是信息化发展到一定阶段的产物。随着信息技术和人类生产生活深度融合,互联网快速普及,全球数据呈现爆发增长、海量集聚的特点,对经济发展、社会进步、国家治理、人民生活都产生了重大影响。习近平同志在中共中央政治局就实施国家大数据战略进行第二次……
数商 2018-08-22
信用评分卡:模型验证
> 过上你的生活只有两种方式。 一个好像什么都不是奇迹。 另一个就好像一切都是奇迹。- 艾尔伯特爱因斯坦 好奇心评论 我认为欣赏和享受琐事的最佳方式是旅行。当我说琐碎的时候,它包括门把手,海报,信箱,涂鸦以及我们从未在我们自己的城市中转过头……
陆勤 2018-08-21
大数据公司挖掘数据价值的49个典型案例
对于企业来说,100条理论确实不如一个成功的标杆有实践意义,本文的主旨就是寻找“正在做”大数据的49个样本。 本文力图从企业运营和管理的角度,梳理出发掘大数据价值的一般规律:一是以数据驱动的决策,主要通过提高预测概率,来提高决策成功率;二是……
数商 2018-08-14
信用评分卡总结
> 由于工作缘故,需要研究,设计,建置,监控和优化信用评分卡。本文对于信用评分卡相关工作进行总结和归纳,以方便后续学习和升级。 背景与意义 术语及概念 信用:意指一个人能够先取得金钱或是商品,日后再行付款的限度。 征信:Credit Ch……
陆勤 2018-08-13
7篇重要的数据科学论文
这是回到学校的时间,这里有一些论文让你在这个学年忙碌。 所有论文都是免费的。 这份清单远非详尽无遗,但这些是数据科学和大数据方面的一些重要论文。 谷歌搜索 [PageRank](http://ilpubs.stanford.edu:809……
陆勤 2018-07-21
信用评分的统计应用
> 编者按:本文介绍利用统计学解决信用评分问题 [TOC] 概述 信用评分可能是预测模型中最“经典”的应用之一,用于预测申请人的信贷是否可能导致贷款机构的获利或者受损。为各种目的(购买设备,房地产,消费品等)的个人,企业和其他组织如何准确地……
陆勤 2018-07-21