原创 Hadoop学习路线
Hadoop学习路线 一、Hadoop入门,了解什么是hadoop 1、Hadoop产生背景 2、Hadoop在大数据、云计算中的位置和关系 3、国内外Hadoop应用案例介绍 4、国内Hadoop的就业情况分析及课程大纲介绍 5、分布式……
转载 未来的人工智能解决方案
2016年5月,在题为《为人工智能的未来做好准备》的白宫博客文章中,时任总统奥巴马说道: “当今的人工智能(AI)局限于狭隘的特定任务,不具备人类所表现出的普适智力。尽管如此,AI对世界的影响力越来越大。我们目睹的AI进步之快,将对医疗、图……
转载 如何成功实现数据治理
如果你处理过大量数据,你也许听说过“数据治理”一词,你可能会想,它是什么?适不适合你?如何实施?简单来说,数据治理就是处理数据的策略——如何存储、访问、验证、保护和使用数据。数据治理包括制定获取方案:谁能访问、使用和共享你的数据。 这些问……
原创 数据话题:互金行业的数据质量问题与解决方案?
数据话题,让数据人深度思考、深度认知和深度实践。 本次数据话题:互金行业的数据质量问题与解决方案? 话题关键词:互金行业 数据质量 问题 解决方案 [TOC] 1 互金行业是什么?有哪些表现形式? 2 互金行业的数据有哪些主题?……
转载 数据正在催生的新经济
市场研究公司IDC预测,到2025年,“数字宇宙”(每年创建并复制的数据)的规模将达到180泽字节(180后面再跟21个零)——若用一根上网宽带来传输,450年都传不完。为加速数据中心的运转,电子商务巨头亚马逊(其云计算分支正迅猛发展)动用……
翻译 6个套路入门ML:用鸢尾花data建立python机器学习的初步印象(二)
(五)用一些算法进行估计 重点地方到了,机器学习开始发挥作用了。 这部分包括:1、对数据集进行分离(分为训练集、验证集等);2、采用10倍交叉验证设置测试机制;3、根据鸢尾花测量维度构建5种不同模型来预测其种类;4、选择最佳模型 5.1 建……
翻译 6个套路入门ML:用鸢尾花data建立python机器学习的初步印象(一)
注:这是一篇翻译文章,来自于 Your First Machine Learning Project in Python Step-By-Step - Machine Learning Mastery,标题为《Your First Mach……
原创 R做机器学习简易教程
作者:陆勤 本文介绍如何利用R语言做一个完整的机器学习项目。一个小项目,端到端,遵循机器学习的实施的工作流,系统地完成项目。 [TOC] 1 搭建R机器学习环境 搭建R机器学习环境是一件简单而有趣的事情。 1.1 R软件下载和安装 R语言是……
原创 数据话题:数据分析师的职业生涯?
数据话题,让数据人深度思考、深度认知和深度实践。 本次数据话题,数据分析师的职业生涯? 话题关键词:数据分析师、职业生涯 [TOC] 1 数据分析师的本质是什么? 2 职业生涯是什么? 3 数据分析师如何设计和规划职业生涯? 您在阅读中,……
原创 Python做机器学习的书籍介绍
作者:陆勤 如何学习和应用Python做机器学习,阅读一些Python做机器学习的好书,是一件值得投入的事情。 本文介绍Python做机器学习的一系列好书。 第一本书: 第二本书: 第三本书: 第四本书: 您在阅读中,有什么建议或者想法,……
原创 数据话题:深度学习如何解决金融风控问题?
数据话题,让数据人深度思考、深度认知和深度实践。 本次数据话题,深度学习如何解决金融风控问题? 话题关键词:深度学习、金融、风控问题 [TOC] 1 深度学习是什么? 2 金融是什么? 3 风控是什么? 4 深度学习为什么可以用来解决金融……
原创 Hadoop是什么?它是学习大数据钥匙
有人认为 hadoop 正在失败,但硅谷数据管理公司 Hortonworks 的总经理 Vamsi K. Chemitiganti 并不这么看,为了反驳此前一篇文章《为什么 Hadoop 正在消亡?(Why Hadoop is Failin……
原创 Python做机器学习简易教程
作者:陆勤 Python是机器学习实现和应用的常用和流行语言。 本文是一份Python做机器学习的简易教程,以一个端到端的完整机器学习项目为案例,使用Python实现项目各个环节中的具体任务。 [TOC] 1 搭建环境 第一步:推荐安装[……
原创 python调用百度地图API实现经纬度换算、热力地图全流程指南
基于地图的数据可视化应用愈来愈广泛,目前,有很多方法来实现地图可视化,包括excel的power map包、各种数据分析软件的地图库以及在线交互地图可视化操作工具,如Echarts、Tableau Public、polyMaps等等。另外还……
原创 Python做机器学习的生态系统
作者:陆勤 如何利用Python做机器学习?本文总结Python做机器学习的生态系统,换句话说,Python做机器学习的相关库分别是什么和怎么使用? 您在阅读中,有什么建议或者想法,请留言。 想加入数据人圈子,请加微信luqin360。 ……
原创 Python机器学习库:Scikit-Learn
作者:陆勤 Scikit-Learn是Python机器学习库,是一个活跃的、易用的、经典的Python库。 本文总结Scikit-Learn库基本知识。 [TOC] 1 Scikit-Learn库的来源? 2007年,scikit-le……