深度学习的能与不能
2018(第九届)清洁发展国际融资论坛上,北京交通大学人工智能研究院常务副院长、教授于剑先生从专业角度回顾了人工智能的发展历程,并介绍了深度学习的适用范围和所面临的问题。他指出,深度学习是机器学习领域最引人注目的研究方向,但没有任何一种算法……
数据跨界 2018-08-29
数据分析综述
提起数据分析,大家往往会联想到一些密密麻麻的数字表格,或是高级的数据建模手法,再或是华丽的数据报表。其实,“ 分析 ”本身是每个人都具备的能力;比如根据股票的走势决定购买还是抛出,依照每日的时间和以往经验选择行车路线;购买机票、预订酒店时,……
数商 2018-08-19
机器学习Python教程:3K近邻分类器
K 近邻分类器 “告诉我你的朋友是谁,我来告诉你你是谁?” k近邻分类器的概念是很难简单描述的。这是一句古老的谚语,可以在许多语言和文化中找到。圣经中也有这句话:“与智慧人同行的人是有智慧的,与愚人同行的人是有害的。”(箴言13:20) ……
陆勤 2018-08-02
机器学习Python教程:2机器学习术语
分类器 将未标记的实例映射到类的程序或函数称为分类器。 混淆矩阵 混淆矩阵,也称为关联表或错误矩阵,用于可视化分类器的性能。 矩阵的列表示预测类的实例,行表示实际类的实例。(注意:也可以反过来。) 对于二进制分类,表有两行两列。 例如: ……
陆勤 2018-08-02
机器学习Python教程:1机器学习
>编者按:机器学习Python教程,一份有价值的英文版Python玩机器学习的资料。数据人网进行翻译,分享和传播。希望更多的数据人,可以利用Python这个工具和机器学习这个方法论从数据中学习到知识,以创造商业价值。 机器学习是一种编程,……
陆勤 2018-08-02
十个例子,教你用统计学方法高效完成机器学习项目
统计学和机器学习是两个联系特别紧密的领域。 事实上,这两者的界限有时候非常模糊。然而有一些明显属于统计学领域的方法,不仅可用于机器学习的项目,并且极具价值。 公平地说,需要统计学方法来有效地完成机器学习预测建模项目。 在这篇博客中,你会了解……
数商 2018-07-26
如何在信用评分中使用机器学习
许多金融机构使用评分模型来降低信用评估的信用风险,以及授信和监管信贷。 基于经典统计理论的信用评分模型被广泛使用。 但是,当涉及到大量的数据输入时,这些模型的弹性较小; 因此,经典统计分析中的一些假设失败了。 这会影响预测和模型一般化的准确……
陆勤 2018-06-08
机器学习算法的优点和缺点
从Logistic回归开始,然后尝试Tree Ensembles和/或Neural Networks。 奥卡姆的剃刀原理:使用最简单的算法,可以满足您的需求,并且只有在严格需要的情况下才用更复杂的算法。 根据我自己的经验,只有神经网络和梯度……
陆勤 2018-05-27
给非开发人员介绍机器学习
关于机器学习 我们都知道机器学习是关于处理数据的,但它也可以被看作是: >通过浏览数据内部信息来查找数据中的规律的艺术。 预测模型的一些背景 有几种类型的预测模型。 这些模型通常有几个输入列和一个目标或结果列,这是要预测的变量。 所以基本……
陆勤 2018-05-26
机器学习之 Anomaly Detection 异常检验
前言 现实生活中异常检测的应用非常广泛,作为机器学习算法的一种常见应用,从银行安全到自然科学,从药学到营销,从金融工程到计量经济学,都能看到它的踪影,在今天数据领域爆炸式发展的时刻,异常检测更是人工智能一种形式的体现。 异常检验是一种很有特……
tensorflow高质量资料汇总
>tensorflow高质量资料,让您又快又好地学习和应用tensorflow。 本文汇总tensorflow的高质量资料,包括:文档、论文、书籍、课程和案例。 1 文档 1 [Getting Started With TensorFlow……
陆勤 2017-11-18
tensorflow工作环境搭建
>要掌握tensorflow,首先要搭建好tensorflow工作环境 本文介绍tensorflow工作环境搭建步骤。 1 下载和安装Python3.6 Python3.6下载链接: https://www.python.org/downl……
陆勤 2017-11-17
tensorflow系列文章
tensorflow是谷歌公司设计和开发的深度学习开源框架。 本文总结和记录tensorflow相关的内容。 1 tensorflow工作环境搭建 2 [tensorflow高质量资料汇总](http://shujuren.org/art……
陆勤 2017-11-17
代价函数
代价函数,度量【假设集】的准确性。 机器学习中常用的代价函数,总结如下: 1 误差平方和函数 说明:yi 是模型预测值,oi是样本实际值 2 交叉熵函数 说明: n是批量训练的样本大小 W是模型f的参数 f函数表示xi样本预测为标签l……
陆勤 2017-11-05
有监督学习和无监督学习
一般情况下,机器学习分为有监督学习和无监督学习。 有监督学习 监督学习是指数据集的正确输出(right output)已知的情况下一类学习算法。因为输入和输出已知,意味着输入和输出之间有一个关系,监督学习算法就是要发现和总结这种“关系”。……
陆勤 2017-10-28