因果推断(零)--辛普森悖论

这个系列我们来介绍一下因果推断,这个时候第一反应应该是因果推断是什么呢?解决什么问题的呢?咱们举几个例子来说明下,例如你会不会经常有这样的疑问?读博士能增加收入吗?如果能增加增加多少呢?其实这其中就包含了因果推断的内容,表面你是抛出了一个疑问,其实你是想了解读博士和收入增加有没有因果关系,“别人家的孩子”的成就中,读取博士到底与他们的生活有多大关系。是不是因为读取了博士才能收入高高。废话了这么多,

xgboost(五) -- 与其他模型融合

之前我们讲了很多xgboost的特性用法等等,接下来我们需要回答的一个问题是xgboost能够与其他模型融合吗?怎么融合?xgboost和DNN模型融合当我们使用xgboost的时候经常会发现,很多场景下我们只用xgboost模型的效果就能够达到一个最佳的效果,使用深度神经网络反而没有xgboost的效果好,这个经常让我们十分头疼,我想做点更nb的东西逻辑就这么难吗?其实个人认为xgboost效果

运筹规划(五)-目标规划

之前我们介绍的大部分方法都是一个目标函数,但是在我们的实际生活中往往很多问题都是有多个目标的问题,要么我们通过加权平均形成一个综合的目标函数,要么就是将问题抽象成一个多目标优化的问题,本章将会介绍这个方法,目标规划。银行投资问题每个投资者在决定如何分配可用的资本的时候需要权衡收益和风险。一般来讲能承诺最高回报的投资机会总是伴随着极大的风险。商业银行在平衡收益和风险尤其谨慎。因为法律和伦理道德要求它

运筹规划(四)-线性规划

线性模型总是比非线性模型更加受欢迎,非线性模型通常是无法避免的,这里我们来介绍一些能够将非线性模型转化为线性模型的例子。通常我们遇到的非线性模型一般有极大化极小,极小化极大,以及最小化偏差。高速公路巡逻队这是一个真实的资源分配问题,巡逻队希望把巡逻员分配到不同的高速公路上,以最大限制的降低超速。下表列出了可用的数据,为了方便记忆。$j$表示高速公路的路段号。12345678巡逻员人数上限,$u_j

xgboost(四) --线性模型

XGBoost不仅实现了以CART为基础的树模型,还实现了一个以ElasticNet和并行坐标下降为基础的线性模型,此时XGBoost相当于一个同时带有L1正则和L2正则的逻辑回归(分类问题)或者线性回归(回归问题)。通过对前面章节的学习,我们对XGBoost的树模型有了一个比较深入的理解。本节将介绍XGBoost线性模型的实现原理。ElasticNet回归在统计学模型中,回归分析是评估变量间关系

xgboost(三) -- 排序模型

RankNet是一种pairwise的排序方法,它将排序问题转换为比较$<d_{i},d_{j}>$对的排序概率问题,即比较$d_{i}$排在$d_{j}$前面的概率。RankNet提出了一种概率损失函数来学习排序模型,并通过排序模型对文档进行排序。这里的排序模型可以是任意对参数可微的模型,如增强树、神经网络等。

运筹规划(三)-线性规划

排班和人员规划模型运营规划模型是用于决策生产工作的安排以有效的使用可用资源。在拍板模型中,工作量给定的前提下,我们需要规划完成这些工作的资源投入。特别的,我们必须决定不同类型的员工数量,以保证完成所有的工作量。同样的,线性规划模型解决这类问题的有效工具。俄亥俄国家银行的排班规划俄亥俄国家银行(ONB)的支票处理中心遇到了人员的工作分配问题。银行收到的支票已经印有账号和其他经过加密的识别信息。支票处

xgboost(零)--使用基础

xgboost是非常常用的机器学习框架,本章我们仅仅从应用角度来讲,xgboost到底能干什么,通过其他文章我们再了解它是怎么做的,这个也比较符合我们的认知过程,能干什么和怎么干。二分类问题84,051

运筹规划(二)-线性规划

如果一个优化模型的决策变量是连续,具有单一线性目标函数,而且所有约束都是关于决策变量的线性等式或是不等式,那么该优化模型称为线性规划。资源分配模型资源分配问题是一类简单、应用广泛的线性规划。其核心是在资源有限的情况下,如何将资源分配给彼此竞争的需求,从而实现资源的优化配置。这些资源可以是所有的有限资源。时间分配问题本学期,小明选修了运筹学、工程经济学、统计学和材料学4门功课。他一共有30个小时的复

xgboost(二)之Gradient Boosting

由前述内容可知,XGBoost是由多棵决策树(即CART回归树)构成的,那么多棵决策树是如何协作的呢?此时便用到了Boosting技术。Boosting的基本思想是将多个弱学习器通过一定的方法整合为一个强学习器。在分类问题中,虽然每个弱分类器对全局的预测准确率不高,但可能对数据某一方面的预测准确率非常高,将很多局部预测准确率非常高的弱分类器进行组合,即可达到全局预测准确率高的强分类器的效果。Ada

xgboost(一)之cart树

最近因为工作原因,需要重新回顾xgboost,原来我个人也仅仅限制于使用,没有过多总结,借着这次机会,正好回顾一下这款神器。提到xgboost就必须要提一下cart树,这个是xgboost的基本组成单元。cart树之前微博中提到决策树,可能包括ID3和cs4.5这些算法,其实cart树和这些算法没有什么本质的区别,都是找到一些分割点,然后构建决策树,这里我们主要介绍一下cart的细节,其实这个也是

自然语言处理之表示学习

什么是表示学习呢?说白了就是特征,机器学习算法的性能严重依赖特征。如果存在一种可以从数据中的到和判别特征的方法们就会减少机器学习对特征工程的依赖,这就是表示学习。离散表示这里虽然咱们单独拿出来讨论,但是其实特征的离散表示十分简单,就是独热编码,但是独热编码的缺点也是十分明显的。在向量空间中,所有的对
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×