因果推断(十六)--直接效应和间接效应

咱们先通过一个例子来引出今天的话题。大家一直怀疑避孕药会在女性的身体形成血栓,同时还能降低怀孕率。怀孕又对血栓的形成具有负面的作用(怀孕导致血栓的形成。)所以如果我们想要探索避孕药和血栓形成的关系仅仅通过控制中间变量怀孕是不足够看清楚关系的。必须要对那些使用避孕药之前就怀孕的,以及通过非药物手段进行避孕的女性进行研究。详细的说是通过条件化中间变量(怀孕),即使避孕药和血栓形成没有直接效应,也可能产

因果推断(十四)--d分离和准则

本文介绍一下因果图中最经典的概念,d分离和前门准则和后门准则。d分离d分离在概率图中用来判断变量独立的一个很有效的方法,下面来看看D分离的定义。当路径p被结点集Z,d-分离(或被blocked掉)时,当且仅当以下条件成立: 1. 若p包含形式如下的链i->m->j 或i<-m->j,则结点m在集合Z中。2. 若p中包含collider(碰撞点)i->m<-j,则

推荐搜索之兴趣学习汇总

DISN有用户历史行为虽然好,但是也需要节制。把用户的行为序列先分片(session) 能过滤掉一些噪声序列。DSIN 针对 DIN 和 DIEN 没有考虑用户历史行为中的 Session 信息,因为每个 Session 中的行为是相近的,而在不同 Session 之间的差别很大,它在 Session 层面上对用户的行为序列进行建模;MIMNMIMN算是本系列中,用户长期行为序列建模的开端,既然是

推荐搜索之LR+GBDT

FFM 模型采用引入特征域的方式增强了模型的特征交叉能力,但无论如何, FFM 只能做二阶的特征交叉,如果继续提高特征交叉的维度,会不可避免地产生 组合爆炸和计算复杂度过高的问题。那么就引入今天要说的新的模型趋势LR+GBDTLR+GBDT模型的结构如图1所示。用 GBDT 构建特征工程,利用 LR 预估 CTR 这两步是独立 训练的,所以不存在如何将 LR 的梯度回传到 GBDT 这类复杂的问题

贝叶斯网络(四)--完整数据集下的参数学习

本节主要讲完整数据集下的参数学习, 在贝叶斯网络中参数就是计算路径概率的时候,每条连边的概率。对于这个概率主要有两种做法,这一种是 频率学派, 一种贝叶斯学派。频率学派这种方法是最容易理解和做的,直接调过证明过程,看一个小例子。看如图1的概率关系。MFRm0m_{0}m0​badOm0m_{0}m0​badOm0m_{0}m0​badOm0m_{0}m0​badOm0m_{0}m0​badNm0m

贝叶斯网络(三)--完整数据集下的结构学习

上一个章节中,讲到了贝叶斯网络常用的评分函数,本节主要讲下搜索的算法,搭配上搜索算法,对于贝叶斯网络的结构学习就完整啦。贝叶斯网络的结构学习问题是一个NP-hard问题,所以实际上计算中并不是对所有的结构分别计算并且评分的,而是采用搜索算法按照某种评分在可能的拓扑结构中进行搜索来获取结构。最基本的搜索算法是启发式的局部搜索算法,主要是K2搜索,Hill-climbing算法、随机重复爬山算法、禁忌

贝叶斯网络(二)--完整数据下结构学习

本节介绍在完整数据集合下如何来构建概率图的模型。主要分为两个部分,一部分是结构的学习,一部分是参数的学习。结构学习基于评分-搜索的结构学习基于评分-搜索的结构学习主要有两部分组成,就是评分函数和搜索算法。常用的评分函数有BDe评分函数。MDL评分函数和BIC评分函数,搜算法包括启发式局部搜索算法和全局搜索算法。BDe评分函数基于BDe评分函数的结构学习是以贝叶斯统计学为理论基础的,主要的思想是假设

贝叶斯网络(一)--有向网络结构

贝叶斯网络一般是指带有概率信息的有向无环图。贝叶斯网络的信息有两部分组成。首先是表示独立信息的一个网络结构S,S中每个节点表示特定域中的一个概念或者变量,节点间的弧表示了可能的因果关系,体现了域知识的特征。其次每个节点都负有一个与该变量相联系的概率分布函数(CPD), 如果概率是离散的,那么在给定了父母节点的时候取不同值的条件概率表(CPT).CPT体现了域知识的定量方面的特征。可见,贝叶斯网络是

贝叶斯网络(零)--概率图网络框架

本节主要介绍为贝叶斯网络网络开个头,介绍一些名词和背景知识。贝叶斯网络对于概率图而言是一个很大的话题,以边的属性作为区分可以分为两种模型,有向图模型和无向图模型。其中无向图称为马尔可夫网络,视觉领域有比较大的应用,而有向图也就是BN(belief network).当然也有无向图和有向图相结合的网络,称为链图(Chain graph)。图1给出了一个完整的架构,当然这些模型具有一定的转换性,通过降

因果推断(十三)--因果发现框架

本章节中咱们来聊聊如何发现一个因果结构,先给出因果的框架长成什么样子。一组变量V的因果结构是一个有向无环图,其中每个节点对应的V的一个变量,每个连接表示对应变量之间的直接函数关系。

因果推断(十二)--贝叶斯网络

之前的章节中咱们已知介绍给定因果图关系以后如何分析图中各个因素之间的关系,对撞路径等等。今天这篇文章中咱们主要介绍一下贝叶斯网络的雏形,开启因果推断的核心区域的探索。条件独立与图咱们在训练模型的时候经常会说条件变量独立,或者是独立同分布这样的名词,那么条件独立怎么在因果中使用并且怎么给出一个比较客观的定义呢?令V={V1,V2...}V=\{V_{1}, V_{2}...\}V={V1​,V2​.

时间序列预测(六)--时序预测概率分布应用

大家一定知道,所有的预测永远不可能把误差控制到0,所以当已知这样的预测结果,如何尽可能的提升可用度呢?咱们举个例子销量预测这是一个十分简单的问题,业务通过预测接来下一段时间内的销量变化,从而尽可能小的损失维持一个库存水平。先描述一下咱们面临的问题。日销量 给定参数μ\muμ, σ\sigmaσ, 商品的日销量独立且服从正态分布N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2)仓库容量 W
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×