自然语言处理之seq2seq+attention

seq2seq处理人工翻译的时候会有一个问题,就是当句子特别长的时候问你会发现翻译的效果并不是特别好,至于原因呢就是seq2seq学习的时候对信息遗忘严重,为了解决这个问题,就有研究者提出了加入Attention的机制来解决这个问题,核心就是我们在解决一个问题的时候只关注某些关键信息就够了,并不要全

RNN代码拆解

rnn对于一些初学者来说被当成直接跳过的内容,因为如果需要使用RNN,那还不如直接用LSTM,好吧这个思路貌似也没什么问题,但是对于学习这件事情来讲的话,其实RNN是一个新型的网络结构,跳出神经网络的那个固定模式的开始,对大家学习还是有百利而无一害的。拆了的RNN[RNN]的经典过程本站也做过讲解,可以跳转过去看看完全的RNN样子,本节就是要将这一结构拆开来看的。上图就是其中一个RNN结构,初始化

自然语言处理之NGram模型

NativeBayes我们首先考虑在原始的数学模型中,我们怎么分析一句话的语义信息呢?我们来举个例子澳门赌场日赚百万这是垃圾短信的其中一句话,如果我们想训练一个模型来识别所有的垃圾短信,会是怎么样的抽象呢?由条件独立性假设:$$p(澳门赌场日赚百万∣J)=p(澳,门,赌,场,日,赚,百,万∣J)=p

自然语言处理之doc2vec和str2vec

本节我们还来讲nlp的相关的东西,我们刚刚讲解了如何将word转化为一个vector,其实我们还是没有对语序做一个很好的应用,例如 我给你一个苹果和你给我一个苹果,意义上完全不同,但是识别的时候可能关键词十分相似。所以我们正好讲讲doc2vec的算法,如何充分利用语序信息的。谷歌的工程师提出了DM模型和DBOW模型,其实就是对应咱们word2vec中的CBOW和Skip-gram模型DM(Dist

自然语言处理之关键字提取

关键字提取对于关键字提取算法最经典的就是[TF-IDF]算法,这个我们已经有文章来讲解这个知识,我们来介绍一点不太一样的知识。textRankTF-IDF算法就是统计某个词在某些文档中的出现频率,这远远是不够的,而主体模型的关键字提取则是通过大量的文档学习发现主题的文档的隐含主题。textRank最

自然语言处理之分词

分词自然语言处理是机器学习领域比较通用的方向,可以和推荐、图像相提并论啦,本系列的博客就就围绕自然语言处理介绍一些相关概念,可以给初学者提供一个学习的地方。中文分词和英文分词有着极大的不同,英文会有空格进行分开,但是中文不仅没有相应的分隔符,甚至歧义也是常有的事情,就如下面这个例子。南京市长江大桥这

图像算法--目标检测

目标检测基础目标检测算法主要分为两种,一种是one-stage检测算法,一种是two-stage检测算法。而对于two-stage检测算法来讲第一步是进行区域分割,然后第二步才是分类,代表方法有RCNN算法。而one-stage检测算法一般有YOLO和SSD算法。Selectivesearch和RC

图像算法--图像分割(Otsu算法)

Otsu算法图像分割是一个经典的图像任务,Otsu算法是借用图像的灰度值,计算几个阈值,然后起到分割图像的作用。本文介绍的Otsu算法常用于基于图像分割的聚类。该算法的理论依据是:假定图像包含两类像素(前景像素和背景像素),直方图为双峰直方图,然后计算使得两类像素能分开的最佳阈值(类内方差),或等价

轨迹挖掘(二)--ta算法

背景介绍本文算法会解决一个在交通领域的问题,在路网中每天都有一些路段会临时施工和封路,如何无监督的利用现有特征快速发现这些路段是一个比较重要的问题,本文带着这个问题将会介绍一个基于路网异常数据的算法讲解,希望能对大家有些帮助。首先我们来介绍下这个背景,在交通领域中有一个比较棘手的问题就是如何快速发现

数学之凸优化(四)

#线性规划前面铺垫了不少,接下来咱们来看看都怎么解这一堆方程。矩阵概念1.如果矩阵E是由单位阵I经过交换矩阵的两行得到的,就是第一类矩阵2.如果E是由单位阵乘以一个数得到,就叫做第二类矩阵3.如果E是由单位阵乘以一个数再加到另一行得到的,就叫做第三类矩阵。定理:对一个矩阵进行第一类、第二类、第三类变

数学之凸优化(三)

#线性规划本节开始我们就来讲解线性规划问题。看看我们该如何解决带有条件约束的最优解问题。线性规划简单例子先从实际问题出发,让我们来了解一下我们将要解决的那种问题?某制造商生产四种不同的产品,分别用X1,X2,X3,X4来表示,生产过程需要三种原料,其中工作人数和原料等参数如下表,问题当然就是如何保证

数学之凸优化(二)

#梯度本节我们来讲梯度方法,非常常用的最优化方法。这个概念我们应该都是理解的,梯度就是一个方向,就是$f(x)$变化最大的方向,沿着这个方向,我们更加可能获取一个极值。下面介绍一种梯度下降的方法最速下降法追速下降法是梯度方法的一个具体实现,其理论为每次迭代中选择合适的步长使得目标函数能够最大程度的减
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×