in Vector Space [ https://arxiv.org/pdf/1301.3781.pdf ] , 并且开源了代码,作用是将所有词语投影到K维的向量空间,每个词语都可以用一个K维向量表示...1、传统的词表示 — one-hot representation
这种方法把每个词表示为一个很长的向量。...这样的表示方法简单容易理解,而且编程也很容易实现,只需要取对应的索引就能够完成,已经可以解决相当一部分NLP的问题,但是仍然存在不足,即词向量与词向量之间都是相互独立的;我们都知道,词与词之间是有一定的联系的...利用这一个正例和neg个负例,我们进行二元逻辑回归(可以理解成一个二分类问题),得到负采样对应每个词wi对应的模型参数以及每个词的词向量。...输入层到投影层是把输入层的所有向量进行加和给投影层,比如,输入的是三个4维词向量:(1,2,3,4),(9,6,11,8),(5,10,7,12),那么我们word2vec映射后的词向量就是(5,6,7,8