我有一个使用Pytorch0.4.0的逻辑回归模型,其中我的输入是高维的,并且我的输出必须是标量- 0、1或2。我使用线性层和softmax层相结合来返回n x 3张量,其中每一列表示输入落入三个类别(0、1或2)之一的概率。但是,我必须返回一个n x 1张量,因此我需要以某种方式为每个输入选择最高的概率,并创建一个张量来指示哪个类具有最高的概率。如何使用
在变压器模型中,存在自我注意,这是使用softmax对Query (Q)和Key (K)向量进行计算的:Q = batch_size x seq_length x embed_sizeK = batch_size x seq_length x embed_size
Softmax QK^T= Softmax (batch_size x seq_length x seq_