首页
学习
活动
专区
圈层
工具
发布

第三章(1.6)tensorflow cross_entropy 四种交叉熵计算函数

:本质上是不用的参数,不用填 labels:一个和logits具有相同的数据类型(type)和尺寸形状(shape)的张量(tensor) shape:[batch_size,num_classes],...(_sentinel=None, labels=None, logits=None, dim=-1, name=None) _sentinel:本质上是不用的参数,不用填 labels:每一行labels...[i]必须是一个有效的概率分布,one_hot=True(向量中只有一个值为1,其他值为0) logits:labels和logits具有相同的数据类型(type)和尺寸(shape) shape:[batch_size...=None) 计算具有权重的sigmoid交叉熵sigmoid_cross_entropy_with_logits() _sentinel:本质上是不用的参数,不用填 labels:一个和logits具有相同的数据类型...1 - labels) * -log(1 - sigmoid(logits)) qrcode_for_gh_0e76b0fa8d4e_258 (2).jpg

1.6K50
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Transformers 4.37 中文文档(六十九)

    返回的 logits 不一定与作为输入传递的pixel_values具有相同的大小。这是为了避免进行两次插值并在用户需要将 logits 调整为原始图像大小时丢失一些质量。...返回的 logits 不一定与作为输入传递的pixel_values具有相同的大小。这是为了避免进行两次插值并在用户需要将 logits 调整为原始图像大小时丢失一些质量。...logits(形状为(batch_size, config.num_labels)的tf.Tensor)— 分类(如果config.num_labels==1则为回归)得分(SoftMax 之前)。...返回的 logits 不一定与作为输入传递的pixel_values具有相同的大小。这是为了避免进行两次插值并在用户需要将 logits 调整为原始图像大小时丢失一些质量。...返回的 logits 不一定与作为输入传递的`pixel_values`具有相同的大小。

    55210

    Transformers 4.37 中文文档(二十九)

    logits(形状为(batch_size, config.num_labels)的torch.FloatTensor)—分类(如果 config.num_labels==1 则为回归)得分(SoftMax...DeBERTa 模型在顶部具有用于提取式问答任务(如 SQuAD)的跨度分类头(在隐藏状态输出的线性层上计算跨度起始 logits和跨度结束 logits)。...参数 input_ids(np.ndarray,tf.Tensor,List[tf.Tensor],``Dict[str, tf.Tensor]或Dict[str, np.ndarray],每个示例必须具有形状...logits(形状为(batch_size, config.num_labels)的tf.Tensor)— 分类(如果config.num_labels==1则为回归)得分(SoftMax 之前)。...参数 input_ids(np.ndarray、tf.Tensor、List[tf.Tensor]、Dict[str, tf.Tensor] 或 Dict[str, np.ndarray],每个示例必须具有形状

    85910

    Transformers 4.37 中文文档(九十二)

    loss (torch.FloatTensor,形状为(1,),可选,当提供labels时返回)) — 总损失,作为类别预测的负对数似然(交叉熵)和边界框损失的线性组合。...必须向模型提供输入(可以是文本、图像、音频等),模型将使用这些输入与潜在变量进行交叉注意力。Perceiver 编码器的输出是相同形状的张量。...感知器编码器的多模态预处理。 对每个模态进行预处理,然后使用可训练的位置嵌入进行填充,以具有相同数量的通道。...logits(形状为(batch_size, num_labels)的torch.FloatTensor)- 分类(如果 config.num_labels==1 则为回归)得分(SoftMax 之前)...logits(形状为(batch_size, config.num_labels)的torch.FloatTensor) — 分类(如果config.num_labels==1则为回归)分数(SoftMax

    62210

    Transformers 4.37 中文文档(六十四)

    为了确保内核成功编译,用户必须安装正确版本的 PyTorch 和 cudatoolkit。...logits(形状为(batch_size, config.num_labels)的torch.FloatTensor) — 分类(如果 config.num_labels==1 则为回归)得分(SoftMax...YOSO 模型在顶部具有用于提取问答任务(如 SQuAD)的跨度分类头(在隐藏状态输出顶部的线性层上计算span start logits和span end logits)。...由于 BEiT 模型期望每个图像具有相同的大小(分辨率),可以使用 BeitImageProcessor 来调整(或重新缩放)和规范化图像以供模型使用。...返回的 logits 不一定与作为输入传递的pixel_values具有相同的大小。这是为了避免进行两次插值并在用户需要将 logits 调整为原始图像大小时丢失一些质量。

    33510

    Transformers 4.37 中文文档(二十八)

    原始实现可在此处找到:github.com/TsinghuaAI/CPM-Generate CPM 的架构与 GPT-2 相同,除了分词方法。有关 API 参考信息,请参阅 GPT-2 文档。...logits (torch.FloatTensor,形状为 (batch_size, config.num_labels)) — 分类(如果 config.num_labels==1 则为回归)分数(SoftMax...logits(形状为(batch_size, config.num_labels)的tf.Tensor) — 分类(如果 config.num_labels==1 则为回归)得分(SoftMax 之前)...DeBERTa 模型在顶部具有用于提取式问答任务(如 SQuAD)的跨度分类头(在隐藏状态输出的线性层上计算span start logits和span end logits)。...loss(形状为(1,)的torch.FloatTensor,可选,当提供labels时返回)- 总跨度提取损失是起始位置和结束位置的交叉熵之和。

    51310

    Transformers 4.37 中文文档(七十一)

    最重要的预处理步骤是将图像和分割图随机裁剪和填充到相同大小,例如 512x512 或 640x640,然后进行归一化。...logits(形状为(batch_size, config.num_labels)的torch.FloatTensor)— 分类(或回归,如果config.num_labels==1)得分(SoftMax...返回的 logits 不一定与传入的pixel_values具有相同的大小。这是为了避免进行两次插值并在用户需要将 logits 调整为原始图像大小时丢失一些质量。...logits(形状为(batch_size, config.num_labels)的tf.Tensor)— 分类(如果config.num_labels==1则为回归)得分(SoftMax 之前)。...返回的对数不一定与作为输入传递的 pixel_values 具有相同的大小。这是为了避免进行两次插值并在用户需要将对数调整为原始图像大小时丢失一些质量。

    74910

    Transformers 4.37 中文文档(九十四)

    queries (str 或 List[str]) — 与要编码的表格相关的问题或问题批次。请注意,在批处理的情况下,所有问题必须引用相同的表格。...Tapas 模型具有用于表格问答任务的单元选择头和可选的聚合头(用于计算 logits 和可选的 logits_aggregation 的隐藏状态输出上的线性层),例如用于 SQA、WTQ 或 WikiSQL...logits (tf.Tensor,形状为 (batch_size, config.num_labels)) — 分类(或者如果config.num_labels==1则为回归)得分(SoftMax 之前...损失 (tf.Tensor 的形状为 (1,), 可选的, 当提供 labels(可能还有 answer, aggregation_labels, numeric_values 和 numeric_values_scale...损失 (tf.Tensor 的形状为 (1,), 可选的, 当提供 labels(可能还有 answer, aggregation_labels, numeric_values 和 numeric_values_scale

    59810

    Transformers 4.37 中文文档(六十三)

    logits(形状为(batch_size, config.num_labels)的torch.FloatTensor)- 分类(如果 config.num_labels==1 则为回归)得分(SoftMax...如果将 use_mems_train 设置为 True,则必须确保训练批次已正确预处理,例如 batch_1 = [[This line is], [This is the]] 和 batch_2 =...logits (形状为(batch_size, config.num_labels)的 tf.Tensor) — 分类(如果 config.num_labels==1 则为回归)分数(SoftMax 之前...XLNet 模型在顶部具有一个用于提取式问答任务(如 SQuAD)的跨度分类头(在隐藏状态输出的顶部有线性层,用于计算 span start logits 和 span end logits)。...XLNet 模型在顶部具有用于提取式问答任务(如 SQuAD)的跨度分类头(在隐藏状态输出的线性层上计算span start logits和span end logits)。

    56810

    Transformers 4.37 中文文档(七十)

    logits(形状为(batch_size, config.num_labels)的torch.FloatTensor) — 分类(如果 config.num_labels==1 则为回归)分数(SoftMax...返回的 logits 不一定与作为输入传递的 pixel_values 具有相同的大小。这是为了避免进行两次插值并在用户需要将 logits 调整为原始图像大小时丢失一些质量。...logits(形状为(batch_size, config.num_labels)的torch.FloatTensor)— 分类(如果config.num_labels==1则为回归)得分(SoftMax...logits(形状为(batch_size, config.num_labels)的torch.FloatTensor)— 分类(或回归,如果config.num_labels==1)分数(SoftMax...logits(形状为(batch_size, config.num_labels)的jnp.ndarray)—分类(如果config.num_labels==1则为回归)得分(SoftMax 之前)。

    40210

    Transformers 4.37 中文文档(四十四)

    损失(形状为(1,)的torch.FloatTensor,可选,当提供labels时返回) - 分类(如果 config.num_labels==1 则为回归)损失。...logits(形状为(batch_size, config.num_labels)的torch.FloatTensor) - 分类(如果 config.num_labels==1 则为回归)得分(SoftMax...MEGA 模型在顶部具有一个跨度分类头,用于类似 SQuAD 的抽取式问答任务(在隐藏状态输出的顶部有线性层,用于计算 span start logits 和 span end logits)。...logits (torch.FloatTensor,形状为 (batch_size, 2)) — 下一个序列预测(分类)头的预测分数(SoftMax 前的 True/False 继续分数)。...seq_relationship_logits (torch.FloatTensor,形状为 (batch_size, 2)) — 下一个序列预测(分类)头部的预测分数(SoftMax 之前的 True

    58610

    Transformers 4.37 中文文档(三十三)4-37-中文文档-三十三-

    它使用与去年早些时候发布的 UL2 模型相同的配置。它经过“Flan”提示调整和数据集收集进行微调。...logits(形状为(batch_size, config.num_labels)的torch.FloatTensor)- 分类(或如果config.num_labels==1则为回归)得分(SoftMax...Flaubert 模型在顶部具有一个用于提取式问答任务(如 SQuAD)的跨度分类头(在隐藏状态输出的顶部有一个线性层,用于计算 span start logits 和 span end logits)...loss (torch.FloatTensor,形状为(1,),可选,当提供labels时返回) — 总跨度提取损失是起始位置和结束位置的交叉熵之和。...logits (tf.Tensor,形状为(batch_size, config.num_labels)) — 分类(如果config.num_labels==1则为回归)得分(SoftMax 之前)。

    71710
    领券