IFS用作分词字符,但当IFS为null/空时会发生什么情况。例如,考虑包含内容的输入文件abc.txtsecond lineIFS='' # or IFS= or assume IFS is nullfirst line second line
既然现在\n也不是IFS,那么输出不应该只在一行中吗?
我正在尝试使用预训练的BERT模型进行文本分类。我在我的数据集上训练了模型,并在测试阶段;我知道BERT只能接受512个令牌,所以我编写了if条件来检查我的数据帧中测试的长度。如果它长于512,我将句子分成序列,每个序列有512个标记。然后进行标记器编码。序列的长度是512,但是在执行tokenize编码之后,长度变成了707,我得到了这个错误。 The size of tensor a (707) must match the size of tensor b (512) at non-singleton dimension 1 下面是我用来执行上述步骤的代码: tokenizer = B