个引人注目的优点:
计算速度快, 计算成本低
容易理解
与具体语言无关
和人类给的评估高度相关
已被广泛采用
BLEU 评分是由 Kishore Papineni 等人在他们 2002 年的论文 BLEU...我们首先逐句计算 n 元组匹配数目接下来, 我们为所有候选句子加上修剪过的 n 元组计数, 并除以测试语料库中的候选 n 元组个数, 以计算整个测试语料库修正后的精度分数 pn
摘自论文 BLEU:...(score)
运行这个例子就像之前一样输出满分
1.0
累加和单独的 BLEU 分数
NLTK 中提供的 BLEU 评分方法允许你在计算 BLEU 分数时为不同的 n 元组指定权重
这使你可以灵活地计算不同类型的..., 通过计算加权几何平均值来对它们进行加权计算
默认情况下, sentence_bleu()和 corpus_bleu()分数计算累加的 4 元组 BLEU 分数, 也称为 BLEU-4 分数
BLEU..., 输出下面的分数:
0.707106781187
累加的和单独的 1 元组 BLEU 使用相同的权重, 也就是 (1,0,0,0) 计算累加的 2 元组 BLEU 分数为 1 元组和 2 元组分别赋