首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【OCR】CTC loss原理

    在图像文本识别、语言识别的应用中,所面临的一个问题是神经网络输出与ground truth的长度不一致,这样一来,loss就会很难计算,举个例子来讲,如果网络的输出是”-sst-aa-tt-e’', 而其ground truth为“state”,那么像之前经常用的损失函数如cross entropy便都不能使用了,因为这些损失函数都是在网络输出与ground truth的长度一致情况下使用的。除了长度不一致的情况之外,还有一个比较难的点在于有多种情况的输出都对应着ground truth,根据解码规则(相邻的重复字符合并,去掉blank), path1: “-ss-t-a-t-e-” 和path2: "–stt-a-tt-e"都可以解码成“state”,与ground truth对应, 也就是many-to-one。为了解决以上问题,CTC loss就产生啦~ 2 CTC loss原理

    02

    在 Octree 网格上扩展的本地时间步长(CS)

    双曲偏微分方程(PDES)的数值解在科学和工程中随处可见。行法是一种在时空定义时对 PED 进行离散化的通俗方法,其中空间和时间是独立离散的。在自适应网格上使用显式时间步长时,使用由最佳网格间距决定的全局时间步长会导致较粗区域效率低下。尽管自适应空间离散化在计算科学中被广泛使用,但由于时间适应性复杂,时间适应性并不常见。本文提出了高度可扩展的算法,用于在完全自适应的八进制上实现显式时间步进(LTS)的显式时间步进方案。在 TACC Frontera 中,我们展示了我们方法的准确性以及我们框架跨 16K 内核的可扩展性。我们还提出了LTS的加速估计模型,该模型预测的加速与全局时间步长(GTS)相比平均误差仅为0.1。

    00
    领券