我正在实现一个关键点检测算法来识别图像上的生物医学标志。我只有一种地标要探测。但在一幅图像中,这些地标中有1-10处可以出现。我想知道什么是最好的方法来组织地面真理,以最大限度地学习。
我考虑为每个图像创建10个地标坐标,并将它们与0(不存在)或1(存在)的标志相关联。但这似乎不太理想。由于一张图片中的多个地标实际上是相同类型的生物医学元素,因此神经网络不应该试图将它们作为单独的实体来学习。
有什么建议吗?
发布于 2022-10-11 15:57:12
一个可以随处可见的地标听起来像是一个典型的CNN问题。你的CNN过滤器应该知道哪些特征构成了地标,但他们不在乎它出现在哪里。这将是下一层的责任。因此,为了训练CNN层,您可以使用单色图像作为目标:1是“此像素处的里程碑”,如果不是,则为0。
下一层基本上是处理CNN检测到的特征。为了训练这些,你的基本真理应该是所期望的结果。您只需要二进制输出(count>0)吗?对计数的准确估计?坐标?定向?NN不太在意他们学到了什么,所以只要在训练它应该在推理中产生什么就给它。
https://stackoverflow.com/questions/74030646
复制相似问题