暂无搜索历史
CrossFormer是一种新型的视觉Transformer架构,旨在通过引入跨尺度注意力机制来提升计算机视觉任务的性能。该模型特别关注不同尺度特征之间的交互,...
MSPLCK(Multi-Scale Parallel Large Convolution Kernel,多尺度并行大卷积核模块) 是一种创新的深度学习模块,旨...
论文连接:https://www.sciencedirect.com/science/article/abs/pii/S0952197623012630 翻译:...
https://arxiv.org/pdf/2407.05128 通道注意力和空间注意力分别为各种下游视觉任务在提取特征依赖性和空间结构关系方面带来了显著改进。...
RAG系统正逐步革新我们对AI驱动信息处理的认知。为充分发挥其潜力,理解其基本原理至关重要。本文旨在简明扼要地解析RAG系统,期望为读者提供洞见与共鸣。
在探索目标检测技术的最新进展中,我们将目光投向了FastViT这一创新的混合视觉变换器架构。通过将FastViT引入Yolo11,并替换其原有的主干网络,我们成...
量化是提升卷积神经网络(CNNs)速度并降低其内存使用量的常用方法。当存在已标记的训练数据时,网络权重和激活已成功量化到l位。然而,对于没有已标记训练数据的场景...
DEA-Net通过提出细节增强注意力模块(DEAB),在单幅图像去雾任务中取得了显著成果。将该模块应用于Yolo11中,通过替换Bottleneck模块,进一步...
本文介绍了EfficientNetV2及其中的MBConv模块,并探讨了将MBConv模块应用于YoloV9中的可能性。通过替换YoloV9中的BottleNe...
DEA-Net通过提出细节增强注意力模块(DEAB),在单幅图像去雾任务中取得了显著成果。将该模块应用于YoloV8中,通过替换Bottleneck模块,进一步...
视频生成技术的最新进展极大地改变了个人与行业日常生活的面貌。然而,主流的视频生成模型仍为闭源,导致行业与公众社区在视频生成能力上存在显著的性能差异。在本报告中,...
本文介绍了EfficientNetV2及其中的MBConv模块,并探讨了将MBConv模块应用于Yolo11中的可能性。通过替换Yolo11中的BottleNe...
涨点效果:在我自己的数据集上,mAP50 由0.986涨到了0.99,mAP50-95由0.737涨到0.753,涨点明显!
本文介绍了EfficientNetV2及其中的MBConv模块,并探讨了将MBConv模块应用于YoloV8中的可能性。通过替换YoloV8中的BottleNe...
本文介绍了《Centralized Feature Pyramid for Object Detection》论文中的内容,该论文提出了一种用于目标检测的中心化...
Yolo11是Ultralytics推出的新一代计算机视觉模型,为YOLO家族树立了新的里程碑。它在对象检测、实例分割、图像分类、姿势估计、定向物体检测和对象跟...
本文参考的是《VOLO:视觉识别中的视觉展望器》一文,该论文主要讨论了视觉识别领域中卷积神经网络(CNNs)与视觉转换器(ViTs)的性能对比,并提出了一个新的...
https://arxiv.org/pdf/1905.02188 特征上采样是许多现代卷积网络架构(例如特征金字塔)中的关键操作。其设计对于诸如目标检测和语义/...
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市