腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
首页
专栏
文章归档
2024 年 07 月 08 日文章目录
neo4j图数据库
超越SOTA:PP-SAM 在有限数据集上的图像分割突破,简化采样 SA M 过程,仅需最小的标注!
港科技 & 港中文 解密 CLIP 模型 Backbone 网络大小与虚假特征的关系!
轻量级网络 LiteNeXt | 结合卷积与混合模块,以小参数实现高效图像分割 !
利用增强现实与改进 YOLOv5 检测 !
打破单模态局限,LoRS在多模态数据提炼上的突破 !
CM-UNet: 利用Mamba架构的高效全局上下文建模进行图像语义分割
AMSA-UNet | 基于自注意力的多尺度 U-Net 提升图像去模糊性能 !
清华 & 卡梅隆 & 上交大 打破计算瓶颈,DiTFastAttn 方法优化扩散 Transformer 的图像与视频生成 !
告别迷路 ,OverlapMamba 提升激光雷达位置识别能力 !
长尾语义分割的挑战与解决方案,基于 Transformer 的 Query匹配在LTSS中的应用 !
从 MaxViT 到 ACC-ViT:视觉 Transformer 的紧凑型网络实现参数与性能的双重优化 !
英特尔实验室引入全局剪辑器,提高基于 Transformer 目标检测模型对软错误的鲁棒性 !
超越传统 UNet ,GCtx-UNet 结合全局与局部特征,实现高效图像分割 !
中科大提出 ShareGPT4Video ,突破视频标注挑战,推动 LVLMs和 T2VMs 的发展!
香港理工大学 & 腾讯实验室提出 PoserLLaVa 方法在内容感知布局生成中实现SOTA性能 !
微软开源 PromptFix | 从命令到图像,引领扩散模型进入精确控制新时代 !
分层多代理驾驶系统 AD-H,利用语言模型提升自动驾驶的适应性和性能 !
融合视觉语言模型 HPE-CogVLM | 基于LoRA层,利用 CogVLM 的视觉定位能力来增强 HPE 预测任务!
中科院提出 DTLLM-VLT | 利用连贯提示框架和大语言模型为视觉语言跟踪提供多粒度语义增强 !
第 1 页
第 2 页
第 3 页
第 4 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
领券