腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
首页
专栏
文章归档
2024 年 07 月 08 日文章目录
使用腾讯云Lighthouse游戏服专区一站式安装幻兽帕鲁游戏服
清华 & 港中文 & 香港科技 深入探究 LLM, 利用大型语言模型理解视频和动作序列的多模态人类行为!
新加坡 & 南开 & 上交大 联合探索揭秘视觉大型语言模型在自动驾驶系统中的风险!
滑铁卢大学使用谷歌地球图像和高斯溅射进行真实感3D城市场景重建和点云提取!
DDP:微软提出动态detection head选择,适配计算资源有限场景 | CVPR 2022
基于 YOLOv8 和计算机视觉 CV 的实时识别系统!
华中科技 & 地平线 提出 通用视觉 Backbone 网络 , FLOPs减少 5.2倍,速度提高4.8倍 !
中科大 & 腾讯微信 & 新加坡国立大学 & 复旦等 将视觉特征与 LLM 的参数空间对齐,LoRA 再升级, 效率更上一层!
清华大学提出CapS-Adapter | 利用CLIP的单模态和跨模态优势,通过使用多模态支持集提高了预测准确性!
Meta-AI再出神作 | 借力打力!设计跨模态量化蒸馏方法,直接白嫖VLP模型的丰富语义信息
Sora 与文本到视频生成,探索通用人工智能的里程碑与挑战!
清华 & 阿里 开源 ConvLLaVA | 替代 Vision Transformer,解决图像处理中 Token 过多问题!
上交大 & 上海 AI 实验室 & ViVO 强势推出 TerDiT ,极低比特量化感知训练和和高效部署方案 !!!
上交大 LoRA再进化 | 高效微调框架FLoRA,专为各种维度参数空间设计,保持高维参数空间结构完整性 !
Xmodel-VLM | 多模态视觉语言模型,解决高成本难题,实现高效部署 !
高效轻量级LLM | Imp模型,通过低比特量化分辨率和降低实现高通骁龙8Gen3 芯片高性能部署 !
MemoryMamba | 工业缺陷检测的视觉模型,在 NEU 数据集取得了高达99%的成绩!
加速视觉-语言对比学习 | 基于像素强度的图像块屏蔽策略!
VLSM-Adapter | 轻量级适配器,加速医学图像分割的视觉语言模型 !
商汤科技提出 SparseLIF | 高性能全稀疏3D目标检测器,性能 & 鲁棒性 达到 SOTA 水平!
第 1 页
第 2 页
第 3 页
第 4 页
第 5 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
领券