腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
专栏
文章归档
2024 年 07 月 31 日文章目录
浙大提出 PD-TPE | 用于3D视觉定位任务,特征提取和上下文感知,刷新 SOTA !
利用大型语言模型和扩散模型大规模生成视觉最小变化数据,提升VLMs的细粒度理解能力 !
OpenSU3D 利用2D基础模型,构建实例级3D场景表示,超越当前所有3D场景理解水平!
HLO:通过 Hadamard 低秩量化快速高效地反向传播,解决了大型多模态模型在理解长视频时所面临的调整!
浙江大学提出 Prompt-Aware 视觉与语言的桥梁,提示感知Adapter在多模态LLMs中的角色 !
斯坦福提出 ExPLoRA 高效扩展预训练 Transformer 在无监督领域的突破 !
当 LLMs 步入3D世界,通过多模态大语言模型对3D任务的调查和元分析 !
Android经典面试题之Kotlin中 if 和 let的区别
NODE-Adapter:神经常微分方程助力更优视觉-语言推理!
Youtu Lab, 腾讯, SJTU, BAAI, ECNU 联合调查高效的多模态大型语言模型报告!
基于新型 Transformer ,通过比较 Query 图像与参考形状进行异常检测的研究!
中山大学 & 华为诺亚实验室提出 HiRes-LLaVA 框架,解决切片的高分辨率LVLM引起的输入碎片化问题 !
注意力经济下的Layer3:2120万融资如何助推全链身份变革
如何将MySQL从5.6平滑升级到5.7
飞书文档 VS Notion:谁是你的最佳生产力工具?
什么是分治法?
一个人全栈开发,有没有必要做前后端分离?
Git在Ubuntu上的配置方法
Windows下载安装IDEA社区版的方法
Python自动计算大量遥感数据的NDVI
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 9 页
第 10 页
第 11 页
第 12 页
第 13 页
领券