首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >计算机视觉与多模态AI技术解析

计算机视觉与多模态AI技术解析

原创
作者头像
用户11764306
发布2025-09-29 09:14:08
发布2025-09-29 09:14:08
990
举报

计算机视觉与多模态AI技术解析

2021年10月28日,某中心Alexa AI团队的首席应用科学家Pradeep Natarajan参与了技术访谈节目,深入探讨了在计算机视觉和深度神经网络领域机器学习技术的重要应用。

学术研究成果

Natarajan在2021年多项顶级学术会议上发表论文,包括:

  • CVPR(计算机视觉与模式识别会议)
  • ACL(计算语言学协会)
  • EMNLP 2021发表的《FewshotQA:使用预训练文本到文本模型进行问答任务少样本学习的框架》

技术实践与应用

在近期ICCV(国际计算机视觉大会)的"实例级识别"研讨会上,重点讨论了艺术品、地标和产品的识别技术。Natarajan自2018年11月加入某中心Alexa AI团队以来,主要致力于:

  1. 计算机视觉技术开发:增强语音助手的基于语音的交互能力
  2. 大规模语言模型应用:提升多模态处理性能
  3. 行动识别系统:在南加州大学攻读博士期间(2009年)开始研发,当时该领域可用文献极少

专业背景

Natarajan在计算机视觉和机器学习领域拥有近20年研究经验,曾担任:

  • DARPA"心灵之眼"计划团队首席研究员
  • IARPA Aladdin项目负责人

研究领域

  • 计算机视觉
  • 机器学习

技术标签

  • 神经网络
  • ICCV
  • EMNLP

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 计算机视觉与多模态AI技术解析
    • 学术研究成果
    • 技术实践与应用
    • 专业背景
    • 研究领域
    • 技术标签
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档