前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【建议收藏】CV算法工程师自修指南

【建议收藏】CV算法工程师自修指南

作者头像
OpenCV学堂
发布于 2022-06-16 05:12:28
发布于 2022-06-16 05:12:28
9190
举报

我跟几位BATJ现职的CV算法工程师聊了聊学习路径的话题——

  • 学习CV要具备哪些基础?
  • CV算法工程师应当掌握哪些技能?

01

学习CV要具备哪些基础

01 编程与数理基础

掌握Python基础理论知识、了解第三方数据科学库,能够使用Python语言进行初级机器学习编程。掌握线性代数、微积分、概率论、最优化的相关知识。

02 机器学习基础

了解线性回归、逻辑回归、决策树等机器学习经典模型、能够基于Python语言上手机器学习算法实践。

03 深度学习基础

熟练卷积神经网络循环神经网络、了解简单的Pytorch使用。

04 计算机视觉基础

以OpenCV为基础,掌握图像基础知识、基本处理等CV方向的基础理论。

02

算法模型——读这些论文

01 图像分类

vgg、inception、resnet、mobilenet、SENet。

02 图像分割

unet、deeplab系列、FCN、SegNet、BiSeNet。

03 目标检测

SSD、FPN、RetinaNet、Faster rcnn、AnchorFree、基于Transformer和CNN的端到端检测。

04 GAN

GAN、DCGAN、Pix2Pix。

03

项目学习——理论结合实战

01 图像分类

图像分类是计算机视觉领域最基础也是最核心的任务,虽然最近涌现出大量优秀的CNN模型可直接用于图像分类,简化了传统图像分类人工设计特征的流程,但是真正的企业级应用中远不止使用CNN网络模型那么简单。实际项目算法开发过程中,除了模型使用还需要考虑数据分布、类别均衡、数据增强、损失函数等trick的应用。

推荐项目:花朵分类&不均衡Cifar分类

熟悉训练技巧,掌握独立完成项目级图像分类模型训练的能力。

02 图像分割

图像分割是CV主要方向之一,在自动驾驶、人像抠图、医学图像分析和工业质检均有广泛应用。能掌握经典图像分割算法,熟悉代码开发流程,独立完成图像分割项目是算法工程师必备的能力。

推荐项目:自动驾驶语义分割&人像分割及证件照制作

用代码实现数据集读取、图像分割模型训练、训练分析、模型推理、线上部署。完整地做一次图像分割项目实战。

03 目标检测

目标检测是CV领域的重要方向之一,在自动驾驶、卫星遥感、机器人、智慧工厂、智能交通等领域中应用广泛。掌握经典的目标检测算法,学会检测器性能提升方法和模型轻量化的方法,了解模型部署的流程,是计算机视觉工程师的必备技能,也是进入各大厂和创业公司的必要条件。

推荐项目:基于YOLOX构建高性能目标检测器&轻量级目标检测器

掌握构建baseline检测器的方法,掌握目标检测器性能优化和轻量化的技巧,了解工程实践中目标检测任务开发的一般流程。

04 GAN

生成式对抗网络模型被誉为“下一代深度学习框架”,是目前最强大的生成式模型,已在图像视频生成、增强、编辑等应用领域广泛落地。每隔一段时间网络上就会出现关于其神奇效果的相关报道,比如换脸、绘画、让人物跳舞、老片修复、以及让照片人脸动起来等等。这其中,图像增强可谓是GAN落地最成熟的一个方向。此外,数据爬取、数据分析筛选、模型批量调参、模型快速部署等算法工程师必备技能也是本项目的重点。

推荐项目:图像增强经典超分辨率任务均衡Cifar分类项目

学习和探索GAN技术是如何在企业中一步步落地,解决客户的实际需求。

04

项目试学

以上内容在深度之眼CV项目班中均有涉及,本公众号粉丝开放获取特殊福利:CV项目试学 —— 约3小时

0.1元领取!

01 算法岗简历撰写及求职面试准备(74分钟)

02 图像分类模型涨点技巧(50分钟)

03 数据爬取及筛选(86分钟)

0.1元领取!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-06-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 OpenCV学堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【建议收藏】CV学习路径推荐
掌握Python基础理论知识、了解第三方数据科学库,能够使用Python语言进行初级机器学习编程。掌握线性代数、微积分、概率论、最优化的相关知识。
小白学视觉
2022/12/27
7300
【建议收藏】CV学习路径推荐
来了解下计算机视觉的八大应用
之前通过三篇文章简单介绍了机器学习常用的几种经典算法,当然也包括了目前很火的 CNNs 算法了:
kbsc13
2019/08/16
1.1K0
如何跟随有三从零进阶中级CV算法工程师
(1) Python前后端与小程序部署,完成一个深度学习开源框架在小程序的完整部署过程,将其最终展示为线上服务,就是有三AI小程序平台了(最近网站安全证书到期不能访问,过几天就可以了)。
用户1508658
2019/09/06
5020
如何跟随有三从零进阶中级CV算法工程师
95后CV工程师晒出工资单:狠补了这个,真香…
许多计算机视觉任务需要对图像进行智能分割,以理解图像中的内容,并使每个部分的分析更加容易。今天的图像分割技术使用计算机视觉深度学习模型来理解图像的每个像素所代表的真实物体,这在十年前是无法想象的。 图像分割有助于确定目标之间的关系,以及目标在图像中的上下文。应用包括人脸识别、车牌识别和卫星图像分析。例如,零售和时尚等行业在基于图像的搜索中使用了图像分割。自动驾驶汽车用它来了解周围的环境。 目标检测和人脸检测 这些应用包括识别数字图像中特定类的目标实例。语义对象可以分类成类,如人脸、汽车、建筑物或猫。人脸检测
计算机视觉研究院
2022/03/04
4910
2020前端智能化趋势:tensorflow.js生态
hi,大家好~我是shadow,一枚设计师/全栈工程师/算法研究员,目前主要研究方向是人工智能写作和人工智能设计,当然偶尔也会跨界到人工智能艺术及其他各种AI产品。
mixlab
2020/01/14
2.2K0
2020前端智能化趋势:tensorflow.js生态
强的离谱!串烧70+个Transformer模型,涵盖CV、NLP、金融、隐私计算...
Transformer 作为一种基于注意力的编码器 - 解码器架构,不仅彻底改变了自然语言处理(NLP)领域,还在计算机视觉(CV)领域做出了一些开创性的工作。与卷积神经网络(CNN)相比,视觉 Transformer(ViT)依靠出色的建模能力,在 ImageNet、COCO 和 ADE20k 等多个基准上取得了非常优异的性能。 正如德克萨斯大学奥斯汀分校的计算机科学家 Atlas Wang 说:我们有充分的理由尝试在整个 AI 任务范围内尝试使用 Transformer。 因此,无论是学术界的研究人员,
zenRRan
2022/04/15
8130
强的离谱!串烧70+个Transformer模型,涵盖CV、NLP、金融、隐私计算...
2020年计算机视觉技术最新学习路线总结 (含时间分配建议)
如今有大量的资源可以用来学习计算机视觉技术,那我们如何从众多教程中进行选择呢?哪个值得我们去投入时间呢?
AI算法与图像处理
2020/08/28
12.6K0
2020年计算机视觉技术最新学习路线总结 (含时间分配建议)
【完结】深度学习CV算法工程师从入门到初级面试有多远,大概是25篇文章的距离
一直有同学希望我在公众号写写面试相关的东西,一直没写。我们不会开相关的板块,因为没有标准,容易引起争议,而且可能会加重大家的浮躁和焦虑。
机器视觉CV
2019/07/15
1.5K0
【完结】深度学习CV算法工程师从入门到初级面试有多远,大概是25篇文章的距离
基于深度学习方法的图像分割,差距不止一点点
图像分割(image segmentation)技术是计算机视觉领域的一个重要的研究方向,图像分割是计算机视觉中的一个关键过程。它包括将视觉输入分割成片段以简化图像分析。片段表示目标或目标的一部分,并由像素集或“超像素”组成。图像分割将像素组织成更大的部分,消除了将单个像素作为观察单位的需要。图像分析有三个层次: 分类 - 将整幅图片分成“人”、“动物”、“户外”等类别 目标检测 - 检测图像中的目标并在其周围画一个矩形,例如一个人或一只羊。 分割 - 识别图像的部分,并理解它们属于什么对象。分割是进行目标
机器学习AI算法工程
2022/09/22
9110
基于深度学习方法的图像分割,差距不止一点点
【人工智能工程师】掌握这10个项目,秒杀90%面试者!
2017年人工智能给了我们太多的惊喜和变化,从今年开始,国际巨头们纷纷开始大踏步地战略转向——从移动优先转向AI优先:3月份的微软、4月份的Facebook、5月份的Google、6月份的苹果……乃至前段时间百度大会上,李厂长的一句:无人车罚单都来了,量场还会远吗?直接掀起当天的高潮! 由此可见:人工智能已经进入了全球爆发的前夜。个性化信息推送、人脸识别、语音操控等人工智能技术,已“入侵”日常生活的细枝末节。那人工智能有多火?平均每10.9个小时诞生一家AI企业。而且众所周知:国内大量的、一线的互联网公司已
AI科技大本营
2018/04/27
9240
【人工智能工程师】掌握这10个项目,秒杀90%面试者!
知乎热议:985计算机视觉研究生找不到工作?
前段时间知乎上“985计算机视觉研究生找不到工作怎么办?”问题,引发了将近80万+人的围观。 到底是什么原因导致找不到工作呢?首先我们来看看他的履历: 他目前是985高校研究生,方向是计算机视觉。成绩中等,无论文,无比赛经历,有项目经历。编程基础还可以,自认为在教研室算好的了,python用得比较熟,C++也会一点,PyTorch, TensorFlow,Keras等框架也用的还可以。 当初选择该方向时,深度学习正处于大热阶段,什么无人驾驶,人脸识别听起来就很高大上。然而,到了找工作的时候,发现就业形式和
机器学习AI算法工程
2022/03/09
7600
【杂谈】如何让你的2020年秋招CV项目经历更加硬核,可深入学习有三秋季划4大领域32个方向(2020.7.23号后涨价)
眼看着2020年上半年已经所剩无几了,大家也经历了一个不一样的学期,许多即将毕业的同学和准备换工作的朋友也在开始准备秋招了。
用户1508658
2020/07/24
6960
【杂谈】如何让你的2020年秋招CV项目经历更加硬核,可深入学习有三秋季划4大领域32个方向(2020.7.23号后涨价)
综述 | 基于深度学习的目标检测算法
计算机视觉是人工智能的关键领域之一,是一门研究如何使机器“看”的科学。图像目标检测又是计算机视觉的关键任务,主要对图像或视频中的物体进行识别和定位,是AI后续应用的基础。 因此,检测性能的好坏直接影响到后续目标 追踪、动作识别的性能。传统图像目标检测的滑窗法虽然简单易于理解,但随目标大小而变化的窗口对图像进行从左 至右、从上至下的全局搜索导致效率低下。 为了在滑动窗口检测器的基础上提高搜索速度,选择性搜索方法(selective search method)孕育而出,基于这一想法采用子区域合并的方式进行
计算机视觉研究院
2022/04/19
4700
综述 | 基于深度学习的目标检测算法
YOLO杀疯了!目标检测速度与精度的最优组合
YOLO是什么? 它是One-stage目标检测的代表,整个框架非常简单。与RCNN算法不一样,是以不同方式处理对象检测。 YOLO算法的最大优点就是速度极快,每秒可处理45帧,也能够理解一般的对象表示。 从个人学习来看:优秀的计算机视觉工程师,目标检测的学习避免不了,而目标检测的核心就是YOLO。YOLO系列也一直在发展,对于它的学习迫在眉睫。 从职业发展来看:YOLO一直是应用很广的主流算法之一,也是月薪30K以上的工程师标配技能,更是技术和求职风向标。因此,搭建检测模型,并深刻理解后,你一定能在
机器学习AI算法工程
2022/09/22
1.2K0
YOLO杀疯了!目标检测速度与精度的最优组合
音视频技术开发周刊 | 244
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 ✦ 一周简讯 ✦ JPEG-XL华为自动驾驶车辆测试专利公布,无需人力测试自动驾驶 华为技术有限公司“自动驾驶车辆的测试方法、装置及系统”专利公布。摘要显示,本申请实施例提供的系统包括软件控制模块、运动控制模块和多个运动平台。根据软件控制模块获取的测试场景信息,确定测试运动平台和目标运动平台,从而向每个确定的运动平台发送参数信息,以便执行对应操作。(Tech星球) 谷歌收购 MicroLED
LiveVideoStack
2022/05/09
9010
音视频技术开发周刊 | 244
目标检测算法终结篇:YOLOV1-V5(非正式版)正式开源
YOLO 是一种快速紧凑的开源对象检测模型,与其它网络相比,同等尺寸下性能更强,并且具有很不错的稳定性,是第一个可以预测对象的类别和边界框的端对端神经网络。YOLO 家族一直有着旺盛的生命力,从YOLO V1一直到”V5“,如今已经延续五代,凭借着不断的创新和完善,一直被计算机视觉工程师作为对象检测的首选框架之一。 YOLO v5 模型的头部与之前的 YOLO V3 和 V4 版本相同。 它比 YOLOv4 小 88%(27 MB vs 244 MB) 它比 YOLOv4 快 180%(140 FPS vs
机器学习AI算法工程
2022/06/09
7200
目标检测算法终结篇:YOLOV1-V5(非正式版)正式开源
知乎热议:985计算机视觉研究生找不到工作?
前段时间知乎上“985计算机视觉研究生找不到工作怎么办?”问题,引发了将近80万+人的围观。 到底是什么原因导致找不到工作呢?首先我们来看看他的履历: 他目前是985高校研究生,方向是计算机视觉。成绩中等,无论文,无比赛经历,有项目经历。编程基础还可以,自认为在教研室算好的了,python用得比较熟,C++也会一点,PyTorch, TensorFlow,Keras等框架也用的还可以。 当初选择该方向时,深度学习正处于大热阶段,什么无人驾驶,人脸识别听起来就很高大上。然而,到了找工作的时候,发现就业形式和
zenRRan
2022/03/24
4810
【AI白身境】一文览尽计算机视觉研究方向
图像分类是计算机视觉中最基础的一个任务,也是几乎所有的基准模型进行比较的任务,从最开始比较简单的10分类的灰度图像手写数字识别mnist,到后来更大一点的10分类的cifar10和100分类的cifar100,到后来的imagenet,图像分类任务伴随着数据库的增长,一步一步提升到了今天的水平。
用户1508658
2019/07/26
8340
【AI白身境】一文览尽计算机视觉研究方向
算法工程师当前选哪个方向好?
看了很多回答,模棱两可、模糊不清,给岀一番没有意乂的解释,最终也没有给岀自己的意见。
机器学习AI算法工程
2020/08/21
2K0
算法工程师当前选哪个方向好?
详细解读YOLO | 让目标检测任务中的小目标无处遁形
YOLO是什么? 它是One-stage目标检测的代表,整个框架非常简单。与RCNN算法不一样,是以不同方式处理对象检测。 YOLO算法的最大优点就是速度极快,每秒可处理45帧,也能够理解一般的对象表示。 从个人学习来看:优秀的计算机视觉工程师,目标检测的学习避免不了,而目标检测的核心就是YOLO。YOLO系列也一直在发展,对于它的学习迫在眉睫。 从职业发展来看:YOLO一直是应用很广的主流算法之一,也是月薪30K以上的工程师标配技能,更是技术和求职风向标。因此,搭建检测模型,并深刻理解后,你一定能
计算机视觉研究院
2022/05/25
8400
详细解读YOLO | 让目标检测任务中的小目标无处遁形
推荐阅读
相关推荐
【建议收藏】CV学习路径推荐
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档