前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >全卷积网络之FCN图像语义分割

全卷积网络之FCN图像语义分割

作者头像
查拉图斯特拉说
发布2024-07-09 08:17:42
770
发布2024-07-09 08:17:42
举报
文章被收录于专栏:后端架构

前言

FCN是一种用于图像语义分割的全卷积网络,可以端到端进行像素级预测。

语义分割

图像语义分割是图像处理和机器视觉技术中的重要一环,旨在对图像中的每个像素进行分类。与普通的分类任务不同,语义分割任务输出与输入大小相同的图像,输出图像的每个像素对应了输入图像每个像素的类别。语义分割常被应用于人脸识别、物体检测、医学影像、卫星图像分析、自动驾驶感知等领域。

模型简介

FCN是一种用于图像分割的端到端的深度学习方法,通过全卷积神经网络实现像素级的预测,主要使用卷积化、上采样和跳跃结构等技术来实现图像分割。通过将全连接层转换为卷积层,利用上采样和跳跃结构获取更多的局部和全局信息,得到与原图大小相等的分割结果。

网络特点

全卷积网络不需要全连接层,可以处理任意尺寸的输入。反卷积层可以输出精细的结果,而跳级结构可以结合不同深度层的结果,同时保证网络的鲁棒性和精确性。

数据处理

数据预处理

由于PASCAL VOC 2012数据集中图像的分辨率大多不一致,无法放在一个tensor中,故输入前需做标准化处理。

数据加载

训练集可视化

这段文字描述了在卷积神经网络中进行池化和卷积操作后,通过反卷积实现不同尺寸的输出。FCN-32s、FCN-16s和FCN-8s分别通过反卷积将输出图像的尺寸扩大到与输入图像相同,并在不同层级上融合特征图以实现更精细的语义分割。

训练准备

导入VGG-16部分预训练权重

FCN使用VGG-16作为骨干网络,用于实现图像编码。使用下面代码导入VGG-16预训练模型的部分预训练权重。

损失函数

语义分割是图像分类的一种形式,通过对图像中的每个像素点进行分类来实现。在语义分割中,使用交叉熵损失函数来计算FCN网络输出与mask之间的损失,这里采用了mindspore.nn.CrossEntropyLoss()作为损失函数。

模型训练

模型推理

使用训练的网络对模型推理结果进行展示。

总结

FCN提出了使用全卷积层进行端到端图像分割的方法,相比传统的CNN方法,具有接受任意大小输入图像和更高效的优点。然而,FCN仍存在两个问题:分割结果不够精细,特别是在边界处;而且没有充分考虑像素与像素之间的关系,缺乏空间一致性。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-07-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 语义分割
  • 模型简介
  • 网络特点
  • 数据处理
  • 数据预处理
  • 数据加载
  • 训练集可视化
    • 训练准备
      • 导入VGG-16部分预训练权重
      • 损失函数
    • 模型训练
      • 模型推理
      • 总结
      相关产品与服务
      人脸识别
      腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档