点击“北京大学前沿计算研究中心”可以订阅哦
编者按
2018年8月5日,美国加州大学伯克利分校博士后Fisher Yu博士来访北京大学前沿计算研究中心,与中心师生及访问学生进行了座谈。座谈会由中心执行主任陈宝权老师主持。座谈会上,Fisher Yu博士就目前在计算机视觉研究领域中的关键问题之一——构建大规模标定数据集方面,分享了很多宝贵经验。Fisher Yu博士在近年来提出的dilated convolution及其后续工作,有效地提升了深度学习网络在解决计算机视觉诸多问题时的性能,受到了广泛关注。
首先,Fisher Yu博士向大家详细地介绍了在论文“Dilated Residual Network”中的研究工作。在这篇论文中,他提出了同时使用dilated convolution和residual network结构的方法,在使用相同甚至更少参数的情况下,提升深度神经网络的性能。Fisher Yu向大家展示了在利用该网络结构进行分类任务的训练时,相比于针对分类任务设计的残差网络模型,在实现分类任务的同时,可以自动地识别出物体的区域。同时,就该工作中的一些细节、研究中遇到的问题、现象及其背后的原理,Fisher Yu也进行了详细地阐述,使同学们在深刻理解该篇论文的同时,也获得了在科研过程中的宝贵经验。
接下来,Fisher Yu博士分享了在大规模数据集构建工作中的一些进展和经验。2018年5月,Fisher Yu及其所在的研究组发布了目前最大规模的带有丰富标注的驾驶视频数据——BDD 100K, 对自动驾驶中视觉算法的研究意义非凡。在这次报告中,Fisher Yu分享了在构建数据集过程中的宝贵经验,涉及标注平台和系统的搭建、人员的管理、标注流程设计、标注检测算法以及标注迁移等方面。众所周知,大规模的标注数据集对视觉算法研究具有极大的推动作用,如ImageNet。 然而目前计算机视觉的很多任务,都面临着缺乏数据集或者已有数据集不够多样的问题,因此更多的大规模标注数据集亟需被构建。陈宝权教授就构建数据集的问题与Fisher Yu博士进行了深入地讨论,对同学们今后的研究工作有很大的启发。
最后,Fisher博士解答了同学们在学术方面及求学道路上的一些困惑。
供稿、照片:王玉洁、郑晓玉、樊庆楠
来访人简介
Fisher Yu博士,博士毕业于普林斯顿大学,目前在加州大学伯克利大学做博士后研究。2016年,他在论文“Multi-Scale Context Aggregation by Dilated Convolutions”中提出的dilated convolution, 由于其在众多计算机视觉算法中的有效性,受到了广泛关注。在2018年5月,他及其所在的研究组发布目前最大规模的驾驶视频标注数据集——BDD 100K,备受瞩目。
领取专属 10元无门槛券
私享最新 技术干货