前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >OpenAI“大力出奇迹”的GPT2同样适用图像领域,训练性能良好

OpenAI“大力出奇迹”的GPT2同样适用图像领域,训练性能良好

作者头像
大数据文摘
发布于 2020-06-20 06:37:15
发布于 2020-06-20 06:37:15
9730
举报
文章被收录于专栏:大数据文摘大数据文摘

大数据文摘出品

来源:OpenAI

编译:牛婉杨、刘俊寰

GPT-3的热度还在发酵,OpenAI又放了个大招。这次的研究往图像界迈出了新的一步。

刚刚,OpenAI发布了一篇博客文章,介绍了将GPT应用到图像领域的研究进展,并且发现,在图像领域,GPT-2仍然可以工作,并且性能良好

研究人员发现,就像利用大型transformer模型训练语言一样,用同样的模型训练像素序列,可以生成连贯的图像像素样本。通过建立样本质量和图像分类精度之间的相关性,OpenAI表明,他们的最佳生成模型也包含了在无监督环境下与顶层卷积网对抗的特征

第一列为研究人员为模型提供的半张图片,中间是模型自动补全的完整图像,最后一列是原始图像

我们都知道,对于机器学习来说,无监督学习或没有人为标签的数据学习长期以来都是一项不小的挑战。最近,在语言上,机器学习已经取得了一些值得称赞的成就,如BERT、GPT-2、RoBERTa、T5等,但是,这类模型尚未成功产生用于图像分类的功能

不过,也正是由于BERT和GPT-2这类模型与领域无关,它们可以直接应用于任何形式的一维序列。比如在图像领域,当在展开为长像素序列的图像上训练GPT-2时,研究人员就发现,该模型似乎可以理解二维图像特征,例如外观和类别。即使在没有人工提供标签的指导下,生成的相干图像样本的范围也足以证明。同时,该模型的功能可以在许多分类数据集上实现最新性能,也就是说,具有最新的无监督准确性

为了突出生成序列模型作为通用无监督学习算法的潜力,OpenAI故意在语言上使用与GPT-2相同的transformer架构。研究人员也就需要更多的计算产生与顶级无监督卷积网络相竞争的特性,结果表明,当面对一个正确的模型先验未知的新领域时,GPT-2可以学习优秀的特性,而不需要特定领域的架构设计选择

在语言方面,依赖于单词预测的无监督学习算法(如GPT-2和BERT)非常成功,在大量的语言任务中表现最佳。这种成功的一个可能原因是下游语言任务的例子在文本中很自然地出现:问题后面经常跟着答案,段落后面经常跟着总结。相反,像素序列没有明确包含其所属图像的标签。

即使没有这种明确的监督,图像上的GPT-2仍然可以工作的原因是:一个足够大的变压器训练下一个像素预测可能最终学会生成不同的样本与清晰可识别的对象。一旦它学会了这样做,被称为“综合分析”的想法表明,模型也将知道对象类别。许多早期的生成模型都是受到这个想法的推动,最近BigBiGAN就是一个产生令人鼓舞的样本和特征的例子。在我们的工作中,我们首先展示了更好的生成模型实现更强的分类性能。然后,通过优化GPT-2的生成能力,研究人员发现在很多场景下都达到了顶级的分类性能,为综合分析提供了进一步的证据。

这项研究表明,通过权衡二维知识交换规模,从网络中间选择预测特征,序列转换器就可以与顶级卷积网络竞争无监督图像分类。值得注意的是,GPT-2语言模型直接应用于图像生成就足以实现实验结果

考虑到系统的简单性和通用性,对于给定足够的计算量的序列转换器,最终可能是学习许多领域优良特性的有效方法。

相关报道:

https://openai.com/blog/image-gpt/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
15个多线程相关的面试题
场景描述:Java并发编程问题是面试过程中很容易遇到的问题,提前准备是解决问题的最好办法,将试题总结起来,时常查看会有奇效。
王知无-import_bigdata
2019/12/30
8130
虚拟机性能监控、故障处理关于控制台的命令整理
监视虚拟机各种运行状态信息;显示进程中的 类加载、内存、垃圾收集、即时编译 等; 如果没有GUI图形化界面的服务器,可以通过该命令查看运行状况,命令格式:
eeaters
2021/12/12
5760
虚拟机性能监控、故障处理关于控制台的命令整理
JVM之jstack实战死锁问题
如果在生产环境发生了死锁,我们将看到的是部署的程序没有任何反应了,这个时候我们可以借助 jstack进行分析,下面我们实战操作查找死锁的原因。所谓死锁指的是是一组互相竞争资源的线程因互相等待导致“永久”阻塞的现象。
共饮一杯无
2022/11/28
8150
JVM之jstack实战死锁问题
高并发编程-线程通信_使用wait和notify进行线程间的通信2_多生产者多消费者导致程序假死原因分析
3. 紧接着,P1又抢到了锁,但是生产后没有被消费,所以直接进入LOCK.wati. 执行完以后释放锁。P1-----WAITING . 对应日志
小小工匠
2021/08/17
3520
一文搞定Java并发编程面试考点
任何线程都可以设置为守护线程和用户线程,通过方法Thread.setDaemon(bool on);true则把该线程设置为守护线程,反之则为用户线程。Thread.setDaemon()必须在Thread.start()之前调用,否则运行时会抛出异常。
Bug开发工程师
2019/05/04
3730
高并发之——线程与多线程
在操作系统中,线程是比进程更小的能够独立运行的基本单位。同时,它也是CPU调度的基本单位。线程本身基本上不拥有系统资源,只是拥有一些在运行时需要用到的系统资源,例如程序计数器,寄存器和栈等。一个进程中的所有线程可以共享进程中的所有资源。
冰河
2020/10/29
4110
高并发之——线程与多线程
JVM故障分析及性能优化实战(II)——jstack生成的Thread Dump日志结构解析
上一篇文章讲述了如何使用jstack生成日志文件,这篇文章首先对Thread Dump日志文件的结构进行分析。
IT技术小咖
2019/09/26
2.5K0
JVM故障分析及性能优化实战(II)——jstack生成的Thread Dump日志结构解析
2022年Java秋招面试,程序员求职必看的Java并发编程面试题
为一名专业的 Java 开发者,如何在并发场景中写出优良的代码,是一道绕不开的坎,也是考量一个 Java 开发者功底的关键技术。因此,不难发现 Java 并发问题一直是各个大厂面试的重点之一,然而我发现很多候选人在面试时,常常表示对各种并发原理一脸懵逼,好像知道一些却又讲不清楚,最终导致面试失败。于是发奋学习,啃大部头书又发现理论太多,头疼。其实 Java 的并发问题虽然内容繁杂,然而整个脉络还是很清晰的。
Java程序猿
2022/07/02
6010
不可不知的7个JDK命令
武培轩(公众号:武培轩)的《不可不知的7个JDK命令》这篇文章,短小精悍,介绍的这7个JDK命令非常实用,值得借鉴。
bisal
2020/05/18
4310
不可不知的7个JDK命令
并发编程原理剖析——多线程及其原理分析 顶
客户端阻塞:如果客户端只有一个线程,这个线程发起读取文件的额操作必须等待IO流返回,客户端才能做其它事情。
须臾之余
2019/07/09
7400
Java自带的性能监测工具之jstack
本文继续介绍Java自带的性能监测工具,本文使用jstack (Java Stack Trace)工具来玩~
孟君
2023/02/23
2.7K0
Java自带的性能监测工具之jstack
JAVA Thread Dump 文件分析
Thread Dump是非常有用的诊断Java应用问题的工具。每一个Java虚拟机都有及时生成所有线程在某一点状态的thread-dump的能力,虽然各个 Java虚拟机打印的thread dump略有不同,但是大多都提供了每个线程的所有信息,例如: 线程状态、线程 Id、本机 Id、线程名称、堆栈跟踪、优先级。
Java宝典
2021/01/15
1.3K0
Java 并发编程中的死锁 ( Kotlin 语言讲解)
在操作系统中的并发处理场景中, 进程对资源的持有与请求过程中,会产生死锁. Say, Process A has resource R1 , Process B has resource R2. If Process A request resource R2 and Process B requests resource R1, at the same time , then deadlock occurs.
一个会写诗的程序员
2019/07/08
1.3K0
Java 并发编程中的死锁 ( Kotlin 语言讲解)
JVM 基础知识
JVM 是可运行 Java 中假想的计算机,就是在真实的计算机上模拟计算机功能,包括一套字节指令,一套寄存器,一个栈,一个垃圾回收,堆,一个存储区域,JVM 是运行在操作系统之上,它与硬件没有直接的交互。
王小明_HIT
2020/02/17
5540
JVM性能调优监控工具专题一:JVM自带性能调优工具(jps,jstack,jmap,jhat,jstat,hprof)
JDK本身提供了很多方便的JVM性能调优监控工具,除了集成式的VisualVM和jConsole外,还有jps、jstack、jmap、jhat、jstat、hprof等小巧的工具,每一种工具都有其自身的特点,用户可以根据你需要检测的应用或者程序片段的状况,适当的选择相应的工具进行检测。接下来的两个专题分别会讲VisualVM的具体应用。
java干货
2021/02/19
6910
JVM性能调优监控工具专题一:JVM自带性能调优工具(jps,jstack,jmap,jhat,jstat,hprof)
jvm调优
查看java程序运行的环境参数,包括Java System属性和JVM命令行参数.。
IT云清
2019/06/14
1K0
jvm调优
jstack查看某个进程堆栈信息
jstack主要用来查看某个进程内线程的堆栈信息 一个死锁的模拟代码 package test; import java.util.concurrent.Executor; import java.util.concurrent.Executors; /** * @className: test * @description: TODO 类描述 * @author: mac * @date: 2020/12/3 **/ public class test { public static
开源日记
2020/12/10
3.3K0
JDK 1.8 的 HashMap 详解: 为什么并发会出问题?甚至出现死循环导致系统不可用?
为什么说HashMap是非线程安全的呢?因为在高并发情况下,HashMap在一些操作上会存在问题,如死循环问题,导致CPU使用率较高。
一个会写诗的程序员
2020/02/25
4.7K0
JDK 1.8 的 HashMap 详解: 为什么并发会出问题?甚至出现死循环导致系统不可用?
源码分析:Java中的Thread的创建和运行
在面试候选人的时候,我有时候会提出这样的一个问题:说说你对Java线程的理解?从这个问题开始,可以考察候选人对并发基础的掌握、对操作系统基本概念的理解,如果遇到对底层有浓厚兴趣的同学,我会抛出另一个问题:Java里的线程和操作系统的线程是什么关系?它们是如何对应的?这两个问题,就是今天这篇文章想讲述的。
阿杜
2018/12/27
1.3K0
性能优化-jstack的使用
有些时候我们需要查看下jvm中的线程执行情况,比如,发现服务器的CPU的负载突然增高了、出现了死锁、死循环等,我们该如何分析呢?
cwl_java
2020/02/13
2.2K0
推荐阅读
相关推荐
15个多线程相关的面试题
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档