首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

论文推荐 | Cycle-GAN:通过双向循环实现一个超棒的图像风格转换器

Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks (Cycle-GAN:通过双向循环实现一个超棒的图像风格转换器...推荐原因 ---- 图像到图像的转换,或者说图像风格转换,传统的想法是直接通过 U-Net 之类的结构做像素级别的一对一转换。...GANs 这样的生成器-鉴别器的架构其实很有潜力完成图像转换任务,只不过并不是直接拿来就能用。...首先要把 GANs 生成器的从随机种子生成图像换成从给定图像生成新图像;同时,为了保留图像中的内容信息,作者们设计了损失函数,要求转换后的图像可以再被转换回原图(形成循环,也就是CycleGAN中cycle...这种设计极大地提升了图像转换任务中的模型表现,而且可以不再需要对应的图片对,只需要是两个不同分布的图像就可以。

1.4K20

人工智能辅助服装设计 | Mixlab论文带读

先把服装进行分割,然后再组合,尝试重建,形成新的风格。 ? 服装创意设计助理平台流程示意图 设计师可以选择多件服装,将多种服装的风格合并。...AI助手将输入服装的不同组成部分进行检测分段,并通过组合各个分段生成新的设计。...此过程迭代运行以选择多件服装和多个蒙版以生成大量的变体。 风格迁移 另一种风格迁移的方法则是通过应用不同的样式、颜色和图案来生成服装的多个定制。...image.png 服装风格转换算法流程 风格转换算法流程: 1、设计者从服装风格合并中选择生成的图像作为内容图像(A) 2、基于主题(B)选择喜欢的风格图像(C) 3、合并 image.png...扩展思考 1、可以使用基于生成性对抗网络(GAN)的模型来生成随机化的高质量图像。 2、可以结合不同风格的服装销售数据构建分析算法,来预测不同色彩、样式组合的服装带来的销量。

1.3K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    医疗数字阅片-医学影像-querySelector() 选择器语法-将画布(canvas)图像保存成本地图片的方法

    [OHIF-Viewers]医疗数字阅片-医学影像-querySelector() 选择器语法-将画布(canvas)图像保存成本地图片的方法 将画布(canvas)图像保存成本地图片的方法 使用HTML5...画布技术,你可以在浏览器客户端用JavaScript绘制出各种美丽酷炫的图案,这些图案是不能直接保存的,本身也不是图片形式。...).toDataURL(); 采用class定位 document.querySelector(".cornerstone-canvas").toDataURL(); querySelector() 选择器语法...原文地址:https://www.cnblogs.com/HavenLau/p/10476508.html 选择器 示例 示例说明 CSS .class .intro 选择所有class="intro...3 :root :root 选择文档的根元素 3 :empty p:empty 选择每个没有任何子级的p元素(包括文本节点) 3 :target #news:target 选择当前活动的#news元素(

    97720

    元学习的崛起

    OpenAI的魔方机器人手的成功源于诸如“通过梯度下降学习如何通过梯度下降学习”之类的可笑标题的论文,魔方机器人手的成功反过来也证明了这些想法的成熟。...最左边的灰色条所示的香草SGD数据选择被课程学习方法超越 神经结构搜索或元学习模型通常比数据级优化更受关注,这是由深度学习研究的趋势所驱动的。...当前的架构搜索将神经架构视为有向无环图(DAGs),并试图优化节点之间的连接。...大多数数据扩充搜索(甚至自动领域随机化)都被限制在元学习控制器可用的一组转换中。这些转换可能包括图像的亮度或模拟中阴影的强度。...增加数据扩充自由度的一个有趣尝试是将这些控制器与能够探索非常独特的数据点的生成模型结合起来。这些生成模型可以设计狗和猫的新图像,而不是旋转现有的图像或使图像变暗/变亮。

    81420

    英伟达帮助开发人员通过合成数据训练和完善他们的深度网络

    为了让深度学习变得更容易获取,英伟达的研究人员引入了一个结构化域随机化(structured Domain Randomization )系统,帮助开发人员通过合成数据训练和完善他们的深度网络。...“合成数据是一个有吸引力的选择,因为数据注释基本上是免费的,”研究人员在他们的论文中说。 为了生成合成数据,团队使用了一种称为结构化域随机化(SDR)的方法。...这是一种通用技术,用于程序生成合成的随机图像,以保留当前问题的结构或Context。 “我们的方法只使用SDR生成的合成数据,”该团队表示。...在结构化域随机化(Structured Domain Randomization, SDR)中,随机选择一个场景,然后全局参数(道路曲率、照明、摄像机姿态等),这些参数将导致产生context样条曲线(...该技术还随机化了照明参数,如白天的时间和图像饱和度。 以上视频显示的是在KITTI基准测试上的检测结果,仅在模拟训练后。 ?

    1.2K20

    元学习—Meta Learning的兴起

    苹果研究人员开发的一种这样的方法称为SimGAN。SimGAN使用对抗损失来训练生成对抗网络的生成器,以使模拟图像看起来尽可能逼真,而鉴别器则将图像归类为真实或模拟数据集。...尽管我们已经看到了物理数据也可以进行扩充和随机化,但在图像数据的上下文中最容易理解数据增强。这些图像增强通常包括水平翻转和小幅度的旋转或平移。...当前的架构搜索将神经架构视为有向无环图(DAG),并尝试优化节点之间的连接。...大多数数据扩充搜索(甚至是自动域随机化)都被约束为元学习控制器可用的一组转换。这些转换可能包括模拟中图像的亮度或阴影的强度。...增加数据增强自由度的一个有趣机会是将这些控制器与能够探索非常独特的数据点的生成模型相结合。这些生成模型可以设计狗和猫的新图像,而不是旋转现有的图像或使图像变暗/变亮。

    1.3K10

    英伟达新研究教机器人仅通过观察人类行为完成任务

    该方法利用合成数据来训练神经网络,是第一次在机器人上使用以图像为中心的域随机化方法。...目前训练神经网络的方法需要大量有标记的训练数据,这对这类系统来说是一个瓶颈。通过合成数据生成,不用太费力就可以生成几乎无限的标记训练数据。 这也是第一次在机器人上使用以图像为中心的域随机化方法。...研究人员选择以图像为中心的方式处理数据,以确保网络不依赖于摄像机或环境。...在他们的演示中,研究团队用几个彩色积木和一辆玩具汽车训练目标检测器。系统被教授“块”(blocks)的物理关系,不管这些“块”是堆叠在一起还是彼此相邻放置。...系统然后推断一个适当的程序并按正确的顺序将立方块正确地放置好。因为它在执行过程中会考虑当前世界的状态,因此系统能够实时地从错误中恢复过来。

    42640

    NIPS 2018 | 哪种特征分析法适合你的任务?Ian Goodfellow提出显著性映射的可用性测试

    当要在众多相互竞争的方法中做出选择时,往往缺乏原则性的指导方针,这会让从业者感到困惑。 本论文提出了一种基于随机化检验(randomization test)的可行方法来评估解释方法的性能。...作者在神经网络图像分类任务上分析了一些显著性方法。实际上,本论文提出的方法论适用于任何解释方法。而且本文提出的随机化检验是很容易实现的,可以帮助人们评估某个解释方法对手头任务的适用性。...实际上,边缘检测器也可以产生突出与模型类别预测相关特征的掩码。有趣的是,研究者发现与边缘检测器最类似的显著性方法(即 Guided Backprop 及其变体)对本研究的随机化检验最不敏感。...我们通过一系列对于线性模型和一个简单的 1 层卷积求和池化(sum pooling)架构的分析来说明我们的发现,同时也与边缘检测器进行了对比。...我们通过与图像的边缘检测器(一种既不需要训练数据也不需要模型的技术)进行类比对我们发现进行说明。线性模型和单层卷积神经网络场景下的理论能够支持我们实验中的发现。

    78720

    解读 | ICLR-17 最佳论文:理解深度学习需要重新思考泛化问题

    我们在 CIFA 10 和 ImageNet 分类基准上训练的几种不同标准体系确立了这个事实。 或易言之,模型及其大小、超参数和优化器并不能解释当前最先进神经网络的泛化能力。...至于为什么会发生这种情况的假设是:随机像素比随机化标签的原始图像更容易区分,这是因为原始图像中属于同一个类别的图像在经过类别随机化后被学习为其他类别。...带有一系列变化的团队实验将不同程度和种类的随机化引入数据集: 1)真实标签(没有经过任何修改的原始数据集) 2)部分坏标签(弄乱部分标签) 3)随机标签(弄乱所有标签) 4)混合像素(选择一排像素,然后将它应用于所有图像...我们在模型中做出的某些选择清楚的表明了模型泛化能力的差异(否则所有的架构应该具有相同的泛化能力)。在数据中没有其他真实信号时,世界上泛化能力最好的网络依旧需要回顾一下。...本文分析中的有趣一面是,我们仅仅通过使用梯度下降过程就获得了一定量的正则化: 我们分析 SGD 如何作为一个隐性正则器。对于线性模型,SGD 经常收敛到一个小规模的解决方案。

    1.7K90

    Transformer大升级!谷歌、OpenAI联合推出分层模型,刷榜ImageNet32刷新SOTA

    (如长文档或高分辨率图像)是非常费时费内存的。...稀疏注意力机制通过从一个序列而不是所有可能的Pair中计算经过选择的相似性得分来减少注意机制的计算时间和内存需求,从而产生一个稀疏矩阵而不是一个完整的矩阵。...这些稀疏条目可以通过优化的方法找到、学习,甚至随机化,如Performer、Sparse Transformers、Longformers、RoutingTransformers、Reformers和BigBird...下采样图像的每维位数(BPD),自回归模型和非自回归模型用一条水平线分开 模型生成的例子,其中每个图像的下半部分由我们的模型生成,由上半部分提示 Hourglass在ImageNet32生成任务的自回归模型中获得最佳结果...,在其他图像生成和语言建模任务中也获得极具竞争力的结果。

    48820

    影像组学初学者指南

    另一方面,在医学图像分析中,人工智能应用不可避免地需要影像组学,因为用于训练和构建人工智能模型的指标是通过影像组学方法提供的,特别是特征提取和特征选择技术。...处理方法的选择取决于人工智能算法对数据分布的假设,这些假设将用于进一步的分析。 另一方面,数据集的随机化是创建模型的另一个重要因素,因为ML算法的性能受初始值或种子因素的影响。...值得注意的是,也有一些基于共线状态和与类的最大相关性选择特征的算法,例如,基于相关性的特征选择算法(59)。这些算法非常有用,因为它通过同时进行两种技术,即共线分析和特征选择,减少了降维的工作量。...此外,还有其他集成学习技术,它们由多个算法组成,特别是弱分类器,如k-最近邻、朴素贝叶斯和C4.5决策树算法(68)。虽然在文献中选择算法似乎是任意的,但最佳实践是通过多次实验选择算法。...图5,k-最近邻示意图。这种机器学习算法通过根据邻居的数量将未知对象或实例(蓝色三角形)分配给类的相似对象(橙色和黑色圆圈)来对其进行分类; 图6。概率空间中朴素贝叶斯示意图。

    1.8K20

    NVIDIA新的人工智能技术:机器人观察人类行为,与人类共同完成任务

    最后,执行网络读取计划并为机器人生成动作,同时考虑到当前现实的状态以确保不受外部干扰。 一旦机器人看到任务,它就会生成一个人类可读的重新执行任务必需的步骤描述。...目前训练神经网络的方法需要大量标记的训练数据,这也正是系统的瓶颈。通过合成数据生成,几乎可以无限制地生成几乎无限的有标记的训练数据。 这也是第一次在机器人上使用以图像为中心的域随机化方法。...域随机化是一种产生大量多样性的合成数据的技术,然后让感知网络将真实世界的数据视为其训练数据的另一种变体。研究人员选择以图像为中心的方式处理数据,确保网络不依赖于摄像头或所处环境。...“尽管感知网络在训练过程中从未观察过真实图像,但在严重遮挡的情况下,它也可以可靠地检测真实图像中物体的边界长方体。” 该团队在几个彩色块和一辆玩具车上训练了物体探测器。...因为它在执行过程中考虑到了当前的世界状况,系统能够实时从改正错误。 研究人员将在本周在澳大利亚布里斯班举行的机器人与自动化国际会议(ICRA)上发表他们的研究论文。

    48550

    金融级别的人脸识别支付?

    当检测到脸部时,通过检测您的眼睛是否打开并您指向的设备,脸部识别确认关注并意图解锁。...这些数据用于创建一系列二维图像和深度图,这些图经过数字签名并发送至 Secure Enclave。...为了对抗数字和物理欺骗,原深感摄像头随机化了2D图像序列和深度图捕获,并且映射成一种特定于器件的随机图案。...它不会发送到Apple,也不会包含在设备备份中。在正常操作过程中拍摄的脸部图像不会被保存。 总之,其安全性通过在Secure Enclave环境来进行处理保证,是一种整体性安全方案。...最后说一点,摄像头信息传输安全解决方案必须是要端到端的保护,也就是说需要将泛光感应元件、红外摄像头、距离传感器、接收器、2500万像素前置摄像头、点阵投影仪共同组成了一套全隐藏式3D前后摄像头(双轨潜望结构

    3.2K20

    学界 | OpenAI推出机器人新系统:机器可通过VR演示自主学习新任务

    randomization)来训练它的视觉系统,也就是说,通过向其展示很多有带有不同色彩的模拟对象、背景、纹理,而不用真实的图像来进行训练。...如上个版本(网址上文已附),我们用成千上万模拟的具有不同光照扰动的图像、纹理和物品来训练视觉网络(该视觉系统从未在真实的图像上训练过)。...模仿网络会观察一个给它的演示,通过处理,它可以推断出对应任务的意图(intent),然后从另一个初始构造(configuration)出发来完成这个意图。因此,该模仿网络必须将演示归纳成一个新的设定。...如此方式,模仿网络可以学习去匹配演示器中堆块的顺序与塔的尺寸大小,而不用担心相关塔的位置。...在每一情况下,任务的不同实例包含带有不同初始状态的不同的块集。一个神经网络通过把演示和当前状态作为输入而获得训练,其输出是一个行动,目标是状态和行动的结果序列尽可能地与第二个演示相匹配。

    73280

    从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,照样能跑酷

    因此,后训练步骤包括从视觉策略本身收集 on-policy 数据,并与当前收集的所有数据的学习交错进行。重复这一步骤三次使得该视觉策略显著提升了自身性能。...研究者的要求包括特定天气、一天中的时间、光照条件和文化遗址。手动编辑生成的图像提示是不切实际的,因而他们通过生成少量图像来调整元提示,并进行迭代直到它们始终可以生成合理的图像。...此外,调整控制强度以避免丢失图像细节非常重要。他们采用的场景几何是以往工作中出现的简单地形,包括可选的侧墙。同时避免随机化几何地形以专注视觉多样性分析。...他们从专家教师那里收集了动作标签,并用余弦学习率计划下使用 Adam 优化器运行 70 个梯度下降 epoch。研究者在实验中仅需重复迭代 DAgger 三次就可以实现接近专家表现程度的视觉控制器。...从生成图像中学习要优于域随机化 在模拟评估中,研究者观察到 LucidSim 在几乎所有评估中都优于经典域随机化方法,如下表 1 和表 6 所示。

    9810

    【CVPR2018最佳论文提名】Deep Learning of Graph Matching论文解读

    图 1 计算机视觉图匹配示意图[2] 相比于只考虑节点与节点之间一阶相似度关系的点匹配,图匹配还考虑了图结构中,边到边的二阶相似度,如图 2所示。...由于额外考虑了图结构中的二阶相似度信息,图匹配通常比简单的一阶点匹配更加精确和鲁棒。 ? 图 2 一阶与二阶相似度示意图 考虑两个图结构之间的匹配,我们将一阶、二阶相似度建模为相似度矩阵。...这篇工作将深度学习与图匹配结合,使用卷积神经网络CNN提取图像特征,同时学习构建相似度的匹配函数,通过反向梯度传播以及标准的深度学习梯度优化算法,实现端到端的训练。...提取深度特征: 论文中使用了在ImageNet分类任务上预训练的VGG16[4]网络作为深度特征提取器,学习最适合图匹配问题的图像特征。...实际上,由于CNN网络的中间层能够学习到图像中的共性特征,任何CNN模型稍作修改,都可以作为深度图匹配模型的特征提取器。

    1.1K40

    Elon Musk揭OpenAI研究新突破, 可在VR中自我学习的机器人(附论文)

    上个月,Elon Musk领导的OpenAI展示了这个机器人的早期版本,在那里他们使用域随机化(domain randomization)对其视觉系统进行了培训,即通过使用各种颜色,背景和纹理显示模拟对象...现在,OpenAI开发并部署了一种新的算法,一次性模仿学习,让人们通过在VR中执行它来传达如何做一个新的任务。给定一个演示,机器人能够从任意的起始配置中解决相同的任务。...研究者们用数以千计的模拟图像替代实际观测来训练这一网络,而每一张图像代表了不同的灯光、材质以及物体的组合。 其次,机器人用一个模仿网络来决定人类在虚拟展示中所完成任务的意图。...12月,该公司推出了一个开源平台Universe,用户可以使用游戏,网络浏览器和各种软件来测量和训练AI。...无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。

    89450

    【2天=100年】OpenAI用打Dota2的算法造了一只会转方块的机器手

    与运动之类的其他问题不同,人们在利用传统机器人方法实施灵巧的操作方面的进展一直很缓慢,并且当前的技术在操纵现实世界中的物体上仍然存在局限性。...当指尖的传感器被其他手指或物体遮挡时,Dactyl必须能够处理不完整信息。像摩擦和滑动等物理体系中的许多组成部分,是无法直接通过观察得到的,必须由推理得出。 操纵多个对象。...MuJoCo是一个刚体模拟器,这意味着它不能模拟手指上或肌腱的拉伸时的可变形橡胶。 机器人只能通过反复接触来操纵物体。 然而,众所周知,接触力难以在模拟中准确地再现。...通过校准其参数来匹配机器人的行为,可以使模拟更加逼真,但在目前的模拟器中,许多这样的效果是无法精确建模的。 相反,该方法是在模拟环境的分布上对策略进行训练,其中物理和视觉属性是随机选择的。...控制网络(control network)根据对象的姿态重新定位,视觉网络(vision network)将图像从摄像机映射到对象的姿态,通过结合这两个独立的网络,Dactyl可以通过观察来操纵对象。

    62420

    前沿 | 从虚拟世界伸到现实的机械臂,靠摄像机就能玩转任何物体

    这给了我们最好的方法:通过在模拟中学习,我们可以通过扩展来收集更多的经验,通过不强调现实意义,我们可以解决模拟器只能近似模拟的问题。...OpenAI 和一些其他组织也表示,域随机化可以处理越来越复杂的问题——域随机化甚至还用来训练 OpenAI Five。现在,我们想要看扩展域随机化是否能够解决当前机械臂技术中无法解决的问题。 ?...但在目前的模拟器中,许多这样的效果没办法被精确建模。 相反,我们在分布式模拟环境中训练策略,其中物理和视觉属性是随机选择的。随机值是表示物理系统不确定性的自然方式,也能防止对单个模拟环境的过拟合。...我们使用卷积神经网络训练一个姿态估计器,该神经网络能从位于机械臂周围的三个摄像头获取视频流输入,并输出估计的目标位置与方向。此外,使用三个摄像头能有效解决图像模糊和遮挡等问题。...控制网络能在给定姿态估计的情况下再调整目标,而视觉网络能将从摄像头获取的图像映射到目标的姿态。通过结合这两个独立的网络,Dactyl 能在观察到目标后就对它做一些操作。 ?

    91020

    20大热门项目告诉你,计算机视觉未来的五大趋势

    通过合成图像训练网络大大减少了多任务学习所需的往往昂贵且耗时的数据注释。...域随机化通过刻意和随机地干扰环境的纹理来迫使网络聚焦并识别对象的主要特征,从而减少对高质量模拟数据集的需求。...在这篇文章中,通过评估其先前获得的知识并询问相关的好问题来最大化来自发送到 oracle 的每个图像-问题对学习信号,训练代理像人一样学习。...与无监督域自适应不同,该方法不假设存在跨域公共特征空间,而是采用条件生成器和鉴别器。因此,条件 GAN 被集成到 CNN 框架中,迁移标记的合成图像域到未标记的真实图像域。...同样有意思的是,使用深度图像先验作为正则项,从非常深的层级获得的预图像中仍然能获取大量信息。 ? 尽管 GANs 很成功,但其鉴别器网络作为普通监督任务(如语义分割)的通用损失函数并不算很成功。

    70330
    领券