首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Github七月最热AI项目榜单还有续集!女娲无限版只能排第3?

,并且在 GPU V100上所有高于30FPS的实时物体检测器中具有最高的精度56.8%AP。...Images with Retrieval-Augmented Diffusion Models 作者:Robin Rombach, Andreas Blattmann, and Bjorn Ommer 机构:路德维希...-马克西米利安-慕尼黑大学(Ludwig-Maximilians-Universität München) Github星数:2.4k 摘要:新的架构最近改进了生成图像合成,从而在各种任务中实现了出色的视觉质量...尤其值得注意的是「AI-Art」领域。通过结合语音和图像合成模型,建立了所谓的“提示工程”,其中使用精心挑选和组合的句子来在合成图像中实现一定的视觉风格。...本文提出了一种基于检索增强扩散模型 (RDM) 的替代方法。在RDM中,在每个训练实例的训练期间从外部数据库中检索一组最近邻,并且扩散模型以这些信息样本为条件。

46220

2022玻尔兹曼奖公布:两位获奖者,Hopfield网络提出者在列

该奖项是由 IUPAP 统计物理委员会 (C3) 设立的,旨在表彰研究者在统计物理学领域的杰出成就。获奖者必须是没有获得过玻尔兹曼奖或诺贝尔奖的科学家。...该奖项设立于 1975 年,每三年颁布一次,其名称来自于统计物理奠基者路德维希・玻尔兹曼。...Deepak Dhar 获奖理由:表彰 Deepak Dhar 对统计物理学领域作出的开创性贡献,包括自组织临界模型的精确解、界面生长、无序磁性系统中的普遍长期弛豫、渗透和簇计数问题的精确解,以及对分形的谱维度定义...他是第一个被授予玻尔兹曼奖章的印度人。 此前,Deepak Dhar 获得了阿拉哈巴德大学的学士学位,印度理工学院坎普尔分校的硕士学位,并在加州理工学院获得了物理学博士学位。...Hopfield 获奖理由:John Hopfield 扩展了统计物理学的边界,使其涵盖生命现象,从分子水平信息传输的动力学校对到神经网络的动力学,他创建了一种用于思考大脑计算的新语言。

20630
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    腾讯微信团队 & 上交通 & 南大 揭秘模型汤,构建与优化,视觉-语言模型的强基准与有效改进策略研究 !

    在本工作中,作者提出了使用模型soup将使用不同数据集训练的各种超参数的模型权重合并以进一步提高性能的方法。...这一方法涉及在不同的数据集上对模型权重进行视觉指令调优后合并模型权重,从而实现显著的性能改进。 3 Methods 在子部分3.1中,作者从先前的方法中整合各种技术,以创建进一步实验的强基准。...这个问题在前人的文章中已经 discussed。因此,作者提出了一种保持图像比例一致的方法,名为一致比例动态高分辨率(见图2)。...为了解决这个问题,由图像描述生成模型生成的合成标题,如LAION-COCO和BLIP-LAION(Li et al., 2022)中的标题,已经被提出。...这些对问题的图像是从LAION-5B(Schuhmann等人,2022年)中随机选择的。作者将最终视觉指令调优数据集的构成称为Base Set。

    11110

    解释总有尽头——​维特根斯坦:语言的边界

    维特根斯坦一家也没能摆脱这种忧郁情绪,父亲本人就一直很脆弱,五个儿子中的三个选择了自杀,路德维希·维特根斯坦一生都在与反复发作的抑郁症做斗争。...路德维希·维特根斯坦在学校成绩中等,在同学中显得格格不入,总是试图通过彬彬有礼的行为举止来掩盖内心的不安。...于是,他将路德维希接回了维也纳。路德维希在熟悉的环境中,果然好了一些,他读了许多书,其中,克莱斯特、歌德、默里克、莱辛对他影响很大,而叔本华哲学所宣扬的残酷的世界观,给他留下了深刻印象。...这样的变化,他在之后的生活中还会多次经历,这些动摇了他的整个心灵……在那些天里,路德维希处于一种难以形容、几乎是病态的兴奋中。”...——对象很简单;而组合方式是可变的、不定的。对象的组合构成了事态。——我们会为自己造出事实的图像。——在图像中,图像的要素与对象相对应。——图像与被反映物在反映的逻辑形式上是统一的。

    2.4K10

    推荐收藏 | 21 个必须知道的机器学习开源工具!

    这是一个广阔的领域,我可以想象第一步可能会多么令人生畏。没有编程经验的人能否在机器学习中取得成功? 事实证明,你可以!...这里有一些工具可以帮助你跨越鸿沟并进入著名的机器学习世界: 优步路德维希:路德维希允许我们训练和测试深度学习模型,而无需编写代码。...这种可视化实现整个模型工作流的方法非常直观,在处理复杂的问题陈述时非常有用。 ? Orange:您不必知道如何编码以便能够使用Orange挖掘数据,处理数据并获得洞察力。...TensorFlow.JS - TensorFlow.JS可以成为你在网络上部署机器学习模型的首选。它是一个开源库,可让你在浏览器中构建和训练机器学习模型。 ?...Google Magenta:此库提供了用于处理源数据(主要是音乐和图像)的实用程序,使用此数据来训练机器学习模型,最后从这些模型生成新内容。

    60520

    21个必须知道的机器学习开源工具!

    这是一个广阔的领域,我可以想象第一步可能会多么令人生畏。没有编程经验的人能否在机器学习中取得成功? 事实证明,你可以!...这里有一些工具可以帮助你跨越鸿沟并进入著名的机器学习世界: 优步路德维希:路德维希允许我们训练和测试深度学习模型,而无需编写代码。...用于模型部署的开源机器学习工具 部署机器学习模型是最容易被忽视但重要的任务之一,它几乎肯定会在采访中出现,所以你可能也很熟悉这个话题。 以下是一些框架,可以更轻松地将你的项目部署到现实世界的设备中。...TensorFlow.JS - TensorFlow.JS可以成为你在网络上部署机器学习模型的首选。它是一个开源库,可让你在浏览器中构建和训练机器学习模型。...Google Magenta:此库提供了用于处理源数据(主要是音乐和图像)的实用程序,使用此数据来训练机器学习模型,最后从这些模型生成新内容。

    55070

    20个必知的自动化机器学习库(Python)

    Auto-SKLearn将机器学习用户从算法选择和超参数调整中解放出来。它包括功能设计方法,例如一站式,数字功能标准化和PCA。该模型使用SKLearn估计器来处理分类和回归问题。...官方网站 https://nni.readthedocs.io/en/latest/ Ludwig 路德维希(Ludwig)是一个工具箱,可让用户无需编写代码即可训练和测试深度学习模型。...路德维希提供了一组模型体系结构,可以将它们组合在一起以为给定用例创建端到端模型。...举例来说,如果深度学习图书馆提供了建造建筑物的基础,路德维希提供了建造城市的建筑物,您可以在可用建筑物中进行选择,也可以将自己的建筑物添加到可用建筑物中。...可理解性:深度学习模型的内部通常被认为是黑匣子,但是路德维希(Ludwig)提供了标准的可视化效果来了解其性能并比较其预测。

    72320

    “偷”代码建起公司、学历造假、6天拿下1亿美元却拖欠工资,这位AI独角兽CEO屡遭质疑后亲自回应了

    ——Björn Ommer, 慕尼黑路德维希马克西米利安大学与海德堡大学教授 之后,Stability 的业务重心又转移了好几次。...但根据领导慕尼黑路德维希马克西米利安大学和海德堡大学研究团队的 Björn Ommer 教授的介绍,该模型在训练过程中只使用过几十个英伟达 GPU。...Bishara 表示,Stability 已经在官方网站和 Stable Diffusion 的 GitHub 页面上“多次发表声明”,对路德维希马克西米利安大学和 Runway 公司表达了赞赏。...Stability 还面临两项诉讼,指控其违反版权法以训练 AI 模型。该公司还以一项动议,以艺术家无法确定具体侵权案例为由驳回了其中一项由艺术家提出的集体诉讼。...她写道,这套模型曾被用于生成“被暴力殴打的亚洲女性”和“色情作品,包括一些高度写实的真人”图像。

    31020

    机器学习算法在预测化学品的毒性方面胜过动物试验

    编译:chux 出品:ATYUN订阅号 研究人员报告称,用大量化学安全性数据进行训练的机器学习软件能够很好地预测某种毒性,而这样的预测甚至可以与昂贵的动物研究结果相媲美,有时甚至准确率更高。...论文“draws attention to the new possibilities of big data”中,德国路德维希港化学公司巴斯夫的毒理学家Bennard van Ravenzwaay说明...这些模型通常包含分子的化学结构,了解它在体内的反应以及动物试验或体外研究的数据。...因此,在2014年,Hartung的团队将可用数据提取到机器可读数据库中。这导致了Hartung和ECHA之间的法律纠纷,因为该机构表示,研究细节属于进行测试的公司。...他负责协调这项工作并为北美达勒姆的美国国家毒理学计划开发替代毒性测试方法。今年晚些时候,美国环境保护署(EPA)计划在线发布免费下载的共识模型。

    47530

    20个必备的Python机器学习库,建议收藏!

    Auto-SKLearn将机器学习用户从算法选择和超参数调整中解放出来。它包括功能设计方法,例如一站式,数字功能标准化和PCA。该模型使用SKLearn估计器来处理分类和回归问题。...官方网站 https://nni.readthedocs.io/en/latest/ Ludwig 路德维希(Ludwig)是一个工具箱,可让用户无需编写代码即可训练和测试深度学习模型。...路德维希提供了一组模型体系结构,可以将它们组合在一起以为给定用例创建端到端模型。...举例来说,如果深度学习图书馆提供了建造建筑物的基础,路德维希提供了建造城市的建筑物,您可以在可用建筑物中进行选择,也可以将自己的建筑物添加到可用建筑物中。...可理解性:深度学习模型的内部通常被认为是黑匣子,但是路德维希(Ludwig)提供了标准的可视化效果来了解其性能并比较其预测。

    83520

    性能堪比GPT-3,但参数量仅为0.1%,LMU团队推出NLP最强文本生成模型

    近日,慕尼黑路德维希·马克西米利安大学(LMU)AI研究团队公布了一项最新研究成果,即在文本生成方面,仅用2.23亿参数量,就可以到达GPT-3的效果。 ?...这是通过将输入文本转换成包含任务描述的完形填空,并结合梯度优化来实现的。此外,利用未标记的数据也可以进一步改进;我们确定了使用小语言模型理解自然语言所需的几个关键因素。...具体来说,PET将完形填空问题的重新表述与基于梯度的规则微调相结合,弥补了GPT-3大模型的弊端。同时,它不需要对数据进行标记,而且能够适用于多个令牌的预测任务。...2 突破大模型的限制,提供新的可能性 论文的结论中表明,通过PET训练方法,可以在参数量少三个数量级的情况下,在SuperGLUE测试中实现类似GPT-3的性能。...PET是一种将任务重新定义为完形填空问题,并为不同的重新表述训练一组模型的方法,它能够用于需要预测多个令牌的任务。

    53810

    一条妙计确保你的AI模型总是有帮助

    这种删减和总结信息的行为是预测的本质,在本文中,我将解释如何定义、度量(近似)和利用这一过程来改进预测模型和人工智能(以及在预测天气这样的问题中给出正确的答案)。...1.玻尔兹曼对熵的理解 没有什么比一个好的理论更实际的了。 - 路德维希·玻尔兹曼 如果你熟悉熵的概念,你可能已经了解了其中一两个系统的定义(例如热力学熵,信息熵,等等)。...我最喜欢的定义之一,最早是在1875年左右由天才路德维希·玻尔兹曼(Ludwig Boltzmann)提出的,现在通常被称为玻尔兹曼熵或是玻尔兹曼熵公式。...但是,假若你还没有看到这个特定的图像,那么这些微观状态中的任何一项都可能同样适合该宏观状态: ? 图4:所有这些都可以对应“一副内容是蒙娜丽莎的剪贴画,可以重复使用”。...2.地图中存在的问题 “以猫为例,猫最好的物质模型是另一只猫,或者说最好是一只完全相同的猫。” - Norbert Wiener,科学哲学(1945) 我们来做一个小小的思考实验。

    44430

    人工智能续写贝多芬生前未完成的《第十交响曲》【智能快讯】

    研究团队人员正在演奏 AI 所续写的第十交响曲 路德维希·范·贝多芬(Ludwig Van Beethoven),1770 年 12 月 16 日(所以 ,今天正好是贝多芬诞辰 249 周年),出生于德国波恩...南加州大学社会人工智能中心(CAIS)的副主任 Vayanos 和她的团队在过去的几年中一直在努力设计一种算法,能够识别在给定的现实社会群体中,谁是最佳人选,可被训练为「看门人」(gatekeepers...来源:eurekalert.org 技术 通过评估假设性的行为来学习人类的目标 DeepMind 提出了一种在未知的不安全状态下,从人类反馈中训练强化学习模型的方法。...当我们在现实世界中训练强化学习(RL)代理时,我们不希望他们过多地探索不安全的环境或状态,比如将移动机器人推入水沟或给老板写一封尴尬的电子邮件。在不安全状态下训练 RL 代理被称为安全探索问题。...DeepMind 今天发博客表示其解决了这个问题的最难的部分——代理最初不知道如何定义环境中的不安全,他们在训练中提供了一个信息源:即来自人类用户的关于不安全状态的反馈。

    58420

    Ethernet-APL产品在国外进行的评估测试(一)(赠书)

    JZGKCHINA 工控技术分享平台 Ethernet-APL产品在国外进行的评估测试在资料上看到的有两处:德国路德维希港的巴斯夫(BASF)化工厂、美国俄亥俄州西切斯特的宝洁工厂。...这里先介绍巴斯夫化工厂进行的评估测试。 1 巴斯夫Ethernet-APL评估测试实验室 我们先来看看德国路德维希港巴斯夫化工厂进行的Ethernet-APL产品评估测试。...从2016年NAMUR大会开始,路德维希港巴斯夫的自动化专家就注意到Ethernet-APL新通信基础设施的应用可能性,他们开始研究Ethernet-APL的细节,并对来自不同制造商的现场仪表进行了测试...巴斯夫评估测试实验室工作人员对Ethernet-APL提供的预测性维护能力非常感兴趣,数据高速传输意味着更高级别的应用程序可以处理更多信息,快速分析设备运行状况,并在导致故障之前确定问题。...Ethernet-APL的未来发展将把这一技术的应用扩展到功能安全应用中。

    36020

    一文读懂:AI大模型训练中的核心版权问题

    问题提出:大模型训练中的版权争议备受关注1.这是探讨大模型版权所有问题的起点一方面,大模型训练问题存在于生成式人工智能生命周期的伊始,如不能妥善解决,AIGC大模型的研发便始终处于侵权不确定状态。...实践中,具有讽刺结果的是,任何限制模型训练内容规模与可用性的举措都可能产生意想不到的问题,即增加模型简单输出被训练作品复制内容的概率。...从目前广泛应用的AIGC产品模型来看,模型训练阶段的“作品处理”行为大致有两类:一类是“文生图”领域比如Stable Diffusion模型,通过对既有图像内容的分析处理,获得思想层面的艺术风格、感觉、...目前来看,我国现行法《著作权法》尚未能对模型训练阶段的版权利用问题加以有效涵摄,需要从“三步检验法”立法标准出发,思考创设新的版权责任豁免机制的正当性。...“三步检验法”也是各国设立版权限制与例外规则所应当遵循的立法标准。如若将AIGC模型训练行为纳入我国版权法中“权利限制与例外”体系,也应符合这一要求。

    1.6K20

    CNN+LSTM--一种运动想象分类新模型

    与过去的 BCI 竞赛相比,解决了与实际 BCI 系统高度相关的新的挑战性问题,例如(数据集链接已附上): •无试验结构的连续脑电图分类(数据集 1)。...,其中还包含空闲状态的时间段[64个EEG通道(0.05-200Hz),1000Hz采样率,2个类别(+空闲状态),7个科目] 数据集 2a: ‹4 级运动图像› 由 格拉茨科技大学知识发现研究所 (...> 由 弗莱堡阿尔伯特路德维希大学 脑机接口计划、弗莱堡伯恩斯坦计算神经科学中心 和 图宾根大学医学心理学和行为神经生物学研究所提供( Stephan Waldert , Carsten Mehring...最后,这两个部分被归类为完全连接的层。除此之外,这个混合模型使用直系线性单元(ReLU)激活和批量归一化(BN)来规范CNN中的激活函数。激活函数tanh用于LSTM。...为了帮助规范模型,我们在每层中使用drop out(随机丢掉一些神经元),并将drop out设置为0.5,以帮助防止在小样本量训练时过度拟合。

    2.7K61

    即插即用:把仿生模块和CNN拼接,对抗攻击鲁棒性显著提高!

    论文地址:https://www.biorxiv.org/content/10.1101/2020.06.16.154542v1 这项工作是由来自慕尼黑大学、路德维希·马克西米利安大学和奥格斯堡大学的科学家的帮助下完成的...1 关于卷积神经网络 目前,计算机视觉所使用的主要架构是卷积神经网络(CNN)。当多个卷积层堆叠在一起时,卷积层可训练于从图像中学习和提取层次特征。...“同时,DNN难以抵抗图像的自然退化(比如增加噪音),因此,鲁棒性通常是DNN的一个开放问题。考虑到这一点,我们认为可以从这个角度去寻找大脑和DNN之间的差异。”...此外,他们还测试了一些已经过“对抗训练”的深度学习模型,在这个过程中,神经网络在对抗样本中进行训练,以避免分类错误。...VOneNet证明,生物智能仍然有很大的发展潜力,可以解决AI研究正面临的一些基本问题。论文所介绍的模型直接采自灵长类动物神经生物学,只需要较少的训练便能实现更类人的行为。

    96720

    Pytorch训练网络模型过程中Loss为负值的问题及其解决方案

    问题描述在复现论文的过程中,遇到了训练模型Loss一直为负的情况。程序主要通过深度学习实现一个分类任务。...训练过程中输出信息如下:?...或者将nn.functional.nll_loss()换成模型中的nn.CrossEntropyLoss(),不过这样需要修改的代码较多,我采用了前者作为解决方案,解决了问题。?3....总结针对解决方案一,我认为应该是主要针对回归问题而言的,因为回归问题中的模型输出具有很大的不确定性,需要归一化处理。而分类问题中,大多数输出都是转化成独热码形式,按理说不应该出现范围溢出的情况。...所以遇到此类问题,回归任务主要检查方案一中的问题;分类问题主要检查方案二中的问题,基本就能解决。

    14.8K30

    深度学习图像识别项目(下):如何将训练好的Kreas模型布置到手机中

    AiTechYun 编辑:yxy 在上篇的博文中,你学到了如何用Keras训练卷积神经网络 今天,我们将这种经过训练的Keras模型部署到iPhone手机或者说iOS的APP中,在这里我们使用CoreML...回顾一下,在这个由三部分组成的系列中,我们学习了: 如何快速构建图像数据集 训练Keras和卷积神经网络 使用CoreML将我们的Keras模型部署到手机应用程序中 我今天的目标是向你展示使用CoreML...如果你的模型是使用BGR颜色通道排序进行训练的,那么将此值设置为True非常重要, 以便CoreML按预期运行。如果模型是使用RGB图像进行训练的,则可以放心地忽略此参数。...如果你的图像不是BGR或RGB,请参阅文档。 我还想指出,如果您在iPhone应用程序中对查询图像执行均值减法,则可以通过参数添加红/绿/蓝/灰的偏差。例如,这对许多ImageNet模型都是必需的。...然后,我使用上篇文章的代码重新训练模型。background类由从我的系统上的UKBench数据集中随机抽取的250个图像组成。 在Xcode中创建一个Swift + CoreML深度学习项目 ?

    5.4K40

    深度学习中模型训练的过拟合与欠拟合问题

    在机器学习和深度学习的模型训练中,过拟合和欠拟合是训练模型时常见的两种问题,它们会严重影响模型的泛化能力。一个好的训练模型,既要避免欠拟合,也要避免过拟合。...防止过拟合的方法假设我们正在开发一个图像分类模型,用于识别手写数字(例如MNIST数据集)。在这个过程中,我们可能会遇到过拟合的问题。...比如,可以对原始图像进行随机旋转、平移、缩放等操作,从而生成新的训练样本。这样不仅能增加训练集的大小,还能帮助模型学习到更具鲁棒性的特征。正则化为了控制模型复杂度,我们可以引入L2正则化。...这种方法适用于多种场景下的机器学习任务,尤其是在特征选择和模型设计已经相对合理的情况下,进一步优化训练过程可以显著提升模型的性能。...通过上述措施,我们可以改善模型的泛化能力,使其在面对新数据时也能保持良好的预测性能。然而,值得注意的是,解决这些问题往往需要反复试验和调优,因为不同的数据集和应用场景可能需要不同的解决方案。

    23220
    领券