首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

OpenAI再放杀器Shap-E:史上最快的文本转3D模型,代码、模型全开源

去年12月,OpenAI曾发布Point-E模型,只需几秒钟即可根据文本生成3D资产,相比竞品模型DreamFusion提速大约600倍。...Shap-E只用NeRF渲染目标对编码器进行预训练,因为研究人员在实验中发现这个操作比基于网格(mesh-based)的目标更稳定,而且可以进行优化。...数据集 为了和其他模型进行公平的对比,研究人员选择了和Point-E论文中相同的数据集(具有渲染图、点云和文字说明的大型三维资产数据集),但具体的后处理操作略有变化。...对于文本条件模型和相应的Point-E基线,研究人员采用了底层3D资产和文字说明的扩展数据集,从高质量的数据源中又收集了大约100万个3D资产。...此外,还额外标注了12万个资产描述,作为大型数据集下的高质量子集。 在文本到3D模型的训练过程中,当人类提供的标签和原始文本说明都可用时,会在两者之间随机选择一个。

49430

什么是 CORS(跨源资源共享)?

CORS 将新的 HTTP 标头添加到标准标头列表中。新的 CORS 标头允许本地服务器保留允许的来源列表。 来自这些来源的任何请求都会得到批准,并且允许他们使用受限资产。...有不同类型的请求允许更复杂的行为,例如数据操作或删除的跨域请求。 存在这些不同的请求是因为我们可能希望根据来源授予不同级别的访问权限。...作为外部用户,我们只能看到网站的内容,不能更改文本或视觉元素。 GET /index.html HEAD: 该HEAD请求预览将与请求一起发送的标头GET。...这方面的一个例子是向论坛线程添加评论。 浏览器向服务器发送添加您输入的评论的请求。一旦被接受,论坛服务器就会获取新收到的数据(评论)并将其存储起来以供其他人查看。...最常见的预检方法是DELETE从服务器中删除选定的文件或资产。 预检请求包括请求者的来源和所需的方法,使用 表示Access-Control-Request-Method。

46930
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    WorkBox 之底层逻辑Service Worker

    在这个示例中,这个Promise执行两个异步操作: 创建一个名为前端柒八九_v1的新Cache实例。 在创建缓存之后,使用其异步的addAll方法「预缓存」一个资源URL数组。...destination,以一种避免使用所请求资产的文件扩展名的方式描述所请求内容的类型。 「异步操作是关键」。...如果资产在缓存中,就从缓存中提供。 如果请求不在缓存中,去访问网络。 一旦网络请求完成,将其添加到缓存,然后返回网络响应。...Service Worker 预缓存的陷阱 如果将预缓存「应用于太多的资产」,或者如果Service Worker在页面「完成加载关键资产之前」就注册了,那么可能会遇到问题。...这减少了预缓存可能干扰加载页面的关键资产的机会,从而意味着页面可以更快地实现交互,而无需处理后来可能不需要的资产的网络请求。

    44220

    Bytom资产发行与部署合约教程

    在比原链上发行资产比较方便快捷,使用节点的dashboard图形界面操作就可以,先在 “资产”一栏新建资产 ?...输入账户的密码,等待交易确认,一旦确认成功资产就会发到刚才指定的地址上。可以只发一个地址,也可以发到多个地址,添加多个Control with address 即可。...即是编译合约时会指定数值,如果解锁合约的人带上大于此数值则可以获得合约里的资产。...编译后会返回一个status 成功或者失败,和一串 data,都是为json格式的数据,主要需要 data里面的 program,即是该编译完成的合约程序,在部署合约时需要用到。 ?...如果符号合约条件即可解锁成功,否则区块确认解锁合约的交易时会失败。 sign-transaction和submit-transaction 参考部署合约的就可以,完全是一样的。

    46920

    谷歌发布文本3D生成模型DreamFusion,重点是zero-shot

    论文链接:https://arxiv.org/abs/2209.14988 训练后的模型可以在任意角度、任意光照条件、任意三维环境中基于给定的文本提示生成模型,整个过程既不需要3D训练数据,也无需修改图像扩散模型...虽然二维图像生成的应用场景十分广泛,但诸如游戏、电影等数字媒体仍然需要成千上万的详细的三维资产来填充丰富的互动环境。...目前,3D资产的获取方式主要由Blender和Maya3D等建模软件手工设计,这个过程需要耗费大量的时间和专业知识。...文中采用的方法是利用扩散模型的结构,通过优化实现可操作的取样,当损失函数最小化时生成一个样本,然后对参数θ进行优化,使x=g(θ)看起来像冻结扩散模型的样本。...对于大于60°的高仰角,在文本中添加俯视(overhead view),对于不大于60°的仰角,使用文本embedding的加权组合来添加前视图、侧视图 或 后视图,具体取决于方位角的值。

    1.2K20

    谷歌发布文本3D生成模型DreamFusion,重点是zero-shot

    论文链接:https://arxiv.org/abs/2209.14988 训练后的模型可以在任意角度、任意光照条件、任意三维环境中基于给定的文本提示生成模型,整个过程既不需要3D训练数据,也无需修改图像扩散模型...虽然二维图像生成的应用场景十分广泛,但诸如游戏、电影等数字媒体仍然需要成千上万的详细的三维资产来填充丰富的互动环境。...目前,3D资产的获取方式主要由Blender和Maya3D等建模软件手工设计,这个过程需要耗费大量的时间和专业知识。...文中采用的方法是利用扩散模型的结构,通过优化实现可操作的取样,当损失函数最小化时生成一个样本,然后对参数θ进行优化,使x=g(θ)看起来像冻结扩散模型的样本。...对于大于60°的高仰角,在文本中添加俯视(overhead view),对于不大于60°的仰角,使用文本embedding的加权组合来添加前视图、侧视图 或 后视图,具体取决于方位角的值。

    79510

    听GPT 讲Rust源代码--compiler(31)

    这个文件中,主要包含了一系列Unicode字符的断言规则,用于检测"&&"操作符在Unicode文本中的正确使用。...它通过使用内部的静态资源,从预烘焙的数据中构建ICU资源,并将其返回给调用者。这样,编译器就可以使用这些资源来执行各种与Unicode相关的操作,如字符转换、字符串处理、排序等。...BakedDataProvider结构体及其相关辅助结构体和方法提供了从预烘焙数据中获取ICU资源的功能,以支持编译器对Unicode文本的处理。...这些结构体和trait共同实现了元数据的解码过程,并提供了访问和操作解码后的元数据的方法。...ForeignModules结构体还定义了一系列可以对外部模块进行操作的方法,比如添加外部模块、获取外部模块信息等。 ForeignModule结构体:该结构体用于表示单个外部模块的详细信息。

    9510

    数据降本利器:无用数据下线自动化

    整体的方案如下图所示: 为方便说明,先简单介绍下图里涉及的系统: 数据研发平台(下文简称DP),一站式大数据管理与应用开发平台 数据资产平台(下文简称Meta),数据资产管理、治理平台 BI系统,有赞自研的可视化数据分析系统...主要能力是: 读取RDS里待下线资产信息(该信息在离线加工后,通过DataX导入RDS),根据规则做通知、下线等操作,并记录过程和结果; 执行下线逻辑,需要和Hive、DP对接,以实现数据的删除、恢复,...根据任务的调度频率,判定标准有所差异: 季级任务从6个月前的1号开始调度天数全部失败,且调度次数大于等于2次 月级任务从3个月前的1号开始调度天数全部失败,且调度次数大于等于3次 周级任务从6周前的周一开始调度天数全部失败...候选池剔除过滤池,得到“预下线池” 在“预下线池”一定时间后,进入“下线池” 以上过程,涉及到很多“阈值”,比如多久算长期、预下线池连续多久后进入下线池等,可以根据实际的业务情况制定。...下线表备份一定时间,过期后再清理。期间如果发现异常,支持快速回滚; 数据准确性监控。

    60420

    蓝队分析研判工具箱(更新2024.07.18)

    蓝队分析研判工具箱,功能包括内存马反编译分析、各种代码整理、网空资产测绘功能、溯源辅助、解密冰蝎流量、解密哥斯拉流量、解密Shiro/CAS/Log4j2的攻击载荷、IP/端口连接分析、...https://github.com/abc123info/BlueTeamTools 2024.07.18修改冰蝎、哥斯拉、天蝎解密后中文乱码问题,可以手工选择相应编码进行切换。...2024年5月28日修复“网空资产测绘”功能的多个bug,添加对域名搜索功能。...2023.07.20 为每个文本框添加右键单击功能。 2023.07.20添加URL全编码功能。 2023.07.19 对所有的文本输入框添加右键复制、粘贴、全选、删除功能。...2022.10.29 加入对Base64解码后的类文件的反编译功能。 2022.10.28 优化“端口连接分析”功能,提升查询IP的物理地址速度,秒出结果。

    19510

    Next.js项目部署到GitHub Pages问题整理

    混合模式:在一个项目中同时支持构建时预渲染页面(SSG)和请求时渲染页面(SSR)。 增量静态生成:在构建之后以增量的方式添加并更新静态预渲染的页面。...我试了一下,会自动在项目根目录创建 .github/workflows/nextjs.yml 文件,提交后就会自动开始部署。...默认的配置文件有些复杂,而且会构建失败,我再此基础上根据自己的需求做了简化修改。...Next.js 配置 output 在配置文件 next.config.js 中添加配置代码,添加完是这样的: /** @type {import('next').NextConfig} */ const...(上面配置完后,编译完会在根目录生成一个 out 文件夹): - name: Upload artifact   uses: actions/upload-pages-artifact@v2   with

    63510

    5分钟生成漫威3D数字人!美队蜘蛛侠小丑都能搞定,高清还原面部细节丨SIGGRAPH 2023

    然而,从文本或图像生成3D模型仍然存在许多挑战。...根据文字描述生成3D资产 该研究团队提出的文本指导的渐进式3D生成框架(简称DreamFace),结合了视觉-语言模型、隐式扩散模型和基于物理的材质扩散技术,生成符合计算机图形制作标准的3D资产。...项目网站:https://sites.google.com/view/dreamface 预印版论文:https://arxiv.org/abs/2304.03117 Web Demo: https:/...引入了双通道外观生成的设计,将一种新颖的材质扩散模型与预训练模型相结合,同时在潜在空间和图像空间进行两阶段优化。...接下来,使用隐式扩散模型(LDM)和得分蒸馏采样(SDS)处理,从而在粗略几何模型中添加面部细节和详细的法线贴图,生成高精度几何体。

    31310

    【Android 高性能音频】Oboe 开发流程 ( 导入 Oboe 库 | 使用预构建的二进制库和头文件 | 编译 Oboe 源码 )

    : 使用 预构建的二进制库和头文件 ; ② 编译源码 : 直接 添加 Oboe 源码到工程中 , 在 Android Studio 中编译 Oboe 源码 ; Oboe 导入库方案适用场景 : 使用稳定功能..., 给 Java 层使用的 使用上述配置 , AS 4.1 , Gradle 6.6.1 , Gradle Plugin 4.1.0 , 即可编译通过 , 有任意一个版本低了 , 都会编译失败 ;.../oboe 指定的是编译后的二进制文件存放位置 ; add_subdirectory (${OBOE_DIR} ..../oboe 指定的是编译后的二进制文件存放位置 ; add_subdirectory (${OBOE_DIR} ./oboe) # 4....链接函数库 , native-lib 是本应用中编译的动态库 , 这里链接 log 日志库 , oboe 高性能音频库 # 该 oboe 函数库就是上面 add_subdirectory 操作编译的

    1.1K00

    Bytom资产发行与部署合约教程

    在比原链上发行资产比较方便快捷,使用节点的dashboard图形界面操作就可以,先在 “资产”一栏新建资产 [f229d533b8f0647e8b22bcb2ba7db975296.jpg] 新建完资产...可以只发一个地址,也可以发到多个地址,添加多个Control with address 即可。...即是编译合约时会指定数值,如果解锁合约的人带上大于此数值则可以获得合约里的资产。...[928fac512d71c9181d8281e1d8ea9d2b80c.jpg] 编译后会返回一个status 成功或者失败,和一串 data,都是为json格式的数据,主要需要 data里面的 program...如果符号合约条件即可解锁成功,否则区块确认解锁合约的交易时会失败。 sign-transaction和submit-transaction 参考部署合约的就可以,完全是一样的。

    50640

    XcodeXcode 9 的全新功能您会喜欢的工具。内建 Interface BuilderXcode IDE

    重构和转换 全新的编辑器远不止于文本输入,更拥有新的内置重构和转换引擎。当您选择一个符号或代码块时,编辑器会提供如“Extract (提取)”和“Rename (重命名)”等强大操作。...代码段 代码段库中有数十种预配置代码实现方式,比如定义新类或方法。通过自定义或添加代码段,只需键入少量字符即可插入那些频繁输入的代码。...借助此编译器,您的代码可以快速编译,并且由 Apple 优化后,可以生成专为 iPhone、iPad 和 Mac 中的 CPU 调试的超快 app。...资产目录 Xcode 中的资产目录编辑器管理 app 的图像,可将相同资产的各种分辨率图像分组归类。构建时,Xcode 将资产目录编译成最高效的最终分发捆绑包。...FileMerge 比较、区分和合并任何文本文档。

    8.3K30

    Qt5 和 OpenCV4 计算机视觉项目:1~5

    如前所述,我们将使用这种机制来抽象一种可以轻松添加新编辑功能的方式。 完成后,在添加新的编辑功能时,只需要注意编辑功能的名称和Mat实例上的操作即可。...项目文件更新后,我们可以编译并运行我们的应用。 对其进行编译,启动,然后单击“打开摄像机”操作-您将在我们应用的主要区域中看到视频。...QAction *calcFPSAction; 该操作将添加到文件菜单。 单击后,将调用新添加的calculateFPS插槽。...现在,让我们再次编译并运行我们的应用。 应用显示其主窗口后,我们可以单击“文件”菜单下的“打开相机”操作以打开相机,然后单击“快门”按钮拍照。...应用启动后,我们打开其中包含文本的图像,然后单击工具栏上的 OCR 操作。

    6K10

    Java中规模软件开发实训——简单的文本编辑器(代码注释详解)

    支持缩放功能,可以通过鼠标滚轮和Ctrl键进行文本的放大和缩小。 在代码编辑区域中输入代码后,可以进行编译操作,将代码保存到文件并执行javac命令进行编译。...编译结果将显示在消息对话框中,显示编译成功或编译失败的消息。 可以运行编译后的代码,调用系统命令行执行java Main命令,并获取代码运行的输出结果。 运行结果将显示在消息对话框中。...编译成功后,会显示编译成功的消息对话框;编译失败则显示编译失败的消息对话框。 运行代码:支持代码的运行操作。...编译成功后,会显示编译成功的消息对话框;编译失败则显示编译失败的消息对话框。 代码运行功能:支持代码的运行操作。...(this, "编译失败!")

    18110

    使用虚幻引擎自动化工具实现自动化部署

    这是引擎的预构建、即用型版本。根据您在启动器中选择的选项,它包含为所有桌面应用程序和移动目标打包项目所需的所有依赖项。 接下来一种引擎类型是从源代码编译而来。...虽然这种引擎类型是最通用的,但它需要编译所有内容,通常需要 15-60 分钟,具体取决于所使用的系统,并且占用的大小是预构建引擎的 4 倍以上....当尝试仅使用 UAT 打包项目时,由于缺少项目的编辑器 dll,它将失败(在项目的干净版本上)。要创建缺少的 dll,我们需要使用 UBT 为我们的项目构建编辑器目标。...接下来是操作步骤: 3Building the Editor Target 在我们启动 UAT 之前,我们首先需要为我们的项目编译编辑器目标,以获取我们的编辑器 dll 的最新版本。...Build:使用所有必要的运行时模块编译引擎、引擎插件、项目插件和项目本身,通常在最后创建一个可执行文件 Cook:将所有引用的资产转换为目标平台的相应运行时格式(例如,在 Windows 上将纹理转换为

    2K10

    教程 | Adrian小哥教程:如何使用Tesseract和OpenCV执行OCR和文本识别

    使用 OpenCV 检测出图像中的文本区域后,我们提取出每个文本 ROI 并将其输入 Tesseract,从而构建完整的 OpenCV OCR 流程!...frozen_east_text_detection.pb:EAST 文本检测器。该 CNN 已经经过预训练,可用于文本检测。...仅仅在边界框的四角周围添加 5% 的填充,我们就能够准确识别出「BAKE」、「U」和「'S」。 当然,也有 OpenCV 的失败案例: ? ?...图 9:添加了 25% 的填充后,我们的 OpenCV OCR 系统能够识别招牌中的「Designer」,但是它无法识别较小的单词,因为它们的颜色与背景色太接近了。...我们的 OpenCV OCR 系统可以很好地处理一些图像,但在处理另外一些图像时会失败。该文本识别流程失败存在两个主要原因: 文本被扭曲或旋转。

    3.9K50

    X-Dreamer |通过弥合Text-to-2D和Text-to-3D生成领域之间的差距来创建高质量的3D资产。

    其中,DreamFusion [4] 引入了一种有效的方法,该方法利用预训练的2D扩散模型 [5] 从文本中自动生成3D资产,从而无需专门的3D资产数据集。...因此,当直接采用预训练的2D扩散模型进行3D资产创建时,text-to-2D和text-to-3D生成之间的域差距构成了显著的性能障碍。...其次,预训练的text-to-2D扩散模型将注意力分配给前景和背景生成,而3D资产的创建需要更加关注前景对象的准确生成。...图3 摄像机引导的CG-LoRA示意 具体的,给定文本提示 T 和相机参数 C=\{x,y,z,\phi_{yaw},\phi_{pit},\theta_{fov}\} [^1],首先使用预训练的文本CLIP...如图5所示,X-Dreamer可以基于给定的文本生成具有精确几何细节的3D资产,即使所提供的粗粒度网格缺乏细节。

    36210
    领券