前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >几个超酷的项目,已开源!

几个超酷的项目,已开源!

作者头像
统计学家
发布于 2024-11-27 07:14:27
发布于 2024-11-27 07:14:27
1530
举报

1、OminiControl

来自新加坡国立大学的研究团队提出了一种全新的框架 ——OminiControl,该框架能在生成图片时,可以更轻松地控制生成的结果,比如通过提供一些图片信息(边缘线稿、深度图或者某个物体的图片)来指导模型,生成更符合要求的图像。

一句话:只要提供素材图,利用OminiControl就能将素材图中的主题融入到生成的图片中。

🧬code: https://github.com/Yuanshi9815/OminiControl 📄paper: https://arxiv.org/abs/2411.15098 🍇runpod: https://github.com/camenduru/ominicontrol-tost 🍊jupyter : https://github.com/camenduru/ominicontrol-jupyter 🥪tost: https://tost.ai

2、背景移除工具-RMBG-2.0

RMBG-2.0 支持处理各种类型的图像,一键移除背景,效果不错且处理速度很快,非常适合电商、广告等应用场景。

🚀在线使用:https://huggingface.co/spaces/briaai/BRIA-RMBG-2.0 ⏬模型下载:https://huggingface.co/briaai/RMBG-2.0

模型开源,但不可商用。

3、Cursor "编程私教" prompt

❝“AI 代码工具就像无弦吉他,懂一些音律会玩得更像样些。”

看到一篇文章,作者介绍了来自油管 @realmckaywrigley 的"私教" prompt,这个"私教" prompt 会指导 AI:

  • 为代码添加清晰的注释说明
  • 解释每个关键概念和使用原因
  • 提供学习建议和改进方向
  • 在你提出疑问时深入浅出地解答

📝文中作者介绍了该 prompt 的使用方法:https://www.ermian.site/blogs/cursor-as-coding-tutor

4、下载管理开源神器

一款功能强大的文件上传/下载管理开源神器:File Centipede。支持几乎所有常见的协议,如 HTTPS、BT/磁力链接、FTP、WebDAV、m3u8 等,还内置了许多实用的辅助功能。此外,还提供了浏览器插件,可抓取网站上的音频和视频,甚至加密的视频。

🔥GitHub:https://github.com/filecxx/FileCentipede

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-11-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与统计学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AIGC最近很火,给大家推荐一个已经有1000位开发者使用的中文aigc开源模型,包括ai画图、ai聊天
12月16日,Science发布2022年度科学十大突破,其中AIGC作为人工智能领域的重要突破也赫然在列。
AIGC布道者
2023/01/05
2.5K0
AIGC最近很火,给大家推荐一个已经有1000位开发者使用的中文aigc开源模型,包括ai画图、ai聊天
如何在OpenCloudOS 8上使用 vLLM运行opt
在容器里运行模型,如果想要在 GPU 上运行,则需要安装 NVIDIA Container Toolkit,可参见 NVIDIA Container Toolkit 安装指引(https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html)。
腾讯开源
2025/04/09
1130
如何在OpenCloudOS 8上使用 vLLM运行opt
BRIA.AI开源最强AI一键抠图模型RMBG,超简上手体验
近日,BRIA.AI团队于HuggingFace开源了一个基于ISNet背景移除模型RMBG-1.4,它可以有效对前景与背景进行分离。RMBG-1.4在精心构建的数据集上训练而来,该数据包含常规图像、电商、游戏以及广告内容,该方案达到了商业级性能,但仅限于非商业用途。关于所用到的训练数据:12000+高质量&高分辨率像素级精度手工标注。更详细的数据分布介绍请移步[RMBG-1.4].
AIWalker
2024/02/17
3.2K0
BRIA.AI开源最强AI一键抠图模型RMBG,超简上手体验
小红书新开源的一款文生图身份保持项目:StoryMaker,面部特征、服装、发型和身体特征都能保持一致!
创作故事场景时,如何让每个角色保持身份一致,并且还能在多个角色之间做到统一的风格?这是很多自媒体人在做连续内容创作时遇到的难题。
Python兴趣圈
2024/09/23
6000
小红书新开源的一款文生图身份保持项目:StoryMaker,面部特征、服装、发型和身体特征都能保持一致!
手把手教你部署开源可商用GPT - Llama2
下面将带你使用 Google 提供的免费的 Colab 服务,快速部署一个带有图形化聊天界面的 Llama2 ,体验一下开源 GPT 的魅力!
Yunjie Ge
2023/09/01
8600
手把手教你部署开源可商用GPT - Llama2
Suno创作音乐的小技巧
AI音乐生成软件Suno发布V3版本,仅需要简单的描述,就可以生成2min长度、广播质量级别的音乐。正如Suno官网所显示:“无论您是歌手还是排行榜艺术家,我们都会打破您与您梦想创作的歌曲之间的障碍。不需要任何工具,只需要想象力。”
统计学家
2024/04/12
2870
Suno创作音乐的小技巧
三行代码实现 AI 梦想,GitHub 8.6k 的这个项目价值千万!
众所周知,在过去一年,各类 AI 绘画作品层出不穷,Disco-Diffusion 等技术模型也在圈中被广泛讨论。
GitHubDaily
2022/11/01
1.1K0
三行代码实现 AI 梦想,GitHub 8.6k 的这个项目价值千万!
Audiocraft——一个基于PyTorch的AI音频生成深度学习研究库
在AI风起云涌的当下,诞生了一大批优秀的AI应用,有像ChatGPT、Claude和文心一言这种文本生成领域的集大成者,也有像MidJourney和StableDiffusion这类AI绘画领域的王者。无独有偶,在AI音频领域里AI孙燕姿[1]也曾风靡一时,让大家大饱耳福。今天要介绍的是AI音频领域最近比较火的另一个项目—audiocraft[2]。
山行AI
2023/06/14
2.1K0
Audiocraft——一个基于PyTorch的AI音频生成深度学习研究库
Fooocus:一个简单且功能强大的Stable Diffusion webUI
Stable Diffusion是一个强大的图像生成AI模型,但它通常需要大量调整和提示工程。Fooocus的目标是改变这种状况。
deephub
2023/08/30
8980
Fooocus:一个简单且功能强大的Stable Diffusion webUI
一个令人惊艳的新项目,SVD开源了!
自 Stability AI 公司发布 SD(全称:Stable Diffusion) 以来,受到了很多人的喜爱。
Jack_Cui
2023/11/25
9320
一个令人惊艳的新项目,SVD开源了!
5个令人惊艳的AI项目,开源了。。
今天,我将继续着重挑选几个近期的优质开源项目,相信这些项目对于我们的日常工作、学习生活,都会有一定的帮助。
Jack_Cui
2023/04/12
1.4K0
5个令人惊艳的AI项目,开源了。。
ChatGPT 之后,再玩玩 Stable-Diffusion
前些天体验的 ChatGPT 主要用来进行文本方面的处理,那么图片生成有没有这样的 AI 工具 呢?答案是肯定的。
oec2003
2023/02/28
1.2K0
ChatGPT 之后,再玩玩 Stable-Diffusion
4个令人惊艳的ChatGPT项目,开源了!AIGC也太猛了...
自从 ChatGPT、Stable Diffusion 发布以来,各种相关开源项目百花齐放,着实让人应接不暇。
Jack_Cui
2023/03/31
2K0
4个令人惊艳的ChatGPT项目,开源了!AIGC也太猛了...
【AI落地应用实战】文本生成语音Parler-TTS + DAMODEL复现指南
这里我要推荐的【好事】文章是如何从零构建一个现代深度学习框架,2024年可以说是大模型发展迅速的一年,国内的国际的各大厂商都推出了多种场景的大模型,那么作为小白,虽然不是大模型从业者,但是也想了解一下大模型这样的深度学习框架到底是怎么来的,是如何构建的呢?可以看这篇文章:
中杯可乐多加冰
2024/11/12
4240
使用开源大语言模型私有化部署打造数据库专家系统
最近在github上发现一个很好的项目: https://github.com/csunny/DB-GPT
成江东
2023/06/03
5.1K0
使用开源大语言模型私有化部署打造数据库专家系统
Databricks来搅局了:0门槛克隆ChatGPT,完全开源可随意修改商用
编译 | 核子可乐、Tina 全球首个完全开源的大语言模型,性能堪比 GPT3.5! 大数据热潮催生了许多成功的公司,例如 Snowflake、Databricks、Splunk 和 Cloudera。现在我们进入了生成式人工智能时代,那么会不会有新的“人工智能和大数据”结合方式? 最近,大数据公司 Databricks 就在生成式人工智能领域采取了行动。两周前,该公司发布了一个名为 Dolly 的开源大型语言模型,旨在应对市场对于生成式 AI 及相关应用的旺盛需求,我们可以称之为 Dolly 1.0
深度学习与Python
2023/04/21
4760
Databricks来搅局了:0门槛克隆ChatGPT,完全开源可随意修改商用
AI数字绘画 stable-diffusion 保姆级教程
prompt: Cyberpunk, 8k resolution, castle, the rose sea, dream
秋风的笔记
2022/12/05
2.6K0
AI数字绘画 stable-diffusion 保姆级教程
开源的Stable Diffusion 3 Medium效果如何?
在2月份的时候,Stable Diffusion 3曾经公布过其强大的能力,由于其在细节生成上更加可控,不少人就一直期待着这个模型的开源。
算法一只狗
2024/08/16
1410
开源的Stable Diffusion 3 Medium效果如何?
一键控制10万多个AI模型,HuggingFace给类ChatGPT模型们做了个「APP Store」
机器之心报道 编辑:张倩、蛋酱 通过 Transformers Agents,你可以控制 10 万多个 Hugging Face 模型完成各种多模态任务。 从聊天到编程再到支持各种插件,强大的 ChatGPT 早就不是一个简单的对话助手,而是朝着 AI 界的「管理层」不断前进。 3 月 23 号,OpenAI 宣布 ChatGPT 开始支持各类第三方插件,比如著名的理工科神器 Wolfram Alpha。借助该神器,原本鸡兔同笼都算不准的 ChatGPT 一跃成为理工科尖子生。Twitter 上许多人评论说
机器之心
2023/05/16
6060
一键控制10万多个AI模型,HuggingFace给类ChatGPT模型们做了个「APP Store」
【AI落地应用实战】HivisionIDPhotos AI证件照制作实践指南
这里我要推荐的【好事】文章是《深度学习入门指南:一篇文章全解》,在科技日新月异的今天,深度学习的应用越加广泛,引领着智能技术的新一轮革命。本文将从以下四个方面:深度学习的背景历史、主要研究内容、重要分以及其在现实生活中的广泛应用,让读者简单认识一直广受关注的深度学习究竟是什么。
中杯可乐多加冰
2024/11/13
3550
推荐阅读
相关推荐
AIGC最近很火,给大家推荐一个已经有1000位开发者使用的中文aigc开源模型,包括ai画图、ai聊天
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档