前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >『GitHub项目圈选23』推荐5款本周 强烈推荐 的AI开源项目

『GitHub项目圈选23』推荐5款本周 强烈推荐 的AI开源项目

作者头像
Python兴趣圈
发布2024-06-04 14:02:37
1.2K0
发布2024-06-04 14:02:37
举报
文章被收录于专栏:翩翩白衣少年翩翩白衣少年

本周 GitHub圈选 项目推荐:

  • chatgpt-on-wechat(基于大模型的WX聊天机器人)
  • FIFO-Diffusion(AI视频生成)
  • AniTalker(语音动画生成器)
  • VoiceCraft(语音编辑工具)
  • FarFalle(AI搜索引擎)

1、chatgpt-on-wechat

chatgpt-on-wechat 是一款基于大模型搭建的聊天机器人,同时支持多平台、多模型,能处理文本、语音和图片,访问操作系统和互联网,支持基于自有知识库进行定制企业智能客服

特征:
  • 多端部署:具备多种可选的部署方式,且功能齐全
  • 基础对话:在私聊和群聊中实现消息的智能回复,支持多轮会话的上下文记忆,涵盖 GPT-3.5、GPT-4、GPT-4o、Claude-3、Gemini、文心一言、XunFeiXH、通义千问、ChatGLM-4、Kimi(月之暗面)。
  • 语音能力:能够识别语音消息,并通过文字或语音进行回复,支持 azure、baidu、google、openai(whisper/tts)等诸多语音模型。
  • 图像能力:支持图片生成、图片识别以及图生图(如照片修复),可选用 Dall-E-3、stable diffusion、replicate、midjourney、CogView-3、vision 模型。
  • 丰富插件:支持个性化的插件拓展,已达成多角色切换、文字冒险、敏感词过滤、聊天记录总结、文档总结与对话、联网搜索等插件。
  • 知识库:借由上传知识库文件来自定义专属机器人,可充当数字分身、智能客服、私域助手,基于 LinkAI 得以实现。

Star:26.3k

项目地址:https://github.com/zhayujie/chatgpt-on-wechat

2、FIFO-Diffusion

FIFO-Diffusion 是一款可以生成无限长的连续视频的AI视频生成开源项目,是一种无需训练的基于预训练扩散模型的新型推理技术,可以从文本生成无限长的视频。

虽然它能够生成无限时长的长视频,但还是会存在一定的跳帧情况。不过网上也有大佬们提供有解决方式,就是推荐使用AI插帧来补充画面跳帧弊端。

特点:
  • • 通过迭代进行对角去噪处理,无需训练即可生成无限长的视频。
  • • 通过前向参考机制使帧之间的去噪效果更好,同时引入潜在分区和前瞻去噪以减少训练-推理差距。
  • • 支持生成高质量、长时间的视频,已在多种文本到视频生成基线模型上展示了其有效性。
  • • FIFO-Diffusion 在TextVQA、DocVQA等基准测试中表现优异,超过了一些非开源模型。

Star:146

项目地址:https://github.com/jjihwan/FIFO-Diffusion_public

3、AniTalker

AniTalker 是一款通过单张头像即可生成语音动画的AI开源项目,旨在通过身份解耦的面部动作编码技术,生成生动多样的说话面部动画。

借助AniTalker,你可以实现动漫人物、古人、老照片、蒙娜丽莎等头像人物开口说话,也可以借此生成一系列生动的表情包。

Star:989

项目地址:https://github.com/X-LANCE/AniTalker

4、VoiceCraft

VoiceCraft 是一款开源的零样本语音编辑和文本转语音工具。

它是一种标记填充神经编解码器语言模型,在包括有声读物、网络视频和播客在内的自然数据上的语音编辑和零样本文本转语音 (TTS)方面均实现了最先进的性能。

可以算的上当前最好用的语音编辑工具之一了。我们可以给它一段语音,编辑这段语音生成的文字,再把文字转回语音,还能保持说话人的声音。

而且如果想要克隆其他声音,仅需3秒!可以作为独立脚本部署至其他应用中。

Star:6.9k

项目地址:https://github.com/jasonppy/VoiceCraft

5、FarFalle

FarFalle 是一款开源的AI搜索引擎项目,类似Perplexity AI。 可使用本地或云 LLM 自托管。

如果有部署网站项目或智能导航站的小伙伴倒也是可以参考一番。

特征:
  • • 使用多个搜索提供商进行搜索(Tavily、Searxng)
  • • 使用云模型回答问题(OpenAI/gpt4-o、OpenAI/gpt3.5-turbo、Groq/Llama3)
  • • 使用本地模型(llama3、mistral、gemma、phi3)回答问题

Star:1.3k

项目地址:https://github.com/rashadphz/farfalle

体验Demo:https://www.farfalle.dev/

以上就是本周 GitHub圈选 的5款开源项目,有兴趣的同学可以前往了解探索!!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python兴趣圈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1、chatgpt-on-wechat
    • 特征:
    • 2、FIFO-Diffusion
      • 特点:
      • 3、AniTalker
      • 4、VoiceCraft
      • 5、FarFalle
        • 特征:
        相关产品与服务
        对话机器人
        对话机器人(Conversation Robot,ICR),是基于人工智能技术,面向企业场景的 AI 服务,可应用于智能客服、服务咨询、业务办理等场景。本产品旨在帮助企业快速构建,满足自身业务诉求的对话机器人,从而减少企业人力成本或解决服务不及时问题。用户可通过对话机器人用户端引擎,实现高准确率的对话服务。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档