前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >介绍一些好玩且实用的开源的AI工具

介绍一些好玩且实用的开源的AI工具

原创
作者头像
星哥玩云
发布2024-07-03 18:38:51
1450
发布2024-07-03 18:38:51
举报
文章被收录于专栏:开源部署开源部署

介绍一些好玩且实用的开源的AI工具

随着人工智能技术的迅猛发展,开源社区涌现出了许多关于AI的项目,这些项目不仅展示了技术的创新力,也为开发者提供了丰富的工具和资源。本文将介绍几个既有趣又实用的开源人工智能工具,它们不仅能够帮助你加深对人工智能技术的理解,还能在实际应用中大显身手。

Open AI-Cook Book

Open AI-Cook Book 是一本 Open AI 的 API 使用指南,提供了一些通过 Open AI 的 API 搭建任务的示例代码。

Github: https://github.com/openai/openai-cookbook

官方文档请访问: https://cookbook.openai.com/

动手学大模型应用开发(中文)

Github:https://github.com/datawhalechina/llm-universe

官方文档:https://datawhalechina.github.io/llm-universe/

本项目是一个面向小白开发者的大模型应用开发教程,旨在基于阿里云服务器,结合个人知识库助手项目,通过一个课程完成大模型开发的重点入门,主要内容包括:

  1. 大模型简介,何为大模型、大模型特点是什么、LangChain 是什么,如何开发一个 LLM 应用,针对小白开发者的简单介绍;
  2. 如何调用大模型 API,本节介绍了国内外知名大模型产品 API 的多种调用方式,包括调用原生 API、封装为 LangChain LLM、封装为 Fastapi 等调用方式,同时将包括百度文心、讯飞星火、智谱AI等多种大模型 API 进行了统一形式封装;
  3. 知识库搭建,不同类型知识库文档的加载、处理,向量数据库的搭建;
  4. 构建 RAG 应用,包括将 LLM 接入到 LangChain 构建检索问答链,使用 Streamlit 进行应用部署
  5. 验证迭代,大模型开发如何实现验证迭代,一般的评估方法有什么;

开源大模型食用指南(中文)

Github: https://github.com/datawhalechina/self-llm

《开源大模型食用指南》基于Linux环境快速部署开源大模型,更适合中国宝宝的部署教程

本项目是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。

Stable Diffusion web UI

Github:https://github.com/AUTOMATIC1111/stable-diffusion-webui

使用 Gradio 库实现的 Stable Diffusion的 Web 界面,STAR数: 135k+

Stable Diffusion 是一种神经网络模型,专门用于生成图像。这个项目提供了一个Web界面,使用户能够直观地与稳定扩散模型进行交互和使用。通过这个界面,用户可以上传图像或调整参数,然后观察模型生成的图像输出。这种界面通常使得复杂的深度学习模型更易于使用和测试,适用于艺术创作、图像编辑等应用场景。

AI 换脸工具

Github: https://github.com/iperov/DeepFaceLive

AI 换脸工具 适用于视频聊天的 AI 换脸模型,你可以使用这个 AI 模型替换摄像头中的面部或视频中的面部。

目前仓库不再更新, 2023 年 11 月 9 日存档,它现在是只读的。

Danswer

Github: https://github.com/danswer-ai/danswer.git

Danswer 是一个开源企业问答工具。当你使用 Danswer 时,只需以自然的方式提出问题,就像与朋友交谈一样简单,它会自动搜索公司内部的文件和资料,然后给你一个可靠的答案,并附上来源。除此之外,Danswer 还可以和其他常用的工具一起使用,比如 Slack、GitHub、Confluence 等。这样你可以更方便地获取答案,同时也可以和团队成员一起分享和讨论。

功能特性

  • answer 提供直接问答功能,它由生成式 AI 模型驱动,所得答案都有引用和来源链接支持。
  • 智能文档检索采用最新的 LLMs 进行语义搜索和重新排序。
  • AI 助手由定制的深度学习模型支持,可以解释用户意图。
  • 已包含用户认证和文档级别的访问管理功能。
  • 可以连接到 Slack、GitHub、GoogleDrive、Confluence、本地文件和网络爬虫等,未来还会添加更多连接方式。
  • 管理仪表盘可以管理连接器,并设置功能,比如实时更新获取。
  • 只需一行 Docker Compose(或 Kubernetes)命令,即可在任何地方部署 Danswer。

wukong-robot

Github:https://github.com/wzpan/wukong-robot

官网: https://wukong.hahack.com/

wukong-robot 是一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持ChatGPT多轮对话能力,还可能是首个支持脑机交互的开源智能音箱项目。

mi-gpt

Github:https://github.com/idootop/mi-gpt

将小爱音箱接入 ChatGPT 和豆包,改造成你的专属语音助手。

在这个数字化的世界里,家已不仅仅是一个居住的地方,而是我们数字生活的延伸。

MiGPT 通过将小爱音箱、米家智能设备,与 ChatGPT 的理解能力完美融合,让你的智能家居更懂你。

MiGPT 不仅仅是关于设备自动化,而是关于:打造一个懂你、有温度、与你共同进化的家。

未来,你的每个智能家居设备,从灯泡、插座,到扫地机器人、电视等,

都可以作为一个个独立的智能体 (Agent),更智能、更贴心的响应你的指令。

这些独立的智能体,也可以彼此感知,彼此配合,构成一个更强大的协作网络。

而小爱音箱就像是你的智能家居专属管家,全心全意为你服务,释放智能家居的真正潜力。

MaxKB

Github:https://github.com/1Panel-dev/MaxKB

官方文档:https://maxkb.cn/

文档:https://maxkb.cn/docs/

飞致云旗下开源产品,基于 LLM 大语言模型的知识库问答系统

  • 开箱即用:支持直接上传文档、自动爬取在线文档,支持文本自动拆分、向量化、RAG(检索增强生成),智能问答交互体验好;
  • 模型中立:支持对接各种大语言模型,包括本地私有大模型(Llama 3 / Qwen 2 等)、国内公共大模型(通义千问 / 智谱 AI / 百度千帆 / Kimi / DeepSeek 等)和国外公共大模型(OpenAI / Azure OpenAI / Gemini 等);
  • 灵活编排:内置强大的工作流引擎,支持编排 AI 工作过程,满足复杂业务场景下的需求;
  • 无缝嵌入:支持零编码快速嵌入到第三方业务系统,让已有系统快速拥有智能问答能力,提高用户满意度。

Lobe Chat

现代化设计的开源 ChatGPT/LLMs 聊天应用与开发框架,支持语音合成、多模态、可扩展的(function call)插件系统,一键免费拥有你自己的 ChatGPT/Gemini/Claude/Ollama 应用

Github:https://github.com/lobehub/lobe-chat

中文: https://github.com/lobehub/lobe-chat/blob/main/README.zh-CN.md

ChatGPT-Next-Web

Github:https://github.com/ChatGPTNextWeb/ChatGPT-Next-Web

中文:https://github.com/ChatGPTNextWeb/ChatGPT-Next-Web/blob/main/README_CN.md

演示:https://app.nextchat.dev/

A cross-platform ChatGPT/Gemini UI (Web / PWA / Linux / Win / MacOS). 一键拥有你自己的跨平台 ChatGPT/Gemini 应用。

一键免费部署你的私人 ChatGPT 网页应用,支持 GPT3, GPT4 & Gemini Pro 模型。

GeminiPro-Next-Web

Github:https://github.com/lchh5/GeminiPro-Next-Web

中文: https://github.com/lchh5/GeminiPro-Next-Web/blob/main/README_CN.md

演示: https://chat.googlegemini.co/

一键免费部署你的跨平台私人 Gemini 应用, 支持Gemini Pro 模型,基于 ChatGPT Next Web。

simple-one-api

Github:https://github.com/fruitbars/simple-one-api

OpenAI 接口接入适配,支持千帆大模型平台、讯飞星火大模型、腾讯混元以及MiniMax、Deep-Seek,等兼容OpenAI接口,仅单可执行文件,配置超级简单,一键部署,开箱即用. Seamlessly integrate with OpenAI and compatible APIs using a single executable for quick setup and deployment.

目前市面上免费的使用国产的免费大模型越来越多,one-api对于个人用起来还是有点麻烦,就想要一个不要统计、流量、计费等等的适配程序即可。

还有一点是:即使有些厂商说兼容openai的接口,但是实际上还是存在些许差异的!!!

simple-one-api主要是解决以上2点,旨在兼容多种大模型接口,并统一对外提供 OpenAI 接口。通过该项目,用户可以方便地集成和调用多种大模型,简化了不同平台接口差异带来的复杂性。

Noi

Github:https://github.com/lencx/Noi

官网: https://noi.nofwl.com/zh-CN/

中文介绍: https://mp.weixin.qq.com/s/dAN7LOw7mH609HdAyEvXfg

ChatGPT、Gemini、Poe等AI桌面应用工具(适用于 Mac、Windows 和 Linux)

ChatTTS

Github:https://github.com/2noise/ChatTTS

中文: https://github.com/2noise/ChatTTS/blob/main/docs/cn/README.md

一款适用于日常对话的生成式语音模型。

亮点

你可以参考 Bilibili 上的这个视频,了解本项目的详细情况。

  1. 对话式 TTS: ChatTTS 针对对话式任务进行了优化,能够实现自然且富有表现力的合成语音。它支持多个说话者,便于生成互动式对话。
  2. 精细的控制: 该模型可以预测和控制精细的韵律特征,包括笑声、停顿和插入语。
  3. 更好的韵律: ChatTTS 在韵律方面超越了大多数开源 TTS 模型。我们提供预训练模型以支持进一步的研究和开发。

Awesome-ChatTTS

Github: https://github.com/panyanyany/Awesome-ChatTTS

ChatTTS资源大全,免费体验地址,音色库等

MiniGPT-4

Github: https://github.com/Vision-CAIR/MiniGPT-4

官网: https://minigpt-4.github.io/

MiniGPT-4 中文部署翻译: https://github.com/RiseInRose/MiniGPT-4-ZH

MiniGPT-4: 使用先进的大型语言模型增强视觉语言理解

所属机构为沙特阿拉伯国王科技大学

facechain

Github:https://github.com/modelscope/facechain

中文简介: https://github.com/modelscope/facechain/blob/main/README_ZH.md

FaceChain是一个可以用来生成个人写真的深度学习模型工具。在最新的FaceChain FACT版本中,用户仅需要提供一张照片即可10秒钟获得独属于自己的个人写真(支持多种风格)。FaceChain可实现兼具可控性与ID保持能力的无限风格写真与固定模板写真功能,同时对ControlNet和LoRA具有优秀的兼容能力。FaceChain支持在gradio的界面中使用模型训练和推理能力、支持资深开发者使用python脚本进行训练推理,也支持在sd webui中安装插件使用。

Open-Sora

Github:https://github.com/hpcaitech/Open-Sora

中文: https://github.com/hpcaitech/Open-Sora/blob/main/docs/zh_CN/README.md

官网: https://hpcaitech.github.io/Open-Sora/

Open-Sora:让所有人都能轻松制作高效视频。

我们设计并实施了Open-Sora,这是一项致力于高效制作高质量视频的计划。我们希望让所有人都能使用模型、工具和所有细节。通过采用开源原则,Open-Sora 不仅使高级视频生成技术的使用变得民主化,而且还提供了一个简化且用户友好的平台,简化了视频生成的复杂性。借助 Open-Sora,我们的目标是在内容创作领域促进创新、创造力和包容性。

今天的推荐就到这里,也是搜集了几个月的开源AI工具,躺在谷歌浏览器的书签中,有机会再出几个教程在本地或者云上部署这几个开源的AI工具。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 介绍一些好玩且实用的开源的AI工具
  • Open AI-Cook Book
  • 动手学大模型应用开发(中文)
  • 开源大模型食用指南(中文)
  • Stable Diffusion web UI
  • AI 换脸工具
  • Danswer
    • 功能特性
    • wukong-robot
    • mi-gpt
    • MaxKB
    • Lobe Chat
    • ChatGPT-Next-Web
    • GeminiPro-Next-Web
    • simple-one-api
    • Noi
    • ChatTTS
      • 亮点
      • Awesome-ChatTTS
      • MiniGPT-4
      • facechain
      • Open-Sora
      相关产品与服务
      向量数据库
      腾讯云向量数据库(Tencent Cloud VectorDB)是一款全托管的自研企业级分布式数据库服务,专用于存储、检索、分析多维向量数据。该数据库支持多种索引类型和相似度计算方法,单索引支持千亿级向量规模,可支持百万级 QPS 及毫秒级查询延迟。腾讯云向量数据库不仅能为大模型提供外部知识库,提高大模型回答的准确性,还可广泛应用于推荐系统、自然语言处理等 AI 领域。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档