部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >解放双手:借助 AI 完成浏览器自动化! | 开源日报 No.313

解放双手:借助 AI 完成浏览器自动化! | 开源日报 No.313

作者头像
小柒
发布于 2024-07-31 11:14:25
发布于 2024-07-31 11:14:25
6530
举报
文章被收录于专栏:开源服务指南开源服务指南

Skyvern-AI/skyvernhttps://github.com/Skyvern-AI/skyvern

Stars: 5.5k License: AGPL-3.0

skyvern 是使用 LLMs 和计算机视觉自动化基于浏览器的工作流程。

  • 提供简单的 API 端点,完全自动化手动工作流程
  • 添加了计算机视觉和 LLMs 来解析实时视口中的项目,并与之交互
  • 可以在从未见过的网站上操作,无需定制代码
  • 抵抗网站布局更改,没有预先确定的 XPaths 或其他选择器系统正在寻找导航时
  • 利用 LLMs 推理交互以确保覆盖复杂情况

python/cpythonhttps://github.com/python/cpython

Stars: 61.3k License: NOASSERTION

cpython 是 Python 编程语言的官方实现。 该项目的主要功能、关键特性、核心优势包括:

  • 提供了 Python 编程语言的官方实现版本
  • 可在多个平台上构建和运行
  • 提供详细的文档和开发指南,方便开发者参与贡献
  • 支持各种构建选项和配置,并提供了相关的构建说明文档

NVIDIA/NeMohttps://github.com/NVIDIA/NeMo

Stars: 11.0k License: Apache-2.0

NeMo 是一个可扩展的生成式 AI 框架,专为研究大型语言模型、多模态和语音 AI(自动语音识别和文本到语音)的研究人员和开发人员构建。 NeMo 的主要功能、关键特性和核心优势包括:

  • 支持大型语言模型和多模态
  • 提供预训练模型和优化增强
  • 支持混合专家和强化学习
  • 可在任何云和本地环境中进行开发和扩展
  • 可以加速语音识别的准确性和速度

deepseek-ai/DeepSeek-V2https://github.com/deepseek-ai/DeepSeek-V2

Stars: 3.1k License: MIT

DeepSeek-V2 是一个强大、经济高效的专家混合语言模型。 该项目主要功能、关键特性和核心优势包括:

  • 拥有 236B 总参数,其中每个标记激活了 21B
  • 相较于 DeepSeek 67B,DeepSeek-V2 在提升性能的同时节省了 42.5% 的训练成本,并将最大生成吞吐量提升至 5.76 倍
  • 在多种基准测试和开放式生成评估中表现出显著性能
  • 提供模型下载、评估结果、模型架构以及 API 平台等信息

DataTalksClub/llm-zoomcamphttps://github.com/DataTalksClub/llm-zoomcamp

Stars: 2.5k License: NOASSERTION

llm-zoomcamp 是一个关于构建能够回答有关知识库问题的 AI 机器人的免费在线课程。

  • 10 周学习如何构建能够回答有关知识库问题的 AI 机器人
  • 覆盖 LLMs 和 RAG 等主题
  • 不需要先前接触过人工智能机器学习
  • 提供预备课程研讨会、视频和代码资源
  • 计划涵盖 LLMs 和 RAG 介绍、自托管 LLMs、向量数据库与检索技术等内容
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-07-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 开源服务指南 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
利用 AI 解放双手:把“贾维斯”带进现实 | 开源专题 No.64
小柒
2024/04/01
3370
利用 AI 解放双手:把“贾维斯”带进现实 | 开源专题 No.64
让照片开口说话!基于音频生成动画 | 开源日报 No.253
SadTalker 是一个基于音频驱动的单幅图像对话头像动画生成项目。它可以将单幅人像图像与音频结合,生成逼真的视频对话头像。该项目的主要功能和核心优势包括:
小柒
2024/05/10
2460
让照片开口说话!基于音频生成动画 | 开源日报 No.253
精准视频切片与 AI 智能剪辑工具 | 开源日报 No.311
FunClip 是一个开源、精准、方便的视频切片工具,集成了大语言模型 AI 智能剪辑功能。 该项目的主要功能、关键特性和核心优势包括:
小柒
2024/07/31
6100
精准视频切片与 AI 智能剪辑工具 | 开源日报 No.311
Cloudflare CDN 速度测试:找到最快的 IP 段 | 开源日报 No.257
CloudflareSpeedTest 是一个用于测试 Cloudflare CDN 延迟和速度的工具。 该项目的主要功能、关键特性、核心优势包括:
小柒
2024/05/10
7240
Cloudflare CDN 速度测试:找到最快的 IP 段 | 开源日报 No.257
WeChatMsg: 导出微信聊天记录 | 开源日报 No.108
llamafile 是一个开源项目,旨在通过将 lama.cpp 与 Cosmopolitan Libc 结合成一个框架,将 LLM (Large Language Models) 的复杂性折叠到单个文件可执行程序中,并使其能够在大多数计算机上本地运行而无需安装。该项目的主要功能和核心优势包括:
小柒
2023/12/12
1.3K0
WeChatMsg: 导出微信聊天记录 | 开源日报 No.108
daisyUI:最受欢迎的 Tailwind CSS 组件库 | 开源日报 No.181
daisyUI 是 Tailwind CSS 的最受欢迎、免费且开源的组件库,主要功能包括提供各种组件和工具来简化使用 Tailwind CSS 进行网页设计。其核心优势和关键特性包括:
小柒
2024/02/26
1.3K0
daisyUI:最受欢迎的 Tailwind CSS 组件库 | 开源日报 No.181
比 md5 更快更安全:全新的哈希函数 | 开源日报 No.294
BLAKE3 是 BLAKE3 密码哈希函数的官方 Rust 和 C 实现。具有以下特点和优势:
小柒
2024/07/10
3240
比 md5 更快更安全:全新的哈希函数 | 开源日报 No.294
使用大型语言模型的指南: 提高效率及安全性的技巧和策略 | 开源日报 0913
Prompt Engineering Guide,提供了与大型语言模型(LLM)相关的技巧和窍门。该指南基于Brex公司在生产用例中研究和创建LLM提示时所学到的经验教训,并涵盖了有关使用和构建程序化系统以及安全性方面的策略、准则和建议。它解释了什么是大型语言模型,如何进行预测并生成文本序列,并介绍了一些修剪方法来改变其行为和性能。
小柒
2023/09/14
2900
使用大型语言模型的指南: 提高效率及安全性的技巧和策略 | 开源日报 0913
Langchain-Chatchat:离线运行的大模型知识库 | 开源日报 No.182
基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现的开源、可离线部署的检索增强生成 (RAG) 大模型知识库项目。该项目是一个可以实现完全本地化推理的知识库增强方案,重点解决数据安全保护和私域化部署的企业痛点,并支持市面上主流的本地大预言模型和 Embedding 模型,无需付费使用。其核心优势包括:
小柒
2024/02/26
1K0
Langchain-Chatchat:离线运行的大模型知识库 | 开源日报 No.182
C++ 算法宝库:多领域覆盖,注释详细 | 开源日报 No.153
Algorithms-C++ 是一个收集了数学、机器学习、计算机科学和物理等领域的各种算法的开源项目,用 C++ 实现,旨在供教育目的使用。该项目提供了以下特点:
小柒
2024/01/14
3740
C++ 算法宝库:多领域覆盖,注释详细 | 开源日报 No.153
中国领先工业级深度学习框架:支持超大规模训练 | 开源日报 No.304
Paddle 是中国首个独立自主研发的深度学习平台,提供高性能单机、分布式训练和跨平台部署。
小柒
2024/07/22
2370
中国领先工业级深度学习框架:支持超大规模训练 | 开源日报 No.304
能够解析任何编程语言的开源语法解析树 | 开源日报 No.171
tree-sitter 是一个用于编程工具的增量解析系统。该项目的主要功能、关键特性、核心优势包括:
小柒
2024/01/31
7660
能够解析任何编程语言的开源语法解析树 | 开源日报 No.171
Cypress.io:快速简单可靠的浏览器测试工具 | 开源日报 No.142
Cypress.io 是一个快速、简单和可靠的浏览器测试工具,可以用于任何在浏览器中运行的内容。它支持 Mac、Linux 和 Windows 系统,并提供了安装指南。
小柒
2024/01/03
3560
Cypress.io:快速简单可靠的浏览器测试工具 | 开源日报 No.142
谷歌开源的跨平台高效序列化库:极速访问,内存高效 | 开源日报 No.289
flatbuffers 是一个跨平台的序列化库,旨在实现最大内存效率。它允许您直接访问序列化数据而无需先进行解析/拆包,同时具有很好的向前/向后兼性。以下是 flatbuffers 项目的主要功能、关键特性核心优势:
小柒
2024/07/10
1680
谷歌开源的跨平台高效序列化库:极速访问,内存高效 | 开源日报 No.289
性能与效率比拼:开源大语言模型竞逐 | 开源专题 No.76
ChatGLM3 是智谱 AI 和清华大学 KEG 实验室联合发布的新一代对话预训练模型。其主要功能包括更强大的基础模型、更完整的功能支持以及全面开源序列。具体特点如下:
小柒
2024/05/17
2560
性能与效率比拼:开源大语言模型竞逐 | 开源专题 No.76
金融预测、生成代码、聊天对话:大语言模型的无穷妙用 | 开源专题 No.97
基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现的开源、可离线部署的检索增强生成 (RAG) 大模型知识库项目。该项目是一个可以实现完全本地化推理的知识库增强方案,重点解决数据安全保护和私域化部署的企业痛点,并支持市面上主流的本地大预言模型和 Embedding 模型,无需付费使用。其核心优势包括:
小柒
2024/07/10
2110
金融预测、生成代码、聊天对话:大语言模型的无穷妙用 | 开源专题 No.97
打包成 WASM 的 Postgres:可在浏览器运行 | 开源日报 No.206
pglite 将轻量级的 Postgres 打包成 WASM,并封装为 TypeScript 库,可在浏览器、Node.js、Bun 和 Deno 中运行。
小柒
2024/03/07
2520
打包成 WASM 的 Postgres:可在浏览器运行 | 开源日报 No.206
探索高效智能:AI 模型的优化工具盘点 | 开源专题 No.43
OpenAI Evals 是一个用于评估 LLMs (大型语言模型) 或使用 LLMs 作为组件构建的系统的框架。它还包括一个具有挑战性 evals 的开源注册表。Evals 现在支持通过 Completion Function Protocol 评估任何系统,包括 prompt chains 或 tool-using agents 的行为。通过 Evals,我们旨在尽可能简单地构建 eval,并编写尽量少的代码。“Eval” 是用于评估系统行为质量的任务。
小柒
2023/11/14
4540
探索高效智能:AI 模型的优化工具盘点 | 开源专题 No.43
Ventoy:打造你的万能启动 U 盘 | 开源日报 No.146
Ventoy 是一个开源工具,用于创建支持 ISO/WIM/IMG/VHD(x)/EFI 文件的可启动 USB 驱动器。其主要功能包括将镜像文件复制到 USB 驱动器并进行引导、一次性复制多个镜像文件并提供引导菜单选择以及在本地磁盘中浏览和引导 ISO/WIM/IMG/VHD(x)/EFI 文件等。该项目的核心优势和关键特点包括:
小柒
2024/01/07
3930
Ventoy:打造你的万能启动 U 盘 | 开源日报 No.146
PaddleOCR 高精度文字识别:丰富多样的前沿算法 | 开源日报 No.187
PaddleOCR 是一个丰富、领先和实用的 OCR 工具库,旨在帮助开发者训练更好的模型并将其应用到实际场景中。该项目具有以下特点和优势:
小柒
2024/02/26
5020
PaddleOCR 高精度文字识别:丰富多样的前沿算法 | 开源日报 No.187
推荐阅读
利用 AI 解放双手:把“贾维斯”带进现实 | 开源专题 No.64
3370
让照片开口说话!基于音频生成动画 | 开源日报 No.253
2460
精准视频切片与 AI 智能剪辑工具 | 开源日报 No.311
6100
Cloudflare CDN 速度测试:找到最快的 IP 段 | 开源日报 No.257
7240
WeChatMsg: 导出微信聊天记录 | 开源日报 No.108
1.3K0
daisyUI:最受欢迎的 Tailwind CSS 组件库 | 开源日报 No.181
1.3K0
比 md5 更快更安全:全新的哈希函数 | 开源日报 No.294
3240
使用大型语言模型的指南: 提高效率及安全性的技巧和策略 | 开源日报 0913
2900
Langchain-Chatchat:离线运行的大模型知识库 | 开源日报 No.182
1K0
C++ 算法宝库:多领域覆盖,注释详细 | 开源日报 No.153
3740
中国领先工业级深度学习框架:支持超大规模训练 | 开源日报 No.304
2370
能够解析任何编程语言的开源语法解析树 | 开源日报 No.171
7660
Cypress.io:快速简单可靠的浏览器测试工具 | 开源日报 No.142
3560
谷歌开源的跨平台高效序列化库:极速访问,内存高效 | 开源日报 No.289
1680
性能与效率比拼:开源大语言模型竞逐 | 开源专题 No.76
2560
金融预测、生成代码、聊天对话:大语言模型的无穷妙用 | 开源专题 No.97
2110
打包成 WASM 的 Postgres:可在浏览器运行 | 开源日报 No.206
2520
探索高效智能:AI 模型的优化工具盘点 | 开源专题 No.43
4540
Ventoy:打造你的万能启动 U 盘 | 开源日报 No.146
3930
PaddleOCR 高精度文字识别:丰富多样的前沿算法 | 开源日报 No.187
5020
相关推荐
利用 AI 解放双手:把“贾维斯”带进现实 | 开源专题 No.64
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档