首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >字节也在发力开源了

字节也在发力开源了

作者头像
Ai学习的老章
发布2025-06-08 19:12:27
发布2025-06-08 19:12:27
2890
举报

Ai学习的老章

长期跟踪关注统计学、机器学习算法、深度学习、人工智能、大模型技术与行业发展动态,日更精选技术文章。回复机器学习有惊喜资料。

672篇原创内容

公众号

大家好,我是 Ai 学习的老章

周末看了字节跳动开源的两个项目

1

第一个是复刻 Deep Research 的 DeerFlow

看了演示视频,有点 manus 的感觉

图片
图片

核心功能

1、大模型集成:本地大模型、兼容 OpenAI API 接口,多层 LLM 系统适配不同复杂度任务 2、搜索和检索:通过 Tavily、Brave Search 等进行网络搜索,使用 Jina 进行网页爬取 3、MCP 集成:扩展私有领域访问、知识图谱、网页浏览等功能 4、人机协作:支持类似 Notion 的块编辑,允许 AI 优化,包括 AI 辅助润色、句子缩短和扩展 5、内容创作:AI 驱动的播客脚本生成和音频合成,自动创建简单的 PPT

图片
图片

部署环境要求

  • Python:版本 3.12+
  • Node.js:版本 22+

推荐工具

  • uv[1]:简化 Python 环境和依赖管理
  • nvm[2]:轻松管理多个 Node.js 运行时版本
  • pnpm[3]:安装和管理 Node.js 项目依赖

安装步骤

代码语言:javascript
复制
# 克隆仓库
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow

# 安装依赖,uv 将负责 Python 解释器和虚拟环境创建,并安装所需的包
uv sync

# 配置 .env 文件,添加您的 API 密钥
# Tavily: https://app.tavily.com/home
# Brave_SEARCH: https://brave.com/search/api/
# 火山引擎 TTS:如果您有 TTS 凭证,请添加
cp .env.example .env

# 为您的 LLM 模型和 API 密钥配置 conf.yaml
# 请参阅 'docs/configuration_guide.md' 了解更多详情
cp conf.yaml.example conf.yaml

# 安装 marp 用于 PPT 生成
# https://github.com/marp-team/marp-cli?tab=readme-ov-file#use-package-manager
brew install marp-cli

可选,通过 pnpm[4] 安装 Web UI 依赖:

代码语言:javascript
复制
cd deer-flow/web
pnpm install

运行项目

控制台 UI

最快的运行项目方式是使用控制台 UI:

代码语言:javascript
复制
# 在类 bash 的 shell 中运行项目
uv run main.py
Web UI

该项目还包括一个 Web UI,提供更加动态和引人入胜的交互体验:

代码语言:javascript
复制
# 在开发模式下同时运行后端和前端服务器
# 在 macOS/Linux 上
./bootstrap.sh -d

# 在 Windows 上
bootstrap.bat -d

打开浏览器并访问 http://localhost:3000[5] 以探索 Web UI。

DeerFlow 提供了多个演示案例,展示其功能:

图片
图片
  • 埃菲尔铁塔与最高建筑相比有多高?[6]
  • GitHub 上最热门的仓库有哪些?[7]
  • 撰写关于南京传统美食的文章[8]
  • 如何装饰租赁公寓?[9]

更多演示案例可访问官方网站[10]

感觉不如manus惊艳,但是胜在开源。

2

字节还开源了一套代码大模型——Seed-Coder-8B-Instruct

Seed-Coder 是由字节跳动 Seed 团队开发的开源代码大语言模型系列,包含基础模型、指令模型和推理模型,均为 8B 参数规模。Seed-Coder-8B-Instruct 是其中的指令调优模型,于 2025 年 5 月 8 日正式发布。

图片
图片

Seed-Coder 主要利用大型语言模型而非手工制定的规则进行代码数据过滤,最大限度地减少了预训练数据构建中的人工干预。在同等规模的开源模型中达到了最先进的性能,在各种编码任务上表现优异,甚至超越了一些参数量更大的模型

Seed-Coder 系列包含三个 8B 参数模型

  1. Seed-Coder-8B-Base[11]:基础模型
  2. Seed-Coder-8B-Instruct[12]:指令调优模型
  3. Seed-Coder-8B-Reasoning[13]:推理增强模型

Seed-Coder 团队对模型进行了广泛的评测,涵盖代码生成、代码补全、代码编辑、代码推理和软件工程任务等多个方面。

图片
图片
图片
图片

根据技术报告[14],Seed-Coder 在 8B 规模的开源模型中达到了最先进的性能,甚至超越了一些参数量更大的模型(QwQ-32B,DeepSeek-R1)。

我没有实测,表示怀疑。。。

更多信息请访问GitHub 仓库[15]项目官网[16]

参考资料

[1] 

uv: https://docs.astral.sh/uv/getting-started/installation/

[2] 

nvm: https://github.com/nvm-sh/nvm

[3] 

pnpm: https://pnpm.io/installation

[4] 

pnpm: https://pnpm.io/installation

[5] 

http://localhost:3000: http://localhost:3000

[6] 

埃菲尔铁塔与最高建筑相比有多高?: https://deerflow.tech/chat?replay=eiffel-tower-vs-tallest-building

[7] 

GitHub 上最热门的仓库有哪些?: https://deerflow.tech/chat?replay=github-top-trending-repo

[8] 

撰写关于南京传统美食的文章: https://deerflow.tech/chat?replay=nanjing-traditional-dishes

[9] 

如何装饰租赁公寓?: https://deerflow.tech/chat?replay=rental-apartment-decoration

[10] 

官方网站: https://deerflow.tech/

[11] 

Seed-Coder-8B-Base: https://huggingface.co/ByteDance-Seed/Seed-Coder-8B-Base

[12] 

Seed-Coder-8B-Instruct: https://huggingface.co/ByteDance-Seed/Seed-Coder-8B-Instruct

[13] 

Seed-Coder-8B-Reasoning: https://huggingface.co/ByteDance-Seed/Seed-Coder-8B-Reasoning

[14] 

技术报告: https://github.com/ByteDance-Seed/Seed-Coder/blob/master/Seed-Coder.pdf

[15] 

GitHub 仓库: https://github.com/ByteDance-Seed/Seed-Coder

[16] 

项目官网: https://bytedance-seed-coder.github.io/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与统计学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1
    • 核心功能
    • 部署环境要求
    • 推荐工具
    • 安装步骤
    • 运行项目
      • 控制台 UI
      • Web UI
  • 2
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档