Ai学习的老章
长期跟踪关注统计学、机器学习算法、深度学习、人工智能、大模型技术与行业发展动态,日更精选技术文章。回复机器学习有惊喜资料。
672篇原创内容
公众号
大家好,我是 Ai 学习的老章
周末看了字节跳动开源的两个项目
第一个是复刻 Deep Research 的 DeerFlow
看了演示视频,有点 manus 的感觉
1、大模型集成:本地大模型、兼容 OpenAI API 接口,多层 LLM 系统适配不同复杂度任务 2、搜索和检索:通过 Tavily、Brave Search 等进行网络搜索,使用 Jina 进行网页爬取 3、MCP 集成:扩展私有领域访问、知识图谱、网页浏览等功能 4、人机协作:支持类似 Notion 的块编辑,允许 AI 优化,包括 AI 辅助润色、句子缩短和扩展 5、内容创作:AI 驱动的播客脚本生成和音频合成,自动创建简单的 PPT
# 克隆仓库
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
# 安装依赖,uv 将负责 Python 解释器和虚拟环境创建,并安装所需的包
uv sync
# 配置 .env 文件,添加您的 API 密钥
# Tavily: https://app.tavily.com/home
# Brave_SEARCH: https://brave.com/search/api/
# 火山引擎 TTS:如果您有 TTS 凭证,请添加
cp .env.example .env
# 为您的 LLM 模型和 API 密钥配置 conf.yaml
# 请参阅 'docs/configuration_guide.md' 了解更多详情
cp conf.yaml.example conf.yaml
# 安装 marp 用于 PPT 生成
# https://github.com/marp-team/marp-cli?tab=readme-ov-file#use-package-manager
brew install marp-cli
可选,通过 pnpm[4] 安装 Web UI 依赖:
cd deer-flow/web
pnpm install
最快的运行项目方式是使用控制台 UI:
# 在类 bash 的 shell 中运行项目
uv run main.py
该项目还包括一个 Web UI,提供更加动态和引人入胜的交互体验:
# 在开发模式下同时运行后端和前端服务器
# 在 macOS/Linux 上
./bootstrap.sh -d
# 在 Windows 上
bootstrap.bat -d
打开浏览器并访问 http://localhost:3000[5] 以探索 Web UI。
DeerFlow 提供了多个演示案例,展示其功能:
更多演示案例可访问官方网站[10]。
感觉不如manus惊艳,但是胜在开源。
字节还开源了一套代码大模型——Seed-Coder-8B-Instruct
Seed-Coder 是由字节跳动 Seed 团队开发的开源代码大语言模型系列,包含基础模型、指令模型和推理模型,均为 8B 参数规模。Seed-Coder-8B-Instruct 是其中的指令调优模型,于 2025 年 5 月 8 日正式发布。
Seed-Coder 主要利用大型语言模型而非手工制定的规则进行代码数据过滤,最大限度地减少了预训练数据构建中的人工干预。在同等规模的开源模型中达到了最先进的性能,在各种编码任务上表现优异,甚至超越了一些参数量更大的模型。
Seed-Coder 系列包含三个 8B 参数模型:
Seed-Coder 团队对模型进行了广泛的评测,涵盖代码生成、代码补全、代码编辑、代码推理和软件工程任务等多个方面。
根据技术报告[14],Seed-Coder 在 8B 规模的开源模型中达到了最先进的性能,甚至超越了一些参数量更大的模型(QwQ-32B,DeepSeek-R1)。
我没有实测,表示怀疑。。。
更多信息请访问GitHub 仓库[15]或项目官网[16]。!
参考资料
[1]
uv: https://docs.astral.sh/uv/getting-started/installation/
[2]
nvm: https://github.com/nvm-sh/nvm
[3]
pnpm: https://pnpm.io/installation
[4]
pnpm: https://pnpm.io/installation
[5]
http://localhost:3000: http://localhost:3000
[6]
埃菲尔铁塔与最高建筑相比有多高?: https://deerflow.tech/chat?replay=eiffel-tower-vs-tallest-building
[7]
GitHub 上最热门的仓库有哪些?: https://deerflow.tech/chat?replay=github-top-trending-repo
[8]
撰写关于南京传统美食的文章: https://deerflow.tech/chat?replay=nanjing-traditional-dishes
[9]
如何装饰租赁公寓?: https://deerflow.tech/chat?replay=rental-apartment-decoration
[10]
官方网站: https://deerflow.tech/
[11]
Seed-Coder-8B-Base: https://huggingface.co/ByteDance-Seed/Seed-Coder-8B-Base
[12]
Seed-Coder-8B-Instruct: https://huggingface.co/ByteDance-Seed/Seed-Coder-8B-Instruct
[13]
Seed-Coder-8B-Reasoning: https://huggingface.co/ByteDance-Seed/Seed-Coder-8B-Reasoning
[14]
技术报告: https://github.com/ByteDance-Seed/Seed-Coder/blob/master/Seed-Coder.pdf
[15]
GitHub 仓库: https://github.com/ByteDance-Seed/Seed-Coder
[16]
项目官网: https://bytedance-seed-coder.github.io/