Author:Gorit
Date:2025 年 4 月 18 日
目标:看完这篇文章你就能学会 mcp-server 如何用啦!
免责声明:本仓库所有代码示例仅用于学习交流,请勿用于商业用途!!!
本项目使用 vscode 和多个 MCP Server 实现了豆瓣图书 TOP250 的数据抓取,并将数据保存至 Excel 文件。主要功能包括:
* 自动访问豆瓣图书 TOP250 页面
* 提取图书相关信息(书名、作者、出版社、出版日期、价格、评分)
* 将数据保存为格式化的 Excel 文件
环境要求:
* Windows 11
* VSCode 1.99 版本(或者其他支持 mcp-server 的客户端,比如 Cursor 等)
* Github 账号(已开通 Copilot, 模型选择:Claude 3.5 Sonnet)
* VSCode 已安装 Github Copilot
* Node.js 版本 >= 20.0
* NPX 支持(需要自行切换 npm 镜像或解决网络问题)
创建一个空项目,然后在项目根目录下创建 .vscode/mcp.json 文件,配置如下内容:
{
"servers": {
"filesystem": {
"command": "npx",
"args": [
"-y",
"@modelcontextprotocol/server-filesystem",
"C:\\Users\\Administrator\\Desktop", // 当前目录是 windows 的示例
"D:\\workspace"
]
},
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest", "--vision"]
},
"excel": {
"command": "npx",
"args": ["--yes", "@negokaz/excel-mcp-server"],
"env": {
"EXCEL\_MCP\_PAGING\_CELLS\_LIMIT": "4000"
}
}
}
}.
├── README.md # 项目说明文档
├── .gitignore # Git忽略配置
└── .vscode/ # 豆瓣图书抓取相关代码
└── mcp.json # mcp服务配置打开 Github Copilot 对话框,选择 agent 模式,选择 Claude 3.5 Sonnet 输入如下提示词:
在桌面创建一个 excel 表,添加 标题,豆瓣图书top250,第二行设置图书名称,作者,出版社,出版日期,价格,评价 等信息。
然后打开 https://book.douban.com/top250。
查找 如下信息
title: 图书名称
url: 图书详情页链接
rating: 评分(如"9.1")
ratingCount: 评价人数(如"12345人评价")
pubInfo: 出版信息(如"[美] 卡勒德·胡赛尼 / 李继宏 / 上海人民出版社 / 2006-5 / 29.00元")
bookId: 豆瓣图书ID;然后数据写入 excel 中然后等模型运行,不停点 continue 即可,以下是模型运行时,生成的参考命令
cd douban
npm installnpx playwright install chromiumnode scrapeDouban.js运行完成后,数据将保存在 douban/data.xlsx 文件中。
Excel 文件包含以下字段:
* 书名:图书标题
* 作者:图书作者信息
* 出版社:出版单位
* 出版日期:图书出版时间
* 价格:图书定价
* 评分:豆瓣评分(10 分制)

当你看到Excel 中有数据时,说明运行成功了

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。