首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >手把手教你使用 mcp-server —— vscode + 多款 MCP Server 实现豆瓣图书 TOP250 读取并保存至 Excel

手把手教你使用 mcp-server —— vscode + 多款 MCP Server 实现豆瓣图书 TOP250 读取并保存至 Excel

原创
作者头像
Gorit
发布2025-04-24 11:23:59
发布2025-04-24 11:23:59
1.8K0
举报

手把手教你使用 mcp-server —— vscode + 多款 MCP Server 实现豆瓣图书 TOP250 读取并保存至 Excel

Author:Gorit

Date:2025 年 4 月 18 日

目标:看完这篇文章你就能学会 mcp-server 如何用啦!

免责声明:本仓库所有代码示例仅用于学习交流,请勿用于商业用途!!!

项目地址

MCP Server 最佳实践

项目介绍

本项目使用 vscode 和多个 MCP Server 实现了豆瓣图书 TOP250 的数据抓取,并将数据保存至 Excel 文件。主要功能包括:

* 自动访问豆瓣图书 TOP250 页面

* 提取图书相关信息(书名、作者、出版社、出版日期、价格、评分)

* 将数据保存为格式化的 Excel 文件

环境准备

环境要求:

* Windows 11

* VSCode 1.99 版本(或者其他支持 mcp-server 的客户端,比如 Cursor 等)

* Github 账号(已开通 Copilot, 模型选择:Claude 3.5 Sonnet)

* VSCode 已安装 Github Copilot

* Node.js 版本 >= 20.0

* NPX 支持(需要自行切换 npm 镜像或解决网络问题)

MCP Server 配置

创建一个空项目,然后在项目根目录下创建 .vscode/mcp.json 文件,配置如下内容:

代码语言:json
复制
{

  "servers": {

    "filesystem": {

      "command": "npx",

      "args": [

        "-y",

        "@modelcontextprotocol/server-filesystem",

        "C:\\Users\\Administrator\\Desktop", // 当前目录是 windows 的示例

        "D:\\workspace"

      ]

    },

    "playwright": {

      "command": "npx",

      "args": ["@playwright/mcp@latest", "--vision"]

    },

    "excel": {

      "command": "npx",

      "args": ["--yes", "@negokaz/excel-mcp-server"],

      "env": {

        "EXCEL\_MCP\_PAGING\_CELLS\_LIMIT": "4000"

      }

    }

  }

}

项目结构

代码语言:shell
复制
.

├── README.md           # 项目说明文档

├── .gitignore         # Git忽略配置

└── .vscode/            # 豆瓣图书抓取相关代码

    └── mcp.json   # mcp服务配置

使用步骤

打开 Github Copilot 对话框,选择 agent 模式,选择 Claude 3.5 Sonnet 输入如下提示词:

代码语言:shell
复制
在桌面创建一个 excel 表,添加 标题,豆瓣图书top250,第二行设置图书名称,作者,出版社,出版日期,价格,评价 等信息。



然后打开 https://book.douban.com/top250。



查找 如下信息



title: 图书名称



url: 图书详情页链接



rating: 评分(如"9.1")



ratingCount: 评价人数(如"12345人评价")



pubInfo: 出版信息(如"[美] 卡勒德·胡赛尼 / 李继宏 / 上海人民出版社 / 2006-5 / 29.00元")



bookId: 豆瓣图书ID;然后数据写入 excel 中

然后等模型运行,不停点 continue 即可,以下是模型运行时,生成的参考命令

  1. 安装依赖
代码语言:bash
复制
cd douban

npm install
  1. 安装 Playwright 浏览器
代码语言:bash
复制
npx playwright install chromium
  1. 运行脚本
代码语言:bash
复制
node scrapeDouban.js

运行完成后,数据将保存在 douban/data.xlsx 文件中。

数据格式

Excel 文件包含以下字段:

* 书名:图书标题

* 作者:图书作者信息

* 出版社:出版单位

* 出版日期:图书出版时间

* 价格:图书定价

* 评分:豆瓣评分(10 分制)

注意事项

  1. 确保网络连接稳定
  2. 首次运行时需要等待安装相关依赖
  3. 运行过程中会启动浏览器,请勿关闭
  4. 抓取频率过高可能会触发豆瓣反爬机制

运行结果

当你看到Excel 中有数据时,说明运行成功了

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 手把手教你使用 mcp-server —— vscode + 多款 MCP Server 实现豆瓣图书 TOP250 读取并保存至 Excel
    • 项目地址
    • 项目介绍
    • 环境准备
    • MCP Server 配置
    • 项目结构
    • 使用步骤
    • 数据格式
    • 注意事项
    • 运行结果
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档