首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >别再只写 Prompt 了 | 这个开源项目把 Nature 风格科研工作流做成了Agent技能包

别再只写 Prompt 了 | 这个开源项目把 Nature 风格科研工作流做成了Agent技能包

作者头像
MindDance
发布2026-05-15 14:13:53
发布2026-05-15 14:13:53
3150
举报

速读

最近调研到一个很适合科研人的开源项目:nature-skills

它不是传统意义上的 Python 包,也不是简单的 Prompt 合集,而是一套围绕 SKILL.md 组织的科研 AI 工作流。它把论文润色、科研绘图、引用检索、数据可用性声明、全文精读、审稿回复、论文转中文组会 PPT 等任务,拆成了一个个可以复用的 skill。

我把它理解成一套科研 AI 使用规范:不是让 AI 每次临场发挥,而是让 AI 按照明确的科研流程工作。

nature-skills 不是 Nature 官方工具,也不能保证论文达到 Nature 录用标准。它更像是一套面向 Nature 风格和高影响力期刊写作习惯的工作流模板,适合帮助科研人把写作、绘图、审稿回复和文献精读做得更规范。

为什么这个项目值得写?

过去一年,科研人使用 AI 的方式越来越熟练。

很多人已经会让 AI 润色英文、总结论文、改审稿回复、生成绘图代码、做组会 PPT。但真正用久了会发现,问题并不在于 AI 不会写,而在于它太容易写得顺滑,却不一定写得准确

科研写作里,顺滑不是最高标准。

一句话能不能成立,取决于证据强度;一张图好不好,不取决于配色,而取决于它是否支撑核心结论;一条引用能不能放在句尾,不取决于文章是否权威,而取决于它是否真的支持这个 claim;一封审稿回复是否专业,不取决于语气多客气,而取决于每条意见是否被完整处理、修改是否可追踪。

这也是我觉得 nature-skills 有意思的地方。

它没有把 AI 当成一个临时聊天助手,而是试图把科研工作中那些重复、重要、容易出错的流程,整理成一个个可以复用的 skill。

这背后对应着 AI 工具使用方式的变化:从一次性 Prompt,走向可复用 Workflow

在科研场景里,这个变化尤其重要。因为科研任务不是一句“帮我润色一下”就能完成的,它往往需要判断、检查、边界、证据和格式。越是接近投稿、修回和公开汇报,越不能让 AI 只凭语言流畅度来决定输出质量。

Spatial imaging and uptake
Spatial imaging and uptake

图片来自github仓库

nature-skills 到底是什么?

nature-skills 是 GitHub 上的一个开源项目,项目名很直白:让 AI 更好地完成符合 Nature 风格的学术表达和科研绘图任务。

它的核心不是某个单独程序,而是一个个 skills/nature-* 文件夹。每个文件夹通常以 SKILL.md 为中心,并可能包含 README.mdreferences/、脚本、测试样例或其他支持材料。

这意味着,它不是让你每次重新写一段提示词,而是把一套规则放进一个稳定的目录里:这类任务什么时候触发,需要先检查什么,哪些信息不能编造,输出应该是什么格式,哪些地方必须让作者人工确认。

从这个角度看,nature-skills 更接近科研工作流,而不是普通 Prompt。

它目前覆盖的任务包括:

  • nature-figure:科研图和多面板论文图;
  • nature-polishing:学术英文润色、重构和中英转换;
  • nature-citation:按 claim 检索和导出引用候选;
  • nature-data:数据可用性声明、数据仓库计划和 FAIR metadata 检查;
  • nature-reader:将论文整理成带原文、中文翻译、图表位置和 source map 的 Markdown 阅读材料;
  • nature-response:审稿意见逐点回复、风险分类和行动映射;
  • nature-paper2ppt:将科研论文转成中文 journal club 或组会 PPTX。

不同模块的成熟度并不完全一样。项目页面中部分模块被标为 Stable,部分模块仍处在 Beta 或 Draft 阶段。因此,它更适合作为可迭代的科研 AI 工作流参考,而不是一个已经完全定型的商业软件。

第一类:科研图不是漂亮图片,而是视觉论证

很多科研图的问题不是丑,而是没有服务科学结论

有的图 panel 很多,但每个 panel 都在重复同一个意思;有的图配色很丰富,但读者看不出实验组、对照组和关键差异;有的图输出成 PNG 后看起来没问题,但投稿、排版和后期修改时文字不可编辑;还有的图把统计、n 值、source data 和图像完整性问题藏在了视觉美化后面。

nature-figure 的设计思路比较清楚:在开始画图之前,先定义图的核心结论、证据链、图形类型、后端选择、导出格式和审稿风险。它把科研图看成一种 visual argument,而不是孤立的漂亮 plot。

这个模块支持 Python 和 R 两条路线。Python 侧主要围绕 matplotlib、seaborn 等工具,R 侧则围绕 ggplot2、patchwork、ComplexHeatmap、ggrepel、svglite、cairo_pdf 和 ragg 等工具。

我觉得这里最重要的不是工具列表,而是它的工作习惯:先问这张图要证明什么,再决定怎么画。

这恰恰是很多科研图最缺的环节。

在高水平论文里,一张主图往往不是数据的堆叠,而是一条证据链。每个 panel 都应该回答不同问题:先给整体趋势,再解释偏差,再展示机制、关系或验证结果。如果两个 panel 不能提供不同证据,其中一个就应该被删掉,或者放到补充材料。

nature-figure 还强调可编辑输出和投稿友好的导出格式。对于论文图来说,SVG 和 PDF 更适合保留矢量结构与可编辑文字,TIFF 更常用于高分辨率栅格提交;它们的用途都不同于单纯的屏幕预览 PNG。不过具体格式仍要以目标期刊和投稿系统要求为准。

这对科研作者非常实用。因为真正投稿时,图不是只在屏幕上好看就够了,还要可编辑、可追踪、可解释、可审稿。

第二类:英文润色不是把句子改高级,而是保护论证

很多人让 AI 润色论文英文时,最常见的指令是:帮我润色成 Nature 风格。

问题是,Nature 风格并不等于更复杂的词、更长的句子、更强的语气。

真正好的学术英文,是让读者更快理解你的问题、证据和边界。它应该帮助论证变清楚,而不是把逻辑问题藏在漂亮句子下面。

nature-polishing 在这一点上写得很克制。它的默认立场是:语言服务于论证,不应该在推理本身有问题时只做句子润色;同时不能编造数据、引用、机制或 novelty claim,也不应该让 AI 从零生成论文的核心科学论点。

这一点非常关键。

很多稿件被改坏,不是因为语法错误,而是因为 AI 把原本谨慎的表达改得过度确定。例如,把 suggest 改成 demonstrate,把 may reflect 改成 proves,把 limited observation 改成 general conclusion。

这些变化在英文上看似更有力,在科研上却可能更危险。

nature-polishing 的思路是先识别论文类型和 section 责任,再处理段落逻辑、claim-evidence-boundary,最后才是句子层面的润色。它区分 Introduction、Results、Discussion、Conclusion、Methods 等部分的写作任务,例如 Results 更关注观察到了什么,Discussion 更关注如何理解以及解释边界。

我觉得这对中文作者尤其重要。

中文科研写作中常见的问题不是不会表达,而是句子里同时塞进了背景、方法、结果、解释和意义。AI 如果只做逐句翻译,很容易生成一种看起来流畅、但逻辑仍然缠绕的英文。

这个 skill 的价值在于,它会先重建逻辑,再改写语言。

也就是说,它不是单纯问:这句话怎么更好听?而是先问:这句话在论文里承担什么功能?

第三类:审稿回复不是礼貌信,而是验证文件

审稿回复是最容易体现科研工作流能力的场景之一。

一封好的 response letter,不只是感谢 reviewer,也不是简单解释作者为什么这么做。它真正要完成的是一件事:让编辑相信每一条意见都被理解、处理、定位和追踪。

nature-response 对这一点的定位很明确。它把审稿回复视为面向编辑的验证文件。每条 reviewer concern 都需要被理解、处理,并映射到具体稿件修改、科学理由或尚需作者补充的信息。

这个 skill 会把编辑意见和审稿意见拆成稳定 ID,例如 E.1R1.1R1.2R2.1,再分类严重程度、行动类型、缺失信息、风险和准备状态。它还明确要求:不能编造实验、分析、引用、行号、图号、补充材料、编辑指令或稿件修改。

这其实非常接近真实的 revision 管理。

很多大修回复写得吃力,不是因为英文不好,而是因为前期没有建立 comment-response tracker。等到 reviewer comment 很多、审稿人意见彼此冲突、编辑还有额外要求时,如果没有稳定编号和行动映射,很容易漏改、错改,或者把尚未完成的工作写成已经完成。

nature-response 的价值就在于:它把审稿回复从临场发挥,变成了一个可审计的工作包。

对正在准备 major revision 的作者来说,这比单纯让 AI 写几段客气话有用得多。

第四类:论文转 PPT,不应该照搬 section 顺序

组会 PPT 是另一个很适合 skill 化的科研任务。

很多同学做 journal club 时,会下意识按照论文顺序做 PPT:背景一页,方法一页,Figure 1 一页,Figure 2 一页,Figure 3 一页,最后总结一页。

这种方式最大的问题是,它把论文搬到了 PPT 上,却没有把论文讲成一个故事。

nature-paper2ppt 的核心原则是:用论文的科学论证作为 presentation spine,而不是机械复制 manuscript section order。它要求先识别论文类型、核心问题、knowledge gap、关键证据、可信度来源、创新点和边界,再选择真正需要进入 PPT 的图表。

它的目标输出不是简单大纲,而是真正的中文 .pptx deck,包括中文 slide 标题、要点、图注、takeaway 和 speaker notes。实际能否直接生成完整 PPTX,也取决于所用 agent 的文件读写能力、Python 环境和本地依赖是否可用。

这点很实用。

对组会来说,听众真正需要的不是作者在每一页做了什么,而是:这篇文章解决了什么问题?为什么这个问题值得解决?作者提出了什么方法或机制?哪几张图构成关键证据链?结果为什么可信?哪些结论有边界?这篇文章对我们自己的课题有什么启发?

如果 AI 只是总结论文,它可能会把每个 section 都压缩一下。

但如果 AI 按照论证链做 PPT,它会更像一个真正的论文分享者。

引用、数据和精读,是科研 AI 最容易出错也最需要规范的地方

除了上面几个更显眼的模块,nature-skills 里还有几类看似不那么炫、但很关键的能力。

nature-citation 的目标是把文稿或单独 claim 转成 citation candidates,并支持导出 ENW、RIS 或 Zotero RDF 等文献管理器格式。这个模块强调 claim segmentation、journal scope filtering、support grading,以及不要编造 DOI、页码、卷期和期刊元数据。

这类工具必须谨慎使用。

AI 给引用最大的问题不是找不到文献,而是找到一篇看起来相关的文献,然后把它放在并不真正支持的句子后面。所以 citation skill 真正有价值的地方,不是帮你堆引用数量,而是把 claim 拆清楚,再判断证据支持关系。

nature-data 则面向数据可用性声明、仓库计划、数据集引用和 FAIR metadata 检查。它会把支撑结果的数据逐项盘点,并区分公开仓库、受控访问、补充材料、第三方受限数据、合理请求等不同访问路线。这个模块也明确要求不能编造 DOI、accession number、repository name、license、embargo date 或访问条件。

这对投稿越来越重要。很多文章科学内容本身不错,但数据可用性声明写得含糊,比如一句 available upon reasonable request 就想解决所有问题。对很多高水平期刊来说,这种表达往往不够。

nature-reader 则更适合文献精读。它可以把论文做成带原文、中文翻译、图表位置和 source anchors 的 Markdown 阅读文件,而不是简单摘要。

这类能力很适合组会前精读,也适合后续追问某个结论到底来自哪一页、哪一段、哪张图。

怎么开始用?

它不是 pip install 一下就结束的工具。

更准确地说,它是一套可以被 AI agent 读取的 skill 文件夹。

项目安装说明强调:不要只复制单个 SKILL.md。很多 skill 依赖 references/README.md、assets 或 scripts,单独复制一个文件可能会让 workflow 被静默破坏。

一个更稳妥的原则是:复制完整的 skills/nature-* 文件夹,而不是只拿一个 SKILL.md。

基础步骤可以这样理解:

代码语言:javascript
复制
git clone https://github.com/Yuan1z0825/nature-skills.git
cd nature-skills

如果使用 Codex,当前官方文档中可用的用户级 skill 目录是 $HOME/.agents/skills。可以参考下面这种方式复制完整 skill 文件夹:

代码语言:javascript
复制
mkdir -p ~/.agents/skills
cp -R skills/nature-polishing ~/.agents/skills/
cp -R skills/nature-figure ~/.agents/skills/

如果使用 Claude Code,当前官方文档中的个人 skill 路径形式是 ~/.claude/skills/<skill-name>/SKILL.md。可以参考下面这种方式:

代码语言:javascript
复制
mkdir -p ~/.claude/skills
cp -R skills/nature-polishing ~/.claude/skills/
cp -R skills/nature-paper2ppt ~/.claude/skills/

需要注意的是,项目安装文档和不同 agent 的官方文档可能存在路径表述差异,尤其是在工具快速迭代时。实际安装时,不要机械照抄旧示例,最好以你正在使用的 agent 版本和最新官方文档为准。

可以先从下面几个场景开始试:

投稿前润色:把 Abstract、Introduction、Results、Discussion 分别交给 nature-polishing,重点看 claim strength、section logic 和 overclaim。

主图优化:用 nature-figure 前,先说明目标结论、数据结构、想用 Python 还是 R、目标输出格式、期刊或使用场景。

审稿回复:把 editor decision letter、reviewer comments、作者修改计划一起交给 nature-response,让它先做 comment-response tracker,再写逐点回复。

组会分享:用 nature-reader 先做精读,再用 nature-paper2ppt 生成中文 journal club PPT。

评价

我觉得 nature-skills 最值得学习的地方,不是它写了多少提示词,而是它体现了一种很重要的科研 AI 使用方式:把不稳定的临场提示,变成可复用的流程规范。

这对科研人非常重要。

因为论文写作、科研绘图、引用选择、审稿回复和组会汇报,本质上都不是纯生成任务,而是带有强约束的判断任务。它们需要遵守证据边界、期刊规范、领域术语、图表逻辑和可追溯性。

普通 Prompt 的问题是,每次都靠人重新说明一次规则。Skill 的优势是,把规则写成可复用结构,让 AI 在正确边界里工作。

当然,它也不是 Nature 录用保证。

这点要说清楚。

它不能替代真实实验,不能替代统计审查,不能替代领域专家判断,也不能替代作者对引用、数据、图表和审稿回复的最终责任。特别是 citation、data availability、reviewer response 这些任务,仍然必须逐条人工核对。

它更像一个科研工作流放大器。

你的科学问题清楚,它能帮你把表达、图表和回复做得更规范;你的证据链完整,它能帮你把论证组织得更可读;你的材料不充分,它也会暴露问题,而不是替你编出一个看似完整的答案。

这其实是一个好工具该有的边界。

END

科研 AI 的下一步,不是让模型更会说漂亮话,而是让它更懂流程。

读论文要有 source map;写论文要控制 claim strength;补引用要匹配具体论断;画主图要服务核心结论;做 PPT 要讲清楚证据链;回审稿要逐条可追踪。

nature-skills 的价值就在这里。

它提醒我们:真正提高科研效率的,不是每次把 Prompt 写得更长,而是把那些反复出现、但又不能出错的科研流程,沉淀成可复用的 skill。

对科研人来说,这可能比一个万能提示词更重要。

项目信息

项目名称:nature-skills

GitHub:https://github.com/Yuan1z0825/nature-skills

定位:面向 Nature 风格科研写作、绘图和论文工作流的 AI skill 集合

协议:项目页面当前标注为 MIT License,后续以仓库页面为准

适合场景:论文润色、科研图、审稿回复、论文精读、文献引用、数据可用性声明、中文组会 PPT


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 速读
  • 为什么这个项目值得写?
  • nature-skills 到底是什么?
  • 第一类:科研图不是漂亮图片,而是视觉论证
  • 第二类:英文润色不是把句子改高级,而是保护论证
  • 第三类:审稿回复不是礼貌信,而是验证文件
  • 第四类:论文转 PPT,不应该照搬 section 顺序
  • 引用、数据和精读,是科研 AI 最容易出错也最需要规范的地方
  • 怎么开始用?
  • 评价
  • END
  • 项目信息
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档