前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何用 NotebookLM 综合分析多篇文献?

如何用 NotebookLM 综合分析多篇文献?

作者头像
王树义
发布2024-05-21 20:05:30
1990
发布2024-05-21 20:05:30
举报
文章被收录于专栏:玉树芝兰

这款 Gemini 1.5 Pro 驱动的免费应用,会给你的科研带来什么样的帮助?

我在得到开设视频课,讲授如何用 AI 辅助读写论文后,看到过读者提问:

王老师,能否讲讲如何对多篇文献进行综合分析回顾呢?

今天咱们就来谈一谈这个问题。首先我给你介绍一下咱们准备使用的工具。

探索

今年 1 月份,我和涂子沛老师见面聊天时,他问了我一个问题:

树义,你有没有关注过 Google 的那款知识管理产品?

当时我有点懵,回答道:Google 的知识管理产品?是 Google Keep 吗?

他说不是,是最近结合大语言模型的那个。

我当时没反应过来,但涂老师稍微提示了一下,我就突然明白过来了。其实这款应用我不仅关注了,还专门做了笔记。当场我翻找 Heptabase 笔记,很快找到了。

我给涂老师展示了一下这则笔记,问:您说的是不是这个 Google NotebookLM?我还特意给他看了时间戳,是 2023 年 12 月份的记录下来的。

只不过,这则 Heptabase 笔记只能证明我关注过 NotebookLM 这款应用,但其实当时我并不看好它。原因很简单 —— 彼时它不支持中文,对我这样经常处理中文的用户来说,用处着实受限。

但我后来还真用过 NotebookLM ,用途是处理英文长文档。最典型的例子是今年 2 月份的 OpenAI Sora 发布,我很快也写了一篇论文。目前是网络首发状态,而 CNKI 上下载量已经超过 2000 了。

在写论文过程中,我们当然需要查阅资料。Sora 的几篇相关英文文档和论文都比较长,于是我把它们交给了 NotebookLM。例如当时针对这些信源,我提出了问题:「请总结一下 Sora 的新结构」,NotebookLM 回答说「Sora 的新型架构将变压器操作应用于时空补丁,使其能够生成持续时间、分辨率和宽高比可变的视频和图像」。

看到这里,你可能会觉得 NotebookLM 可以处理中文啊,而且处理得还挺好嘛。但其实这是因为我用了一个叫做 Immersive Translate 的插件,它可以把网页上的所有内容对照翻译成中文而已。当时 NotebookLM 确实处理不好中文。

写完这篇文章后,我基本上就把 NotebookLM 扔到一边了。毕竟在更多的日常情境下,我需要使用能够认得中文的大语言模型嘛。

升级

好在这次更新,Google 把 NotebookLM 升级成由 Gemini 1.5 Pro 驱动。

Gemini 1.5 Pro 这款模型你应该并不陌生,因为前些日子 我刚给你演示过用它来看视频写小小说

在那篇文章里,我给你演示过这款大语言模型的中文能力有多强。它支持 100 万 token 的上下文窗口,大海捞针信息搜寻依然准确,非常惊艳。

因为 NotebookLM 换成了 Gemini 1.5 Pro ,中文处理就不再是问题了。加上支持长百万级别上下文还免费,NotebookLM 的价值就立即突显出来了。

下面咱们用多篇文献一起放进去,做个测试。

测试

我在这里使用了 4 篇文献,来测试 NotebookLM 新版是否好用。这 4 篇文献分别为:

  • ChatGPT给科研工作者带来的机遇与挑战
  • 图数据库驱动的知识管理应用特性对比研究——以Roam Research为例
  • AIGC时代的科研工作流:协同与AI赋能视角下的数字学术工具应用及其未来
  • 面向科研工作赋能的笔记类个人知识管理工具研究

这都是我近 3 年内发表的论文。有的跟 AI 相关,有的涉及知识管理工具。

我把这四篇论文一股脑儿输入进 NotebookLM ,作为来源文献。然后咱们把 4 个文献都勾选上,开始提问让它综合分析。

提问

我提的第一个问题是「详细说明来源文献中论述的人脑记忆缺陷的问题」。NotebookLM 直接定位到《面向科研工作赋能的笔记类个人知识管理工具研究》这篇文章,找寻其中讨论的人脑记忆缺陷问题。

答案中提到文章指出「人脑在某些情况下会发生信息过载」,进而引发「认知负荷」等,并且说明在第 652 页。然后提到「过载会影响选择与处理,导致信息规避」。NotebookLM 还自动用黑体标示了重要词汇,非常有意思。

每一条答案后的页码,都可以看出这些答案有原文依据,不是凭空捏造的。文章还提到了「信息偶遇」,可以「被动唤醒记忆」。这都与记忆缺陷相关。我很满意,可惜来源都锁定在单篇文献里。

于是我又问了第二个问题:「详细说明来源文献中论述的 AI 赋能的问题」。

这次 NotebookLM 首先找到了《AIGC 时代的科研工作流:协同与 AI 赋能视角下的数字学术工具应用及其未来》一文,因为这篇文章和主题最为相近,也确实有 3 条答案都出自该文。

值得注意的是,NotebookLM 列出的答案又不仅仅来自于单一文献,还包括「大幅提升工作效率,缩短研究成果生产周期」,这来自《ChatGPT 给科研工作者带来的机遇与挑战》一文的第 115 页。这充分证明了 NotebookLM 检索资料时候的综合能力。

最有意思的是最后还有一个小节。NotebookLM 提到《面向科研工作赋能的笔记类个人知识管理工具研究》,指出「这一篇文献主要关注图数据库驱动的知识管理工具特性,没有专门论述 AI 赋能问题」。

既然「没有论述 AI 赋能」,为什么要作为答案列出?因为这虽然不是 AI 赋能,但它指出「这些特性可以显著提升知识管理工具的能力范围」,这依然是「赋能」嘛。有意思,NotebookLM 似乎并不是教条地反馈答案,而是在揣度我们究竟想要的是什么。

我又提出了第三个问题,意图在于查看 NotebookLM 综合评价分析能力:

以科研人员的实际需求来说,目前 AI 和技术工具可以在哪些环节提升效率?在哪些环节和任务上还有欠缺?」

NotebookLM 首先回答了提升部分问题。这里首先拿出来《ChatGPT 给科研工作者带来的机遇与挑战》一文,提到了编程、阅读和写作等方面 AI 提升效率的方式,并且都给出来了页码。

接下来是不足之处。还是在同一篇文献中,NotebookLM 提到「回答的真实性问题」、「数据污染问题」、「隐私和数据安全问题」,也都有页码标示。

这还没完,NotebookLM 继续说,《AIGC 时代的科研工作流:协同与 AI 赋能视角下的数字学术工具应用及其未来》一文论述了「AI 工具目前不能找寻关键问题、形成最终决策」。还来了一句「换言之」:

AI 工具可以作为辅助工具提升科研效率,但不能代替科研人员的思考和判断」。

我觉得 NotebookLM 总结得非常好。如果我在课堂上提问时,学生能答得这么条理清晰,并能提供充足的证据,我会判断他事先做足了功课…… 或者使用了 NotebookLM,哈哈。

另外请注意,NotebookLM 每次给出的答案,都可以作为笔记起来,作为你后续问答的来源(source),你也可以对其进行编辑处理。这样你就可以用滚雪球的方式,积攒自己的个性化问题与思考答案了。

发现

我是怎么发现 NotebookLM 这次大升级呢?OpenAI 发布的 GPT-4o 模型实在太吸引眼球了,所以大家可能忘了第二天还有个重要事件,那就是 Google I/O 2024。

我就是在大会主题演讲中发现的 NotebookLM 更新后台模型。演讲者演示了 NotebookLM 的功能,看完后我不知道应该用眼前一亮,还是眼前一黑来形容。

演示的内容,是 NotebookLM 未来将会支持的多模态效果。到时它能干什么呢?

你把资料堆进来,NotebookLM 自己根据这些资料总结,并且根据你的需求,设定专属讲述方案。而且还是用两个人对话的方式(类似于对口相声),来给你进行寓教于乐形式的语音讲解。

这还不算,你还可以选择「加入」,进行语音提问。演讲者演示的,是让 NotebookLM 给他的儿子讲牛顿力学,指明要求用篮球为例子,因为孩子喜欢篮球。于是 NotebookLM 立即就开始用墙边的篮球为什么能够不运动来讲解,说明力的平衡作用,非常生动,而且音色、语气等因素也让学习者感受到了足够的关注和鼓励。

从前我们提到的「第二大脑」,往往是指把你的笔记合理积攒和组织起来,然后你可以跟它「对话」。但是从前所谓的对话,还仅仅是去阅读浏览思索,然后补充内容,链接卡片,扩展补充,阐释输出…… 但是现在,你真的可以和自己的「第二大脑」对话了,对,用语音。甚至将来,很可能你的表情也会被 AI 准确识别,从而在你一颦一笑中,发现你的疑惑,给你不同的讲解方式和辅导。

你明白我为什么眼前一亮了吧?因为很有可能,这将带来低成本个性化的学习辅导,以及「母慈子孝」的家庭环境。

但是我为什么会眼前一黑呢?因为你别忘了,我自己的职业是教师啊。😂

让我跟大语言模型比耐心、学习能力?别说这些了,就连「说多少话嗓子都不会痛」这点儿,我就不是它对手啊。

小结

本文我给你介绍了如何用 NotebookLM 这款免费应用综合分析多篇中文文献,回答用户具体问题,并且给出足够扎实原文证据的方法。我非常建议你动手尝试一下 NotebookLM ,也建议你认真看看 Google I/O 2024 的全部 Keynote 视频,感受一下「未来已来」的冲击。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 玉树芝兰 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 探索
  • 升级
  • 测试
  • 提问
  • 发现
  • 小结
相关产品与服务
图数据库 KonisGraph
图数据库 KonisGraph(TencentDB for KonisGraph)是一种云端图数据库服务,基于腾讯在海量图数据上的实践经验,提供一站式海量图数据存储、管理、实时查询、计算、可视化分析能力;KonisGraph 支持属性图模型和 TinkerPop Gremlin 查询语言,能够帮助用户快速完成对图数据的建模、查询和可视化分析。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档