首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >解析具有可读性的新闻Urls

解析具有可读性的新闻Urls
EN

Stack Overflow用户
提问于 2019-02-09 07:02:53
回答 1查看 286关注 0票数 0

我正在尝试使用https://zapier.comhttps://ifttt.com之类的东西自动从新闻urls中提取数据。

其主要目标是在google电子表格中获得一个漂亮的新闻urls文本版本。尝试使用像"importXML“这样的函数失败,因为我需要分析不同结构的urls。

我正在考虑使用像readability.js https://code.google.com/archive/p/arc90labs-readability/downloads这样的东西来将html转换成漂亮的文本,因为zapier允许使用javascript或python中的代码片段。

问题是,在zapier中,你不能使用不是这些编程语言标准的模块(比如漂亮汤)来抓取urls。

有没有可能我可以将url传递给readability.js https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/arc90labs-readability/readability.js的代码,或者对https://mercury.postlight.com/web-parser/进行api调用,返回一个漂亮的文本?

EN

回答 1

Stack Overflow用户

发布于 2019-02-12 04:31:53

我是David,来自Zapier平台团队。是的,这是完全有可能的!

现在最简单的事情就是向水星解析器发出POST请求,它将返回关于文章的信息。这将工作几个月(直到他们的应用程序接口shuts off)。他们已经开放了他们的代码,所以如果你喜欢他们(我也喜欢!)您可以将它们的库包装在一个一次性的CLI app中,Zapier将为您运行它们的代码。老实说,我可能很快就会为我自己做这件事,如果你愿意的话,你可以用它!当答案准备就绪时,我将更新此答案。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54601412

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档