开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >解析具有可读性的新闻Urls

问解析具有可读性的新闻Urls
EN

Stack Overflow用户

提问于 2019-02-09 07:02:53

回答 1查看 286关注 0票数 0

我正在尝试使用https://zapier.com或https://ifttt.com之类的东西自动从新闻urls中提取数据。

其主要目标是在google电子表格中获得一个漂亮的新闻urls文本版本。尝试使用像"importXML“这样的函数失败，因为我需要分析不同结构的urls。

我正在考虑使用像readability.js https://code.google.com/archive/p/arc90labs-readability/downloads这样的东西来将html转换成漂亮的文本，因为zapier允许使用javascript或python中的代码片段。

问题是，在zapier中，你不能使用不是这些编程语言标准的模块(比如漂亮汤)来抓取urls。

有没有可能我可以将url传递给readability.js https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/arc90labs-readability/readability.js的代码，或者对https://mercury.postlight.com/web-parser/进行api调用，返回一个漂亮的文本？

EN

回答 1

Stack Overflow用户

发布于 2019-02-12 04:31:53

我是David，来自Zapier平台团队。是的，这是完全有可能的！

现在最简单的事情就是向水星解析器发出POST请求，它将返回关于文章的信息。这将工作几个月(直到他们的应用程序接口shuts off)。他们已经开放了他们的代码，所以如果你喜欢他们(我也喜欢！)您可以将它们的库包装在一个一次性的CLI app中，Zapier将为您运行它们的代码。老实说，我可能很快就会为我自己做这件事，如果你愿意的话，你可以用它！当答案准备就绪时，我将更新此答案。

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/54601412

复制

相似问题