我正在尝试使用https://zapier.com或https://ifttt.com之类的东西自动从新闻urls中提取数据。
其主要目标是在google电子表格中获得一个漂亮的新闻urls文本版本。尝试使用像"importXML“这样的函数失败,因为我需要分析不同结构的urls。
我正在考虑使用像readability.js https://code.google.com/archive/p/arc90labs-readability/downloads这样的东西来将html转换成漂亮的文本,因为zapier允许使用javascript或python中的代码片段。
问题是,在zapier中,你不能使用不是这些编程语言标准的模块(比如漂亮汤)来抓取urls。
有没有可能我可以将url传递给readability.js https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/arc90labs-readability/readability.js的代码,或者对https://mercury.postlight.com/web-parser/进行api调用,返回一个漂亮的文本?
https://stackoverflow.com/questions/54601412
复制相似问题