一般的想法是,每10秒在后台运行一次可运行的程序,以检查一些数据,并在需要时对对象进行更改。ScheduledExecutorService在main()方法中实例化,并对任务进行调度。可运行任务实例化Crawler对象并开始爬行。大多数情况下,它成功地运行了几次,但是当应用程序运行和数据更改时,一个爬虫方法会被触发,但永远不会结束。代码中没有循环。我也在尝试调试,但没有成功。也许你能找出问题的所在。
Main:
public class Main {
public static void main(String[] args) {
DataStock dataSt
我想用JS写我自己的网络爬虫。我正在考虑使用node.js解决方案,如
目标是每10分钟进行一次“爬行”,所以我希望我的爬虫每10分钟从网站上获取数据。
我知道我可以编写一个无限循环,例如:
var keeRunning = true;
while (keepRunning) {
// fetch data and process it every 10 minutes
}
如果我一直都有我的电脑,而且我在网站上,这会非常好的工作。
然而,如果我关闭我的电脑,我可以想象它将不再工作了。那么,我应该考虑什么样的解决方案来让脚本一直运行,即使计算机被关闭了呢?