腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何在一个mesos从节点上运行多个码头容器?
、
、
我有两种不同的
爬虫
器,每一种都被构建成一个码头容器。现在我通过马拉松发射。下面的代码是马拉松启动json。]], "cmd": "ip=`wget http://ip.lustfield.net/ -O - -q`;echo $ip; sleep 20; echo $i
浏览 3
提问于2015-04-09
得票数 1
回答已采纳
2
回答
Scrapy在启动后立即完成
如果我这样做几次,它将在一些尝试中起作用我有相同的
爬虫
为另一个网站,这没有问题。或者这是亚马逊的问题吗?
浏览 2
提问于2019-11-08
得票数 2
2
回答
scrapy未能与
python
3.7合作
、
、
、
、
只有在我这样做之后,我的笔记本电脑才能安装scrapy;然而,似乎扭曲的包与
python
3.7不兼容,并且它一直在说“
语法
错误”。我想知道我是否需要转换到
Python
3.6?因为我的
python
爬虫
只能设置它的下载器,不能解析网页 有人能给我一些建议吗?
浏览 8
提问于2018-08-21
得票数 1
回答已采纳
1
回答
弹性豆杆不运行的克隆约伯
、
、
、
、
我在一个弹力豆茎应用程序上有一个抓取器,我可以像这样运行SSH: 我想帮我安排一个任务来处理这个问题。Cron won't r
浏览 0
提问于2015-04-13
得票数 0
2
回答
以XML格式保存网页的工具
、
、
、
我想创建一个显示毒品信息的离线应用程序。我需要使用的信息已经在维基百科中提供了。但是在这个页面上,有那么多的子页面(1000+)需要保存,在我看来,手动完成这个任务是不可行的。我的需求最好免费 基于Windows或Linux的
浏览 0
提问于2015-01-06
得票数 4
回答已采纳
1
回答
基于Crawler输出的触发Lambda
、
、
、
我有一个设置,在我的胶水
爬虫
运行和数据准备红移时,我需要触发lambda函数。有办法制造这样的触发器吗?编辑: 我为
爬虫
状态更改添加了一个事件桥规则,它可以工作并触发lambda函数,但是当我的任何
爬虫
程序运行时它都会触发。我想隔离它,只有在运行了特定的
爬虫
之后才触发。我用下面的代码进行了测试,但它似乎没有选择我的
爬虫
名称。是否有其他方法在规则中指定
爬虫
名称,或者我是否犯了
语法
错误?
浏览 6
提问于2022-10-04
得票数 0
回答已采纳
2
回答
检测网页中同构元素的列表
、
、
、
我需要检测页面DOM中连续的相同元素的序列。这些元素可以是div元素、li元素或span元素,也可以包含其他元素。这些元素有一个共同的事实,即它们是连续出现的,具有相同的内部结构。谢谢。
浏览 3
提问于2014-07-04
得票数 0
回答已采纳
1
回答
将具有动态生成名称的DynamoDB表导出到S3
、
、
我将时间序列数据存储在每日生成的DynamoDB表()中。这些表的命名惯例是"timeseries_ 2019-12-20 ",其中2019-12-20为当前日期。我想以CSV格式将前一天表发送到S3桶。推荐的方法是什么?我在看AWS Glue,但不知道如何让它每天找到新的表名。也许有云观察事件的lambda函数会更好?DynamoDB表的大小不大,存储了几百个数字。
浏览 4
提问于2019-12-21
得票数 0
回答已采纳
2
回答
使用scrapy
python
的.net框架
、
、
、
可以在
Python
框架中使用.NET框架从不同的站点抓取数据吗?我正在做我的最后一年的项目,在这个项目中,我想使用C#作为前端语言,并使用
Python
来抓取数据。
浏览 0
提问于2014-05-07
得票数 4
1
回答
如果我为我的
python
脚本做了一个简单的gui,它会影响它的效率吗?
、
、
嗨,我想做一个网页
爬虫
,检查URL的数据,如果我做一个简单的Gui,使脚本更容易查找变量的数据,添加代码的gui会使我的网络
爬虫
效率降低吗? 我需要
爬虫
尽可能高效,能够尽可能快地处理数据。为这个
Python
脚本制作一个gui,会不会妨碍web
爬虫
的性能?
浏览 3
提问于2015-01-27
得票数 0
回答已采纳
3
回答
将数据从PHP脚本传递到
Python
Web Crawler
、
、
、
、
我有一个
python
爬虫
,每隔几分钟就抓取几个网页。我现在正在尝试实现一个可以通过web访问的用户界面,并显示
爬虫
获得的数据。我将使用php/html作为接口。无论如何,用户界面需要某种类型的按钮来触发
爬虫
程序立即抓取特定的网站(而不是等待下一次抓取迭代)。 现在,有没有一种方法可以将数据从php脚本发送到正在运行的
python
脚本?然后我在考虑使用一个共享文件,php在其中写入数据,
python
从中读取数据。但是,我需要一些方法来让
python
脚本知道,新数
浏览 1
提问于2011-03-31
得票数 1
1
回答
如何轻松地在远程github分支和本地分支/文件夹之间切换?
、
、
、
我用
Python
2.7编写了大量的Scrapy爬行器。我需要将它们全部转换为支持
Python
3,这种转换必须在1 go内完成。我只能在
Python
3
爬虫
做好部署准备之后才能开始使用。现在,由于“所有操作都必须保持活动状态”,我需要一个单独的
Python
3
爬虫
的远程分支。这个分支可以称为Remote-B。我手动创建了这个分支,所以整个存储库现在有两个分支: Master(Remote-A)和
Python
3
爬虫
(Remote-B),后者是主分支的一个
浏览 3
提问于2019-09-10
得票数 0
回答已采纳
1
回答
我怎么能强制停止我的
爬虫
得到一个特定的网址抓取最后一次?
、
、
、
、
我正在制作一个
爬虫
来找出最近添加的youtube视频,当我的
爬虫
到达旧视频(在前一个转弯中爬行)时,我想停止
爬虫
。我使用的不是scrapy和漂亮的汤,我使用的是
python
库。请给我推荐任何选项
浏览 9
提问于2017-06-27
得票数 0
1
回答
在ubuntu的后台运行时,
爬虫
停止。
、
我使用具有无限循环的
python
制作了一个简单的
爬虫
,所以它不能停止。随机延迟17 ~ 30,这个
爬虫
爬行相同的一个页面,并找到'href‘链接,定期更新,并存储到Mysql。因为我使用了Linux命令这个
爬虫
是在Ubuntu服务器背景下运行的。我想它已经运行了大约4个小时。但
爬虫
突然停止了。第二天我再试一次。
浏览 1
提问于2014-05-20
得票数 0
回答已采纳
2
回答
PHP与
、
、
我计划制作的网络
爬虫
,可以抓取200+领域,哪一种语言将适合它。我非常熟悉PHP,但我是
Python
的业余爱好者。
浏览 2
提问于2014-11-21
得票数 0
回答已采纳
1
回答
BeautifulSoup - TypeError:序列项0:预期的str实例
、
、
我使用
python
制作了一个web
爬虫
,一切都很好,直到它到达代码的这一部分: # Use BeautifulSoup modules to format web page as text that我认为我的
语法
可能是问题所在,但我不确定。我怎么才能解决这个问题?
浏览 0
提问于2019-01-02
得票数 1
1
回答
如何提取我的
爬虫
目前所站的网址?
、
、
我正在使用
python
中的scrapy框架制作一个web
爬虫
。其主要思想是,
爬虫
从页面中提取一些数据,如果数据符合某些条件,
爬虫
应该提取其当前所处的URL。是否有一些方法/函数可以获得当前的URL?
浏览 5
提问于2016-11-27
得票数 0
回答已采纳
2
回答
刮取Web爬行
语法
高级代码
、
、
、
、
你好斯塔克沃夫,这就是某个标签中的东西是如何被爬行的。for sel in response.xpath('//ol/li/h3'):cout << "\n Choose your action:" << endl注意:我正在用
Python
编写代码,并使用Scrapy web
爬虫
/蜘蛛。 谢谢你的阅读和帮助。
浏览 5
提问于2015-01-09
得票数 1
2
回答
Facebook机器人是否停止了对?_escaped_fragment= AJAX爬行的坚持?
、
、
、
很长一段时间以来,当#!somethingLikeThis包含?_escaped_fragment=somethingLikeThis时,它可以为机器人提供页面,而在幕后,机器人会以?_escaped_fragment=somethingLikeThis的形式请求它,但这似乎不再起作用了。有官方说明这是为什么吗?
浏览 1
提问于2018-03-08
得票数 0
回答已采纳
1
回答
分布在不同地理位置的
爬虫
、
、
我需要创建一个
爬虫
与客户端在每个台式机和一个中央服务器,其中的数据是索引。有没有可能在Nutch中创建这样的
爬虫
?还有没有别的选择。基于
Python
的
爬虫
会更好。
浏览 2
提问于2011-07-04
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫语法规则
Python 02 Python 基础语法
python 字典语法
Python语法大全
Python基础语法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券