腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用Scrapy
抓取
ajax
页面
、
、
我能够
抓取
和
抓取
几个网站(事实上我已经
抓取
了900个网站),基于pipelines.Now给出的
关键字
,问题是当我们遇到javapages (ajax)时,
抓取
不能
抓取
。我正在尝试使用以下代码,并对
抓取
ajax
页面
进行适当的更改第二个问题是,我面临的问题是scrapy无法
抓取
登录
页面
浏览 2
提问于2013-06-19
得票数 0
回答已采纳
1
回答
使用Scrapy搜索新闻网站时避开新闻列表
页面
、
、
我必须从新闻网站
抓取
文章,与某些
关键字
,我正在使用Scrapy这个任务,检查是否存在一个
关键字
在
页面
上,或我从
页面
提取的内容,并搜索该
关键字
。但我面临的问题是,当列表
页面
只列出了带有链接到新闻
页面
的新闻,例如/features/cinema/时,我想避开这个
页面
,但我无法找到一种方法来检查它是否是一个列表
页面
。
浏览 0
提问于2014-12-21
得票数 0
1
回答
如何存储网站内容?
、
、
、
我编写了脚本PHP,它应该
抓取
一个域的所有子
页面
,将文本(所有
关键字
)从子
页面
上传到数据库(MySQL)。接下来,我想快速查找具有特定
关键字
的url's。在我的例子中,如何保存和处理大文本数据?它应该像谷歌的网站爬虫一样工作 创建两个表:
关键字
,
关键字
子
页面
,
关键字
:
关键字
id,子
页面
id。
浏览 6
提问于2014-03-25
得票数 0
1
回答
如何
抓取
搜索引擎结果
、
、
、
构建一个
页面
(asp.net)来
抓取
搜索引擎结果,然后显示在我自己的
页面
上,这是可行的吗?我的同事想开发一个包含搜索框的
页面
,当用户输入
关键字
并单击搜索时,它会传递给搜索引擎(如google)并
抓取
结果。然后将结果插入到数据库中,并在我的
页面
中显示结果。
浏览 0
提问于2012-12-29
得票数 0
2
回答
在google搜索
页面
中搜索
关键字
的前10个搜索链接
、
我想从一个谷歌
页面
抓取
搜索
关键字
前10名的搜索链接。属性模式?这是正确的方式吗,它目前不起作用。还有没有其他简单的方法?
浏览 0
提问于2010-09-02
得票数 0
回答已采纳
1
回答
python selenium
抓取
多页表格
、
、
这段代码的目的是从某个URL
抓取
多页数据表。而且它只适用于第一行,不再有效。
浏览 0
提问于2018-09-19
得票数 0
1
回答
我是否可以使用HTMLUnit访问HTML5存储
、
、
、
我有一个需求,那就是我需要确定是否有任何
页面
正在存储或读取HTML5数据存储。我正在使用HTMLUnit
抓取
网页。我查看了sourceforge列表,发现已经构建了对HTML5存储的支持。我还想过
抓取
页面
上的所有Javascripts并搜索
关键字
,但有比这更好的方法吗?
浏览 2
提问于2012-02-10
得票数 0
回答已采纳
3
回答
如何根据
关键字
获取网站的Google位置?
、
我搜索了谷歌搜索API,但没有找到一种方法来获得基于搜索
关键字
的网站位置排名,我认为这是不可能的。 但是我碰巧发现这个网站"“和我想做的一样,所以我只想知道它背后的想法,或者它是不合法的。
浏览 1
提问于2009-05-27
得票数 1
回答已采纳
1
回答
关键字
排序跟踪器,在每个域上工作。
、
、
、
、
我正在寻找一个
关键字
抓取
跟踪工具的谷歌。有什么建议吗?还是我必须为每个
关键字
设置每个URL?
浏览 0
提问于2012-11-28
得票数 0
3
回答
我可以阻止谷歌列出我的网站时,使用
关键字
X,但允许它的
关键字
Y?
、
当我在Google上搜索
关键字
X或Y时,我可以看到我的网站位于结果列表的顶端。 有什么方法不显示我的网站在谷歌的结果列表时,
关键字
Y被输入,而我的网站保持在结果列表的顶部,当
关键字
X被输入?
浏览 0
提问于2013-08-26
得票数 3
2
回答
抓取
页面
关键字
,描述和标题的功能?
、
、
我写了3个简单的函数来
抓取
简单的html
页面
的标题、描述和
关键字
这是第一个
抓取
标题的函数{ $title = $array[1]; }它工作得很好,有两个函数可以
抓取
描述和
关键字
浏览 0
提问于2012-06-15
得票数 0
回答已采纳
2
回答
这样做会对性能有什么好处吗?PHP问题
、
我正在创建一个从网页
抓取
所有链接的站点蜘蛛,以及该网页的html源代码。然后,它检查它找到的所有链接,并只保留内部链接。接下来,它转到这些内部
页面
中的每一个并重复上述过程。基本上,它的工作是
抓取
指定域下的所有
页面
,并
抓取
每个
页面
的源。现在这样做的原因是,我想运行一些检查,看看在任何
页面
上是否找到这个或那个
关键字
,以及列出每个
页面
的元信息。我想知道我是否应该在每个
页面
的爬行阶段对html运行这些检查,或者是否应该将所有
浏览 2
提问于2011-02-20
得票数 0
1
回答
使用Scrapy从论坛获取搜索结果
、
、
我正在尝试使用Scrapy来收集搜索
关键字
的结果(例如,朝鲜)。当我使用搜索栏时,我得到了一个结果列表,但随后试图根据结果
页面
的url ()用Scrapy
抓取
这些结果似乎行不通。这通常会让我暂停一下。如果我试图
抓取
整个
页面
的搜索结果,使用顶部的。
页面
看起来像这样:但是当我回到它的时候:我不知道why....Huge是怎么回事,感谢任何能帮上忙的人!
浏览 0
提问于2020-03-03
得票数 0
1
回答
使用wget递归下载网站时排除包含特定字符串的网页
我试图递归地
抓取
一个网站,但我想排除该域下的一些网页,其中包含字符串“不必要的
页面
”。该字符串不在URL中。以下是用于构建的原始命令:例如,我想
抓取
维基百科。但我想排除包含
关键字
“药物”的文章。 有什么想法吗?
浏览 8
提问于2014-06-23
得票数 0
1
回答
如何避免多个
页面
的相同内容和
关键字
,而只关注母版页
、
、
、
大家早上好, 希望一切顺利,我是在一个三角的情况下,我的多细节页,我想知道如何可以避免谷歌不
抓取
我的详细信息页和crowl其容器
页面
,其中包含90%相同的
关键字
,元和url。例如,我有一个
页面
,它是多个类别的母版页,当我打开一个类别时,它包含多个类别,它允许我们打开另一个
页面
,它现在是子类别,这个子类别有多个
页面
的区域副列表--这个
页面
和这个子类别
页面
相同,但是这些
页面
只包含区域列表,并且这个
页面
有经纪人发布的实际列
浏览 0
提问于2015-02-26
得票数 0
回答已采纳
4
回答
如何在C#中的其他两个字符串之间返回字符串?
、
、
、
对于已经创建的
页面
源,我有一个字符串。我需要从字符串中
抓取
几行文字。我需要的字符串介于另外两个字符串之间。这两个字符串是“
关键字
”:和,"“ 如何在引号(如“
关键字
”:)之后搜索具有冒号的字符串?
浏览 8
提问于2013-10-16
得票数 0
回答已采纳
1
回答
使用R进行web
抓取
,单击链接
、
、
我是一个初学者,我想刮所有的文章与所选的
关键字
从
页面
上。我只能
抓取
单个
页面
上显示的文章标题,文章描述及其链接的一部分。我不仅想
抓取
搜索结果,还想
抓取
每个显示的链接的内容。
浏览 2
提问于2018-02-22
得票数 2
1
回答
将大量维基百科表刮到MySQL数据库的最佳方法
、
、
、
什么是
抓取
维基百科主要文章
页面
中所有HTML表格的最佳编程方法,其中
页面
标题与某些
关键字
匹配?然后,我想把列名和表数据放到数据库中。 还会获取URL和
页面
名称以进行属性设置。
浏览 8
提问于2013-07-31
得票数 0
1
回答
需要从谷歌
关键字
外部工具提取结果?
、
、
、
需要建立一个小的java工具,从谷歌
关键字
工具在获得
关键字
建议和流量估计。
页面
是用javascript呈现的,所以简单的
抓取
是不可能的。
浏览 2
提问于2010-10-14
得票数 2
1
回答
抓取
PHP
页面
上的
关键字
、
、
我想要
抓取
这个网页下拉表中的
关键字
问题是,每个项目的下拉菜单阻止我直接
抓取
表,因为它只获取每个项目的标题,而不是每个项目的内部内容。
浏览 3
提问于2021-09-12
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
爬虫抓取页面图片
如何吸引百度蜘蛛来抓取页面,蜘蛛抓取页面的因素
Python按关键字抓取新浪新闻
批量抓取页面图片 up!
爬虫抓取页面图片 update
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券