腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
抓取
网站
主页
的
附加
页面
、
、
在一些帮助下,我写了一些代码来从网页上
抓取
一些数据。然而,我只能根据代码
抓取
每个链接
的
第一页。目前,下面的代码允许我根据第一页
抓取
每年数据(https://aviation-safety.net/database/dblist.php?Year=1949)
的
链接。然而,对于某些年份,在特定年份
的
链接(https://aviation-safety.net/database/dblist.php?Year=19
浏览 21
提问于2019-09-16
得票数 1
回答已采纳
1
回答
如何
找到Googlebot何时会再次访问(爬行)我
的
页面
?
、
、
像下面这样,我在我
的
页面
中实现了unavailable_after标记,并在3天后设置为不可用,但是在Google工具中,我得到了该
页面
的404。<META NAME="GOOGLEBOT" CONTENT="unavailable_after: 05-May-2014 15:00:00 EST"> 我怎么知道Googlebot访问(爬行)我
的
页面
再读这个标签(或) Googlebot将需要多长时间来再次爬行这些
页面
?注意:我在XML中
浏览 0
提问于2014-05-06
得票数 0
回答已采纳
2
回答
你能知道谷歌何时会派Googlebot去爬行你
的
网站
吗?
、
、
我可以找到最后一个日期,当谷歌爬行我
的
网站
,但我找不到下一个爬行日期。 有什么地方可以让我看看Googlebot什么时候才能回来?
浏览 0
提问于2016-02-24
得票数 1
3
回答
如何
让谷歌在我
的
服务器上读取每个站点?
、
我
如何
让谷歌不提交一个
网站
地图到谷歌为每个
网站
抓取
每个
网站
?
浏览 0
提问于2011-11-08
得票数 4
回答已采纳
2
回答
Google最初为关键字排列新
页面
,然后恢复到我们
的
主页
排名。
、
、
、
、
我有一个WordPress站点,我们在特定关键字下构建
的
每一个
页面
都会被用来交换
主页
。第二天,我们检查,网页已被交换为
主页
。我改变了不同
的
站点地图,看看这是否是问题所在。我无法对每个
页面
的结果进行优化,从而从关键字中获得最大
的
好处。
浏览 0
提问于2017-05-09
得票数 2
1
回答
Nutch与crwaling
网站
的
问题,其中url仅在参数传递
的
术语上有所不同
我正在使用Nutch
抓取
网站
,奇怪
的
是,对于我
的
一个
网站
用户,Nutch
抓取
只返回两个url,
主页
url ()和另一个。我
的
webiste上
的
urls基本上是这种格式 Nutch不能
抓取
这样
的
网站
吗?我应该做什么Nutch设置才能
浏览 0
提问于2009-11-10
得票数 0
回答已采纳
1
回答
Facebook共享调试器
抓取
主页
URL,而不是Angular 6中给定
的
URL
、
、
Facebook共享调试器工具
抓取
了错误
的
页面
。相反,它
抓取
了https:/
浏览 5
提问于2020-02-10
得票数 1
2
回答
谷歌索引
如何
如下图所示,
如何
让google进行索引。这是爬虫
的
一个功能吗,或者你能操纵google以这种方式显示你
的
网站
吗?
浏览 0
提问于2012-03-14
得票数 2
回答已采纳
1
回答
如何
使用php获取网页列表(站点地图)?
、
我需要得到所有网页
的
有限列表,这属于一些
网站
Php。代码看起来会是什么样子?Limited表示功能(某些url,
页面
限制)。
浏览 0
提问于2015-08-05
得票数 0
1
回答
Apache Nutch 2.3.1
网站
主页
处理
、
、
我已经配置了Nutch 2.3.1来
抓取
一些新闻
网站
。由于
网站
主页
将在一天后发生变化,这就是为什么我想以一些不同
的
方式处理
主页
,以便
主页
只
抓取
主要类别,而不是文本,因为文本会在一段时间后发生变化(我在谷歌中观察到了类似的事情)。对于
页面
的其余部分,它可以正常工作(
抓取
文本等)
浏览 1
提问于2018-03-12
得票数 0
1
回答
如何
使用Python和机械化
抓取
站点
、
、
我
如何
使用机械化和Python来
抓取
一个
网站
,递归地跟踪每个
页面
上
的
每个链接?我在教程和机械化文档中看到
的
每一个例子都展示了
如何
遵循浏览
的
“路径”(例如,转到
主页
,填充表单,按提交,对响应做一些事情),而不是
抓取
整个
网站
。
浏览 0
提问于2011-11-04
得票数 2
1
回答
HTML:我应该将元信息添加到转发php
页面
吗?
我必须纠正一个
网站
的
谷歌搜索标题和摘要有以下代码作为
主页
: header("Location:/mil/index.php");它将用户转到另一个
页面
。我知道这不太好,但我想知道
如何
快速修复它。或者它是从
网站
页面
抓取
并绕过这个
页面
? 谢谢
浏览 2
提问于2010-05-12
得票数 0
回答已采纳
2
回答
怎样才能用PHP curl
抓取
一个无限滚动
的
网页?
、
、
我想知道
如何
在循环中进行
抓取
(第1页,第2页等...)一个有无限循环(如imgur)
的
网页,例如...?<?
浏览 1
提问于2013-01-20
得票数 3
回答已采纳
4
回答
Google似乎没有更新我
主页
的
描述或标题
、
、
、
、
在我们推出我们
的
网站
之前,我们已经建立了一个“即将到来”
的
页面
,谷歌从其内容中获取了标题和描述。因此搜索结果中
的
描述是: 马上就来!有关更新,请访问example.org。离我们
的
网站
开通已经有几个星期了。我们甚至创建了一个站点地图并将其提交给了Google。在Google搜索控制台中,
页面
已经被爬行,所有
页面
都如预期一样出现在Google上,除了
主页
,它还没有更新!谷歌搜索结果中
主页
的</
浏览 0
提问于2011-02-04
得票数 9
1
回答
对于
网站
的
所有
页面
,使用其他语言引用相同
的
页面
,这是正确
的
吗?
、
、
对于一个电子商务,它是正确
的
选择标签引用相同
的
网页(显然在其他语言)
的
所有网页
的
网站
?我将更好地解释,一个在
主页
中有替换标记
的
站点,非常简单
的
例子:以及同一
网站
的
另一页最后是产品: <link rel=
浏览 0
提问于2018-03-29
得票数 2
2
回答
Sitelink搜索框昨天在我
的
站点中添加JSON-LD SearchAction后不会出现在Google上
、
、
、
我向我
的
站点添加了JSON-LD代码,但是搜索栏没有出现。原因是什么?我做错什么了吗?
浏览 0
提问于2020-05-29
得票数 1
回答已采纳
1
回答
WebCrawler java numHops
、
我正在尝试创建一个爬网.edu域
的
webCrawler。我为我
的
程序提供
的
参数之一是numHops。跳数仅仅是url中/s
的
数量吗?例如,假设www.harvard.edu在我
的
种子文件(numHops = 0)中。然后,我通过www.harvard.edu解析更多
的
锚文本,我得到了www.forfard.edu/faculty和www.forfard.edu/about。那么numHops = 1吗?当我解析该网页以获取更多信息时,我得到
的</em
浏览 2
提问于2015-02-09
得票数 0
1
回答
我
如何
让谷歌索引更改我
的
网站
的
关键字?
、
、
我已经修改了我
的
网站
的
关键字,描述,标题,但谷歌没有索引
的
新关键字。相反,我发现谷歌正在为旧
的
那个做索引。 我
如何
让谷歌使用我添加
的
新关键字来索引我
的
网站
呢?
浏览 0
提问于2010-12-27
得票数 0
2
回答
XML站点地图能帮助索引flash
页面
吗?
、
XML站点地图能帮助索引flash
页面
吗?我认为它不是,你觉得呢?
浏览 2
提问于2012-03-16
得票数 0
2
回答
如何
统计广告点击量并存储在数据库中
、
、
我们把我们
的
网站
广告放在另外两个
网站
上。我们需要计算我们从这些广告中获得
的
点击量,并将其存储在我
的
数据库中。请给我一个这样做
的
想法。
浏览 0
提问于2010-05-18
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何吸引百度蜘蛛来抓取页面,蜘蛛抓取页面的因素
scrapy爬虫实战-国外soybase网站跨页面抓取
SEO页面的抓取频次对网站排名有哪些影响?
网站中的页面如何转成PDF文档?
如何做到网站单页面优化?
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券