腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用jQuery在head中添加元标记可以吗?
、
、
、
、
我想在HTML页面中有条件地添加元标记,我不确定这样做是否可以或者甚至不使用jQeruy ready。给出了这个例子。if(myHost.startsWith("techstag")) {}
浏览 1
提问于2020-01-06
得票数 1
2
回答
使用用户登录从其他网站导入用户帐户数据
、
、
、
到目前为止,我能够发现网络
爬虫
/蜘蛛可以用来从
网页
上删除数据。但我不确定网络
爬虫
在我们需要用户登录并且页面urls是
加密
的,或者至少是动态生成的urls的情况下是否有用。如果
爬虫
是这个问题的解决方案,请提供一些我可以在我的.net应用程序中使用的web
爬虫
API的链接。Atif
浏览 4
提问于2011-09-09
得票数 0
回答已采纳
1
回答
CSS显示表,任何SEO的含义?
、
、
我想使用CSS显示表代替
JS
,用于HTML元素的垂直对齐和等高,但是我不确定这是否有任何SEO含义,
爬虫
会尝试以这种方式解释以表格数据方式显示的元素的内容,还是会忽略它并将其解释为正常的内容?
浏览 0
提问于2014-02-07
得票数 1
2
回答
Laravel Vue.
js
应用程序的SEO
、
、
我的Laravel5.6应用程序有一个Vue.
js
前端。Vue.
js
应用程序位于资源目录中。我已经读过几篇使用Prerender SPA插件的文章。这些文章是为独立的vue.
js
应用程序编写的,并且有一个index.html文件。在Laravel的例子中,我们有index.php。我如何使我的Laravel Vue.
js
应用程序SEO自由。
浏览 1
提问于2018-07-20
得票数 3
1
回答
抓取的html与浏览器中的html不同
我使用网络收获来获取HTMLs,但是我发现我得到的和浏览器中的略有不同。html中的几个数字被一个破折号(-)替换成了用web采集爬行的HTML中的数字。我保证我的浏览器中的URL和web采集中的http请求中的URL是相同的。我怎么才能让它工作呢?
浏览 0
提问于2014-09-23
得票数 1
1
回答
主脚本和内容脚本之间的数据交换-- Firefox Addon SDK
、
、
、
、
我的Mozilla (用Addon编码)需要在表单提交到
网页
服务器之前以
网页
形式
加密
信息。我使用的
加密
库只能在lib/main.
js
中访问,并且要在
网页
上
加密
的信息是由内容脚本收集的。我的想法是让我的Addon用以下过程
加密
数据:
浏览 6
提问于2013-11-18
得票数 1
1
回答
搜索引擎如何唯一地识别web上的每个页面
、
、
、
、
如果我写了一篇文章,他的链接是'example.com/abc.php‘&这篇文章在搜索引擎中排名靠前。 几天后,我更新了这篇文章,包括它的内容和'xyz.php‘的永久链接。 现在,之前URL为'example.com/abc.php‘的帖子被更新为'example.com/xyz.php’。 那么搜索引擎将如何知道这是与URL example.com/abc.php排名相同的页面/帖子。并且需要将搜索结果中的链接更新为“example.com/xyz.php”,而不影响排名。 在更新固定链接之前和之后,在为搜索引擎创建一个唯一标识页面的新帖子时,有
浏览 35
提问于2021-01-25
得票数 0
1
回答
谷歌网站
爬虫
如何找到我的网站,如果我没有张贴网址任何地方?
、
想知道谷歌网站
爬虫
是如何找到我的网站。假设我没有在谷歌索引的任何其他地方发布网址。 有人能解释一下吗?
浏览 2
提问于2016-04-22
得票数 0
回答已采纳
1
回答
Nuxt.
js
服务器端呈现是如何工作的?
、
、
我主要是和Next.
js
一起为网络项目工作。工作要求我从事一个使用Nuxt.
js
(v2)的项目。 我开始读努克斯特的书。在过去的几天里,从翻阅文档到现在,仍有几个问题悬而未决。这看起来相当简单,与在构建时使用Next.
js
进行纯静态站点使用getStaticProps()来获取数据并没有太大的不同。动态数据获取和身份验证可以在客户端进行,就像SPA一样。Server-Side呈现(关于下一步):对于Next.
js
来说,这也很简单,每次请求页面时,getStaticProps()都会阻止它呈现,直到它能够用服务器本身的上的
浏览 6
提问于2022-07-02
得票数 0
回答已采纳
2
回答
浏览器限制会影响
网页
爬虫
吗?
、
、
return Redirect("/h"); return View(); 问题:如果我限制一些浏览器访问我的主视图,它也会限制对网络
爬虫
的访问吗
浏览 0
提问于2013-02-21
得票数 0
回答已采纳
2
回答
为开放图实现元标记
、
Facebook在发送动作post请求时需要对象的url。现在,我的应用程序只允许授权用户,我将用户重定向到登录页面,它将重定向回用户请求的页面。
浏览 1
提问于2012-03-26
得票数 2
1
回答
C#
爬虫
程序无法加载动态内容
、
、
、
我正在使用Abot库来抓取
网页
。
爬虫
可以正确地请求页面,但问题是几乎所有内容都是通过knockout.
js
动态加载的。
爬虫
程序目前无法请求此内容,这导致只加载了页面的一小部分。
浏览 12
提问于2019-07-09
得票数 0
1
回答
Robots.txt:允许除根目录之外的所有内容
、
我有一个站点,它的根目录是,任何到的流量都被重定向到。在网站管理员工具中,我将站点添加为,但我只在/blog目录和其他静态页面上获取谷歌。对吗?有人能验证一下这是否会达到我想要达到的目的吗?Allow: /$
浏览 1
提问于2015-11-18
得票数 0
回答已采纳
2
回答
Robots.txt和Coldfusion
、
、
我知道您可以禁止
爬虫
中的: /page1.cfm,但是如果我只想禁止该页面的一部分,比如该页面上存在的链接或联系人表单,该怎么办?这种功能有可能实现吗?根据我最近读到的一些论坛,"nofollow“功能不再有效,因为
爬虫
变得更智能了。(我不知道那个论坛的可信度如何,所以如果有人有更好的来源,请分享) 有什么建议吗?
浏览 2
提问于2012-06-02
得票数 1
回答已采纳
4
回答
我应该同时打开多少个Java HttpURLConnections?
、
、
我正在编写一个多线程的Java网络
爬虫
。根据我对
网页
的理解,当用户加载
网页
时,浏览器请求第一个文档(例如,index.html),当它接收到超文本标记语言时,它会找到需要包括的其他资源(图像,CSS,
JS
),并同时请求这些资源。我的
爬虫
程序只请求原始文档。由于某些原因,我不能让它每5秒抓取超过2到5页。我正在为我制作的每一个HttpURLConnection创建一个新的线程。看起来我应该至少能够每秒抓取20-40页。
浏览 1
提问于2009-09-04
得票数 2
回答已采纳
1
回答
您能使用AWS摄取
加密
的S3对象(文本文件)吗?
、
、
、
、
我在S3中有一个
加密
的文本文件。我希望使用AWS Glue将这些数据加载到RDS Aurora。 如果不是,什么最好的方式来摄取
加密
的数据到AWS胶,而不解密它。
浏览 0
提问于2019-04-30
得票数 1
回答已采纳
2
回答
抓取: Web抓取由于结构变化而停止
、
、
当抓取一个
网页
时,
网页
的结构一直在变化,我的意思是它的动态性导致我的
爬虫
停止工作。是否有一种机制可以在运行完整的
爬虫
程序之前识别
网页
结构的变化,以便识别结构是否已经改变。
浏览 32
提问于2020-09-28
得票数 0
1
回答
C# -用
网页
爬虫
下载网站ajax页面
、
、
我用c# (使用Microsoft WebCrawler)编写了一个简单的网络
爬虫
项目,它可以下载特定站点的内容。正如Marcom建议的那样,我从我的
网页
爬虫
和
网页
浏览器上看到了小提琴的响应。当我的
网页
爬虫
导航到
网页
时,他会在与
网页
相反的一个仿真器上接收假信息。 有线索吗?
浏览 1
提问于2011-03-11
得票数 0
1
回答
使用apache nutch对solr中的结构进行索引
、
、
、
、
我只是想抓取特定网站的页面,以及页面的特定部分,并将其索引到solrTy
浏览 0
提问于2016-08-02
得票数 0
3
回答
“索引,跟随”和“跟随”的区别是什么?
、
、
以下清单有哪些不同之处: <meta name="
浏览 4
提问于2018-07-11
得票数 6
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
爬虫之旅(2)——网页知识储备html、css及js
使用蜜蜂采集器对Crypto-JS加密的网页数据进行解密
用Python做网页爬虫
想获取JS加载网页的源网页的源码,不想获取JS加载后的数据
Python爬虫实现网页截图的方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券