腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
除非启用了Javascript,否则使用php函数
、
、
我有一个网站,将
抓取
新的数据在第一页访问。我想使用AJAX来做这件事,这样我就可以在
抓取
过程中向用户提供至少一些loading.gifs,但这只有在启用了Javascript的情况下才能实现。我的站点使用了一个PHP模板引擎,所以我想把
抓取
函数放在html模板的<noscript>标记中。因为这将在所有PHP代码之后发生,所以我必须重新加载页面,以便可以使用PHP呈现/解析
抓取
的数据。
浏览 0
提问于2011-01-16
得票数 1
1
回答
抓取
网站未返回正确的源代码
、
、
、
我正在尝试用Python
抓取
一个quizlet匹配集。我想用class:TermText
抓取
所有的<span>
标签
import requestsraw最终返回的
内容
根本不包含任何
标签
或卡片当我检查网站的源代码时,它显示了我需要的所有TermText跨度,这意味着它不是
JS
加载的。因此,我不明白为什么我的HTML是错误的,因为它没有包含任何我需要的html。
浏览 18
提问于2020-07-31
得票数 1
回答已采纳
2
回答
从网页中提取
内容
数据
我希望从网页urls获得结构化文章数据。到目前为止,我已经找到了这两个服务和。有没有更好的替代方案,或者自己写代码来做这件事值得吗?
浏览 2
提问于2014-10-07
得票数 0
3
回答
阻止来自我的网站的cURL请求
、
、
、
我想用一个<noscript>
标签
来阻止它,但我能做的就是隐藏
内容
,机器人仍然可以
抓取
我的
内容
。 有没有办法运行
JS
测试来查看
js
是否被禁用(以检测bot),并重定向这些请求,可能是在黑名单中。
浏览 0
提问于2014-06-08
得票数 4
1
回答
抓取
标题
标签
的
内容
、
我想获取下面给出的heading
标签
的
内容
: <h1 style="BACKGROUND-COLOR: white; line-height: 2em; margin:0 .5em .2em .5em;
浏览 0
提问于2016-11-24
得票数 0
1
回答
基于
抓取
的爬虫不提取<p>标记中的
内容
、
、
、
、
我有一个自定义的
抓取
新闻文章的爬虫。然而,在大多数情况下,当添加新的urls时,有时很难弄清楚使用什么css选择器来获得我想要的
内容
。下面是我正在做的代码。它
抓取
除
内容
之外的所有
内容
。我试过下面的选择器它
浏览 2
提问于2020-06-02
得票数 0
1
回答
如何指定要用作facebook共享缩略图的图像
、
、
我正在制作一个网站画廊页面,在meta
标签
中我设置了一个og: image,这样当有人在页面上点击like时,该图像就会被用作facebook墙上故事的缩略图。
浏览 0
提问于2012-01-25
得票数 0
回答已采纳
1
回答
带通配符的木偶师waitForSelector
、
我遇到了一个问题,当我使用节点
js
傀儡()做一些网络
抓取
。我有一个这样的选择器问题是,BVID后的id会动态变化我试过这样的东西: 等待page.waitForSelector(“包含(,'BVID') > div >div.d-挠曲.md 10.正当性-
内容
-md-介于> div:nth
浏览 1
提问于2021-04-08
得票数 0
回答已采纳
1
回答
我可以回复不同的
内容
吗?
、
我正在开发一个url缩短器,目前的规范要求避免Facebook
抓取
这些链接,相反,一个集成的
抓取
器会做到这一点,并将og meta
标签
交给Facebook。在Facebook的术语中,有没有什么东西不允许我用与普通用户看到的
内容
不同的
内容
(例如,一个只有opengraph meta
标签
的空页面)来回复它的
抓取
器? 提前谢谢。
浏览 0
提问于2012-09-20
得票数 0
1
回答
有没有可能用NodeJS
抓取
任何给定的网址?
、
我已经阅读了一些关于
抓取
的文章,似乎NodeJS、ExpressJS、Request和Cheerio是我作为一个熟悉
JS
/jQuery的前端人员的首选方法。到目前为止,我读过的所有文章都集中在没有API的情况下从特定网站上
抓取
数据,而我想要实现的是一个工具,它可以获取任何给定的URL,并返回true/false来列出正在使用的通用库和链接的社交网络。由于CSS选择器,我选择的设置(如上)是合适的,还是仅限于
抓取
特定页面?
浏览 0
提问于2014-08-07
得票数 0
1
回答
使用Node.
js
进行网页
抓取
、
、
、
我观看并测试了一些教程和示例,以帮助我理解
抓取
代码是如何工作的,我看过Node.
js
和PHP教程,但遗憾的是,这些教程都没有解释如何将这些代码实际连接到html中的<input>
标签
,所以当用户粘贴链接时,它会
抓取
并显示数据。跳到1:05查看我真正需要学习的
内容
。 非常感谢:)
浏览 3
提问于2017-02-06
得票数 1
2
回答
如何用BeautifulSoup
抓取
文本
标签
?
、
、
我对BS4和网络
抓取
是个新手,所以对于这样一个基本的问题,我很抱歉。有人知道如何提取这些信息吗?
浏览 2
提问于2020-10-08
得票数 1
2
回答
抓取
使用javascript注入html的网站
、
我试图用Node.
JS
抓取
一个网站,但当
抓取
html文件时,出现的东西是注入JavaScript的脚本
标签
,在查看有问题的JavaScript文件时,我似乎是正确的,因为我发现了我试图
抓取
的文本。在这个脚本被注入到html之后,我如何
抓取
文档?有什么办法吗?谢谢
浏览 22
提问于2020-11-04
得票数 0
回答已采纳
4
回答
如何
抓取
HTML
标签
的
内容
?
、
、
、
嘿,所以我想做的是
抓取
第一段的
内容
。Paragraph 1</p><p>Paragraph 2</p><p>Paragraph 3</p>以下是我的当前代码: i
浏览 1
提问于2008-09-02
得票数 7
回答已采纳
1
回答
驱动不
抓取
更新的
标签
内容
而
抓取
旧的
内容
、
、
、
但是,对于所有的作业元素,第一个作业的作业描述总是被
抓取
的。这是我的代码。specified element. #to click use .click(), action chains, or
js
我想知道为什么当前单击的作业的描述没有被
抓取
,而旧作业的描述被
抓取
。这个问题的答案将会解决这个问题。谢谢。 这是该网站的网址:website to be scraped
浏览 30
提问于2021-05-01
得票数 0
回答已采纳
2
回答
有没有可能在chrome扩展中做一些简单的web
抓取
?
、
、
、
我想知道是否有可能在基本的
JS
或chrome API中进行web
抓取
?任何信息或指导都将非常感谢,我一直在努力做这个主题的研究,但没有找到任何最近或明确的答案。 谢谢你的帮忙!
浏览 2
提问于2020-07-20
得票数 0
1
回答
如何在CSS选择器中指定'all td,and all td img‘?
、
、
我正在使用X-ray
JS
包从一个页面上
抓取
一个表。使用JSON字符串中的CSS选择器数组指定所需的标记和属性。 "{[ 'th, td' ]}"可以正确地从所有th和td
标签
中获取
内容
。
浏览 1
提问于2016-03-01
得票数 1
1
回答
在bg中不加载脚本
内容
、
即使启用了javascript,html
标签
noscript也会在后台加载
内容
吗? 我有一个由
JS
调用的随机图像,每次加载页面时,但我希望所有的链接(不仅仅是当前的随机链接)都被
抓取
。
浏览 4
提问于2008-10-21
得票数 6
1
回答
LinkedIn
抓取
逻辑
、
、
我通过REST API分享了一条消息,在消息标题下面显示了一些额外的
内容
。我的结论是linkedin从我的网站
抓取
了这些
内容
(因为当我测试在本地服务器上发布的
内容
时,LinkedIn不能从那里
抓取
任何东西,所以很清楚),但是它是如何工作的呢?OpenGraph
标签
被设置为正确的值,但消息中的额外
内容
甚至不是来自主页。它看起来像是
抓取
了我网站的任意一块并发布了它。另外,图片与OG
标签
中的图片不匹配。
浏览 1
提问于2013-06-10
得票数 0
回答已采纳
1
回答
使用Prerender.io如何将爬虫重定向到我们的碎片化站点?
、
、
目前我们使用prerender-node来
抓取
HTML
内容
。只有当我们将"_escaped_fragment_=“添加到我们的url时,它才能工作。如何在不添加哈希
标签
的情况下查看
抓取
的HTML
内容
。没有"_escaped_fragment_=“我们能看到超文本标记语言的
内容
吗? 示例:
浏览 1
提问于2018-06-05
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python项目实战:抓取大型网站JS特效模板
使用JS和NodeJS爬取Web内容
python爬虫:散文网站内容抓取实战案例附源码
站长吐槽:头条搜索爬虫暴力抓取网站内容
Python爬虫学习:抓取电影网站内容的爬虫
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券