腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
not
抓取
网站
的
问题
:不
提取
任何
内容
、
、
我正在尝试从以下
网站
提取
数据:'https://2010-2014.kormany.hu/hu/hirek'。例如,当我尝试使用以下
内容
从该
网站
提取
文章链接时,我什么也得不到。如果我运行以下代码,我甚至什么都得不到: links <- read_html(url) %>% html_nodes("div") > character(0) 这非常奇怪,因为当我检查
网站
时,似乎我应
浏览 15
提问于2021-08-29
得票数 0
1
回答
使用BeautifulSoup
抓取
的
数据与源代码
不
匹配
、
、
、
我是网络
抓取
的
新手。我已经看过一些关于如何使用漂亮
的
汤来
抓取
网站
的
教程。作为练习,我想从一个房地产
网站
上
提取
数据。我想要
抓取
的
特定页面是这个:我遇到
的
第一个
问题<
浏览 4
提问于2021-05-02
得票数 1
6
回答
爬虫vs刮板
、
、
有人能在范围和功能方面区分爬虫和刮板吗?
浏览 0
提问于2010-07-09
得票数 71
回答已采纳
2
回答
NUTCH可以用来从电子商务
网站
获取数据吗?
、
、
、
我想从
网站
上获取数据。我想要易趣上不同商品
的
价格。我想把这些产品和它们
的
价格放在我
的
数据库里。纳奇在这里会有帮助吗?如果不是的话,我更喜欢哪种刮刀/爬行?
浏览 5
提问于2014-06-17
得票数 0
回答已采纳
1
回答
Facebook如何
抓取
我
的
网站
,我如何手动更改此信息?
、
、
我正在使用iFrame版本
的
Facebook点赞按钮,我想知道Facebook是如何
抓取
我
的
网站
的
。他们在页面中间
提取
信息,这是第一个段落标签,而不是从之前
的
div中
提取
。我想知道这是否正常,以及Facebook多久更新一次他们
的
页面。 其次,我在生成
的
Facebook页面上
的
页面设置中编辑此信息时遇到
问题
。如果我可以手动覆盖Facebook从我
的
网站</
浏览 0
提问于2012-04-08
得票数 0
回答已采纳
1
回答
无法为我
提取
登录html
内容
。
Document document = Jsoup.connect(url).document.getElementsByClass("login-form"); 我
不
获取登录窗口
浏览 5
提问于2020-08-04
得票数 0
回答已采纳
1
回答
用Python从
网站
中检索源代码
、
我一直试图从一个没有运气
的
网站
上
提取
链接。据我所读,它可以很容易完成,但链接是与弹出对话框在
网站
内。唯一能
抓取
链接
的
方法是ctrl并查看要复制
的
源。编辑我想避免下载
任何
超出python已经拥有的
内容
,例如BS/Scrapy等。
浏览 0
提问于2015-09-08
得票数 0
2
回答
网页
抓取
(热门
网站
的
HTML格式)
、
我如何
抓取
任何
网站
,以便为我
的
网站
创建提要?最受欢迎
的
网站
遵循什么格式?
浏览 0
提问于2010-11-03
得票数 0
1
回答
如何从多个网页中
提取
内容
?
、
我想从各种评论
网站
中
提取
某些
内容
(评论信息)。from webscraping import download, xpath D
浏览 0
提问于2017-04-25
得票数 2
1
回答
Scrapy在特定级别的div之后
不
返回
任何
数据
、
我正在尝试
抓取
一个
网站
:步骤如下: a. fetch("") b. view(response) -->到目前为止一切都按预期进行。一旦我开始使用下面的语法
提取
数据,我只能获取某些级别的div,在此div之后,我将无法访问
任何
其他div及其
内容
。 我以前在为其他
网站
开发爬虫时没有遇到过这样
的
问题
。
问题
站点是否特定..?你能告诉我一个
抓取
内部div
的
方法吗?
浏览 0
提问于2018-07-03
得票数 0
1
回答
抓取
AWS博客
网站
时Scrapy
不
返回
任何
内容
、
这是我在AWS博客
网站
首页
抓取
URL列表
的
尝试。但它不返回
任何
内容
。我想可能是我
的
xpath出了
问题
,但不确定如何修复。aws.amazon.com/blogs/> (referer: None)
任何
帮助都将不胜感激
浏览 17
提问于2019-11-06
得票数 0
回答已采纳
1
回答
挖掘/爬行/使用phantomjs或其他东西
的
web控制台?
、
、
、
、
我想创建一个应用程序,它
的
行为与另一个web应用程序
的
行为直接相关。本质上,有一个在Gmail中运行
的
应用程序,它基于用户
的
操作与界面进行动态交互。我遇到
的
问题
是,我想要创建一个与web应用程序交互
的
应用程序,但它们没有提供开放
的
API。因此,我不能只调用api来获取我需要
的
数据。有没有什么方法可以让我用像PhantomJS这样
的
东西来
抓取
动态
的
活动来建立另一个应用程序
的<
浏览 2
提问于2012-04-25
得票数 4
1
回答
XPath在python中返回空
的
[]搜索结果
、
我试着从booking.com上
提取
评论 URL = "https://www.booking.com/hotel/ph/oyo-518-mytown-amsterdam-manila.en-gb.html275784337_2_0_0__139646;srepoch=1632033539;srpvid=af482ec1c5c20263;type=total;ucfs=1&#tab-reviews" 我使用
的
是我从浏览器上逐字复制
的
/*[@id=&quo
浏览 7
提问于2021-09-20
得票数 0
1
回答
公司可以限制从他们
的
网站
上
抓取
的
内容
吗?
、
、
我正在学习使用Python3
的
Requests和Beautiful Soup进行web
抓取
。import requests url = 'https://www.packtpub.com在这种情况下,我没有得到异常,但我注意到变量中包含<
浏览 0
提问于2018-05-28
得票数 2
1
回答
从呈现
的
网站
抓取
时出现
的
问题
、
、
、
、
我正试图从这个
网站
上刮掉一件衣服
的
价格:response.xpath('//span[@data-id="current-price"]/text()').extract()谢谢!
浏览 13
提问于2017-02-24
得票数 0
回答已采纳
2
回答
网络爬虫程序C# .Net
、
我不确定这是不是真的叫做网络爬虫,但这就是我想要做
的
。我想找到所有的网址,其中有相同
的
第一部分。有没有办法获得以www.mywebsite.com开头
的
所有urls
的
列表--下午12:16编辑-- 而
浏览 0
提问于2013-06-27
得票数 1
回答已采纳
1
回答
如何利用JavaScript检测来
抓取
网站
、
我在使用Guzzle library从HTML中
提取
特定数据时,正在
抓取
一个
网站
。但现在,在浏览器启用JavaScript之前,该
网站
不会将
内容
可视化。所以现在我被这些
问题
困住了: 欢迎
任何
建议。
浏览 2
提问于2019-11-23
得票数 0
回答已采纳
2
回答
谷歌在爬行时能看到iframe
的
内容
吗?
、
、
、
我已经查过了,没有找到一致
的
答案。我想在我
的
页面中嵌入一个谷歌文档(当你发布你
的
谷歌文档时,它会给你一个iframe)。像google这样
的
搜索引擎能够读取文档
的
内容
(只有文本,但可能有重要
的
关键字)吗?或者它会表现得好像页面是空
的
?如果它不能索引文本,那么有没有办法在某种类型
的
服务器端包含嵌入
的
内容
,以便它看起来像是硬编码到爬虫
的
html中?
浏览 4
提问于2010-07-15
得票数 2
1
回答
如何将程序连接到(学校)
网站
以
提取
数据
这是由一个为大学创建
的
程序提出
的
,该程序
提取
可用班级、代码、教师、时间和地点
的
完整列表。如果没有API或登录凭据来获取可用
的
课程数据,程序如何访问这些数据。
浏览 1
提问于2012-06-15
得票数 0
1
回答
LinkedIn
抓取
逻辑
、
、
谁能给我解释一下linkedIn grabber是如何工作
的
?我通过REST API分享了一条消息,在消息标题下面显示了一些额外
的
内容
。我
的
结论是linkedin从我
的
网站
抓取
了这些
内容
(因为当我测试在本地服务器上发布
的
内容
时,LinkedIn不能从那里
抓取
任何
东西,所以很清楚),但是它是如何工作
的
呢?OpenGraph标签被设置为正确
的
值,但消
浏览 1
提问于2013-06-10
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫学习:抓取电影网站内容的爬虫
Python多进程方式抓取基金网站内容的方法分析
如何解决网站内容的重复性问题
手把手教你搭建个人网站八:解决配置缓存导致统计不更新的问题
优质的网站结构设计有哪些好处?
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券