腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
not
抓取
未
检索
整个
文档
urllib
或
请求
、
、
、
我正在尝试从lowes.com
抓取
产品信息。我的测试是专门针对这个产品的。当我访问
未
启用JavaScript的页面时(以确保我看不到
urllib
/ requests可能无法识别的内容),我清楚地知道该项目的价格,但当我尝试使用上面的任一包时,我会丢失网页的几个部分。碰巧的是,这些部分是我需要
抓取
的部分(具体来说,价格信息,其他所有神奇的信息仍然可用)。为了提高速度,我不喜欢使用selenium。content.txt", "w") as f: f.write(page) #
浏览 7
提问于2017-08-03
得票数 0
回答已采纳
3
回答
用python刮网站
、
、
、
、
如果有一种方法可以在不使用任何第三方库(如beautifulsoup和scrapy )的情况下
抓取
一个网站,那么就可以使用beautifulsoup。It can use builtin libraries请推荐我一个博客、文章
或
教程,这样我就能学到
浏览 1
提问于2020-06-09
得票数 1
回答已采纳
2
回答
从web服务器获取特定的.html文件
、
我听说过
urllib
2,但作为python新手,我对如何使用它一无所知。
浏览 0
提问于2010-01-20
得票数 0
回答已采纳
1
回答
BeautifulSoup网站scraping - html解析
、
、
我正在尝试使用beautifulsoup4从网站中
抓取
数据,并且只
检索
html标记之间的信息以放入excel
文档
,目前我只能从页面中获取
整个
html数据。import sysimport xlsxwritersoup
浏览 0
提问于2018-10-20
得票数 0
回答已采纳
2
回答
如何从<select>标记中
抓取
更改内容的网页
、
我想刮一个通过<select>标记改变其内容的网页。当我选择不同的选项时,页面的内容会动态变化。我想知道是否有一种方法可以从python脚本中更改选项,以便从<select>标记中的所有不同选项的所有不同页面获取内容。
浏览 6
提问于2012-09-10
得票数 4
1
回答
Python中的多步并发HTTP
请求
、
、
、
我需要在Python中做一些三步web
抓取
。我最初有几个基本页面,我需要从这些页面中选择几个链接,并
检索
它们所指向的页面,然后再重复一次。诀窍是,我希望所有这些操作都是异步的,这样每个
请求
都会尽快被触发,并且
整个
应用程序不会在单个
请求
上被阻塞。我该怎么做呢?body = eventlet.green.
urllib
2.urlopen(url).read() return data pool但是,如果我扩展这种技术并包含一个
浏览 2
提问于2012-07-16
得票数 0
回答已采纳
4
回答
urllib
2
未
检索
整个
HTTP响应
、
、
>>> import
urllib
2... 'ce2-003048343a40","name":"
浏览 1
提问于2009-12-01
得票数 12
回答已采纳
1
回答
在Cocoa模拟浏览器中生成HTTP
请求
、
、
、
因此,我试图读取一个HTML文件的内容,从一个特定的网站上
抓取
一些元数据。然而,我遇到的问题是,使用cocoa调用执行objective中的HTTP
请求
将给我一个不同的HTML文件,而当我通过web浏览器
或
实现的python调用执行调用时。这很烦人的原因是,我正在
抓取
在每个
请求
中生成的密钥。当我通过可可而不是从python库
或
浏览器执行
请求
时,这个站点似乎知道了。request =
urll
浏览 2
提问于2011-03-20
得票数 1
2
回答
使用urlopen(url)
检索
整个
HTML
、
、
、
、
我注意到如果我
请求
一个url我得到了这样的东西:<head><body> <有没有方法可以不使用webdriver来
检索
整个
HTML
文档
?
浏览 1
提问于2017-12-06
得票数 1
回答已采纳
1
回答
从“添加到屏幕”按钮中
检索
临时代码
、
、
、
、
我在我的网站上添加了Add按钮,根据
文档
的下一步是
检索
一个临时代码: 任何帮助
或
指导都是非常感
浏览 0
提问于2016-03-07
得票数 1
回答已采纳
1
回答
使用Python3从JS生成的内容中
抓取
数据
、
我需要从一个python3程序中
抓取
一个网站(比如"www.example.com"),这个程序有一个包含以下两个元素的表单:2: Dropdownmethod: 'POST', Logi
浏览 1
提问于2016-10-28
得票数 0
3
回答
Python -
抓取
谷歌的简单方法,为给定的搜索下载前N个命中结果(
整个
.html
文档
)?
、
、
、
有没有一种简单的方法来
抓取
谷歌,并为给定的搜索写出前N个(比如说1000个) .html (
或
其他任何)
文档
的文本(只是文本)?举个例子,想象一下搜索短语“大灰狼”,只下载前1000个点击量中的文本--也就是说,实际上是从这1000个网页中下载文本(但只下载那些页面,而不是
整个
网站)。 我假设这将使用
urllib
2库?
浏览 2
提问于2011-03-16
得票数 10
回答已采纳
1
回答
python
请求
从浏览器
或
urllib
返回不同的网页
、
、
我使用
请求
来
抓取
网页上的一些内容。当我使用requests.get('example.org')import
urllib
.request我试过使用
urllib
,但它真的很慢。
浏览 0
提问于2017-04-09
得票数 3
4
回答
如何将一行文本从html转换为Python
、
到目前为止,我的代码如下:sock =
urllib
.urlopen("http://ipchicken.com") htmlSource =
浏览 0
提问于2011-05-03
得票数 1
回答已采纳
1
回答
从Python访问Facebook
、
、
如何使用Python登录Facebook,导航到多个页面并
检索
一些数据?
浏览 2
提问于2012-02-04
得票数 3
回答已采纳
1
回答
如何使用
urllib
2获取传输大小?
、
、
我有基本的代码(表单):response =
urllib
2.urlopen(req)我想知道
整个
请求
的大小和
整个
响应的大小,有没有办法?(还没有看到用于
urllib
2
或
请求
的) “完整”-意味着包括报
浏览 1
提问于2015-02-26
得票数 0
2
回答
为什么要从Google App Engines导入urlfetch?
、
、
、
我得到了这段代码,它可以帮助通过网址获取任何网页的代码:url = "http://www.google.com/"if result.status_code == 200:我不明白这里的一件事(事实上,在许多事情中)为什么在这段代码中建议从google.appengine.api导入urlfecth?Python没有自己的命令吗?
浏览 1
提问于2009-12-12
得票数 8
回答已采纳
2
回答
Python
抓取
包含PHP的页面源代码
、
我知道如何
抓取
源代码HTML,但不知道PHP,有没有可能用内置的函数?
浏览 0
提问于2013-02-25
得票数 0
回答已采纳
7
回答
有没有可能阅读一个大网页的最后几行(比如1000个字符)?
、
我们需要每5分钟轮询一次网页,而网页正在变得相当大。web页面是一个目录列表,我们需要最后一行(以获取文件名)。获得这最后一行的最好方法是什么?
浏览 0
提问于2009-01-06
得票数 8
回答已采纳
1
回答
如何移植使用Beautiful 4的python
urllib
2应用程序(一个web刮刀)来代替
请求
包
、
、
Anaconda通道中不存在
urllib
和
urllib
2,据我所读,
请求
包已使
urllib
和
urllib
2过时。对于web
抓取
,我仍然是Python编程方面的新手,并且还没有完全理解这4个包的所有概念和内部微妙之处。我找不到关于如何将
urllib
或
urllib
2代码移植到Beautiful 4
请求
的解释。有人能提供一个关于如何移植
urllib
/
urllib
2应用程序以
浏览 0
提问于2018-09-09
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python 网络爬虫十万张高清美图实战指南
Python爬虫入门(二)
Python爬取网站的一些小技巧
Python Requests使用
Python网络爬虫:异常的处理和HTTP状态码的分类
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券