腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
xpath
/
lxml
抓取
文本
、
、
、
、
我正在尝试
使用
xpath
/
lxml
从中
抓取
文本
" 2005 -2013“中的”2005- 2013“,并且只能在这个站点上的其他一些页面上这样做,而不是这个页面。不确定我做错了什么/我从元素复制的
xpath
是否不正确print(content_divs[0].text_content().strip())下面是我的代码: import requests,
lxml<
浏览 0
提问于2017-07-27
得票数 3
回答已采纳
2
回答
如何
使用
lxml
,
XPath
和Python从网页中提取链接?
、
、
、
、
我得到了这个
xpath
查询:它提取所有带有标题属性的链接-并在中给出href。但是,我似乎不能在
lxml
中
使用
它。from
lxml
import etreehyperlin
浏览 0
提问于2010-01-18
得票数 5
回答已采纳
1
回答
lxml
在从元素检索
文本
时不考虑css样式
、
、
、
、
我正在测试selenium + chrome和requests +
lxml
的一些
抓取
目的。我有兴趣收到一些短信。
使用
selenium + chrome时,我可以执行以下操作:return element.text.strip()elements = self.
浏览 0
提问于2019-01-12
得票数 1
2
回答
获取包含
文本
的标签的最快方法
、
我需要
使用
lxml
.html
抓取
所有包含
文本
的标记。我一直在
使用
{e.tag for e in doc.
xpath
('.//*[text()= true()]')},但是
lxml
中的通配符和text()查询都是出了名的慢。有没有更快的方法。
浏览 0
提问于2013-02-04
得票数 0
回答已采纳
1
回答
从一个站点返回的数据,而不是从另一个站点返回的数据
、
、
、
这个返回[[]]import requests 我希望它做的是给我一个列表,其中包含页面上每个offer_title元素的
文本
。我从Firebug
抓取
的
xpath
是: /html/body/div1/d
浏览 1
提问于2017-04-21
得票数 1
回答已采纳
1
回答
在没有BeautifulSoup的Python语言中将HTML表解析为列表
、
、
我想知道是否有一种方法可以从HTML表中提取数据,并仅
使用
HTMLParser将其解析到字典中。由于某种原因,我不能做这件事..
浏览 1
提问于2012-03-04
得票数 0
1
回答
Python
抓取
xpath
不适用于特定站点/表
、
、
、
、
我在尝试从url的表中
抓取
数据时遇到问题: import urllib2import
lxml
import
lxml
.etree url = 'httpintr
浏览 0
提问于2014-01-18
得票数 0
1
回答
无法按位置或属性匹配时,提取BeautifulSoup中的标签值
、
我正在
使用
BS来
抓取
网页,但我遇到了一个小问题。下面是页面中的一段HTML代码。我不能将标记与style属性匹配,因为它在页面中的十几个地方
使用
。我甚至不知道span标记的确切位置,因为它的位置会从一个页面改变到另一个页面。因此,我不能通过位置匹配。
浏览 7
提问于2010-08-06
得票数 2
1
回答
如何
使用
XPath
选择HTML表上方的
文本
?
、
下面是我正在
使用
的HTML。我删除了一些与这个问题无关的行,比如表中的内容。 </div> 我现在有这个
XPath
我尝试过
使用
'./ancestor::div[1]/text()',尽管
浏览 3
提问于2022-08-26
得票数 0
回答已采纳
2
回答
Python
xpath
查询不返回
文本
值
、
、
、
我正在尝试
使用
Python中的
lxml
模块从中
抓取
数据。我想获取第一段中的
文本
,但下面的代码返回空值import requests tree = html.fromstring(page.tex
浏览 3
提问于2015-07-09
得票数 1
1
回答
使用
BeautifulSoup
抓取
时出现问题
、
、
我正在尝试
使用
BeautifulSoup
抓取
url torrents获取该页面上的所有
浏览 16
提问于2011-07-03
得票数 0
2
回答
抓取
数据python
、
我
使用
python和
lxml
,但似乎没有返回a标记中的字符串。request = requests.get(self.url) league = tree.
xpath
浏览 3
提问于2015-03-10
得票数 0
回答已采纳
1
回答
使用
Python中的美观汤从元素中获取
文本
值
、
我正在制作python脚本,它从在线站点获取
文本
数据。这是一个简单的web
抓取
脚本,语言只是python。我不
使用
硒,只
使用
漂亮的汤。而且我可以从<p>或<div>,甚至<h>和<a>中
抓取
文本
,但是当我试图从<td>获取
文本
时,代码不起作用。下面我分享了我的代码。from threading import Thread
浏览 5
提问于2021-07-16
得票数 1
回答已采纳
1
回答
具有多个表的时间表Web
抓取
(Python)
、
、
、
、
我只是在找一些关于python web
抓取
的信息。我正在尝试从时间表中获取所有数据,我想让课程与其开始的时间联系起来。查看html,有多个表(表中的表)。我计划将Google App Engine与Python (或许也包括BeautifulSoup )一起
使用
。对最好的方法有什么建议吗?谢谢我已经设法
使用
以下代码从表中提取了所需的数据:from
lxml
import etree url = "http://ttcac
浏览 0
提问于2013-03-15
得票数 1
回答已采纳
3
回答
web解析内容的
lxml
长度
、
、
我用Python语言中的
lxml
抓取
网页。然而,为了获得表行的数量,我首先获得所有行,然后
使用
len()函数。我觉得这太浪费了,有没有其他方法来获取他们的数字(动态1),以便进一步
抓取
?import
lxml
.htmltry:except SkipException: pass #get the t
浏览 3
提问于2012-09-22
得票数 0
回答已采纳
2
回答
使用
请求和
lxml
的html
抓取
在location>处生成<元素x,而不是位于该节点的
文本
、
、
、
、
我正在创建一个Python程序,
使用
lxml
和请求从网站
抓取
文本
。但是,当我导航到正确的节点时,我的代码生成一个元素标签,而不是位于该节点的
文本
。# import packagesimport requests ficUrl = 'https10847788/' page = requests.get(ficUrl)
浏览 18
提问于2019-04-21
得票数 0
1
回答
我可以将
lxml
div对象转换为字符串吗?
、
我正在编写一个从网站上
抓取
文本
的程序。是否可以将此div标记转换为字符串,以便更容易格式化?from
lxml
import etreeelement = etree.HTML(requests.get('a website')).
xpath
('//div')
浏览 1
提问于2018-07-22
得票数 0
1
回答
如何在这个
抓取
器程序中
使用
lxml
提取
文本
?
、
、
、
我正在尝试从这个页面上的特定元素中
抓取
文本
数据(
使用
scraperwiki)from
lxml
import html owner = tree.
xpath
('/html/td[2]')
浏览 3
提问于2013-07-25
得票数 0
1
回答
下载HTML时未出现URL如何刮除?Javascript在这里可能是个问题
、
、
、
、
但是它们中的一些不在HTML上,无法
使用
请求和
lxml
进行
抓取
。我不想
使用
selenium/bs4 4/美观so,因为代码将在Heroku服务器上运行,因此会使一切变得更加困难。我想要
抓取
的URL是在div之后
使用
以下两个类:容器和false。这是强制性的。在div上没有类"false“的其他URL可以很容易地
抓取
。urls = doc.
xpath
浏览 4
提问于2022-03-11
得票数 1
回答已采纳
2
回答
如何在python中不
使用
[‘']来显示
、
、
、
我正在用python中的
lxml
抓取
一个网页import requeststree=html.fromstring(page.text)print name我想显示:Matthew 有什么解决办法吗?
浏览 3
提问于2014-11-20
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用lxml模块 获取标签内所有文本
使用XPath进行网页爬取的Python实现
Python爬虫入门2 爬取豆瓣电影信息
网页源码解析模块介绍及实战
爬取豆瓣电影信息,入门Python爬虫的精品小案例,请收下
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券