无法使用lxml抓取表

、、、

我正在尝试从这个网站抓取个人球员的网址。我已经尝试过使用bs4执行此操作，但每次我尝试查找该表时，它都会返回[]。切换到lxml来尝试一下。import urlopen from urllib.requests url = "https://www.espn.com/soccer/team

浏览 26提问于2019-08-30得票数 0

1回答

安装lxml包Python

、、

我无法安装用于python抓取的lxml包。我安装了所需的库C 。尝试使用python 2.7、2.7、3.4。dowsnt work仍然无法安装我的lxml包。

浏览 1提问于2015-12-13得票数 0

1回答

用python抓取表

、、、

试图从开放访问的学术文章中抓取表格，出于某些原因，我无法从本文中抓取这些表，这就是我所做的，但由此产生的ResultSet“表”是一个空列表。谢谢你的帮助。article/pii/S0378874116301696" soup = BeautifulSoup(content, "lxml

浏览 4提问于2017-08-26得票数 0

1回答

我应该如何从一个有“最小化”部分的页面中抓取数据？

、、、、

我是BeautifulSoup的新手，我正在尝试从一个页面中抓取数据，这个页面有一个可以被浏览页面的人最小化的部分。当我查看页面的HTML代码时，我发现如下所示。webOpen = urllib2.urlopen(webpage).read() webSoup = BeautifulSoup(webOpen, "lxmlwebSoup.

浏览 8提问于2017-08-30得票数 0

1回答

无法使用python lxml抓取包含多个表的web

、

import lxmlimport requestsimport pandas as pd df = tree.xpath('//tr') #df = pd.read_html(lxml.etree.tostringrequests.

浏览 16提问于2019-04-14得票数 0

3回答

web解析内容的lxml长度

、、

我用Python语言中的lxml抓取网页。然而，为了获得表行的数量，我首先获得所有行，然后使用len()函数。我觉得这太浪费了，有没有其他方法来获取他们的数字(动态1)，以便进一步抓取？import lxml.htmltry:except SkipException: pass if doc:

浏览 3提问于2012-09-22得票数 0

回答已采纳

1回答

如何使用pandas将我的python web抓取数据导出到现有excel文件中的特定工作表？

、、、、

我有一个包含多张工作表的Excel文件。我想使用pandas将Python中的新数据添加到同一Excel文件中的新工作表中。有没有可能做到这一点而不影响我之前的数据？我是新来的。谢谢你的帮助！下面是我目前使用的Python代码：from lxml import htmlimport pandas as pd df =

浏览 49提问于2018-08-19得票数 0

回答已采纳

1回答

下载HTML时未出现URL如何刮除？Javascript在这里可能是个问题

、、、、

但是它们中的一些不在HTML上，无法使用请求和lxml进行抓取。我不想使用selenium/bs4 4/美观so，因为代码将在Heroku服务器上运行，因此会使一切变得更加困难。我想要抓取的URL是在div之后使用以下两个类:容器和false。这是强制性的。在div上没有类"false“的其他URL可以很容易地抓取。import lxml

浏览 4提问于2022-03-11得票数 1

回答已采纳

2回答

使用python抓取动态javascript内容网页

、、、、

我正在尝试使用Python抓取这个网站：'‘。但是，requests + BS4只给了我HTML格式的页面源代码。我假设这是因为内容是动态的。因此，我尝试了Selenium + BS4来抓取网站，但我仍然只能抓取页面源代码。from selenium.webdriver import Firefoximport lxml driver = Firefox()&#x

浏览 4提问于2020-02-02得票数 0

1回答

从雅虎财经抓取python中的数据

、

我可以抓取表格格式，但不能抓取非表格格式。我将同样的原则应用于在同一页中抓取信息，但没有结果。p=AAPL中抓取import numpy as npimport lxml table = tree.xpath('//table

浏览 4提问于2019-11-19得票数 0

回答已采纳

1回答

Python表在使用id刮取时不返回任何

、、

我想从下面的url 中抓取每日观察表from bs4 import BeautifulSoupimport lxml content = requests.get(url).content soup = Be

浏览 0提问于2018-12-08得票数 0

回答已采纳

1回答

从一个站点返回的数据，而不是从另一个站点返回的数据

、、、

它从站点上的一个表中获取某些元素。我从Firebug抓取的xpath是： <a href由于新帐户上的链接限制，无法发布它们。标题： Python -无法使用Beautiful或lxml xpath从

浏览 1提问于2017-04-21得票数 1

回答已采纳

1回答

我正在尝试开发一个使用python的web抓取应用程序。但是，当我要在数据帧上构建结构或内容时(在Pandas的情况下)，出现以下错误： "ImportError:找不到lxml，请安装它“ 通过PyCharm，我无法将Lxml添加到项目解释器中。当尝试通过"pip install lxml“安装它时，在命令提示符中显示： “已满足要求: c:\xxx\site-packages (4.5.0)中的lxml” 我用的是Windows10，你知道会发生

浏览 12提问于2020-04-08得票数 0

2回答

将html表格转换为CSV格式

、、、、

我刚开始抓取，我不知道如何从某个网站获取我需要的数据。下面是我的代码：import requestsimport pandas as pd soup = BeautifulSoup(website_url,'lxml')table_rowsfor i in td]

浏览 1提问于2020-04-21得票数 0

2回答

无法使用Python BeautifulSoup找到表

、、

我试图从以下NOAA站点的表id=AWS中抓取数据，但当我尝试使用'.find‘查找该表时，结果为none。我可以返回父div，但似乎无法访问表。下面是我的代码。soup set upsoup = BeautifulSoup(html, 'lxml

浏览 17提问于2017-07-13得票数 0

回答已采纳

2回答

使用requests和BeautifulSoup的页面上找不到元素

、、、

我正在试着抓取我最喜欢的大学橄榄球队的网站。网页上有两个我想要抓取的表格，我写的代码很容易抓取第一个表格。我可以将其放入pandas数据帧中，然后再放入Excel。由于某种原因，我不能弄清楚我无法从站点中抓取第二个表(防御表)。我尝试了许多不同的方法来抓取第二个表。我尝试只查找所有表，它可以找到第一个表，但找不到第二个表。我已经尝试使用表中列出的

浏览 25提问于2019-01-30得票数 1

回答已采纳

2回答

如何从该网站拉取表格数据？

、、

使用下面的代码，我不能从游戏中心的pregame.com中拉取大学足球比赛。我尝试过使用不同元素的多个类I，甚至尝试使用pandas拉取，但无法获得整个表。有没有其他方法可以成功地抓取它？from bs4 import BeautifulSoupimport requests header = {'User-Agent: Mozilla/5.0 (Windowsl=2&a=0&s=AwayRot&

浏览 56提问于2021-11-03得票数 0

回答已采纳

1回答

在没有BeautifulSoup的Python语言中将HTML表解析为列表

、、

我想知道是否有一种方法可以从HTML表中提取数据，并仅使用HTMLParser将其解析到字典中。由于某种原因，我不能做这件事..

浏览 1提问于2012-03-04得票数 0

1回答

在Python scraper中使用etree时出现的问题

、、

我是Python的新手，希望在Scraperwiki中构建一个屏幕抓取器，但我正在与一个我无法解决的错误作斗争。下面是抓取器：import lxml.htmlfrom urlparse import urlparse root =

浏览 2提问于2012-07-24得票数 0

回答已采纳

2回答

如何在使用python向下滚动时刮掉提供更多信息的html页面

、、

我正在从上抓取课文。但是我不能抓取页面中位于“总计”表下面的内容。我想从“总计”和“高级”表中得到数字，但是代码没有返回任何内容。当用户向下滚动页面时，该页面似乎会加载其他信息。我运行了下面的代码，并成功地从玩家的个人资料部分和“每个游戏”表中获得数据。但无法从“总计”表中获得值。from lxml import htmlplayerURL=urllib.urlopen("https://ww

浏览 2提问于2019-07-27得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

安装lxml包Python

用python抓取表

我应该如何从一个有“最小化”部分的页面中抓取数据？

无法使用python lxml抓取包含多个表的web

web解析内容的lxml长度

如何使用pandas将我的python web抓取数据导出到现有excel文件中的特定工作表？

下载HTML时未出现URL如何刮除？Javascript在这里可能是个问题

使用python抓取动态javascript内容网页

从雅虎财经抓取python中的数据

Python表在使用id刮取时不返回任何

从一个站点返回的数据，而不是从另一个站点返回的数据

如何解决在python中使用Lxml的问题？

将html表格转换为CSV格式

无法使用Python BeautifulSoup找到表

使用requests和BeautifulSoup的页面上找不到元素

如何从该网站拉取表格数据？

在没有BeautifulSoup的Python语言中将HTML表解析为列表

在Python scraper中使用etree时出现的问题

如何在使用python向下滚动时刮掉提供更多信息的html页面

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐