抓取网站时获取空输出

文章/答案/技术大牛

发布

1回答

、、、

我正在为这个网站写一个网络抓取程序，http://www.starcitygames.com/catalog/category/Duel%20Decks%20Venser%20vs%20Koth，在网站的数据表中例如，对于以太薄膜，它将输出卡名以及所有其他信息，但在下一行，我将获得所有其他信息，但对于卡名，我将获得Null。有没有一种方法可以设置一个if语句或其他东西，让它看到卡片名称是否为空，如果是，则将卡片名称设置为之前的条目。我需要一些东西来用正确的

浏览 23提问于2019-06-06得票数 0

回答已采纳

1回答

从.asp中抓取表

、

我正在尝试抓取的主表。我没有太多的网站开发知识，但我已经抓取了一些教程的其他网站。由于我还没有找到任何关于.asp的特殊内容，所以我尝试了一些教程，比如。但是，当我运行以下代码时，它返回一个空列表。为什么会返回这个空列表，问我如何获取表格数据？

浏览 10提问于2018-09-04得票数 0

回答已采纳

2回答

谷歌在爬行时能看到iframe的内容吗？

、、、

我想在我的页面中嵌入一个谷歌文档(当你发布你的谷歌文档时，它会给你一个iframe)。像google这样的搜索引擎能够读取文档的内容(只有文本，但可能有重要的关键字)吗？或者它会表现得好像页面是空的？如果它不能索引文本，那么有没有办法在某种类型的服务器端包含嵌入的内容，以便它看起来像是硬编码到爬虫的html中？

浏览 4提问于2010-07-15得票数 2

1回答

Facebook在第一次分享时不包含图片，使用调试器后就没问题了

、、

我正在使用Facebook Debugger来获取我尝试分享的网址这可能不是因为缓存，因为当将随机后缀附加到URL时也会发生这种情况。

浏览 3提问于2015-01-05得票数 0

1回答

使用BeautifulSoup从HTML文件中删除元素

、、

我对网络抓取的世界非常陌生，我正在尝试从一个网站上抓取鞋子的名字。当我在网站上使用inspect时，有一个div标签，基本上整个网页都在里面，但当我打印出html代码时，div标签完全是空的！html_file, 'lxml') findShoeNames() 当我调用我的函数和print(soup)时，div标记看起来

浏览 41提问于2021-09-23得票数 1

回答已采纳

4回答

刷新我的网站的Google搜索结果

当我搜索我的网站标题时，它显示在结果中，但它是他们的默认标题。几天前更改后，我的网站仍然显示默认标题，而不是我更改后的标题。

浏览 1提问于2012-03-29得票数 15

回答已采纳

1回答

谷歌是否考虑到由于JavaScript而引起的页面标题更改？

、、、

我的一个页面被设置为初始页面标题只是一些占位符标题，并且在AJAX调用之后它会发生变化。初始页面加载根据AJAX数据更改页面标题谷歌是否考虑到页面标题的更改？还是谷歌只看最初的页面标题是什么？

浏览 0提问于2018-08-18得票数 0

回答已采纳

4回答

Google似乎没有更新我主页的描述或标题

、、、、

在我们推出我们的网站之前，我们已经建立了一个“即将到来”的页面，谷歌从其内容中获取了标题和描述。因此搜索结果中的描述是：马上就来！有关更新，请访问example.org。离我们的网站开通已经有几个星期了。我们甚至创建了一个站点地图并将其提交给了Google。在Google搜索控制台中，页面已经被爬行，所有页面都如预期一样出现在Google上，除了主页，它还没有更新！

浏览 0提问于2011-02-04得票数 9

1回答

在网站上使用木偶索引刮某个特定元素时有困难

、、、、

我试图用“”这个网站的网址"“来抓取网站的部分--然而，每当我试图使用在网站的铬控制台上工作的选择器时，我的代码的输出总是一个空数组或对象。例如，当我通过代码输出document.querySelectorAll("#key\功能> p")和document.getElementById(‘关键功能’)时，它们都作为空数组或对象返回，但都是通过铬控制台工作的

浏览 3提问于2022-01-23得票数 1

1回答

蒸汽虚拟现实中物体质量的提取

、、

我对团结和C#非常陌生。我正在制作一个游戏，它需要能够在VR中提取当前持有的物体的质量。所以，如果我持有一个物体，我想知道并记录刚体质量的值。我尝试了很多不同的方法，但我的C#知识还不够好，无法使用我在网上找到的有限数量的信息。

浏览 9提问于2022-11-22得票数 0

2回答

Python bs4 bs4抓取仅返回空值

、、、

我正在尝试抓取网站，该网站包含即将到来的选举候选人的信息。我正在尝试获取候选人声明和个人资料图片，它们都包含在"votewa- candidate -page“标记中，但每当我尝试抓取数据时，我只能得到空值。

浏览 33提问于2020-08-01得票数 0

回答已采纳

1回答

抓取站点时未从服务器获取数据

、、

我已经从一个特定的网站提取了项目，现在想把它们写到一个.xls文件中。我期望得到一个完整的excel工作表，其中包含标题和信息行，但得到的工作表中只包含标题。

浏览 5提问于2019-03-29得票数 0

回答已采纳

1回答

从AngularJS加载页面中抓取数据

、

我正在尝试从一个公共网站的页面中抓取数据。

浏览 0提问于2018-02-26得票数 0

3回答

无法从网站获取数据，因为URL在获取数据时不会更改，因此数据表为空

、、、

我刚刚开始使用python进行网络抓取。我使用了两个库来抓取:请求和漂亮的汤。我打开给定的URL，并在该页面上传递所需数据的日期间隔。当我按submit时，URL不会改变，但是数据在页面上。我就是这样访问这个网站的：c = r.content如果我想获取数据，我使用以下代码从存储数据的

浏览 3提问于2017-02-20得票数 1

回答已采纳

2回答

请求返回响应447

、、、、

我正在尝试使用requests和BeautifulSoup抓取一个网站。当我运行代码来获取网页的标记时，soup对象是空的。我打印出了请求对象以查看请求是否成功，但没有成功。打印结果显示响应447。有谁知道我怎样才能成功地连接和抓取这个站点？https://foobar)print(soup.get_text()) '' 当我打印请求对象<

浏览 88提问于2018-12-31得票数 1

回答已采纳

3回答

可以在没有API的情况下为站点创建应用程序吗？

、

因此，论坛上的网站在iPhone或安卓系统上看起来会更好、更整洁。有没有可能没有API呢？这不是我的站点以太。

浏览 1提问于2010-11-07得票数 1

2回答

用漂亮的汤解析<br>标签

、、、、

我正在抓取一个网站，<div class="content" "C Space" "802 white avenue" "xyz 123" "Lima"当我使用下面的命令来获取文

浏览 3提问于2017-04-27得票数 3

2回答

为什么在抓取网站后输出是空的？

、、

网站可以阻止python脚本从它们中扫描值(通过BeautifulSoup)吗？Google工作表中的输出：Prodej bytu

浏览 2提问于2021-03-25得票数 1

回答已采纳

1回答

从包含scrapy python中的javascript的div中通过xpath抓取数据

、、、

我正在抓取工作，我正在抓取一个网站，并使用xpath来抓取项目。但是一些div元素包含javascript，所以当我使用xpath时，直到包含javascript代码的div id返回一个空列表，并且不包含该div元素(包含javascript)也能够获取HTML数据subContent2"]/div[@id="contentDetails"]/div[@class="eventDetails"]&#

浏览 3提问于2012-06-12得票数 2

1回答

从Facebook拉取给定URL的共享缩略图

、、、

我想从以下位置拉出共享站点的缩略图： <div class="UIThumbPager_Thumbs">谢谢！:)

浏览 0提问于2010-09-02得票数 1

回答已采纳

点击加载更多