用美汤刮掉eBay卖出的商品

文章/答案/技术大牛

发布

1回答

python、pandas、beautifulsoup

我正试着在eBay上抓取已售出的商品。我在试着刮： https://www.ebay.com/sch/i.html?下面是我的代码，我在其中加载html代码并将其转换为soup对象： ebay_url = 'https://www.ebay.com/sch/i.html?Oakley&rt=nc&LH_Sold=1&LH_Complete=1&

浏览 18提问于2021-08-16得票数 0

2回答

在html元素中刮取“数据”或自定义参数的值。

python、html、web-scraping、beautifulsoup

我用的是美汤。我想刮掉以下值的值：和以下元素中的参数：基本上是想得到卧室数和卧室数<em

浏览 3提问于2017-05-07得票数 0

回答已采纳

1回答

用美汤刮掉乱七八糟的源码页面

python-2.7、web-scraping、beautifulsoup

我试着用Python和Beautiful Soup做一些网页抓取，但网页的源页面不是最漂亮的。

浏览 2提问于2014-01-19得票数 0

1回答

从ebay出售的页面抓取中获得recaptcha结果

python、selenium、web-scraping、beautifulsoup、ebay-api

我正在尝试从ebay中一个商品的总销售页面中获得一些信息(因为对此的API请求不再可用)。我尝试过bs4 (漂亮汤)和selenium，但是得到了recaptcha结果，而不是页面内容本身。

浏览 2提问于2021-12-29得票数 0

1回答

如何禁用所有不在列表中的链接，使用漂亮的汤

python、html、beautifulsoup

在我的后端，我使用selenium检索给定url的页面源代码。我想遍历page_source并禁用其href不在列表中的所有链接。html.parser') if not (link['href'] in link_list): link['href']="" 我刚接触美汤，所以我不确定它的语法。我用的是美</e

浏览 15提问于2019-06-07得票数 0

回答已采纳

1回答

如何使用scrapy或selenium抓取动态页面？

javascript、python、html、parsing、screen-scraping

我正在尝试抓取web动态页面，但使用scrapy时，我不能检索所有信息，因为我想要的信息是动态的。我试着使用Selenium，但与Scrapy不同的是，你不能指定头部，网站阻止了我。(我不能说出这个网站的名字，因为抓取是非法的，但它是一个著名的旅游元搜索引擎...)。我有一个带有验证码解算器的页面(用脚本很难解决重新验证码)，因为网站会检测到我是机器人。我想拥有所有的动态信息，并有权访问网站，但不可能与selenium和scrapy没有给我所有我想要

浏览 23提问于2019-06-13得票数 0

1回答

构建类似于Python的Jon's的声誉跟踪器

python

Jon有以下，它是由C#构建的。我有兴趣用Python构建一个类似的应用程序，这样至少可以使用以下模块通过defaultdict存储数据--你怎么能建立一个类似琼恩的声誉系统呢？

浏览 3提问于2009-07-22得票数 1

回答已采纳

1回答

如何用漂亮汤提取代码的某一部分

python、beautifulsoup、python-3.9

我在做一个私人项目，我有一个关于美汤的问题。我使用python 3.9.2和BeautifulSoup4.9.3。我的html代码是：style="transform-origin:50% 50%;transform:rotate(382deg)，我想得到零件:382 get。现在有谁用美丽的汤来做这个吗？

浏览 5提问于2022-09-28得票数 -1

回答已采纳

1回答

如果我的拍卖清单在没有出价的情况下结束会发生什么？

ebay

具体而言，如果发生这种情况，我需要支付某种费用吗？

浏览 0提问于2020-08-17得票数 0

2回答

我怎么才能用Python查看某人在Instagram上有多少粉丝？

python、api、instagram

因此，我希望能够在我的Python程序中输入用户名，然后它会检查该帐户有多少关注者(如果它不是私有的)，并显示数字。我确信这与API有关。

浏览 29提问于2019-09-17得票数 0

1回答

BeautifulSoup，findAll('table')返回所有表，但也返回它们之间的文本

python、web-scraping、beautifulsoup、html-table

我试图隔离网页的一部分，不幸的是，它并不包含在任何我可以提取的东西中。storyText = soup.bodyfor each in toRemove: print each目前的问题是，toRemove行返回表和它们之间包含的文本

浏览 1提问于2013-09-22得票数 0

1回答

美丽的汤-在原始文本中找到识别标签

python、beautifulsoup

在识别了原始文档中的文本之后，我需要操作HTML中的某些文本。我可以使用BeautifulSoup识别特定的标记，但是由于它改变了原始文档的格式，所以我也不能搜索/替换字符串。我不想只写BeautifulSoup的输出，而是希望在原始文档中标识标记，并将其替换为<a href="link">。知道怎么继续吗？回答提出的几个问题：这是一个巨大的现有代码库，需要一些更新，所以它不仅仅是一个单一的搜索/

浏览 1提问于2013-05-09得票数 1

1回答

用漂亮的汤解析表中的行

python、parsing、beautifulsoup

我试图解析这个html，并获得53.1和41.7的值。我不太确定该怎么做。如有任何建议或想法，我们将不胜感激。谢谢。 

浏览 0提问于2017-07-13得票数 0

1回答

r}的连接适配器”.format(Url))

python-3.x、ajax、beautifulsoup、python-requests、http-post

\/2021\\/06\\/11\\/ws964-multifamily-investing-is-a-team-sport-with-cameron-roy\\/\\"' 我得到了所有的链接，但是当我试图解析这个链接的标题时，这个无效的模式错误发生了，我

浏览 40提问于2021-06-12得票数 0

2回答

如何在没有特定类的情况下刮取文本

python-3.x、beautifulsoup、python-requests

如何在没有特定类的情况下刮取文本？我已经找到了一份过去通过拍卖出售的eBay上市。以下是标题部分的代码片段。Details about </span>2018 Panini Contenders Josh Allen #105 No Feet RC Ticket Auto PSA 10 GEM 我想能刮的只是文字“2018年帕尼尼的竞争者乔希艾伦#105没有脚RC票自动PSA 10宝石”的与请求和美丽的<em

浏览 6提问于2020-11-29得票数 2

1回答

美丽的汤花了很长时间在特定的网站上

python、multithreading、web-scraping、beautifulsoup、raspberry-pi

它们中的大多数都工作得很好；我习惯于在我的主计算机上看到0.01到0.02秒的解析。然而，当我尝试抓取某些网站的链接时，比如slickdeals.net，我发现任何地方都有0.9到2秒的速度；几乎慢了100倍。这在我的主计算机上还不错，但这是我计划在我的Raspberry Pi 3型号B上运行的脚本，在此基础上，这个站点上的链接平均需要30到40秒(偶尔会有罕见的60+秒)。因为我的主计算机比我<e

浏览 20提问于2019-12-21得票数 0

1回答

漂亮的汤跳过注释和脚本标签

python、beautifulsoup

我用美汤代替文字。for x in soup.find('body').find_all(string=True): fix_str = re.sub(...)如何确定x中的哪些元素或标记

浏览 0提问于2017-11-14得票数 5

回答已采纳

1回答

JSSoup是否支持提取文本？

beautifulsoup、jssoup

JSSoup是否支持提取类似于美汤soup.findAll(text=True)的文本文档没有提供关于这个用例的任何信息，但在我看来应该有一种方法。为了澄清我想要的是从页面上抓取所有可见的文本。

浏览 19提问于2021-11-20得票数 1

回答已采纳

1回答

如何在centOS服务器中安装美汤？

terminal、centos、beautifulsoup

我刚从hostgator那里得到了一个新的主机服务器，它有centOS。现在我有了一个用python编写的从bs4导入BeautifulSoup导入的网页抓取程序请帮帮忙

浏览 0提问于2014-04-08得票数 2

回答已采纳

1回答

漂亮的Soup -连字符关键字，错误:：关键字不能是表达式

python、beautifulsoup、keyword

Selenium给了我普通的html，我使用print检查了它，发现它确实包含了我试图刮掉的部分。但我的问题是美汤。我想找到div标签我试过用但这会返回空的，可能是因为实际的div标记也包含在其中。comment-

浏览 1提问于2016-05-28得票数 0

回答已采纳

点击加载更多