从目标网站抓取产品和存储信息

、、

我是新手的网络抓取和寻找从目标的网站上拉产品数据。图像中突出显示的部分 ? 我已经能够获得产品名称和价格，但无法使用BeautifulSoup找到其余信息。以前有没有人经历过这种情况，或者知道获取这些信息的方法？使用Python3和BeautifulSoup。不确定这个问题的最佳表达方式，所以如果您需要更多信息或我是否需要重新表达，请让我知道。

浏览 16提问于2019-02-23得票数 1

回答已采纳

2回答

如何使用javascript获取用户的浏览器历史记录？

、、

我想要获取该信息并将其存储在文本字段中。我想把它集成到zendesk中，这样当用户点击support进入我的zendesk页面时，我就知道他们来自哪里。

浏览 0提问于2016-08-17得票数 0

4回答

Import.io -它能取代Kimonolabs吗？

、

我现在使用Kimonolabs从有相同目标的网站上抓取数据。为了简单起见，让我们说这些网站是网上销售东西的在线商店(实际上，它们是有在线申请可能性的求职网站，但从技术上讲，它看起来很像一个网店)。每个网站都会创建一个刮板- API，通过可用的高级搜索页面来抓取所有产品-URL。让我们把这个API称为“URL列表”。然后，为产品详细信息页创建一个“product”，该页面可以抓取所有

浏览 6提问于2016-02-16得票数 2

2回答

是否需要为每个目标站点编写抓取器？

、、、、

我使用Python语言和BeautifulSoup来抓取存储。我想问的是，如果我需要清理一些其他的eCommerce商店(比如亚马逊、Flipkart)，我是否需要定制我的代码，因为它们具有不同的HTML ( 和名字是不同的，另外还有其他东西)。我想知道比价网站是如何从所有在线商店中抓取数据的？他们对不同的在线商店有不同的代码，还是有通用的代码？他们会研究每个在线商店的HTML模式吗？

浏览 40提问于2014-12-28得票数 7

回答已采纳

2回答

我正在使用selenium python，我想知道如何在24小时内有效地抓取超过50,000个数据点。例如，当我在网页'insight.com‘上搜索产品时，抓取器大约需要3.5秒来搜索产品并获取其价格，这意味着对于大量数据，抓取器需要几天时间。从使用线程同时查找多个产品的一部分，我还可以如何加速这个过程？我只有一台笔记本电脑，将不得不同时抓取其他六个类似的网站，因此不想要太多的线程，计算机的运行速度将显着减慢。人们如何实现

浏览 28提问于2020-06-18得票数 2

1回答

Python无法获取包含请求的API : Web抓取、请求、API

、、、

我试图通过python来抓取一个网站，但是我无法通过请求检索到正确的API，因为我无法获取产品信息：提前感谢:)

浏览 0提问于2021-11-15得票数 0

1回答

Laravel模块以更新附属网站上的价格、股票和评论

、、、、

我正在为类似于的产品开发一个附属网站，但我面临一些问题，在更新价格，股票和个人产品的评论实时。我主要是使用Laravel和MySQL进行开发。我的方法：我目前正在从不同的网站获得不同类型产品的产品细节。每个网站都支持提供产品细节的不同方式，如XML格式、RESTful API格式或简单地爬行其网站数据。我将每个产品存储在一个表中，其中有一个标志，表示相关的<

浏览 1提问于2017-09-18得票数 0

5回答

价格比较网站-它们是如何工作的？

、、

我想知道是否有人可以向我解释一下价格比较网站是如何工作的？我的意思是，如果它像我想的那样工作(下面解释)，那么我有一个非常好的项目可以为自己工作，从长远来看，应该会赚很多钱。所以我认为它的工作原理是每个供应商提供一个RSS提要，比较网站连接到这个RSS提要。每种产品都有自己的唯一代码(由制造商提供)，这些代码在RSS提要的标准标记中提供。比较网站收集关于谁提供哪种产品的数据，并比较确实提供特定产品的数据。例如，图书出版商可以提供RSS提要，其中包含每本书背面的简介、ISBN、出版商名称、

浏览 2提问于2010-08-03得票数 3

回答已采纳

1回答

从网站上抓取产品信息的困难

、、、

我很难从这个网站上抓取“产品名称”和“价格”：。希望从网页上废除“4.30美元”和"Zespri新西兰猕猴桃绿色“。我尝试过各种方法(美丽汤、request_html、硒)，但都没有成功。我可以在Chrome的“开发者工具”选项卡中查看“价格”和“产品名称”的详细信息。似乎网页使用Javascript来动态加载产品信息，所以上述各种方法都不能正确地抓取信息</e

浏览 6提问于2022-02-06得票数 -1

回答已采纳

1回答

用Java开发自动web爬虫

你好，我想抓取多个电子商务网站，并获得所有可用的产品被抓取和显示在我的网站。我已经使用Java开发了爬虫，但在这方面，我们必须通过提供URL和HTML标记来手动抓取网站，并通过连接URL和解析URL来抓取站点，并在相应的HTML标记中获取产品。在这个例子中，我使用JSoup (“doc.getElementsByTagName”)；在名为“爬行”的标签中获取产品但我想让爬行完全自

浏览 1提问于2014-01-20得票数 1

1回答

在iOS上用TFHpple解析超文本标记语言

、、、

我正在做一个iOS项目，我的目标是创建一个特定网站的“漂亮”应用程序版本。为此，我正在使用TFHpple解析来自上述网站的所有数据，以便在我的应用程序中使用。这个网站有一个商店，所以我的目标是阅读包含产品的网页，然后将它们全部显示在表格视图中。但是，该网站不会一次显示特定页面上的所有产品。它将产品拆分到一个网站页面内的3个页面上，因此您必须单击网站上的“下一页”按钮，这将运行一些javascript

浏览 1提问于2013-12-28得票数 0

2回答

电子商务HTML Cleaner？

、

我试图通过Selenium抓取eBay，但很难提取所需的数据。我知道有一些工具可以让你清理HTML数据，以便提取“文章”并去除杂乱。 Java中有没有什么工具可以让你从电子商务网站上提取相关数据？例如，我需要提取产品名称、描述和其他产品详细信息。

浏览 0提问于2015-09-01得票数 0

1回答

基于机器学习的智能网络爬虫

、

我正在建设电子商务网站我想抓取网页到get product name, images and product specifications/features并将其存储在我的database中输入到机器学习算法机器学习的输出-- algo 然后应该解析产品名称、规格说明

浏览 0提问于2016-07-20得票数 2

1回答

单个代码库中的多个iPhone应用程序

图像和版本详细信息将有所不同。但业务逻辑几乎是相似的。在Xcode和iPhone中是可能的吗？

浏览 2提问于2011-11-14得票数 0

1回答

如何在NodeJS中通过值获得元素的CSS选择器？

、、、、

我的目标是构建一个可以在一个网站上抓取多个相似页面的抓取器，以获取几个关键信息。但是，我有一些包含这些信息的样本数据，我想使用它们为这些页面动态构建一个模型，然后使用该模型抓取站点的其余部分。为了清楚起见，如果一个网站上有三个页面，每个页面包含一个不同的产品：<html><h1>Product 1</h1> <p>Desc<

浏览 14提问于2017-01-25得票数 2

1回答

如何从网站上抓取所有产品信息？

、

理想情况下，我有兴趣从这个网站的男性部分抓取所有产品信息，以获取所有可用的产品页面： import requests有人能帮我确保页面上所有的48种产品都被捕获了吗？或者更好的是，有人能帮我弄清楚如何循环遍历每种产品，获取所有可用样式的样式名称、颜色、价格，然后单击“下一步”和“相同”，直到所有产品<e

浏览 2提问于2020-10-15得票数 0

回答已采纳

3回答

从社交媒体网络中提取数据

、、、

我想分析的社交网站有Facebook、Twitter和YouTube。请有人建议我可以使用的免费的API吗？最好是那些不会太难执行的项目。

浏览 5提问于2015-04-14得票数 0

回答已采纳

3回答

在构建从HTTP请求中提取数据的“机器人”方面需要帮助

、

我在ASP.net和C#建设一个网站，其组件之一涉及登录到一个网站，用户有一个帐户(例如移动电话公司)代表用户，从这个网站的信息，并将其存储在我们的数据库中。我不需要一个软件来做这件事，我需要一个可以与我的C#代码集成的软件开发工具包。科比

浏览 0提问于2011-10-12得票数 0

回答已采纳

2回答

不使用后端即可从电子商务网站导出内容

、、

我有一个网站，我希望转移到Volusion。将表格内容导入到Volusion中是件轻而易举的事情，它正在让它变成表格，这是一个问题。旧网站没有真正的出口能力，我也不知道如何获取它的数据库。我在想，一定有某种脚本可以让我从前端获取内容，并将其下载到某种列表中，然后放到CSV和Volusion中。有什么建议吗？我也希望进入图像目录，并下载所有他们上传到新网站。

浏览 10提问于2015-01-17得票数 0

3回答

从Google appEngine、computeEngine或cloudFunctions网站抓取数据时，我应该使用哪一个？

、、、、

我想构建一个nodejs应用程序，每20分钟从一个网站上抓取数据，并将其存储在防火墙中。请您告诉我google的哪个产品(计算引擎、应用程序引擎或云功能)对这个需求是有效的，因为下面是我希望做的事情: 1.运行Nodejs，从网站上抓取数据并存储在firebase 2中。指点和想法会很好。

浏览 1提问于2018-06-13得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用javascript获取用户的浏览器历史记录？

Import.io -它能取代Kimonolabs吗？

是否需要为每个目标站点编写抓取器？

如何在24小时内从动态加载的网页中抓取超过5万个数据点？

Python无法获取包含请求的API : Web抓取、请求、API

Laravel模块以更新附属网站上的价格、股票和评论

价格比较网站-它们是如何工作的？

从网站上抓取产品信息的困难

用Java开发自动web爬虫

在iOS上用TFHpple解析超文本标记语言

电子商务HTML Cleaner？

基于机器学习的智能网络爬虫

单个代码库中的多个iPhone应用程序

如何在NodeJS中通过值获得元素的CSS选择器？

如何从网站上抓取所有产品信息？

从社交媒体网络中提取数据

在构建从HTTP请求中提取数据的“机器人”方面需要帮助

不使用后端即可从电子商务网站导出内容

从Google appEngine、computeEngine或cloudFunctions网站抓取数据时，我应该使用哪一个？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐