在Python中从多个页面中查找URL

在Python中，可以使用第三方库如BeautifulSoup和requests来从多个页面中查找URL。

BeautifulSoup是一个用于解析HTML和XML文档的Python库，可以方便地从网页中提取数据。使用BeautifulSoup，可以通过以下步骤从多个页面中查找URL：
a. 导入必要的库：
a. 导入必要的库：
b. 发送HTTP请求获取页面内容：
b. 发送HTTP请求获取页面内容：
c. 使用BeautifulSoup解析页面内容：
c. 使用BeautifulSoup解析页面内容：
d. 使用BeautifulSoup提供的方法查找URL：
d. 使用BeautifulSoup提供的方法查找URL：
另一种方法是使用正则表达式来从页面中提取URL。Python的re模块提供了正则表达式的支持，可以通过以下步骤从多个页面中查找URL：
a. 导入必要的库：
a. 导入必要的库：
b. 发送HTTP请求获取页面内容：
b. 发送HTTP请求获取页面内容：
c. 使用正则表达式查找URL：
c. 使用正则表达式查找URL：

无论使用哪种方法，都可以通过循环遍历多个页面，并在每个页面中查找URL。这样可以从多个页面中获取URL，并进行后续的处理和分析。

在腾讯云中，推荐使用的产品是腾讯云爬虫托管服务。该服务提供了高可用、高性能的爬虫托管环境，可以方便地进行网页爬取和数据提取。您可以通过以下链接了解更多关于腾讯云爬虫托管服务的信息：腾讯云爬虫托管服务。

页面内容是否对你有帮助？

有帮助

没帮助

TypeError : WebElement是不可迭代的

、、

在我的Python中，我试图抓取最多5个滚动的Twitter页面，但是我的脚本抛出了一个TypeError，声明WebElements不可迭代。任何解决这个问题的方法。 import time from selenium import webdriver from selenium.webdriver.common.keys import Keys path_chromedriver = '/Users/SubrataMohanty/Desktop/chromedriver' browser = webdriver.Chrome(path_chromedriver) bas

浏览 3提问于2017-05-16得票数 0

回答已采纳

1回答

如何使用python请求模块在需要触发按钮显示url的网站中下载图片

、、

我目前正在开发一个python脚本，可以帮助显示来自网站的Manga图像。虽然我可以成功地从网站获取图像URL，但在一些特殊情况下，需要单击按钮才能在HTML中显示URL (以更改按钮在同一页面中的显示)。这是一个示例网页。当我尝试查看该按钮的HTML代码时(带有字符串“请点击此处继续阅读！”)，在href="javascript:void();"元素中只有一个按钮，我不知道它是如何工作的，以及当我手动单击它时它会改变什么类型的参数(否则我可以在使用python中的请求时尝试发送一些参数?) 我希望有人能告诉我通过python请求模块从这个页面获取漫画章节URL的方法。

浏览 0提问于2020-03-28得票数 0

1回答

如何从ODP中准确地提取信息？

、

我正在用python构建一个搜索引擎。我听说谷歌从ODP ()中获取页面的描述，以防谷歌无法使用页面中的元数据找出描述……我想做一些类似的事情。 ODP是Mozilla的一个在线目录，它有网上页面的描述，所以我想从ODP上获取我的搜索结果的描述。如何从ODP获取特定url的准确描述，并在找不到的情况下返回python类型"None“(这意味着ODP不知道我正在寻找的是什么页面)？ PS。有一个叫的网址，但我不知道如何从中提取信息。

浏览 2提问于2013-05-03得票数 1

回答已采纳

1回答

如何使用python在网页的HTML中搜索包含特定单词的URL？

、、

使用Python，我希望能够创建我从多个页面获取的URL列表，每个页面都有一个链接(尽管页面上可能有多个对同一链接的引用)，其中每个URL中都有重复的关键字。如何在页面的HTML中搜索包含此特定单词的URL？抱歉，如果这是很明显的事情，您能提供的任何帮助都将非常感谢。

浏览 38提问于2020-04-10得票数 1

回答已采纳

1回答

网络抓取:没有使用BeautifulSoup(page.content，'html.parser')返回正确的内容

、、

我试图从AJIO网站上进行抓取，但Python获取的内容似乎与我在检查确切网页的元素时看到的内容不完全相同。在后端创建HTML页面的页面上似乎存在某种java代码，但是当我尝试用Python获取页面内容时，它会向我展示java代码，而不是确切的HTML页面。有人能对此提出解决方案吗？下面是我正在使用的代码。在下面的代码中，我在最后一行后得到错误"TypeError：'NoneType‘object是不可迭代的“，这是因为页面没有通过"soup=BeautifulSoup(page.text，’html.parser‘)被正确地获取。”我可以在检查HTML页面时看到“预

浏览 8提问于2021-12-28得票数 0

回答已采纳

1回答

已将站点上的CNAME url转移到

、

有没有可能让你从CNAME转移到的站点和'A‘记录在url中保留来自CNAME的名称？示例:Site123.com有一个名为app的CNAME指向abc.com。当我输入app.123.com时，它会将我转移到abc.com，并将app.123.com保留在我转移到的第一个页面的url中。但是，一旦我点击页面上的任何东西在页面内移动，url就会恢复为abc.com。当我移动时，是否可以让app.123.com留在url中？因此，它将保留app.123.com/otherPage.php，而不是更改为abc.com/otherPage.php？谢谢你的帮助！

浏览 1提问于2013-08-04得票数 0

1回答

getJSON调用成功但仍然抛出500个错误

、、

我有一个getJSON()调用，它访问返回一些数据的视图。调用工作，数据被检索，但尽管如此，我仍然得到一个500错误。 Failed to load resource: the server responded with a status of 500 (INTERNAL SERVER ERROR) MultiValueDictKeyError at /album_ajax/ "Key u'reid' not found in <QueryDict: {}>" Request Method: GET Request URL: http://127

浏览 1提问于2013-07-23得票数 0

回答已采纳

2回答

为什么Python请求模块没有返回链接？

、

因此，我为我的大学教头项目创建了一个python刮刀，它在网页上刮过，并根据页面中的随机选择来跟踪链接。我使用Python的请求模块从get请求返回链接。我让它完美无缺地工作在一个图形化的程序中，它显示了程序的实时工作。我启动它是为了向我的教授展示，现在.links为每一个网站返回一个空字典。最初，我为任何没有返回链接的站点添加了一个跳转，但现在它们都是空的。我已经重新安装了Python，重新安装了请求模块，并且尝试手动输入程序网站，我似乎找不到改变的原因。作为参考，我一直使用Portswigger.net作为基线来测试.links，以查看是否返回它们。以前起作用了，现在不行了。下面是g

浏览 5提问于2022-05-13得票数 0

1回答

如何在提取特定亚马逊销售商的所有产品链接时处理分页符

、、、

我正在编写一个Python程序来提取锚标与hrefs匹配某个正则表达式模式从卖家页面。例如，我的第一个以字母'A‘开头的卖家URL如下：现在，我想要的是让所有的产品链接由上面的卖家通过抓取下面模式下的hrefs的锚标签来销售。但是来自第一个URL的产品列表分布在多个页面上。假设我正在使用Python2.7和XPath1.0字符串函数以及regex，我该如何处理分页符呢？注意:我使用的是Chrome版本60.0.3112.113 (官方版本)(64位)

浏览 1提问于2017-09-13得票数 1

1回答

TinyMCE插件-如何删除添加的代码？

、、

全! 我正在为TinyMCE 4编写一个小插件。插件所做的现在已经不重要了。我可以在页面中添加一个代码。我的问题是，我需要删除添加的代码的可能性。而我不能..。这里我的代码： tinymce.PluginManager.add('subpages', function(editor, url) { editor.addButton('subpages', { image: url + '/subpages.png', title: 'Liste der Unterseiten',

浏览 3提问于2016-10-14得票数 0

1回答

如何链接到Magento中的另一个操作，同时将参数作为POST链接而不是查询字符串传递到新页面(控制器)？

我需要向一个新页面传递一个参数(没有查询字符串)，因为我想重定向回当前页面的模块和查询字符串。所以我可以从摊牌/索引?id=35--单击-->摊牌/投票?id=1 摊牌/投票?id=1--重定向->摊牌/索引?id=35 没有看到投票的行动。 (重定向方法不起作用，因为它只重定向到普通的index.php主页url，不能保持模块/操作的完整，而且我在Magento中找不到创建超链接的助手。) Magneto有链接助手吗？我想要的东西的例子：<a href="<?php echo Mage::Helper->Link->($url

浏览 2提问于2012-07-11得票数 0

回答已采纳

1回答

通用电子邮件爬行器

、、、

我在python中编写了一个脚本，它使用requests模块和selenium以及regex来解析来自任何网站的电子邮件地址(如果有的话)。我试图以这样的方式创建它，这样它也可以遍历启用javascript的站点。我的爬虫应该跟踪任何网站链接(给定在它的列表存储中)，然后从该页面中查找contact us或about us等关键字，并解析匹配的链接，它将进入目标页面，并使用正则表达式最终从该页面解析电子邮件地址。它将电子邮件地址与解析电子邮件的链接地址一起擦拭。我尝试了几个链接，大多数情况下它都成功了。我知道很难创造一个完整的，但我努力了，它一点也不绝望。任何改进这个爬虫的建议都会受到极大的赞

浏览 0提问于2017-09-29得票数 2

回答已采纳

2回答

我遇到了一个错误"ModuleNotFoundError:没有名为‘__main_..models’的模块；'main‘不是一个包“

、、、

我正在创建一个用于网络抓取的应用程序目录，这是在我的django_project中刮刮。在将类从models.py模块导入到views.py模块时出错。这是我的项目结构：下面是我在刮擦应用程序models.py中的代码 from django.db import models # Create your models here. # model -- headline (title, url, date) class Headline(models.Model): title = models.CharField(max_length=12

浏览 1提问于2019-07-13得票数 1

回答已采纳

2回答

Django Get返回多个值

、、、

你好，我是django的新手，我正在创建一个博客网站，当我尝试访问我的博客时，我得到了一个错误，我的代码是: views.py： from django.http import request from django.shortcuts import render from django.views.generic.list import ListView from django.views.generic.detail import DetailView from .models import Item, Blog # Create your views here. class BlogV

浏览 3提问于2021-05-12得票数 0

3回答

Python BeautifulSoup为findAll提供了多个标签

、

我正在寻找一种方法来使用findAll来获得两个标签，按照它们在页面上出现的顺序。目前我有： import requests import BeautifulSoup def get_soup(url): request = requests.get(url) page = request.text soup = BeautifulSoup(page) get_tags = soup.findAll('hr' and 'strong') for each in get_tags: print each

浏览 2提问于2013-12-18得票数 62

回答已采纳

1回答

Python -如何保存从html传递的文件？

、、、

我有一个表单，当用户提交时，重定向到感谢页面，并选择下载的文件开始下载。如何使用python保存此文件？我可以使用python的urllib.urlopen打开要发布内容的url，但返回的html是感谢页面，我怀疑是这样的。有没有一种解决方案可以让我从网站上抓取要下载的文件的内容并将其保存在本地？提前感谢您的帮助。

浏览 1提问于2010-09-02得票数 1

回答已采纳

1回答

AWS和Python线程可伸缩性

、、

我在本地服务器上运行了一个使用库编写的服务。可以把它想象成一种网络爬虫。它使用50个线程。我想把它部署在云上，并向上扩展，这样它就可以使用更多的线程。简单地说，我有两个：带有URL的Qinput和带有页面内容的Qoutput。线程从Qinput中挑选URL，获取网页内容并将其放到Qoutput中问:我只需将线程数量增加到500、5000或50,000，AWS + Python就可以处理它了吗？在AWS上移植多线程服务时，我应该期待服务无缝运行，还是应该注意一些“标准”设计缺陷？我知道，尽管它在这里不是问题，因为线程的主要任务是在爬行/抓取页面时调用解释器外部

浏览 1提问于2013-01-09得票数 0

回答已采纳

1回答

python解析器不从站点读取信息，但不返回任何信息。

、、

我正在为这个站点制作一个python解析器：任务是从电影中挑选电影类型(在页面上显示为：'span'，class _= 'selection-film-item-meta__meta-additional-item') import requests from bs4 import BeautifulSoup URL = 'https://www.kinopoisk.ru/lists/series-top250/' HEADERS = {'user-agent': 'Mozilla/5.1 (Windows NT 7.

浏览 1提问于2021-03-31得票数 1

回答已采纳

1回答

Python BeautifulSoup只从每一页中获取1项

、、

我正在用BeautifulSoup框架在python中开发一个网络爬虫。我从目标页面得到正确的信息。但它只从每一页得到一个项目。我的代码看起来像： import csv import time import bs4 as bs from urllib.request import Request, urlopen for i in range(1, 5): site = "XXURLXX".format(i) hdr = {'User-Agent': 'Mozilla/5.0'} req = Request(site, he

浏览 1提问于2017-08-16得票数 1

回答已采纳

1回答

使用ElasticSearch为HTML页面提供服务

我正在开发一个应用程序，用户可以在其中创建自己的网页。为此，他们可以从管理面板创建静态HTML页面。然后这个页面可以发布在他们的网页上。页面的字段是: id、标题、内容、url。接下来的功能是：用户有自己的模板，这个模板包括一个名为base.html的文件，其中有标题、正文等。他们在管理面板中创建的所有页面都将显示在这个base.html文件中。因此，他们在后端创建的“页面”只包括页面的内容，而不是页眉、页脚等。此外，该应用程序还允许用户使用博客等其他功能，用户可以使用一些变量在页面中显示内容。例： {%表示last_post %}{ post.title } {{ post.

浏览 2提问于2017-05-05得票数 1

1回答

从具有相同url的两个不同页面中抓取数据

、、

我正试图从这个网站上删除数据。对于不同的州，url is same.For示例华盛顿页面和俄勒冈州页面有相同的url.How来编写单个脚本，根据用户在python中的选择为每个州编写数据。

浏览 3提问于2016-12-05得票数 0

回答已采纳

1回答

我想查看一个类别下的帖子列表单独显示

、、、

我的问题是，我希望当用户点击某个类别(例如体育)时，能够在一个视图中列出某个类别下的帖子。 class Category(models.Model): POLITICS = 'Politics' SPORTS = 'Sports' ENTERTAINMENT = 'Entertainment' TECHNOLOGY = 'Technology' CHOICE_CATEGORY_TYPE = ( (POLITICS, 'Politics'), (SPORTS, 'Sports

浏览 5提问于2017-09-30得票数 0

1回答

从IP地址获取gTLD或ccTLD

、、、

关于从URL获取IP地址有很多问题，反之亦然。如标题所示，我想得到其各自IP地址的网站URL。例如： >>> import socket >>> print(socket.gethostbyname('google.com')) 这将查找域并返回172.217.20.14.。我在找柜台，例如： >>> print(socket.getnamebyhost('172.217.20.14')) 任何类似的内容，都会将域返回为指定的IP的google.com。在python3中可以这样做吗？如果是，如何才能做

浏览 5提问于2020-08-25得票数 0

1回答

未定义谷歌应用程序引擎get_serving_url()

、、、

这似乎是一个简单的问题，但我无法解决：我在代码中调用get_serving_url()函数并获得en错误： NameError:未定义全局名称“get_serving_url” 我的导入语句当前如下所示:从google.appengine.api导入图像在我尝试各种“从PIL导入图像”并得到导入错误之前。我最近安装了PIL库我在python路径上有网站包和PIL文件夹。我如何使get_serving_url()工作？

浏览 1提问于2012-01-24得票数 1

1回答

ajax网站中的Python爬虫(调制解调器-路由器设置)

、、、、

如何为始终具有相同url的ajax网站创建python爬虫？有可能吗？我应该一步一步地从索引页转到我想要的页面，并祝愿一切顺利吗？(或者还有其他通往天堂的途径？) 编辑：网址是我实际上想访问我的路由器设置。

浏览 0提问于2016-03-01得票数 1

回答已采纳

1回答

同一页面上有多个Facebook按钮

、、

是否可以在同一页面上使用多个类似facebook的按钮，但共享不同的数据。我知道我可以用下面的代码设置og:image，og:title动态 jQuery('.item-facebook').hover(function() { var image_url = $(this).parent().parent().parent().find('.item-left .photo-url').attr('src'); jQuery('meta[property="og:image"]&

浏览 2提问于2013-06-24得票数 0

1回答

如何使用python中的漂亮汤从html页面中获取特定的单词

、、

我必须从HTML页面中提取特定的单词，并计算该单词被重复的次数。我如何使用python中的美汤来做这件事呢？我如何将url传递到函数中，然后计算单词数？这是我到现在为止的代码。我不知道下一步该怎么办。 import bs4 as bs import urllib.request source = urllib.request.urlopen('https://pythonprogramming.net/parsememcparseface/').read() soup = bs.BeautifulSoup(source,'lxml') for parag

浏览 3提问于2017-11-05得票数 0

1回答

宜家(SG)商店库存状况

、、

这使用Python、Selenium和chromedriver。初学者偶然发现了这样的情况：我怎么从弹出式窗口刮擦？使用此示例url： (此页面中没有关于股票状态的元素) 在右边的窗格上有“在商店里寄存”。单击时，弹出窗口将显示商店名称、位置和库存状态(库存，缺货)。我能看到所有的元素。在这种情况下，如何刮掉商店的名称和库存状态？

浏览 2提问于2021-09-27得票数 0

回答已采纳

1回答

BeautifulSoup找不到匹配

、、、

我试图通过搜索锚文本从页面中提取BeautifulSoup。我在BeautifulSoup中尝试过几种不同的方法，包括不同的html解析器，但这些方法都没有成功。代码： import requests import re from bs4 import BeautifulSoup url = "http://forum.xda-developers.com/showthread.php?t=1916098" response = requests.get(url) soup = BeautifulSoup(response.content, "lxml"

浏览 3提问于2016-09-26得票数 1

回答已采纳

1回答

check_http插件未能检查字符串之间用多个空格分隔

我有一个URL，其中内容字符串在网页上分开。我需要检查在同一行中这两个字符串是否存在。比方说，在这个页面上，我有"API操作“字符串。我不知道这两者之间有多少空位。而且，这个操作字符串是HTML页面span类中的"component-status“，我不知道如何从shell中处理。

浏览 0提问于2016-10-14得票数 1

2回答

setup.py安装只显示文件夹

、、

我试图在python中为pypi创建一个库，所以我创建了setup.py文件。在看了一些教程之后，我上传了它，但是当我试图通过pip install pyravendb安装它时，我只得到一个空文件夹。再次尝试从python setup.py install.直接安装它，只获得一个金字塔型的空文件夹。我的setup.py文件 from distutils.core import setup setup( name='pyravendb', packages=['pyravendb'], version=

浏览 3提问于2016-04-14得票数 0

回答已采纳

2回答

如何到达隐藏在瓶盖后面的媒体火焰直接链接？

、、

我编写了一个python程序从互联网下载一个文件： url = "http://download2163.mediafire.com/icum151v51zg/55rll9s5ioshz5n/Alcohol52_FE_2-0-3-6850.exe" file_name ='file' u = urllib2.urlopen(url) f = open(file_name, 'wb') buffer = u.read() f.write(buffer) f.close() 而且工作正常。问题是，在这个程序中，用于下载文件的链接并不昂贵

浏览 0提问于2015-07-24得票数 0

1回答

如何在tuckey-urlrewrite-filter中配置url映射？

、、、、

我在webapps根目录下的文件夹中有一些about.jsp，contact.jsp，user.jsp，index.jsp页面项目。我使用tuckey-urlrewrite-filter进行url映射。我使用url编写作为 <rule> <from>/contact_us</from> <to>/contact.jsp</to> </rule> <rule> <from>/about_us</from> <to

浏览 0提问于2013-05-20得票数 0

回答已采纳

1回答

错误:没有为打包找到匹配的发行版(来自pytest)

、、、、

OS: Raspbian 10；Python版本: 3.8；Pip版本: 20.2.2 我已经尝试过所有的解决方案，包括这个中的链接，但仍然找不到解决方案的raspbian环境。我正在尝试执行pip3 install --no-cache-dir pytest，这给出了上面的错误。有没有针对raspbian或linux环境的特定解决方案？下面是pip install --no-cache-dir pytest -vvv输出。我突出显示了下面的错误(位于中间)。获取项目页面并分析链接： GET GET/ "GET /simple//1.1“200 962找到链接 (来自)，版

浏览 1提问于2020-08-19得票数 1

1回答

那么用户的Python API呢？

、

把我加到对这一切感到困惑的人名单中：。我目前在上运行的一个AppEngine应用程序中使用Python Users API。我为我的登录按钮构建登录URL，如下所示： login_url = users.create_login_url(federated_identity='gmail.com', dest_url=dest_url) self.redirect(login_url) 用户API为我管理我的用户数据库。我可以使用下面的代码拉取当前用户的会话： current_user = users.get_current_user() 鉴于我在Google页面上看到的关于这

浏览 1提问于2015-01-07得票数 0

1回答

如何在Django/Python中将表单数据(从HTML页面的函数中检索)发送到另一个HTML页面的函数？

、

顺序是：-用户在'a‘HTML页面中填写'A’表单。(URL: AppName/A) -用户被定向到'B‘HTML页面，并有其他表单要填写。(URL: AppName/A/B) 在python代码中，如何将'a‘表单的数据(从与'A’HTML页面对应的函数中检索)发送到views.py中与'B‘HTML页面对应的函数？注意:我不想在'B'HTML页面中从'A‘HTML页面检索数据，而是在用户从'A’转到'B‘HTML页面时从与'B’HTML页面相对应的函数中检索数据。谢谢。

浏览 3提问于2020-06-06得票数 0

1回答

需要使用bs4和python从幻灯片中抓取图像的帮助

、、、、

我正在尝试从Craigslist中删除列表信息，不幸的是，我似乎无法获得图像，因为它们是在幻灯片中。 import requests from bs4 import BeautifulSoup as soup url = "https://newyork.craigslist.org/search/sss" r = requests.get(url) souped = soup(r.content, 'lxml') ? 由于图像甚至不在请求的html文件中，我是否需要以某种方式动态加载页面或其他什么。如果是这样，我只能把它保存在python中，我不想

浏览 14提问于2019-02-06得票数 0

回答已采纳

1回答

哪个url指向哪个文件

实际上，我已经在我的本地环境中部署了一个运行网站的wordpress。我想得到一些一般性的指导，我如何知道哪个文件指向哪个url。就像我进入网址mysite.com/居家薪酬。它在后端打开了一个页面，我通过这个项目从文本中搜索到，这个页面打开了文件名为“house-facilities.php”，那么有什么方法可以查看这个文件吗？

浏览 0提问于2017-07-11得票数 0

回答已采纳

3回答

使用Python的网站下载器

、

我正在尝试使用python创建一个网站下载程序。我有以下代码：从页面中查找所有URL 下载给定的URL 我要做的是递归下载一个页面，如果页面中还有其他链接，我也需要下载它们。我尝试将上述两个函数组合在一起，但递归功能不起作用。守则如下： 1) *from sgmllib import SGMLParser class URLLister(SGMLParser): def reset(self): SGMLParser.reset(self) self.urls = [] def start_a(self, attrs):

浏览 2提问于2011-09-26得票数 0

1回答

为什么我的自定义字体渲染使用font-face会有所不同？

、、

我使用了以下css： @font-face { font-family: 'bariol_regularregular'; src: url('Bariol_Regular.otf'); } 该字体正在使用中，页面上没有错误。当我将此自定义字体添加到页面上的文本时，它与默认样式明显不同。以下是字体的显示方式：但是，它是这样显示的：特别要注意撇号(')和字母‘g’，这是最明显的差异所在。如果我使用本机应用程序，则字体显示正确。我下载字体的站点上的演示字母也正确显示- 我是不是遗漏了什么/做得不对？

浏览 5提问于2018-04-16得票数 0

1回答

Django Rest框架视图集-基于用户名问题的ForeignKey过滤过滤器

、、

我有一个django项目，我已经将Django Rest框架集成到后端的项目中。我有个侧写模型。在配置文件模型中，我有一个具有用户名字段的用户foreignkey。用户名是我目前使用的过滤配置文件。当ListAPIView和RetrieveAPIView分开的时候，我的一切都很完美。 class ProfileListView(ListAPIView): queryset = Profile.objects.all() serializer_class = ProfileSerializer class ProfileDetailView(RetrieveAPIView):

浏览 1提问于2019-01-23得票数 0

回答已采纳

1回答

用Python3.6.4中的Urllib下载图片

、、

我运行了下面的代码来使用urllib模块下载图像。但最后我还是遇到了一些错误，如下所示。 import urllib.request import random def downloader(image_url): file_name = random.randrange(1,10000) full_file_name = str(file_name) + '.jpg' urllib.request.urlretrieve(image_url, full_file_name) url = input("U

浏览 4提问于2018-12-30得票数 2

1回答

使用gmail api访问电子邮件中的链接

、、

我正在尝试访问我的电子邮件中的链接，这是我在Gmail帐户中从特定电子邮件地址获得的链接。到目前为止，通过使用GMAIL api，我可以从文档中使用python函数ListMessagesMatchingQuery获取电子邮件id 然后，从这里，我可以使用python函数GetMessage从文档检索电子邮件的内容。然而，内容的格式是不够的。我想要得到的是从电子邮件内容中的链接，这样我就可以访问它的HTML页面，然后抓取它。谢谢

浏览 0提问于2018-10-03得票数 0

1回答

在另一个项目类型中使用来自一个项目类型的项目

、

我刚开始在网上零售商的产品页面中添加微数据。我使用Schema.org的Product类型，此时我只引用产品manufacturer、name和description。谷歌发现这个网站现在已经有了结构化的数据，并且列出了页面(没有错误)。我在产品页面上有一个URL，链接到同一制造商的更多项目。我想在每个页面上标记这个URL，但是Product类型中的属性似乎不适用。url在Product中的描述似乎表明它是该产品的URL，当然，我已经在该产品上，并且正在链接到相关产品。我从WebPage那里偶然发现了一个更适用于我的参考的属性，所以我的问题是：我是否可以将属性url从Product中

浏览 2提问于2015-01-10得票数 2

回答已采纳

2回答

如何在代码点火器中从url中找到视图页？

、、

我已经从codeigniter中的服务器下载了一个项目。我想编辑几页。问题是我无法从URL中找到一个特定的页面。如何从URL中找到一个特定的页面来对该特定页面进行更改？视图中有多个文件夹，例如，http://localhost/TMO/CMS/company/6/admin/store 如何找到在此URL上查看的页面？

浏览 6提问于2017-02-16得票数 0

回答已采纳

1回答

Django模板不存在@

、、

我使用python 3.7.2和Django 2.1，每次我试图加载home url时都会得到以下错误。 TemplateDoesNotExist at / 代笔/post_list.html 请求方法: GET请求URL： Django版本: 2.1异常类型: TemplateDoesNotExist异常值：代笔/post_list.html 异常位置: C:\Users\User.virtualenvs\ghostwriter-HT06mH6q\lib\site-packages\django\template\loader.py in select_template，第47行Pyth

浏览 3提问于2020-09-21得票数 2

回答已采纳

1回答

获取从Episerver的特定页面继承的所有页面

、

有一个抽象的基页 public abstract class BasePage : PageData 有一些页面是从这个页面继承的。 public class ChildPage : BasePage public class ChildPage2 : BasePage 我需要检索从BasePage继承的所有页面。在PropertyCriteria中，我只能使用ChildPage和ChildPage2进行PageTypeID的搜索。所以这种方法不能解决我的问题

浏览 2提问于2016-04-09得票数 1

回答已采纳

2回答

在web爬网过程中获取CSS计算样式

、

有没有办法从页面源中获取元素的计算样式？或者，如果不是来自页面源代码，那么可以通过其他方式？我希望能够转到一个网页，然后获得所有计算出的样式(通过我的代码；我不是在谈论打开浏览器选项卡并单击Inspect element)。现在，我使用Python BeautifulSoup来获取和遍历文档。这将获取所有元素及其属性，但不能获取css样式。理想情况下，这应该是使用Python，但我对使用其他语言持开放态度。 (对不起，如果这个问题之前已经回答过了。我看了几个问题，它们似乎都与从“检查元素”或从使用javascript的您自己的个人页面获取信息有关。)

浏览 3提问于2011-12-27得票数 2

回答已采纳

1回答

客户证书认证:接受请求证书或从主机检索证书？

、、

从其主机检索客户端证书比接受请求中提供的证书更安全吗？示例： B2B 客户预售公共证书我将公共证书存储在数据库中。稍后，客户端向我的HTTPS端点发送GET请求+ cert。端点将Enforce HTTPS和Require client certs设置为true Python代码从GET请求中获取客户端证书，并将这些属性与数据库中的预共享证书(cert of )中的属性进行比较。 valid_not_before/after issuer common_name 等。然后，Python代码：在请求中从客户证书确定OCSP响应者url 检索发行人证书创建OCSP请求验证OC

浏览 0提问于2020-10-24得票数 0

回答已采纳

1回答