网站js css代码的抓取_网站css代码_js抓取网站信息 - 腾讯云开发者社区

、、、、

我有困难开发一个适当的"CSS选择器“代码来抓取/解析以下HTML的赔率。我对node.js比较陌生。但在过去，我成功地抓取了类似的网站。不幸的是，这个网站有点棘手(对我来说是这样！)。我可以断定问题出在我使用的CSS选择器代码上。你能告诉我如何写一段代码，让我从.. <div class="market"..............> <header class=..........> <div class="market-content"> <div class ="selec

浏览 3提问于2016-03-06得票数 0

1回答

编辑样式和Typekit

、

我的网站使用typekit抓取自定义字体，这在前端工作。我想把这个放在我的编辑风格的后端。但是，我不知道我会怎么做。Typekit使用js嵌入代码段，而不是css字体面板嵌入代码段。

浏览 0提问于2012-07-25得票数 10

回答已采纳

1回答

httrack仅下载index.html文件

、、、

通常，当我使用Httrack下载网站时，我会得到所有的文件；图片，CSS，JS等。今天，程序在2秒内完成下载，只抓取了index.html文件，里面还有CSS，IMG代码等仍然链接到外部。我已经将我的设置重置为默认设置，但没有帮助。有谁知道如何将其改回正常运行？

浏览 5提问于2014-11-23得票数 0

1回答

使用JavaScript获取站点的HTML、CSS和JavaScript

我见过很多关于用Jquery + node.js + YQL抓取html的问题。它没有提到从网页中获取css和javascript。有没有办法在不使用服务器端技术的情况下获得外部网站的html、css和javascript？ *我需要这在代码中发生，这样我就可以在webapp应用程序中使用结果。

浏览 1提问于2013-02-12得票数 1

1回答

使用Javascript和/或jQuery获取包含的css文件的内容

、、

我正在制作一个文档网站，在那里我展示了html，css和js示例。目前，我获取导航栏的html并将其放入代码块中： $(".navbars #navbar .html code").text($(".navbar")[0].outerHTML); 我希望能够用css做一些类似的事情。所有导航栏css都是这样包含的： <link href="css/navbar.css" rel="stylesheet"> 一开始我想用ajax请求获取它，但由于我没有运行服务器(只是一个简单的html、css和js网站)，我得到了一个O

浏览 3提问于2014-07-24得票数 1

1回答

我怎样才能让我的刮板网站-设计-更改容错？

、、

我已经用ruby写了一个网页抓取器。但是我正在抓取的网站已经改变了它们的design.Thus，我的刮板正在失效。有没有一种聪明而简单的解决方案来解决这种固有的刮刀问题？(例如..使用某种模式匹配、xpath、比较DOM tress...etc) EM.run { http_request = EM::HttpRequest.new(url, opts).get http_request.callback { |body| doc = Nokogiri.parse(body.response) doc = Nokogiri::HTML(body.response) puts doc.

浏览 1提问于2012-07-14得票数 3

回答已采纳

1回答

如何在Siteground托管服务器中运行Python脚本

、

我正在建立我的网站，其中包含一个python(.py)文件，超文本标记语言，css和JS文件。我想知道，我怎样才能运行我的python脚本在我的网站从我的托管帐户，以便它可以从一个网站抓取数据，并输出一个JSON文件到Javascript文件，可以显示在网页上。

浏览 15提问于2021-01-06得票数 0

1回答

视差脚本(在Enjin中注入代码)不能单击按钮

、、、、

所以，经过无数次尝试之后，我终于在上启动并运行了我的视差网站背景，现在唯一的问题是(你可以自己看到)，每当你进入该网站时，你都不能点击任何按钮，一旦你点击并抓取任何地方，你就会看到你正在抓取视差效果中的一幅图像。所以我假设视差在网站层之上，我不能直接编辑，这就是为什么我注入代码的原因。现在我尝试在CSS中设置z-index：-1和-9999，但遗憾的是没有改变任何东西。因此，我认为这与代码有关，我找到了一行代码，可以实现这一点: object.style.zIndex="-1“。遗憾的是，我对JS一无所知，我想知道是否有人能帮我解决这个问题，因为我离解决这个问题很近，如果你需要代

浏览 2提问于2014-09-17得票数 0

回答已采纳

1回答

我很难在网上抓取<span>中和<span>之外的值

我正在使用抓取这个网站的。我正在尝试检索图片中显示的值。但是我相信我用一种错误的方式抓取了这些值，请看我的变量"Info“。请给我一些提示，我应该如何实际网络刮图片中的值。我今天使用的代码是： categories = response.css("body > main > div.js-childLayoutContainer.u-marginTmd > div > div.js-favoriteStoreView.js-settings > div.Main-container.Main-container--padding >

浏览 1提问于2021-03-31得票数 0

1回答

如何将Nutch2.3中的图像作为HBase作为后端？

我想从某些网站抓取图片。到目前为止，我尝试修改regex-urlfilter.txt。我改变了： -\.(gif|GIF|jpg|JPG|png|PNG|ico|ICO|css|CSS|sit|SIT|eps|EPS|wmf|WMF|zip|ZIP|ppt|PP T|mpg|MPG|xls|XLS|gz|GZ|rpm|RPM|tgz|TGZ|mov|MOV|exe|EXE|jpeg|JPEG|bmp|BMP|js|JS)$ 至： -\.(css|CSS|sit|SIT|eps|EPS|wmf|WMF|zip|ZIP|ppt|PPT|mpg|MPG|xls|XLS|gz|GZ|rpm|RP

浏览 6提问于2015-05-27得票数 2

回答已采纳

1回答

无法使用Scrapy从下拉列表中进行抓取

、、、

我正在尝试从网站上嵌入的JS下拉列表中抓取市场列表：https://e27.co/startups 使用scrapy shell，我试图从“markets”下拉菜单中抓取市场列表，但无法这样做。在运行了scrapy shell 'https://e27.co/startups'之后，我尝试了同时使用response.css()和response.xpath()。对于css选择器： response.css('#startups-page > div > div.search-block.box-view > div.row.mbt-s >

浏览 9提问于2019-06-13得票数 0

回答已采纳

1回答

使用Scrapy抓取原始javascript和css文件

、、、

我想抓取所有链接的javascript和css文件在一个给定的域名与Scrapy。问题是我不太理解如何从link元素中提取链接。假设我正在抓取example.com。有指向表单的js和css的链接： <link rel="stylesheet" href="/path_to_css/example.css"/> <script src="/path_to_js/example.js"></script> 这些链接是从根域开始的，所以没有问题。但是，如果链接类似于下面的链接，就会开始变得令人困惑： <l

浏览 9提问于2019-08-28得票数 0

回答已采纳

1回答

使用python 2.7从网站中提取CSS媒体查询

、、、、

我试图通过使用python2.7中的爬虫来在网站的@media only screen CSS文件中找到特定的CSS媒体查询(CSS媒体查询)。现在，我可以抓取网站/URL(从CSV文件中)，使用以下代码在其HTML源代码中查找特定的关键字： import urllib2 keyword = ['keyword to find'] with open('listofURLs.csv') as f: for line in f: strdomain = line.strip() if strdomain:

浏览 0提问于2017-02-20得票数 1

2回答

如何在使用phantomjs抓取网页时获取css文件和js文件

、、

我正在做一个项目，我需要抓取网页，所以我通过教程，我发现phantomJs将是最好的选择。因为它允许我们得到的angularJs网站和基于ajax的视图网站的HTML内容，我已经写了它的代码，工作得很好，但问题是，我不能得到css和js文件，如果只写短路径的文件。如果受害者使用的是网站的完整URL，如下所示 <script src="https://ajax.googleapis.com/ajax/libs/jquery/1.12.4/jquery.min.js"></script> 它工作得很好，因为受害者使用的是我可以使用的js的完整URL。但如果

浏览 0提问于2018-03-06得票数 0

1回答

有没有可能用NodeJS抓取任何给定的网址？

、

在开始之前，我会说这对我来说是新的东西，纯粹是一个学习练习，所以请原谅我的幼稚。我已经阅读了一些关于抓取的文章，似乎NodeJS、ExpressJS、Request和Cheerio是我作为一个熟悉JS/jQuery的前端人员的首选方法。到目前为止，我读过的所有文章都集中在没有API的情况下从特定网站上抓取数据，而我想要实现的是一个工具，它可以获取任何给定的URL，并返回true/false来列出正在使用的通用库和链接的社交网络。例如，用户输入一个网址，结果返回“本网站使用jQuery、MooTools、BackboneJS、AngularJS等”和“本网站与Facebook、Twitte

浏览 0提问于2014-08-07得票数 0

2回答

执行从随机网站下载的javascript代码

、

我做了一个工具，从其他网站(任何类型)抓取所有的html，css，javascript和图片。然后我在我自己的域名上执行这个(当然是在修改链接之后)。 javascript也会执行，因此页面呈现与抓取的网站上的页面呈现完全相同。但都在我的域名下。有没有什么方法可以保护这个javascript的执行(使用不受控制的代码)，这样被抓取的网站就不能获得我网站用户的cookie了？(或其他潜在的安全漏洞？) 谢谢。

浏览 1提问于2013-05-24得票数 1

3回答

将一个30页的网站保存在一个离线查看的30页(但是CSS和JS已经到位了)？

、、、

如何将一个10页的网站保存在一起，使其离线查看(但是CSS和JS已经到位)？我试图通过Firefox保存一个网页，以便从浏览器中脱机查看： File > Save page as > Webpage (complete), HTML. 网页保存在一个包含HTML、CSS和JS文件的文件夹中，但它看起来很混乱，而不是在线出现。因特网档案回送机(IAWM)可以一次将一个页面保存到归档文件中，但我想将所有文件保存在一起。我可以使用火狐屏幕抓取来制作网站上所有页面的截图，但这并不是在保存整个页面，而且也是重复的(AFAIR)。我还剩下什么，我还有没有办法把一个30页的网站放在一个离

浏览 0提问于2017-11-29得票数 -2

回答已采纳

1回答

从Drupal7中的ajax调用数据中删除css文件

、

我在Drupal7中用ajax support.But构建了一个模块，现在我遇到了一个大麻烦，当我调用ajax进行某些数据提取时，由于包含了system.menu.css文件和我的网站css中断的提取数据。那么，您能指导我如何从ajax抓取的数据中删除那些不必要的文件，主要是Drupal7中的css和js文件。

浏览 3提问于2011-10-04得票数 0

1回答

iframe是这个问题的合适解决方案吗？

我为一个更大的网站建立微型网站。目前，我发送HTML/CSS/JS，它被嵌入到一个页面上。99%的时间，我需要修改我的代码，因为页面上现有的CSS和JS搞砸了我的内容。父页面使用XHTML1.0Transition作为文档类型、旧版本的jQuery (1.2)、糟糕的样式等，而我的代码使用新的脚本和特定于我的页面的CSS。如果我将内容加载到<iframe>中，我就可以完全避免这些问题。但我担心，如果我这样做，会对谷歌抓取页面产生什么样的影响。谷歌会将整个页面视为一个页面，还是会将<iframe>视为一个“链接”并将其作为一个单独的页面进行跟踪？我希望我可以覆盖默认的

浏览 2提问于2012-08-04得票数 0

回答已采纳

1回答

Web抓取-在输入标签中写入

、、

所以让我们想象一下，我有一个网站，它有这样的代码： <input class="js-search-input" type="text" name="q" (and some other useless attribute here)> 我想要做的是写一段代码来抓取这个网站并识别这个输入(在本例中使用CSS选择器很容易做到这一点)，并且我希望它为我在输入标记中键入类型的。注意，我不想提交页面，我只想在那里键入单词！我已经刮了这个网站，这是相当容易，但这部分真的挑战我，因为我也没有找到具体的谷歌/youtube的答案。谢谢你提前提供

浏览 1提问于2021-04-01得票数 0

回答已采纳

1回答

AttributeError: scrapy中的“list”对象没有属性“”css“”

、

抓取网站：http://quotes.toscrape.com 我使用的是Scrapy 2.3.0。我试着从上面的网站上抓取所有的引文以及它的作者和标签。有没有人能解释一下为什么这个代码 Error : AttributeError: 'list' object has no attribute 'css' 在第1行： author = quote.css('.author::text').extract() ? 我正在学习使用scrapy，我被卡住了。导入scrapy class QuotesSpider( scrapy.Spid

浏览 48提问于2020-09-06得票数 0

回答已采纳

1回答

尝试使用Nokogiri从HTML中抓取字符串

、、、、

我是一名学生，正在用Ruby做我的第一个CLI项目，我正在尝试用Nokogiri抓取一个网站。该网站的内容并没有严格地组织到它们自己的classes/id中，但是有一些信息我就是搞不懂如何抓取。它看起来是这样的： <p> <strong> First Aired:</strong> "2017 | " <strong> Episodes:</strong> " 24" <br> 我想知道是否有一种方法可以抓取每个"Ep

浏览 5提问于2020-10-03得票数 0

1回答

抓取蜘蛛不能正确抓取数据

、、、、

我正在尝试从我的大学网站上抓取关于循环的数据，使用scrapy进行一个项目，但我的爬虫没有正确地抓取数据。有很多空白元素，而且由于某些原因，我无法抓取通知的'href‘属性。我假设我的CSS选择器是错误的，但我无法找出我到底做错了什么。我用'Selector Gadget‘Chrome扩展复制了我的CSS选择器。我一直在学习scrapy，所以如果你能解释我做错了什么，那就太好了。我正在抓取数据的网站是：https://www.imsnsit.org/imsnsit/notifications.php 我的代码是： import scrapy from ..items imp

浏览 10提问于2020-11-21得票数 0

1回答

用BeautifulSoup抓取TradingView上的数据

、

我刚刚开始学习网络抓取，并决定从这个网站上抓取每日价值：我使用BeautifulSoup，然后做inspect元素，然后复制-> CSS选择器。但是，返回的项长度始终为0。我尝试了select()方法(来自ATBS)和find()方法。不确定我做错了什么。这是代码。 import requests, bs4 res = requests.get('https://www.tradingview.com/symbols/INDEX-MMTW/') res.raise_for_status() nmmtw_data = bs4.BeautifulSoup(re

浏览 33提问于2020-05-18得票数 1

2回答

品牌名称: AttributeError：'NoneType‘对象没有属性'text’

、

我正在做一个使用python从Sephora抓取产品的练习，但是在成功地抓取了12个产品之后，我得到了"AttributeError：'NoneType‘对象没有属性'text'“。我很确定这与产品被组织成12块这一事实有关，但我很难理解如何解决这个问题。代码和参考网站下面。太感谢你了！我的代码片段： product = soup.find(class_ = "css-zwibo9 e65zztl0") product_list = product.find_all(class_ = "css-12egk0t") for p

浏览 0提问于2021-04-22得票数 0

1回答

将另一个网页文件夹上传到Wordpress的正确方法是什么？

我使用Wordpress作为我的博客，目前有一个项目，其中有一个网页文件夹，其中包含HTML/CSS/JS/PHP (基本网站抓取)。我可以通过localhost/project/index.html使用MAMP来运行它，并希望将whold网站添加到我的Wordpress博客中，作为一个独立的页面，比如mywebsite.com/project/index.html。怎样才是正确的方法？

浏览 4提问于2015-03-07得票数 0

1回答

如何在cytoscape.js中启用/实现摇摄？

、

cytoscape.js源代码多次提到摇摄。通过平移，我指的是抓取背景和移动鼠标移动方向的整个图形的能力，就像在d3.js中所做的那样。到目前为止，我已经包含了相关的库和css： <link rel="stylesheet" type="text/css" href="cytoscape.js/build/plugins/jquery.cytoscape-panzoom.css"> <script src="demo/jquery-1.7.2.js"></script> <script s

浏览 2提问于2012-07-03得票数 2

回答已采纳

1回答

用beautifulSoup抓取CSS信息

、、、

我正在从包含网站URL的网站上抓取数据。我想知道是否有一种方法可以知道网站是否响应了beautifulSoup？更特别的是，我们是否可以用BeautifulSoup检查CSS代码，或者您只能使用HTML。来自响应式网站的CSS将通过示例包含类似"@media“的内容。有没有办法检查一下？谢谢

浏览 2提问于2016-05-11得票数 0

1回答

如何使用Selenium和Node.js从网页中抓取动态渲染的数据？

、、、、

我目前在抓取一个使用react渲染部分网站的网站时遇到了一些困难，我不太确定为什么我不能抓取数据。以下是该网站的html：image 我想做的是用data-test="shipItButton"抓取按钮的文本然而，当我运行我的代码时，我得到了这个错误： (node:23294) UnhandledPromiseRejectionWarning: NoSuchElementError: no such element: Unable to locate element: {"method":"css selector","select

浏览 22提问于2020-10-13得票数 0

1回答

使用CSS获取指定的类及其后面的几行

、

我正在尝试写一个CSS代码片段来隐藏网站上的广告。问题是，我需要隐藏的内容是带有class标记的div后面的一行，并且与页面上其他有用的内容完全相同。有没有可能用类抓取div，然后用CSS抓取它后面的一行？现在我只想从 .ad-indicator { display: none ; }

浏览 3提问于2018-10-08得票数 0

1回答

无法使用Goutte Laravel包抓取此站点。视图源中存在元素

、、、

我正在用Laravel Goutte包https://github.com/FriendsOfPHP/Goutte构建一个抓取工具，我已经能够抓取大多数网站，直到我遇到这个网站的http://www.bhutanpost.bt/，我需要抓取。我怀疑的问题是该站点的字符集为UTF-7，并且返回的xml与"view source“中显示的不同。我试图抓取的元素确实存在于视图源代码中，所以我可以说它们不是由JS动态拉取的。任何帮助都将受到高度的感谢。

浏览 21提问于2021-02-09得票数 0

2回答

无法使用Ruby中的Nokogiri刮取数据

、、、

目前，我正在尝试使用Nokogiri从网页中抓取数据。我想从链接中抓取服务中心列表中的数据。我所编写的代码是： require 'open-uri' require 'nokogiri' doc = Nokogiri::HTML(open("http://www.cardekho.com/Maruti/Noida/car-service-center.htm")) doc.css('.delrname').each do |node| puts node.text end 我尝试了一堆CSS标签的组合，但它们都没有给

浏览 6提问于2015-07-17得票数 0

回答已采纳

1回答

如何让我的angular js网站在搜索引擎上可抓取？？

、

我想让我的angular js网站可被搜索引擎抓取。我的网站没有被谷歌抓取?？

浏览 1提问于2016-02-14得票数 0

1回答

简单的jQuery插件不工作

、

日安，我正在写我的第一个jQuery插件。我从网站抓取了代码。下面是带有Javascript的HTML： <div>Hello World</div> <br> <br> <div>Hola Mundo</div> <a href="http://www.nbcnews.com">My Link</a> <script src="js/jquery-1.9.1.min.js"></script> <script src="j

浏览 1提问于2015-07-20得票数 0

回答已采纳

1回答

添加自定义jquery后wordpress http 500错误

、、、

我尝试用不同的方法将jquery添加到我的站点上已经有一段时间了--并且发现最佳实践是在functions.php中对其进行排队。具体来说，我正在尝试添加一个“粘性”导航条，当用户向下滚动时，它会在页面的顶部抓取。然而，当我这样做，我的网站得到一个500错误，我必须删除它，以使网站恢复和运行。显然，是functions.php代码将脚本或脚本本身排入队列，从而导致了问题--然而，我无法确定是哪个原因，当然也是原因。(我的服务器的设置是否有问题？缺乏资源/权限等？) 以下是我的Functions.php摘录： function verdigris_script() { // regis

浏览 4提问于2017-04-06得票数 0

回答已采纳

1回答

将静态网站转换为WordPress主题并导入所有现有内容

、、、

我有一个网站，是建立与html，css和javascript，没有CMS。这看起来很棒，我的客户希望该网站的背景是wordpress，这样他就可以轻松地修改内容。所以，我被困在这里了。我知道有一些插件可以导入写得很好的html，它们的工作原理就像魅力一样。但是，我从来没有做过这样的迁徙。我如何将整个网站转移到wordpress？有没有一种方法可以自动抓取整个站点，以及导入js库的简单方法，以便我可以保留html中的所有类、div或span标记、css中的样式等？

浏览 0提问于2016-07-27得票数 2

回答已采纳

1回答

如果尚未设置cookie，则尝试随机化样式表

、、

我有一个网站，允许用户之间切换两种不同的CSS外观的网站通过jQuery。一旦用户选择了一个样式表，它就会设置365天的cookie来记住用户选择了哪个样式表。我正在尝试找出一种方法，如果没有设置cookie，可以在两个样式表之间随机选择。下面是相关的jQuery (核心和cookie插件在.js文件中加载的位置较高)。我想我需要在其他地方添加一些随机的“抓取”。 if($.cookie("css")) { $("link").attr("href",$.cookie("css")); }else{ } $(funct

浏览 1提问于2011-04-05得票数 0

回答已采纳

1回答

下载没有js/css版本名称的网站的工作本地版本

、

有没有办法在没有js/css版本名称的情况下获取网站的本地版本？我用来获取该站点的内容如下： wget --mirror --page-requisites --convert-links --adjust-extension --compression=auto --reject-regex "/search|/rss" --no-if-modified-since --no-check-certificate --user-agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KH

浏览 3提问于2019-04-05得票数 0

1回答

基于js的Google索引网站

、、、

我在AngularJS上有一个网站，在NodeJs上有后台。我知道google可以抓取和索引基于js的网站，所以我在网站管理员的googles抓取和渲染工具上输入了一个url。在抓取工具上，谷歌显示的是页面源代码，而不是html，而是在呈现端，它向访问者显示了网站的完整渲染版本。现在我试着在谷歌上搜索网址我发现这个url有索引，但有意想不到的文本。同样，在单击缓存版本时，不会显示任何内容我不确定谷歌是否能够索引我的内容。请告诉我哪里出了问题？

浏览 0提问于2015-12-14得票数 0

1回答

将Scrapy与Javascript和iFrames及替代方案一起使用

、、

我正在尝试使用Scrapy来抓取美国政府法规网站(www.regulations.gov)。它有大量的信息，但这是一个糟糕的网站，充满了javascript和iframe。我试着运行一些简单的Scrapy爬虫，但我无法解析出任何东西，因为所有东西都是通过Javascript和iframe加载的。例如，在上，这段代码实际加载结果表： <script type="text/javascript" src="Regs/Regs.nocache.js?REGS211-b3"></script> <title>Regulations

浏览 0提问于2011-05-17得票数 4

回答已采纳

1回答

使用scrapy进行web抓取数据的难度

、、、

我正在尝试从https://www.ta.com/portfolio/business-services中使用scrapy抓取数据，但是响应为空。我正在寻找抓取href在div.tiles js-portfolio-tiles中使用代码response.css("div.tiles.js-portfolio-tiles a::attr(href)").extract()我认为这与之前出现的::before有关，但可能不是。如何解压这个文件？website HTML

浏览 10提问于2020-01-17得票数 0

回答已采纳

1回答

Scrapy Load More Issue - CSS选择器

、、、

我试图刮一个网站，其中有一个“显示更多”链接在页面底部，导致更多的数据来刮。这里有一个网站页面的链接：https://untappd.com/v/total-wine-more/47792。下面是我的完整代码： class Untap(scrapy.Spider): name = "Untappd" allowed_domains = ["untappd.com"] start_urls = [ 'https://untappd.com/v/total-wine-more/47792' #URL: Major liquor store

浏览 10提问于2020-05-02得票数 1

1回答

如何从javascript文件运行我的纯python (.py)文件

、、

我正在创建一个网站，从一个网站抓取数据，并在我的网站上显示该数据。我使用selenium进行抓取，这完全是用python编写的，它可以将抓取的数据转换为JSON。我使用Javascript从JSON获取数据并将其显示在HTML中。现在我想问两件事。首先，如何通过虚拟主机在web浏览器中运行python文件。其次，我想要的是每天我的Javascript代码运行python文件，这样每当网站更新时，更新的数据也会显示在我的网站上。谁能指导我如何从Javascript运行Python文件。我也看过Brython，但它不能运行我的python(.py)。下面是我如何使用Brython的这些

浏览 147提问于2021-01-03得票数 0

1回答

我能识别哪个.js脚本正在改变特定的HTML吗？

、、、、

我会以以下网站为例：在这个网站中，值是使用存储在.js本身中的HTML脚本来计算的。通过查看源(在按下F12之后)，我们可以将包含计算值的元素识别为 <span id="added">[calculated value here]</span> 由于源代码本身只有一个.js文件，即js/scripts.js，所以我可以推断公式在那里。但是假设有多个脚本，比如js/scripts1.js、js/scripts2.js和js/scripts3.js。是否有一种方法可以知道它们中的哪一个实际上正在更改<span id="added"

浏览 0提问于2020-06-03得票数 1

回答已采纳

1回答

开合铬延长线

、、、

这似乎是最简单的任务，但我现在很难.我想通过点击扩展图标来打开我的扩展，而不是每次打开一个新选项卡。我还希望在按下图标时完全关闭。我在网站的DOM中插入了一个iframe，这不是一个标准的弹出窗口。现在，每当单击图标时，我都会隐藏它，但每当加载新页/选项卡时，它仍然会插入iframe。我试着删除iframe，它可以工作，但是每次我重新插入它时都会触发content_script，重新抓取网站并添加到数组中，这使得TTS在每次重新打开扩展时都会重复单词。清单： { "manifest_version": 2, "name": "Caliban

浏览 1提问于2017-11-08得票数 0

回答已采纳

1回答

包括使用PHP的子文件夹页的头

我正在使用PHP包含，以便包括页眉和页脚到所有网站页面。这是很好的工作，除非我是冲浪的顶层网页，这是‘索引’和‘约’，例如。在较低级别的页面上，即“product1”和“product2”包括工作，但不抓取样式。我可以通过为内部页面创建额外的页眉和页脚来解决这个问题，在这些页面中，我将将样式链接从"styles.css“更改为”./styes.css“，但我希望找到另一种解决方案，只保留一个页眉和一个页脚。是否有办法这样做？网站结构 -assets -includes header.html footer.html +css +js -products

浏览 0提问于2016-02-21得票数 2

回答已采纳

2回答

使用CSS选择器查找存储在javascript元素中的某些数据

、、、、

我正在做一些网络抓取(与网站所有者的ok )，并遇到了一些数据，当滑块移动时更新。问题是这些数据在某个javascript中。我使用的是perl Web::Scraper，它同时允许CSS选择器和xpath选择器，但我似乎就是无法分离出javascript。我尝试过属性选择器；scriptsrc="path_to.js“普通节点选择器'script‘和绝对css path -它们根本不想工作。你知道如何获取脚本节点的内容吗？

浏览 0提问于2013-08-08得票数 0

1回答

Nutch 2.3.1不能抓取没有域名的内部链接

我有一个nutch设置在一个地方抓取许多网站一次，但对于一个网站，特别是因为像href=的内部链接“一个没有域名的链接”nutch不能看到这些网址，下面是nutch网站 conf/regex-urlfilter.txt # skip file: ftp: and mailto: urls -^(file|ftp|mailto): # skip image and other suffixes we can't yet parse # for a more extensive coverage use the urlfilter-suffix plugin -\.(gif|GIF|jp

浏览 22提问于2017-03-14得票数 0

2回答

如何将字体添加到我的项目中，使其正确显示图标？

、、

所以..。我访问了：下载了zip文件，我只想使用图标，所以我抓取fontawesome.min.css文件并连接到我的html文件： <link rel="stylesheet" href="lib/css/fontawesome.min.css"> 在他们的网站上，我找到了一个我想使用的代码： <i class="fas fa-cloud-download-alt"></i> 以上代码的链接如下：我在他们的网站上找到的代码不起作用。我在这里错过了什么？如何将字体添加到我的项目中，使其显示图标？

浏览 0提问于2020-03-05得票数 0

回答已采纳

2回答

为集中式javascript css模板构建系统(监视、连接、缩小)

、、、

刚刚完成新的重新设计(响应性html5)，我想知道运行自动构建系统最简单的方法是什么。我的网站的模板都从两个包含文件的JavaScript和CSS位置抓取，所以我不需要一个构建系统，通过我的整个网站缩小和调整，等等。从本质上说，我想象的工作流是这样的：如果我上传对我的JS或CSS目录的更改，系统会注意到更新，并调用一个细化和连接过程。调用JS和concatenated/串联文件的php文件可以生成一个带有md5哈希的文件名，用于设置长时间过期。最简单的方法是什么？如果只是几个文件，我真的需要安装Grunt等等吗？仅仅使用inotifywait是最好的吗？

浏览 2提问于2013-07-17得票数 1