腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
import.io和
portia
正则表达式url模式
、
、
我使用的是数据采集器: Import.io &
Portia
。我该如何解释结尾的"pdi-medical"?我已经看遍了所有地方,并且理解了如何在
JS
环境中使用regex,但是我有点困惑,我不知道我到底在
Portia
/Import.io上输入了什么 像这样吗?^a-zA-Z0-9-_+$/
浏览 16
提问于2016-09-09
得票数 0
1
回答
windows上的
portia
(scrapy/slybot)错误
、
、
、
我安装了
portia
并让它工作,我注释了一些网站(看起来真的很好),但当我试图运行蜘蛛时,我得到了一些错误,没有什么被抓取C:\Python27\Scripts>python portiacrawl C:\
portia
\slyd\data\projects\new_projectFile"portiacrawl", line 7, in <module>File
浏览 7
提问于2014-04-05
得票数 0
1
回答
如何在
Portia
视觉刮伤中使用regex?
、
、
、
我可以用
Portia
网络
爬虫
来注释网页,我的问题是如何在提取数据的同时使用Regex。我已经从一页中提取了位置。
浏览 2
提问于2015-01-21
得票数 1
回答已采纳
1
回答
试图在OSX或Ubuntu上安装
Portia
、
、
、
在我使用twistd命令之前,一切都进行得很顺利,我得到了以下信息: (
portia
)Matts-Mac-mini:slyd matt$ twistd -n slyd Traceback (most>最近一次调用):File "/Users/matt/
portia
/bin/twistd",第14行,在run() File () File "/Users/matt/
portia
/lib/python2.7
浏览 2
提问于2015-02-01
得票数 1
4
回答
如何安装
portia
,一个来自Github (Mac)的python应用程序
、
、
、
、
我正在尝试安装
Portia
,一款来自Github:的python应用程序。我在命令行中使用以下步骤: cd slyd 运行波西亚
浏览 2
提问于2014-05-04
得票数 2
回答已采纳
1
回答
安装
portia
时出现安装错误
、
我在为
portia
创建虚拟环境以运行的文章中谈到了要点。我正在尝试使用pip安装所需的软件包。它因而失败。我甚至尝试了如下:$ python ../.."c:\
Portia
\
portia
_env\lib\site-packages\twisted\__init__.py",
浏览 9
提问于2014-12-04
得票数 0
1
回答
如何让波西亚蜘蛛跑起来?
、
、
我使用以下代码之一: docker run -i -t --rm -v /home/raphael/Documents/entreprise/
portia
/
portia
-master/test:/app/data/projects:rw -v /home/raphael/Documents/entreprise/
portia
/res:/mnt:rw -p 9001:9001
浏览 10
提问于2018-01-15
得票数 0
1
回答
在字符串数组的情况下,Ruby产品方法的行为不同
first_array = ["orange", "purple", "colour-black"]返回,意外地: [["orange", ["sputter", "ribus"]], [&quo
浏览 2
提问于2021-04-16
得票数 0
回答已采纳
1
回答
Portia
接口不工作
、
、
在我的mac上运行和打开
portia
接口时,我遇到了问题,我安装了
portia
,就像它是写在doc: git克隆上一样vagrant init hashicorp/precise32
浏览 1
提问于2015-12-30
得票数 0
回答已采纳
1
回答
如何在
Portia
下拉列表中添加默认字段名称?
、
、
、
、
我已经从()下载了
Portia
,并在我的windows机器上安装了
Portia
,同时启动
Portia
我可以对页面进行注释。我可以使用create new选项根据需要选择字段并添加名称。
浏览 3
提问于2015-01-20
得票数 0
1
回答
我怎样才能得到最少的网站文章使用波西亚
、
我正在使用
portia
爬行一个网站的文章,现在我想知道如何才能得到每天最少的文章,当运行
portia
蜘蛛? 我有一个想法:使用本文中的日期时间,与现在的datetime.But相比,还有更好的吗?
浏览 5
提问于2015-09-01
得票数 1
回答已采纳
1
回答
ImportError:加载名为scrap.middlewares的对象'scrap.middlewares.RandomUserAgentMiddleware':No模块时出错
、
、
我在~/
portia
/slyd/data/projects/scrap安装中有一个
portia
项目,在DOWNLOADER_MIDDLEWARES中使用scrap.middlewares.RandomUserAgentMiddleware,RandomUserAgentMiddleware是在~/
portia
/slyd/data/projects/scrap/middlewares.py中定义的。
浏览 2
提问于2014-09-18
得票数 0
3
回答
角度双向数据绑定不工作
、
、
、
input type="checkbox"/></td> <
portia
-tdvalue="{{value}}"></
portia
-td></tr>return
浏览 1
提问于2014-09-04
得票数 1
回答已采纳
2
回答
使用
portia
(scrapy)从网站中提取Meta标签
、
、
、
使用
portia
(scrapy)从网站中提取Meta标签我只能从body标签中提取数据
浏览 6
提问于2014-11-27
得票数 1
1
回答
如何在提取值后对其进行转换?
、
、
我正在使用
Portia
从页面中提取信息。但是,提取的其中一个值不是我可以使用的格式。我现在要做的是将数据导出到csv,然后使用sed替换有问题的数字。 谢谢
浏览 8
提问于2018-08-30
得票数 0
1
回答
如何在
portia
中呈现javascript页面?
、
、
、
、
我正在使用
portia
来使用scrapinghub/splash中间件来呈现JavaScript页面。但在
portia
中加载作业页时似乎出现了以下错误。平台:
portia
-scrapy + scrapinghub/splash。注:本人亦曾尝试下列指示: 1.
浏览 0
提问于2015-01-19
得票数 1
1
回答
没有找到这样的资源文件
、
我正在跟踪
portia
的,并且我被困在运行th服务器上。twistd -n slyd 在浏览器中,我得到404错误。
浏览 2
提问于2015-03-09
得票数 1
1
回答
脚本在html中工作,但外部不起作用。
、
、
、
DOCTYPE html><head> <link rel="stylesheet" href="scripts/
Portia
.css"><body> <div cla
浏览 0
提问于2019-03-14
得票数 0
回答已采纳
3
回答
为什么python会抛出一个"ImportError:没有名为linkextractor的模块“,即使Scrapy模块已经安装了?
、
、
、
、
我还安装了virtualenv (按照推荐)并执行了virtualenv
Portia
,以便仅为该项目创建一个python虚拟环境。现在它需要使用twistd -n slyd启动twisted服务器,但随后抛出了一个错误: from .base import BaseLinkExtractor, ALLOWED_SCHEMES
浏览 1
提问于2014-04-05
得票数 3
1
回答
无法使用scrapyd在centos7中部署
portia
、
、
、
、
我已经安装了
portia
和scrapyd。使用
Portia
创建了新项目-一切正常然后,我将new_folder复制到其他一些不同的路径进行部署。
浏览 1
提问于2015-02-17
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
走近代码之Python-爬虫框架Portia
爬虫之旅(2)——网页知识储备html、css及js
(新版完结无密)Python 分布式爬虫与 JS 逆向进阶实战
(新版)Python 分布式爬虫与 JS 逆向进阶实战-梦里有时终须有
新技术栈爬虫工具 Crawlee:功能强大,自适应并发,支持 JS 渲染和防封锁
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券