一、概述 之前利用Scrapy爬取的数据,都是写入在json文件中,现在需要写入到mysql中。...在items.py中,主要有2个字段: class CityItem(scrapy.Item): name = scrapy.Field() url = scrapy.Field()... = "192.168.0.3" MYSQL_PORT = 3306 MYSQL_DBNAME = "qunar" MYSQL_USER = "root" MYSQL_PASSWORD = "abcd@...pipelines here # # Don't forget to add your pipeline to the ITEM_PIPELINES setting # See: https://docs.scrapy.org...dbpool): self.dbpool = dbpool @classmethod def from_settings(cls, settings): # 函数名固定,会被scrapy
一、环境搭建安装Scrapy框架:pip install scrapy创建一个新的Scrapy项目:scrapy startproject google_search进入项目目录:cd google_search...二、爬虫代码import scrapyfrom scrapy.http import Requestfrom urllib.parse import quoteclass GoogleSpider(scrapy.Spider...crawl google_spider查看输出结果,即爬取到的搜索结果。...在Scrapy中,可以使用concurrent_requests参数来设置并发请求数。...在Scrapy中,可以使用try-except语句来实现异常处理。
起因 之前线上遇到一个问题, 就是当MySQL挂了, 然后导致整个服务崩塌, Redis在前面完全没分担任何压力....业务常规的查询逻辑如下: 从redis中获取数据, 有则返回 当第一步redis无数据, 去MySQL查询数据 把第二步查询到的数据写入redis 返回数据 问题分析 redis当然不会有问题, 问题是在第二步的时候...去MySQL查询数据,数据库服务已经宕机, 这时候请求阻塞住 阻塞超时,然后抛出异常,导致无法走到第三步 下一次请求来, 又继续去连接MySQL,无限阻塞,把业务服务器也拖垮 解决方案 这是我们的解决方案...当MySQL宕机强制缓存空数据到redis,允许部分页面为空.而不是无法提供服务 解决思路 设置好合理的MySQL连接超时时间 mysqlnd.net_read_timeout = 3 当数据库连接超时之后...])) { // 记录日志, 通知xxx // Log::error($e); // 强制返回空集合
SUBQUERY(subquery):子查询中的第一个SELECT,结果不依赖于外部查询。...UNCACHEABLE SUBQUERY(uncacheable subquery):(一个子查询的结果不能被缓存,必须重新评估外链接的第一行) 3 table 输出结果集的表名称。...4 partitions 输出结果集的表所在的分区 5 TYPE type显示的是访问类型,是较为重要的一个指标,结果值从好到坏依次是: Null > system > const > eq_ref >...Using temporary:为了解决查询,MySQL需要创建一个临时表来容纳结果集,常见于排序和分组查询,常见 group by、order by。...Impossible where:这个值强调了where语句会导致没有符合条件的行(通过收集统计信息不可能存在结果)。
我们可以使用拼接来完成这个操作: 使用mysql的CONCAT函数,可以满足我们的需求。
1、items.py -- coding: utf-8 -- import scrapy class LearnscrapyItem(scrapy.Item): name = scrapy.Field...() link = scrapy.Field() 2、settings.py -- coding: utf-8 -- BOT_NAME = 'learnscrapy' SPIDER_MODULES =...import HttpProxyMiddleware 导入有关用户代理有关的模块 from scrapy.downloadermiddlewares.useragent import UserAgentMiddleware...self, spider): self.cur.close() self.conn.close() 5、spiders/test.py -- coding: utf-8 -- import scrapy...from scrapy.linkextractors import LinkExtractor from scrapy.spiders import CrawlSpider, Rule from
方法一: 直接执行命令: mysql> select count(1) from table into outfile '/tmp/test.xls'; Query OK, 31 rows affected...'; 报错: ERROR 1 (HY000): Can't create/write to file '/data/test.xls' (Errcode: 13) 可能原因:mysql没有向/data/...下写的权限,没有深究 方法二: 查询都自动写入文件: mysql> pager cat > /tmp/test.txt ; PAGER set to 'cat > /tmp/test.txt' 之后的所有查询结果都自动写入.../tmp/test.txt',并前后覆盖 mysql> select * from table ; 30 rows in set (0.59 sec) 在框口不再显示查询结果 以上参考:http://blog....163.com/cpu_driver/blog/static/117663448201111295420990/ 方法三: 跳出mysql命令行 [root@SHNHDX63-146 ~]# mysql
方式一 在mysql命令行环境下执行: sql语句+INTO OUTFILE +文件路径/文件名 +编码方式(可选) 例如: select * from user INTO OUTFILE '/var.../lib/mysql/msg_data.xls ' ; 注意事项: 0)可能会报没有 select command denied(没有查询权限) 或者 Access denied for user(没有...生成的文件中可能会有中文乱码问题,可以在语句后面+CHARACTER SET gbk (utf8等) 例如: select * from user INTO OUTFILE '/var/lib/mysql...命令执行 ,不需要登录进mysql命令行环境下。...例如: mysql -u用户名 -p密码 --default-character-set=gb2312 -e"select * from a" 数据库名 > 1.txt 若有中文乱码,添加设置编码方式
MySQL 结果排序-- 聚集函数 一、环境准备 二、查询结果排序 三、查询的分组与汇总 3.1、查一下 学生们平均年龄 3.2、查一下总人数是多少 3.3、查一下每个年龄有多少人 3.4、查出最大年龄...INTO `student` VALUES (3, '小明', '男', 20, 85); INSERT INTO `student` VALUES (4, '小张', '男', 21, 87); 二、查询结果排序...语法格式: SELECT 字段名1… FROM 表名 ORDER BY 字段名1 [ASC | DESC ] ,字段名2 [ASC | DESC ]…; 字段名1 、2 是对查询结果排序的依据。...3.5、查询出男女各多少人 select sex ,count(*) AS "人数" from student GROUP BY sex; #GROUP BY 是将结果按照 后面跟的字段名分组 3.6
mysql -hxx -uxx -pxx -e "query statement" db > file 例如: mysql -h127.0.0.1 -uroot -p000000 -e"select... host ip user password query statement database filename 这样会输出列名信息,如果不想输出列名信息: mysql...from a" test > 1.txt host ip user password query statement database filename 或 mysql...-hxxx -uxx -pxx select * from table into outfile 'xxx.txt'; 例如: mysql -h127.0.0.1 -uroot -p000000...-e执行导出到文件的sql语句 mysql -hxx -uxx -pxx -e "query statement" db 例如: mysql -h127.0.0.1 -uroot -p000000
MySQL中explain的结果字段介绍(二) 昨天说完了执行计划的前四个字段,今天说说后面几个字段吧。...我们看看explain的基本语法和输出内容: mysql ::>>explain select ; +----+-------------+-------+------+---------------+...mysql:yeyztest 17:30:49>>show create table test_explain\G *************************** 1. row ********...此时表test_explain的存储引擎是myisam,有2条记录,我们修改存储引擎为innodb,然后删除1条记录,再来看结果: mysql:yeyztest 17:41:55>>alter table...warning (0.00 sec) index_merge 顾名思义,这个意思是索引合并,也就是说当我们在一个SQL中使用了字段的时候,这两个字段又分别使用了索引,那么这个时候就会取这两个字段的交集作为结果展示给客户端
从最好到最差的连接类型为const、eq_reg、ref、range、index和ALL type显示的是访问类型,是较为重要的一个指标,结果值从好到坏依次是:system > const >...将在表4.3中讨论,但这里可以看到的坏的例子是Using temporary和Using filesort,意思MYSQL根本不能使用索引,结果是检索会很慢 extra列返回的描述的意义 Distinct...这里,MYSQL需要创建一个临时表来存储结果,这通常发生在对不同的列集进行ORDER BY上,而不是GROUP BY上 Where used 使用了WHERE从句来限制哪些行将与下一张表匹配或者是返回给用户...Using temporary:为了解决查询,MySQL需要创建一个临时表来容纳结果。 Using where:WHERE 子句用于限制哪一个行匹配下一个表或发送到客户。...一.select_type的说明 1.UNION: 当通过union来连接多个查询结果时,第二个之后的select其select_type为UNION。
host=`mysql -u$user -p$pass -D $db -e "select host from user;"` or host=$(mysql -u$user -p$pass...-D $db -e "select host from user;") 将结果用 | grep -v host 筛出来至变量中~不用循环了。。。...参考 百度知道~ 循环取出结果至变量
SELECT UNION:UNION中的第二个或后面的SELECT语句 DEPENDENT UNION:UNION中的第二个或后面的SELECT语句,取决于外面的查询 UNION RESULT:UNION 的结果...Extra 该列包含MySQL解决查询的详细信息 Distinct:MySQL发现第1个匹配行后,停止为当前的行组合搜索更多的行。...Using temporary:为了解决查询,MySQL需要创建一个临时表来容纳结果。 Using where:WHERE 子句用于限制哪一个行匹配下一个表或发送到客户。...SELECT UNION:UNION中的第二个或后面的SELECT语句 DEPENDENT UNION:UNION中的第二个或后面的SELECT语句,取决于外面的查询 UNION RESULT:UNION 的结果...Using temporary:为了解决查询,MySQL需要创建一个临时表来容纳结果。 Using where:WHERE 子句用于限制哪一个行匹配下一个表或发送到客户。
在其他的关系型数据库中,都有rownum这类型的内置函数来提供查询结果的行号,但是MySQL没有,阿福也一直觉得奇怪。 虽然没有这玩意,但是需求还是要完成的,所以只能用其他的途径来实现了。...其实熟悉MySQL语句的应该都能看懂。无非就是定义了一个用户变量来实现自增。 当然这个变量是永久变量还是临时变量就不晓得了。...阿福在测试的时候发现,该变量接执行结果后还是保留的,却不知道数据库重启之后该变量是否保留。 未经允许不得转载:RffanLAB|Rffan实验室 » MySQL 在查询结果中记录行号
如图,公司在统计实际成交金额时,比如我支付1分钱,但是数据库里存的金额是100,所以在统计实际金额时,我需要将金额在除以100,如图
SELECT UNION:UNION中的第二个或后面的SELECT语句 DEPENDENT UNION:UNION中的第二个或后面的SELECT语句,取决于外面的查询 UNION RESULT:UNION 的结果...Using temporary:为了解决查询,MySQL需要创建一个临时表来容纳结果。 Using where:WHERE 子句用于限制哪一个行匹配下一个表或发送到客户。...SELECT UNION:UNION中的第二个或后面的SELECT语句 DEPENDENT UNION:UNION中的第二个或后面的SELECT语句,取决于外面的查询 UNION RESULT:UNION 的结果...Using temporary:为了解决查询,MySQL需要创建一个临时表来容纳结果。 Using where:WHERE 子句用于限制哪一个行匹配下一个表或发送到客户。...一.select_type的说明 1.UNION: 当通过union来连接多个查询结果时,第二个之后的select其select_type为UNION。
局限性:批量查询时,数据量不可控,范围越大,内存越可能扛不住,单次查询结果量可预估时酌情考虑,不确定的话不推荐。 方案2:子查询的ORDER BY配合LIMIT使用。...局限性:需要对可能导致查询结果中GROUP BY字段数据非唯一的情况做考虑(本需求要求查询结果中销售数据唯一,影响唯一的字段是check_time(大)、create_time(小),若还有其他字段,则需要再次关联...MAX的结果),影响字段越多,则关联的子查询越多,降低性能。
CONCAT 将多个结果作为字符串拼接在一起 concat(str1,str2,...)...: select concat(o.user_name,o.user_number) from user o where user_id = '1' 但是如果查询过程中有一个字符串为 null 则整个结果都将是...null 转换为 “ select concat(IFNULL(o.user_name,''),o.user_number) from user o where user_id = '1' 如果想将结果分隔...CONCAT_WS 将多个结果拼接在一起,使用指定的分隔符 concat_ws(separator,str1,str2,...)...,也不会返回 null ,但是如果将分隔符指定为 null 则结果会全变成 null GROUP_CONCAT 将多行的字符串分组整合成一个字符串,必须配合 group 使用 group_concat(
数据操作语言:结果集排序 如果没有设置,查询语句不会对结果集进行排序。也就是说,如果想让结果集按照某种顺序排列,就必须使用 ORDER BY 子句。 SELECT ......