首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    学习正则表达式 - 提取和替换 XML 标签

    一、需求         使用 lorem.dita 作为示例 XML 文档,通过正则表达式提取出该文档中的所有 XML 标签,并转换为简单的 XSLT 样式表。...)) a from num group_concat(distinct b order by b) 将递归查询返回的多行排序去重,然后合并为以逗号作为分隔符的一行字符串。...convert 函数将 group_concat 返回的一行字符串转为 utf8mb4 字符集。 replace 函数将合并后的一行字符串中的分隔符从逗号换成换行符。        ...内嵌视图 t1 的查询结果即为 去重、排序后的,以换行符作为分隔符的所有标签。 2....替换掉标签属性 select regexp_replace(a,' id=".*"','') a from t1         内嵌视图 t2 的查询结果为去掉属性的所有标签名称。

    72920

    如何分析粉丝兴趣?

    为了便于后期分析粉丝兴趣,请将该表中的这种情况进行拆分为多条。...select max(length(关注媒体id) - length(replace(关注媒体id,',','')) + 1) as 最多关注媒体个数 from 粉丝关注表; 返回结果为: 那我们需要新建的...此处有两个注意点: 1)为保证原表中的每一条数据不丢失,选择“左联结”,并以原表为左表; 2)联结条件里对复制条数进行限制,限制条件是用户关注媒体的数量,即“关注媒体id”字段下的逗号数量加1。...select t1.用户id, t1.关注媒体id, t1.日期, t2.序列 from 粉丝关注表 t1 left join 序列表 t2 on t2.序列...t1.日期 from 粉丝关注表 t1 left join 序列表 t2 on t2.序列 <= (length(关注媒体id) - length(replace(关注媒体id,',','')) + 1

    42610

    【MySQL 系列】MySQL 语句篇_DML 语句

    值的位置和列的位置一一对应;⑤ 当插入多行数据时,多个值列表之间使用逗号分隔;⑥ INSERT 语句返回插入的行数。...[WHERE clause]; 语句说明:① UPDATE 关键字后指定要更新数据的表名;② 使用 SET 子句设置字段的新值。多个字段使用逗号分隔。...以下语句删除 t1 和 t2 表中满足条件的行: DELETE t1, t2 FROM t1 INNER JOIN t2 WHERE t1.id = t2.id; 以下语句删除 t1 表中满足条件的行:...DELETE t1 FROM t1 INNER JOIN t2 WHERE t1.id = t2.id; 以下语句在删除时使用 LEFT JOIN: DELETE t1 FROM t1 LEFT...列名放在小括号中,多个列表使用逗号分隔;④ VALUES 关键字之后的小括号中是值列表。值的数量要和字段的数量相同。值的位置和列的位置一一对应; ⑤ 当插入多行数据时,多个值列表之间使用逗号分隔。

    29710

    如何写优雅的SQL原生语句?

    1. from form是一次查询语句的开端。 如果是一张表,会直接操作这张表; 如果这个from后面是一个子查询,会先执行子查询中的内容,子查询的结果也就是第一个虚拟表T1。...如果需要关联表,使用join,请看2,3 2. join 如果from后面是多张表,join关联,会首先对前两个表执行一个笛卡尔乘积,这时候就会生成第一个虚拟表T1(注意:这里会选择相对小的表作为基础表...on 对虚表T1进行ON筛选,只有那些符合的行才会被记录在虚表T2中。...(级联)删除尤为有用 delete t1,t2 from t_a t1 , t_b t2 where t1.id = t2.id 子查询结果需要使用别名 查看上面一段sql 别名使用注意事项 虽然定义字段别名的...AS 关键字可以省略,但是在使用别名时候,建议不要省略 AS 关键字 书写sql语句的注意事项 书写规范上的注意 字符串类型的要加单引号 select后面的每个字段要用逗号分隔,但是最后连着from的字段不要加逗号

    1.9K20

    精通正则表达式 - 正则表达式实用技巧

    (substring_index(s,',',lv),',',-1) s from t1,t2) select * from t3 where s like '44%';         把 '\d{5...| | 44272 | +-------+ 2 rows in set (0.00 sec) 十、解析CSV文件         逗号分隔的值要么是“纯粹的”,仅仅包含在逗号之前,要么是在双引号之间,这时数据中的双引号以一对双引号表示...非引号格式包含引号和逗号之外的任何字符,可以用 '[^",]+' 匹配。         双引号字段可以包含双引号之外的任何字符(包括逗号和空格),还可以包含连在一起的两个双引号。...分解驱动过程         要解决问题,就不能依赖传动机构的驱动过程来越过逗号,而需要手工控制。能想到的办法有两个: 手工匹配逗号。...其他格式 使用任意字符,例如 ';' 或者制表符作为分隔。         只需要把逗号替换为对应的分隔符。

    93940

    hive学习笔记之二:复杂数据类型

    确保hadoop已经启动; 进入hive控制台的交互模式; 执行以下命令,使查询结果中带有字段名: set hive.cli.print.header=true; ARRAY 创建名为t2的表,只有person...和friends两个字段,person是字符串类型,friends是数组类型,通过文本文件导入数据时,person和friends之间的分隔符是竖线,friends内部的多个元素之间的分隔符是逗号,注意声明分隔符的语法...,接下来是键值对; MAP,建表,导入数据 接下来打算创建名为t3的表,只有person和address两个字段,person是字符串类型,address是MAP类型,通过文本文件导入数据时,对分隔符的定义如下...: person和address之间的分隔符是竖线; address内部有多个键值对,它们的分隔符是逗号; 而每个键值对的键和值的分隔符是冒号; 满足上述要求的建表语句如下所示: create table...之间的分隔符是竖线,info内部的多个元素之间的分隔符是逗号,注意声明分隔符的语法: create table if not exists t4( person string, info struct<

    49410

    擅用子查询,让复杂问题简单化

    *,sc.c_id,sc.score FROM (SELECT * FROM sc WHERE c_id='01') t1 JOIN (SELECT * FROM sc WHERE c_id='02')...首先,它执行下面的查询: SELECT t1.* FROM (SELECT * FROM sc WHERE c_id='01') t1 JOIN (SELECT * FROM sc WHERE c_id...1990-12-21 男 01 70 04 李云 1990-08-06 男 01 50 这里只得到了这两个学生的课程1的成绩,结果需要查询到这两个学生所有课程的成绩,因此需要将上述得到的表格tt再与成绩表连接...然后,这两个值以 NOT IN 操作符要求的逗号分隔的格式传递给外部查询的 WHERE 子句。...子查询中的 WHERE子句使用了完全限定列名,任何时候只要列名可能有多义性,就必须使用这种语法(表名和列名由一个句点分隔)。如果不使用完全限定的列名会与本身匹配。

    51020

    hive学习笔记之二:复杂数据类型

    确保hadoop已经启动; 进入hive控制台的交互模式; 执行以下命令,使查询结果中带有字段名: set hive.cli.print.header=true; ARRAY 创建名为t2的表,只有person...和friends两个字段,person是字符串类型,friends是数组类型,通过文本文件导入数据时,person和friends之间的分隔符是竖线,friends内部的多个元素之间的分隔符是逗号,注意声明分隔符的语法...,接下来是键值对; MAP,建表,导入数据 接下来打算创建名为t3的表,只有person和address两个字段,person是字符串类型,address是MAP类型,通过文本文件导入数据时,对分隔符的定义如下...: person和address之间的分隔符是竖线; address内部有多个键值对,它们的分隔符是逗号; 而每个键值对的键和值的分隔符是冒号; 满足上述要求的建表语句如下所示: create table...和info之间的分隔符是竖线,info内部的多个元素之间的分隔符是逗号,注意声明分隔符的语法: create table if not exists t4( person string, info struct

    48600

    MySQL EXPLAIN详解

    发布渠道表T5,T3,T5表的serial_id关联T1表的serial_id,T2表的user_name关联T1表的create_by,T1,T3,T5的字段serial_id都创建了索引,T2表的user_name...多个索引 如果查询中有多个可以使用的索引,它们将以逗号分隔列在possible_keys字段中。 NULL值 如果possible_keys字段的值为NULL,表示在查询中没有找到可以使用的索引。...多个索引 如果查询中有多个可以使用的索引,它们将以逗号分隔列在key字段中。这表示MySQL优化器可能在多个索引中选择一个用于查询执行。 key_len 使用的索引的长度。...多个ref值 如果查询中有多个连接条件,ref字段的值将以逗号分隔,分别对应不同的连接条件。...Extra 查询执行计划的一些额外信息,如Using index、Using where、Using temporary等。这个字段可以包含多个标志,每个标志之间以分号(;)分隔。

    43210

    MADlib——基于SQL的数据挖掘解决方案(8)——数据探索之描述性统计

    我们先要清楚两个关于统计学的基本概念:总体和样本。统计的总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品。总体中的每一个基本单位,如一件产品称为个体,个体的特征用一个变量,如x来表示。...输出表和概要表中各字段的含义分别由表2、表3给出。 target_cols(可选) VARCHAR 缺省值为‘*’。需要计算相关性的列组成的逗号分隔字符串。...source_table VARCHAR 源表名。 output_table VARCHAR 输出表名。 column_names VARCHAR[] 计算相关性的列名组成的逗号分隔字符串。...汇总结果保存在output_table参数指定的表中,表5给出输出表列的说明。 target_cols(可选) TEXT 缺省值为NULL,请求汇总列组成的逗号分隔字符串。...grouping_cols(可选) TEXT 缺省值为NULL,分组列构成的逗号分隔字符串。如果为NULL,为全表生成汇总统计(不分组)。

    1.5K20
    领券