首页
学习
活动
专区
圈层
工具
发布

excel数据提取技巧:从混合文本中提取数字的万能公式

一种是提取数值,有正负之分大小之别,也有小数点;另一种是提取数字字符串,如电话号码、身份证号码等,这里的数字没有小数和负号,也没大小之分。...四、提取数值的万能公式 情景特征:除了目标数值,文本中不存在其他数字,否则容易产生干扰。...于是,MIDB函数的功能就是从③确定的起始位置开始,分别从A2单元格文本中截取长度为1-100个字节的100个不等长字符串E{"-","-2","-29","-299",…"-299.19"}。...② LARGE(①,ROW($1:$100)) 通过LARGE函数,将①中的字符位置值集合从大到小重新排序。由于数字在文本中的位置总是大于0,且数字越靠后,位置值越靠前。而其他字符总是小于0的。...这些通通交由*10^ROW($1:$100)/10完成,它通过构建一个多位数来将各个数字顺序摆放,最终将代表文本的有效数位前的0值省略,其余数字按次序从个位开始向左排列。最终的多位数即数字提取结果。

8K20

Excel公式技巧10: 从字符串中提取数字——数字位于字符串开头

本文主要研究从字符串开头提取数字的技术: 1. 这些数字是连续的 2. 这些连续的数字位于字符串的开头 3....字符串中除开头外其他地方也有数字,要么在末尾,要么在中间,例如123ABC456或123ABC456DEF。...这就是在开始给lookup_vector(通过创建一个由负数、零(如果期望提取的字符串以0开头例如0123ABC)或错误值组成的数组)中的值添加负号的原因,可以确保lookup_value为1永远是一个充分而合法的选择...当然,这不是唯一会出现这种情况的字符串,实际上,任何可以被Excel解释为日期的字母数字都会如此,例如30SEP、01FEB等,这也会导致不正确的结果。...MATCH/ISNUMBER组合确保字符串中除开头以外的数字不会影响最终的结果。

3.9K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Excel公式技巧11: 从字符串中提取数字——数字位于字符串末尾

    上篇文章讲解了提取位于字符串开头的数字的公式技术,本文研究从字符串开头提取数字的技术: 1. 这些数字是连续的 2. 这些连续的数字位于字符串的末尾 3....“0123456789”效果相同,详见《Excel公式技巧08. 17分之一和其他全数字(pandigitals)》。...LOOKUP与RIGHT 公式2: =-LOOKUP(0,-RIGHT(A1,ROW(INDIRECT("1:"& LEN(A1))))) 这个公式与上一篇文章《Excel公式技巧10:从字符串中提取数字...456 下面,我们来看看字符串中除末尾以外的数字会不会影响最终的结果。...“”中第一个非数字字符自右向左出现的位置,减1表示数字字符出现的位置: =0+RIGHT("ABC456",3) 结果为: 456 可以看到,由于是从右向左取数,因此在字符串的其它位置存在数字并不会影响结果

    3.2K20

    SQL 从字符串中提取数字

    4 0 5 123.0 6 0123 7 01#123 8 0$123 我们希望能从字段 v 的数据中提取出所有数字...,重新组合成数值(数字在字符串中出现的相对顺序不变)。...,然后过滤掉非数字字符,最后把剩下的数字按照出现的顺序组合成数值。...把字符串拆分成多个字符,可以使用递归的方式实现,也可以先和数字辅助表(有 1 ~ 15的自然数)做笛卡尔积连接,再分割出每个字符。 先来看比较简单的实现方案,也就是使用笛卡尔积的实现方案。...从打印的结果中可以看出,我们已经将字符串拆分成单个字符,并且还保持了字符出现的相对顺序。 最后,我们将非数字的字符过滤掉,再使用GROUP_CONCAT() 将数字字符拼接到一块。

    3.1K40

    Excel公式技巧13: 从字符串中提取数字——将所有数字提取到单个单元格

    前三篇文章分别讲解了提取位于字符串开头和末尾的数字的公式技术、提取字符串中所有的数字并放在不同的单元格中的公式技术,本文研究从字符串中提取所有数字并将这些数字作为单个数字放置在单个单元格中的技术。...本文使用与上一篇文中相同的字符串: 81;8.75>@5279@4.=45>A?...1:"& LEN(A1))),1)/10,"")) 原理解析 现在,我们应该很熟悉ROW/INDIRECT函数组合了: ROW(INDIRECT("1:" & LEN(A1))) 生成由1至单元格A1中的字符串长度数组成的数组...,本例中A1里的字符串长度为24,因此得到: {1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;22;23;24} 由1+LEN(A1)=25...NPV函数具有一个好特性,可以忽略传递给它的数据区域中的空格,仅按从左至右的顺序操作数据区域内的数值。

    3.1K40

    python从字符串中提取数字

    1、使用正则表达式,用法如下: ## 总结 ## ^ 匹配字符串的开始。 ## $ 匹配字符串的结尾。 ## \b 匹配一个单词的边界。 ## \d 匹配任意数字。 ## \D 匹配任意非数字字符。...## 正则表达式中的点号通常意味着 “匹配任意单字符” 2、解题思路: 既然是提取数字,那么数字的形式一般是:整数,小数,整数加小数; 所以一般是形如:—-.—–; 根据上述正则表达式的含义...\d*”; \d+ 匹配1次或者多次数字,注意这里不要写成*,因为即便是小数,小数点之前也得有一个数字; \.?...这个是匹配小数点的,可能有,也可能没有; \d* 这个是匹配小数点之后的数字的,所以是0个或者多个; 3、代码如下: # -*- coding: cp936 -*- import re string

    4K20

    如何使用Python提取PDF表格及文本,并保存到Excel

    ('test.xlsx') table_df 输出: 一个小小的脚本,不到十行代码,便将PDF表格提取并转化为dataframe格式,最终保存到excel。...pdfplumber.Page类 这是pdfplumber的核心功能,对PDF的大部分操作都是基于这个类,包括提取文本、表格、尺寸等。 这里暂不一一列举它的属性和方法。...在实际项目所需处理的PDF文档中,线框完全及不完全的表格都比较多,为了能够理解pdfplumber实现表格抽取的原理和方法,我们需要去细究相关参数的设置。...正如案例所示,pdfplumber.Page对象的.extract_table()方法可以提取表格,返回从页面上最大的表中提取的文本,以列表列表的形式显示,结构为row -> cell。...首先,pdfplumber能轻松访问有关PDF对象的所有详细信息,且用于提取文本和表格的方法高级可定制,使用者可根据表格的具体形式来调整参数。

    5.6K20

    如何使用python提取pdf表格及文本,并保存到excel

    ('test.xlsx') table_df 输出: 一个小小的脚本,不到十行代码,便将pdf表格提取并转化为dataframe格式,最终保存到excel。...「pdfplumber.Page类」 这是pdfplumber的核心功能,对pdf的大部分操作都是基于这个类,包括提取文本、表格、尺寸等。 这里暂不一一列举它的属性和方法。...在实际项目所需处理的pdf文档中,线框完全及不完全的表格都比较多,为了能够理解pdfplumber实现表格抽取的原理和方法,我们需要去细究相关参数的设置。...正如案例所示,pdfplumber.Page对象的.extract_table()方法可以提取表格,返回从页面上最大的表中提取的文本,以列表列表的形式显示,结构为row -> cell。...首先,pdfplumber能轻松访问有关PDF对象的所有详细信息,且用于提取文本和表格的方法高级可定制,使用者可根据表格的具体形式来调整参数。

    3.8K30

    Excel经典公式:提取位于字符串后面的数字

    标签:公式与函数 有时候,可能有一个数据集,单元格中包含着文本和数字,其中数字在字符串的右侧,如下图1所示,你希望删除所有文本,而只保留数字。...图1 下面的公式将删除数字左侧的所有文本,因此只剩下字符串中的数字部分。...图2 上面的公式移除了单元格中左侧的文本部分,只剩下右侧的数字。 公式中: FIND({0,1,2,3,4,5,6,7,8,9},A2) 将在单元格中查找这10位数字,并返回这些数字的位置组成的数组。...接着,使用了MIN函数来找出数组中的最小值,即该单元格中数字的起始位置。例如,在单元格A2中,它会提供值13,这意味着该单元格中的文本部分在第12个字符处结束,数字从第13个字符开始。...最后,使用了RIGHT函数从右侧提取所有数字,这意味着左侧的所有文本字符都被删除了。 欢迎在下面留言,完善本文内容,让更多的人学到更完美的知识。

    5.2K40

    关于从文本中提取数字,这些公式各显神通

    下面图1所示是示例数据,从单元格内容中提取出红色标识的数字。 图1 注:示例数据来源于chandoo.org。...首先会想到的是,使用FIND函数或者SEARCH函数查找“(”和最后一个空字符的位置,然后使用MID函数取出数字,公式如下: =MID(A1,FIND("(",A1)+1,SEARCH("",A1,FIND...: =NPV(-0.9,,IFERROR(MID(RIGHT(A1,8),1+LEN(RIGHT(A1,8))-ROW(OFFSET(A$1,,,LEN(A1))),1)%,"")) 但只适用于单元格中的数字不大于...其实,还可以使用Excel的快速填充功能,如下图2所示。 图2 在单元格B7中输入数字23,然后单击功能区“开始”选项卡“编辑”组中的“填充——快速填充”,即可完成。...注:有兴趣的朋友可以到知识星球完美Excel社群下载本文配套示例工作簿。

    1.6K30

    Excel公式技巧12: 从字符串中提取数字——将所有数字分别提取到不同的单元格

    前两篇文章分别讲解了提取位于字符串开头和末尾的数字的公式技术,本文研究从字符串中提取所有数字的技术: 1. 字符串由数字、字母和特殊字符组成 2. 数字在字符串的任意地方 3....字符串中的小数也一样提取 3. 想要的结果是将所有数字返回独立的单元格 例如,在单元格A1中的字符串: 81;8.75>@5279@4.=45>A?...因为希望从字符串里考虑成对的字符,所以需要将字符串里位置1中的字符和位置2中的字符比较、位置2中的字符和位置3中的字符比较,依此类推。...因此,Arry2后生成的数组让我们可以知道字符串中的字符从数字变为非数字或者从非数字变为数字的位置。 3....FALSE;FALSE;14;15;FALSE;17;18;FALSE;20;FALSE;FALSE;FALSE;FALSE},2*COLUMNS($A:A)+{-1,0})*{-1,1}) 上面生成的数组中的数值代表着字符串中从非数字到数字或者从数字到非数字的位置

    5.9K30

    Excel公式技巧22: 从字符串中提取指定长度的连续数字子串

    本文给出了一种从可能包含若干个不同长度的数字的字符串中提取指定长度的数字的解决方案。在实际的工作表中,存在着许多此类需求,例如从字符串中获取6位数字账号。...20/04/15 - VAT Reg: 1234567: Please send123456 against Order #98765, Customer Code A123XY, £125.00 从该字符串中提取出现的一个...在字符串中正确定位一个6位数字,需要考虑在与任意6个连续数字的字符串相邻的之前和之后的字符,并验证这两个字符都不是数字。...由于解决方案的关键之处在于有效地测试所有长度为8个字符的子字符串,并验证其中的子字符串依次由1个非数字、6个数字和1个非数字组成。对于6个数字处于字符串的开头或结尾的情况,进行适当调整。...可以使用例如 ISNUMBER达到这个目的,这里选择的ISERR同样出色,因为当尝试强制转换为数字时(例如这里使用+0),唯一不会导致错误的单字符字符串就是从0到9的数字。

    3.5K20

    Excel公式练习:查找每行中的最小值并求和(续)

    在《Excel公式练习:查找每行中的最小值并求和》中,我们提供的示例数据每行只有2列,如果数据有3列,又如何求每行最小值之和呢? 本次的练习是:如下图1所示,求每行最小值之和。...解决方案 公式1:《Excel公式练习:查找每行中的最小值并求和》中的公式5可以应用到3列: =SUM(LARGE(A1:C10,MOD(LARGE(ROW(A1:C10)*10^6+RANK(A1:C10...如果数据集中的数字恰好也是如此,那么这个数字就必须增加。 让我们更详细地了解一下它是如何工作的。...2.将其与ROW函数结合,乘以足够大的数字,使RANK值即使在组合后也不会改变。使用ROW函数可自动确保结果值按行分组,从而更容易提取行最大值。...3.从第一个值开始,通过查看数组中的每n个值来提取行最大值,其中n是原始数据集中的列数。

    3.2K40
    领券