前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【C++】算法集锦(11):敏感词过滤算法(DFA)

【C++】算法集锦(11):敏感词过滤算法(DFA)

作者头像
看、未来
发布于 2021-09-18 02:29:54
发布于 2021-09-18 02:29:54
87400
代码可运行
举报
运行总次数:0
代码可运行

文章目录

DFA:确定的 有穷 状态机 如果 设计模式 中的状态模式比较熟的话,这个就很清楚了。 DFA常用于敏感词过滤。


什么是 确定的、有穷状态、机

啊,看这个名字,就通俗易懂了嘛。首先它是个机,干嘛用的机我说一下:模式串筛选用的机。

常用于从复杂的字符串中筛选有效信息,可以是敏感词啊、词法编辑(编译器使用)等方面。 当然,这是常用,别人这么用。

它这个功能特性啊,我很喜欢。确定、有穷状态,能想到什么?图,流程图! 再细想,什么流程图?动态流程图,是吧,很自然吧。

普通流程图那流程都锁死了,按部就班就好了,但是动态流程就不一样了,可能有的人不知道什么叫动态流程图,不知道正常,我刚起的名字。动态联编知道吧,就那意思。

我觉得,DFA的机制很适合用于动态流程图的实现,特别是复杂的,动态流程图。当然,动态流程图是可以暴力硬写的,就是代码肥了点而已。


跟我一起看个栗子

这也是我最初接触到DFA的栗子,当时我就是暴力硬写,当然,代码肥的我都没脸贴当时那篇博客里去。

请你来实现一个 atoi 函数,使其能将字符串转换成整数。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:

如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。

在任何情况下,若函数不能进行有效的转换时,请返回 0

提示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
本题中的空白字符只包括空格字符 ’ ’ 。
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [231, 2311]。
如果数值超过这个范围,请返回 INT_MAX (2311)INT_MIN (231)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
示例 1:

输入:42输出: 42
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
示例 2:

输入: " -42"
输出: -42
解释: 第一个非空白字符为 ‘-, 它是一个负号。
我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
示例 3:

输入:4193 with words”
输出: 4193
解释: 转换截止于数字 ‘3’ ,因为它的下一个字符不为数字。
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
示例 4:

输入: “words and 987输出: 0
解释: 第一个非空字符是 ‘w’, 但它不是数字或正、负号。
因此无法执行有效的转换。
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
示例 5:

输入:-91283472332输出: -2147483648
解释: 数字 “-91283472332” 超过 32 位有符号整数范围。
因此返回 INT_MIN (231)

来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/string-to-integer-atoi 著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。


DFA图解

我们的程序在每个时刻有一个状态 s,每次从序列中输入一个字符 c,并根据字符 c 转移到下一个状态 s’。这样,我们只需要建立一个覆盖所有情况的从 s 与 c 映射到 s’ 的表格即可解决题目中的问题。

上面这个图是不是看不太懂,没关系,我也看不懂。 但是下面这个表那得看懂:

是吧,第一栏是输入,第一列是状态。其他部分就是特定状态下,遇到特定输入,会触发什么状态。

这个表嘛,当状态为in_number的时候意味着可以计数了,为signed的时候意味着是符号,为end的时候就意味着该收拾收拾走了。

那,该怎么把这个表转换为代码呢?


DFA示例实现代码

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include<iostream>

#include<vector>

using namespace std;

int DFA(vector<char>& cvec)
{
	vector<vector<int>> vec = { {0,1,2,3},{3,3,2,3},{3,3,2,3},{3,3,3,3} };	//DFA

	int stat = 0;//实时状态,初始化为0

	int ret = 0;	//数据纪录,姑且初始化为0吧
	int flag = 1;//正负号纪录

	for (int sz = 0; sz < cvec.size(); sz++)
	{	
		//这里是状态机走一圈
		if (isspace(cvec[sz]))
			stat = vec[stat][0];
		else if (cvec[sz] == '+' || cvec[sz] == '-')
			stat = vec[stat][1];
		else if (isdigit(cvec[sz]))
			stat = vec[stat][2];
		else
			stat = 3;
		
		//状态机走完该判断状态了
		if (stat == 3)
			return ret * flag;
		else if (stat == 1)	//这个最多也就一次机会进了
		{
			if (cvec[sz] == '-')
				flag = -1;
		}
		else if (stat == 2) {}
			//对数据进行叠加处理,这边建议先放到数组里,等返回的时候(stat == 3)一次性处理
	}
}
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/02/24 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
高频原题——LeetCode题目8:字符串转换整数 (atoi)
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
二环宇少
2020/08/13
3350
高频原题——LeetCode题目8:字符串转换整数 (atoi)
LeetCode-面试题67-把字符串转化成整数
写一个函数 StrToInt,实现把字符串转换成整数这个功能。不能使用 atoi 或者其他类似的库函数。
benym
2022/07/14
2130
【每日算法Day 89】手动实现字符串转整数(atoi)函数,你会吗?
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
godweiyang
2020/04/14
4790
LeetCode 8. 字符串转换整数 (atoi)
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
freesan44
2020/06/08
4630
leecode刷题(16)-- 字符串转换整数
当我们寻找到的第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字组合起来,作为该整数的正负号;假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。
希希里之海
2019/03/06
5570
【每日一题】【leetcode】15. 字符串-把字符串转换成整数
写一个函数 StrToInt,实现把字符串转换成整数这个功能。不能使用 atoi 或者其他类似的库函数。
aneutron
2022/08/10
1750
Leetcode-8.字符串转换整数 (atoi)
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
悠扬前奏
2020/05/18
7030
图解LeetCode——剑指 Offer 67. 把字符串转换成整数
写一个函数 StrToInt,实现把字符串转换成整数这个功能。不能使用 atoi 或者其他类似的库函数。
爪哇缪斯
2023/05/10
1990
图解LeetCode——剑指 Offer 67. 把字符串转换成整数
程序员进阶之算法练习(四十九)LeetCode
题目链接 题目大意: 给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。 你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。
落影
2020/12/09
4840
LeetCode - #8 字符串转换整数 (atoi)
实现一个 func myAtoi(_ str: String) -> Int 函数,使其能将字符串转换成一个 32 位有符号整数(类似 C/C++ 中的 atoi 函数)。
Swift社区
2021/12/06
4820
leetcode刷题(115)——剑指 Offer 67. 把字符串转换成整数
写一个函数 StrToInt,实现把字符串转换成整数这个功能。不能使用 atoi 或者其他类似的库函数。
老马的编程之旅
2022/06/22
3450
leetcode - 字符串转换整数 (atoi)
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
江涛学编程
2021/01/28
7640
LeetCode 刷题笔记——day 6
如果反转后整数超过 32 位的有符号整数的范围 [−231, 231 − 1] ,就返回 0。
h-t-m
2022/11/24
3710
LeetCode 刷题笔记——day 6
【LeetCode】8. 字符串转换整数 (atoi)
当我们寻找到的第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字组合起来,作为该整数的正负号;假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。
韩旭051
2020/06/23
5510
【LeetCode】8. 字符串转换整数 (atoi)
【LeetCode08】字符串转换整数
1 )删除掉字符串的空格,这里用到了lstrip()方法,截掉字符串左边的空格或指定字符
Sam Gor
2019/07/08
6910
研一月总结之LeetCode攀登之旅(6)
现在的内心状态是“心累”。目前方向未定,甚感迷茫,paper无望,已绝望,跟之前考研的所有的想法均有落差,这也许是自己要去提升的一个“落差度”吧。
公众号guangcity
2019/09/20
3990
【刷穿 LeetCode】8. 字符串转换整数 (atoi)
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
宫水三叶的刷题日记
2021/02/20
4400
python实现字符串转换整数
当我们寻找到的第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字组合起来,作为该整数的正负号;假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。
py3study
2020/01/17
1.4K0
【打卡贴】(No.008)字符串转整数 (atoi)
该函数首先根据需要丢弃任意多的空格字符,直到找到第一个非空格字符为止。如果第一个非空字符是正号或负号,选取该符号,并将其与后面尽可能多的连续的数字组合起来,这部分字符即为整数的值。如果第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。
PM小王
2019/07/02
4730
Leetcode打卡 | No.008 字符串转整数
欢迎和小詹一起定期刷leetcode,每周一和周五更新一题,每一题都吃透,欢迎一题多解,寻找最优解!这个记录帖哪怕只有一个读者,小詹也会坚持刷下去的!
小小詹同学
2018/07/24
5590
Leetcode打卡  |  No.008 字符串转整数
相关推荐
高频原题——LeetCode题目8:字符串转换整数 (atoi)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验