首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >转义不同语言中的特殊字符

转义不同语言中的特殊字符
EN

Stack Overflow用户
提问于 2012-04-02 21:20:04
回答 2查看 491关注 0票数 0

我使用下面的正则表达式来转义特殊字符:

代码语言:javascript
复制
var searchForTest = text.replace(/[^a-zA-Z 0-9.]/gi,'.');

当文本是英文时,这是正确的,但当我试图高亮希腊字符时失败,因为它们被标识为特殊字符。

工作示例示例:English Characters

非工作样本Greek Characters示例

谢谢

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-04-02 21:30:57

在处理希腊符号时,应该改用unicode序列。

由于希腊符号are in range \u0374 - \u03FF只需将此范围添加到您的regexp中

代码语言:javascript
复制
var searchForTest = text.replace(/[^a-zA-Z 0-9.\u0374-\u03FF]/gi,'.');
票数 2
EN

Stack Overflow用户

发布于 2012-04-02 21:34:39

JavaScript正则表达式对Unicode没有任何真正的理解;也就是说,不存在支持Unicode的字符类,如“字母”或“数字”(只有"ASCII字母数字字符“),无法引用Unicode属性等。因此,您基本上有两种选择:

  • 匹配您的特殊子集之外的任何ASCII码字符:

var searchForTest = text.replace(/(?=\x20-\x7E)^a-zA-Z 0-9./gi,'.');

(这有一个缺点,它不能识别卷曲引号、特定于希腊语的标点符号等,作为特殊的characters.)

  • match任何字符不在您的特殊子集,并添加希腊和其他字符,您需要他们:

var searchForTest = text.replace(/^a-zA-Z 0-9.α-ωΑ-Ω/gi,‘.);

(这样做的缺点很明显。)

你可以尝试将以上几种方法结合起来,但你永远不会得到完美的结果。:-/

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9977258

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档