我的问题是:
我有一个“机器”表,列的行如下所示,但更长:
Microsoft应用程序错误ReportingMicrosoft Office Professional Plus 2010 Microsoft MUI (英文)
Microsoft Office InfoPath MUI (英文) 2010 Microsoft Office Access MUI (英文)2010 Microsoft Office共享设置元数据MUI (英文)2010 Microsoft Office Excel MUI (英文)2010 Microsoft Office共享64位设置元数据MUI (英文)201
假设我有以下数据集,我希望用类似于“ABC”的东西替换那些不在英文字母表中的数据集
Data
コハニー
Cat
Blue
زبان
所以我的理想输出是:
Data
ABC
Cat
Blue
ABC
一种选择是使用所有的英文字母表,如以下所示,以识别没有英文字母表的数据。
df$Data <- ifelse(!grepl("A",df$Data ) .... |!grepl("Z",df$Data ) ,"ABC",grepl("A",df$Data ))
但有没有其他选择?
我需要识别CMD控制台中的unicode特殊字符,特别的字符是:-(它像一个普通的破折号,但它不是。)这是U+2013字符,根据。
PS:你可以通过下载任何文件到你的电脑上找到文件名中的字符.并不是所有下载的文件名都有这个字符,但是许多服务器在下载文件的文件名中用该破折号对普通破折号进行代码转换,我不知道为什么.
如果我在文件名中有一个带有这个字符的MP3文件,然后我尝试在cmd中执行一个"dir /B“命令,那么我得到以下命令:
C:\>dir /B
this is a - test.mp3
在这部分一切都好..。但是,如果我将文件名复制到剪贴板(直接从"dir“输出)
我的表中有字符串值,其中包括希伯来语字符(或本例中的任何R-T-L语言)和英语字符(或数字)。
问题是英文字符颠倒了,看起来像:בדיקה123456 esrever sti fI kcehC。数字和英文字符是颠倒的,希伯来语的是好的。
如何使用内置的SQL函数来识别英语子字符串(和数字)并反转它,同时保持其他RTL字符的顺序?任何变通方法都可以:-) ...谢谢