例如,将由Unicode点é表示的é在这里被编码为两个独立的字符,如é (e & ́)。这并不容易处理,特别是一些浏览器(Firefox)在重音字母后显示空格,而另一些浏览器(Chrome)则不显示空格。因此,是否有一种方法可以自动将这些讨厌的字符转换为友好的单个Unicode代码点字符?
给定NFC规范化字符串,对该字符串应用完全大小写折叠,我是否可以假设结果也是NFC规范化的?
正规化也与案例折叠相互作用。对于任何字符串X,设Q(X) =NFC(toCasefold(NFD(X)。换句话说,Q( X )是标准化X的结果,然后用大小写折叠结果,然后将结果转化为NFC格式。反复应用q不会改变结果;对于NFC或NFD,案例折叠是在规范规范化的情况下关闭