我的数据库中有一些非标准字符(因为换行)。
我的HTML验证程序正在抱怨它们。
因为我的HTML验证器是我自我的直接扩展,所以我希望保持这个东西的快乐和绿色-ok-箭头-y。
以前做过这件事的人有快速解决办法吗?
顺便说一下,我不想更改页面的字符集、doctype或数据。只是想找一个utf8_decode()
类型的东西来清理字符串,但是utf8_encode()
和utf8_decode()
不能工作.
更新
对不起,“非标准字符”有点模糊,但是这个错误警告也是如此。具体来说,它们不是SGML字符,它显然不适合SGML的parser...but,现在我进入了模糊的领域,不知道发生了什么。
发布于 2011-07-12 03:17:22
如果非标准字符是指XHTML验证器看到文档中不被XML规范所允许的字符,即:http://www.w3.org/TR/xml/#charsets,那么您的解决方案就是使用XML实体来转义它们。例如,如果您有非法字符U+0004,则可以在编写它之前将其转换为
。
如果你所说的非标准字符是指你的字节序列被破坏到不是UTF-8的合法字节序列(也就是说,它不能被解码),那么你的应用程序中就有一个逻辑错误。也许您正在读取字节,而不是要求PHP读取字符并正确地对它们进行编码。
编辑:作为对上面关于非法字符编号为30的评论的回应,这确实是XML和XHTML中的一个非法字符。如果您希望它们是换行,那么执行php替换,将\x1E
替换为\n
。
https://stackoverflow.com/questions/6659090
复制相似问题