首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >PHP从字符串中剥离非SGML字符?

PHP从字符串中剥离非SGML字符?
EN

Stack Overflow用户
提问于 2011-07-12 03:07:30
回答 1查看 824关注 0票数 2

我的数据库中有一些非标准字符(因为换行)。

我的HTML验证程序正在抱怨它们。

因为我的HTML验证器是我自我的直接扩展,所以我希望保持这个东西的快乐和绿色-ok-箭头-y。

以前做过这件事的人有快速解决办法吗?

顺便说一下,我不想更改页面的字符集、doctype或数据。只是想找一个utf8_decode()类型的东西来清理字符串,但是utf8_encode()utf8_decode()不能工作.

更新

对不起,“非标准字符”有点模糊,但是这个错误警告也是如此。具体来说,它们不是SGML字符,它显然不适合SGML的parser...but,现在我进入了模糊的领域,不知道发生了什么。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-07-12 03:17:22

如果非标准字符是指XHTML验证器看到文档中不被XML规范所允许的字符,即:http://www.w3.org/TR/xml/#charsets,那么您的解决方案就是使用XML实体来转义它们。例如,如果您有非法字符U+0004,则可以在编写它之前将其转换为

如果你所说的非标准字符是指你的字节序列被破坏到不是UTF-8的合法字节序列(也就是说,它不能被解码),那么你的应用程序中就有一个逻辑错误。也许您正在读取字节,而不是要求PHP读取字符并正确地对它们进行编码。

编辑:作为对上面关于非法字符编号为30的评论的回应,这确实是XML和XHTML中的一个非法字符。如果您希望它们是换行,那么执行php替换,将\x1E替换为\n

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/6659090

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档