首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >百度AI接口开发文字转语音功能-符号错误

百度AI接口开发文字转语音功能-符号错误

作者头像
申霖
发布2020-04-02 21:29:15
发布2020-04-02 21:29:15
70900
代码可运行
举报
文章被收录于专栏:小白程序猿小白程序猿
运行总次数:0
代码可运行

我们还是继续说一下百度AI语音合成,整体的功能上没有问题,但是在细节上需要注意符号问题,这也是在开发过程中实际遇到的,目前主要涉及到了三个符号“、”、——。

在我们拿到文字内容时先将空格进行去除,方式如下:

代码语言:javascript
代码运行次数:0
运行
复制
//替换空行 
$content = strtr($content, [" " => '']);

然后将HTML代码进行去除,方式如下:

代码语言:javascript
代码运行次数:0
运行
复制
//去除标签 
$content = strip_tags($content);

按照现有的方式,我们可以看到纯文字了,基本上满足了大多数文章了,但是在特殊文章上遇到了问题,一篇文章中含有“”——时,就会出现ldquo、rdquo、mdash读音。这是一个非常严重的问题,我们需要将其进行替换。方式如下:

代码语言:javascript
代码运行次数:0
运行
复制
//去除部分标点符号
$content = str_replace(['“', '”', "—"], [], $content);

这里说一下PHP的str_replace函数。支持数组形式进行替换,但是要求查询格式和替换格式均为数组形式。可对多个条件进行执行,目前我们知道了上面三个符号在读音上出现问题。

后续会继续更新百度AI语音合成文字及注意事项。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-04-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档