首页
学习
活动
专区
圈层
工具
发布

记一次智能语音软件的开发-终于为孩子找到了个靠谱的口语老师

调用API接口的准备工作 首先,是需要在有道智云的个人页面上创建实例、创建应用、绑定应用和实例,获取到应用的id和密钥。...,分数越高,当前音标越可能是重音,分数在[0 100] --stress_ref 元音重音参考/标准答案,如果为true,说明参考答案认为该元音应该发重音,辅音时无意义 --stress_detect...在一个单词中,用户该音标发音为重音 Demo开发: 这个demo使用python3开发,包括maindow.py,audioandprocess.py,isebynetease.py 三个文件,分别为...API直接相关的一些方法,最核心的是connect()方法,整合了API所要求的各个参数,并调用执行请求的方法do_request(),而后根据UI的展示需求,处理API的返回结果并拼接字符串。...(即标准重音),如果为true,说明参考答案认为该元音应该发重音,辅音时无意义 'pronunciation': 50.640331, //音标准确度评分 'stress_detect':

1.8K00

看我如何使用Python打造一个带娃神奇(一玩能玩一天)?

二、准备工作 首先,是需要在有道智云的个人页面上创建实例、创建应用、绑定应用和实例,获取到应用的id和密钥。具体个人注册的过程和应用创建过程详见文章分享一次批量文件翻译的开发过程 ?...,分数越高,当前音标越可能是重音,分数在[0 100] –stress_ref 元音重音参考/标准答案,如果为true,说明参考答案认为该元音应该发重音,辅音时无意义 –stress_detect 在一个单词中...,用户该音标发音为重音 (一)Demo开发: 这个demo使用python3开发,包括maindow.py,audioandprocess.py,isebynetease.py 三个文件,分别为demo...API直接相关的一些方法,最核心的是connect()方法,整合了API所要求的各个参数,并调用执行请求的方法do_request(),而后根据UI的展示需求,处理API的返回结果并拼接字符串。...(即标准重音),如果为true,说明参考答案认为该元音应该发重音,辅音时无意义 'pronunciation': 50.640331, //音标准确度评分 'stress_detect':

1.7K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    手把手教你用 Keras 实现 LSTM 预测英语单词发音

    数据集获取 我们将使用 CMU Pronunciation Dictionary (http://www.speech.cs.cmu.edu/cgi-bin/cmudict) 作为我们的数据集,该词典收录了将近...数据准备 接下来,在我们将数据交给学习算法之前,我们需要想办法将单词和发音用数值的形式表示。在这里我们将单词看作是字符序列,发音看作音素符号的序列(包括重音标记)。...我们需要告诉模型语音拼写从哪里开始又从哪里结束,因此我们引入两个独特的开始和结束标注符号,在这里我使用的制表符'\t' 和换行符'\n'分别来表示。 ?...从语音拼写中获得音节的计数与用重音符号计算音素一样简单: ? 2....这次我们将只存储字符和音素 ID 而不是它们的 One-Hot 向量表示。为了简单起见,我们将继续使用音素的 One-Hot 向量表示作为为解码器的输出层。 ?

    1.3K20

    手把手教你用 Keras 实现 LSTM 预测英语单词发音

    数据集获取 我们将使用 CMU Pronunciation Dictionary (http://www.speech.cs.cmu.edu/cgi-bin/cmudict) 作为我们的数据集,该词典收录了将近...数据准备 接下来,在我们将数据交给学习算法之前,我们需要想办法将单词和发音用数值的形式表示。在这里我们将单词看作是字符序列,发音看作音素符号的序列(包括重音标记)。...我们需要告诉模型语音拼写从哪里开始又从哪里结束,因此我们引入两个独特的开始和结束标注符号,在这里我使用的制表符'\t' 和换行符'\n'分别来表示。 ?...从语音拼写中获得音节的计数与用重音符号计算音素一样简单: ? 2....这次我们将只存储字符和音素 ID 而不是它们的 One-Hot 向量表示。为了简单起见,我们将继续使用音素的 One-Hot 向量表示作为为解码器的输出层。 ?

    1.5K20

    日拱一卒,LeetCode周赛287,训练你的逆向思维

    遍历matches,存储每一个玩家获胜和失利和参加比赛的次数,当获胜次数等于参赛次数时,此玩家是全胜玩家。当失利次数等于1时,此玩家是只输一场的玩家。 就是一个map的简单使用,几乎没有技术含量。...很多同学拿到这道题会觉得很棘手,因为找不到突破口,不知道从哪里入手可以找到答案。...所以本题的关键就是及时发现这一点:正向思维不太可行,及时从反方向入手思考。 正向思维是通过题目信息想办法找到答案,反向思维是先假设一个答案,然后通过题目信息判断这个假设是否正确。...请你设计并实现一个支持加密及解密下标从 0 开始字符串的数据结构。 字符串 加密 按下述步骤进行: 对字符串中的每个字符 c ,先从 keys 中找出满足 keys[i] == c 的下标 i 。...实现 Encrypter 类: Encrypter(char[] keys, String[] values, String[] dictionary) 用 keys、values 和 dictionary

    37610

    Selenium结合HttpWatch进行Web自动化测试(实时获取页面性能)

    2、简介 HttpWatch 是一款强大的网页数据分析工具,包括网页摘要、Cookies 管理、缓存管理、消息发送接收、字符查询、POST 数据和目录管理功能、报告输出等。...例如:HttpWatch 版本 13.1.18 适用于 Windows 7 - 11 和 Server 2008 R2 - 2019 支持 Google Chrome 50+、Microsoft Edge...5、Selenium结合HttpWatch 要在 Selenium 进行页面功能测试的时候,想要获取一些信息,如提交请求数据、接收请求数据、页面加载的时间等。...HttpWatch 具有广泛的自动化 API,允许从最流行的编程语言(C#、Ruby、Python、JavaScript 等)对其进行控制。...可以与 IE 的自动化测试框架(例如 Watir 和 Selenium)集成,以便可以在测试过程中检测 HTTP 级别的错误和性能问题。

    1.8K10

    AI口语测评APP的开发

    设计清晰的反馈展示界面,使用户能够理解自己的优势和不足。二、后端开发搭建服务器: 选择合适的云服务提供商并搭建服务器环境。API 设计与开发: 用户认证与授权 API。...测评内容管理 API (获取题目、标准答案等)。 录音文件处理 API (接收用户语音文件)。 AI 测评服务接口 (将语音数据发送给 AI 模型进行分析)。...录音功能实现: 集成设备的录音功能,获取用户语音数据。API 集成: 调用后端提供的 API 接口获取测评内容、发送录音文件、获取测评结果等。...编写标准答案或参考答案。 可以考虑与第三方教育资源集成。内容管理系统 (CMS): 搭建一个后台管理系统,方便管理和更新测评内容。 支持题目的导入导出、编辑、分类等功能。...七、发布与推广应用商店发布: 按照 Google Play Store 和 Apple App Store 的要求打包和发布应用。市场推广: 通过各种渠道推广应用,吸引用户下载和使用。

    30900

    红袖添香,绝代妖娆,Ruby语言基础入门教程之Ruby3基础数据类型(data types)EP02

    nil 值对象),可以通过调用内置class属性来获取该对象的具体数据类型。...常用的字符串方法: # 获取字符串长度 "Hello".length #=> 5 "Hello World!".length #=> 12 # 判断字符串是否为空 "Hello".empty?...符号(symbol)     符号(symbol)和字符串很相似,符号也是对象,一般作为名称标签来使用,用来表示变量等对象的名称,另外符号和字符串可以相互转换。    ...也可以使用fetch方法,他和[]方法一样都可以查找某一个键的值,但是如果键对应的值不存在,会抛出异常。    ...# ---- 输出结果 ---- true     也可以使用size或者length方法,判断哈希的大小是否为0: dictionary = { "one" => "eins", "two" => "

    1.9K20

    C#脚本实践(一)

    但是问了好多人为什么逻辑用脚本写, 答案都是不用编译 这也只能怪DT的C++当初没设计好 由于WOW的成功, 让lua几乎成了游戏脚本的标准 原来的python/ruby/tcl啥的一下子就没落了, 都怪暴雪啊...~ 虽然lua做为一个脚本语言来说, 非常的完美 但是我对它不是很感冒, 可能习惯了C系语言的语法了 对于C/C++/C#/Java/JS/AS类的我才看着比较顺眼 而且, 从学校开始, 好像自己就中了...这也让我有了使用C#做为脚本的冲动 如果嫌C#不是动态语言的话, Mono还支持JavaScript和Boo 本来想如果不跨平台的话是不是可以直接使用MS的.Net实现 Google一下到是真有个叫CS-Script...的windows安装版本中的 Embedded Samples就是嵌入mono的示例程序 以teste为例, 运行时需要依赖mscorlib.dll, 而且那个路径很奇怪, 竟然是mono/msvc/Win32...另外一种脚本调用底层的方法是internal call, 大体看了下好像必须要在C#中再做一次extern声明 这个看看能不能做自动生成的, 要不然每次改动两边都要改多不爽 C++调脚本是通过Mono提供的一系列API

    1.6K40

    Web前端学习笔记之JavaScript、jQuery、AJAX、JSON的区别

    js允许在运行过程中使用eval动态执行字符串里的命令,也可以通过new Function等方式由字符串动态构造函数,函数可以被创建、修改、删除,可以从已有函数构造出新函数,等等。...在jQuery出现之前,在js程序中获取元素节点比较麻烦,例如获取id为elem1的节点 document.getElementById('elem1') 或者是获取页面上的所有checkbox元素,首先需要获取...实际上这是一种实践先行的技术,该方案的技术依赖之一XMLHTTP在1998年就已经被Microsoft开发出来了,而Google在若干年后使用这项技术开发Google Maps等产品之后,才发表了相应的文章并对其进行了命名...从ajax的命名中我们就可以看到,数据交换是通过XML格式进行的。在ajax刚出现的时候,绝大多数应用都是采用XML格式,也有少数使用纯文本的。...此外它的语言规范和引擎还被用于其他领域,比如 Node 等。 人类为了让自己页面功能更加丰富,使用了大量的 JavaScript,并且写了非常多的代码。

    2.6K20

    kaldi -- aidatatang_200zh脚本解析:词典准备

    silence_phones.txt、nonsilence_phones.txt、optional_silence.txt等文件) local/prepare_dict.sh || exit 1; 流程: 1.处理自身数据集 - 获取数据集中所有单词...【从text中获取】-> 生成words.txt - 把整个数据集的单词分成ch和en两个词典 -> 生成words-{en,ch}.txt 2.生成【英文发音字典】,通过CMU字典生成lexicon-en.txt...(格式:数据集中的英文单词 及其对应的拼音发音) - Downloading CMU dictionary - 格式化cmu字典(把字典中重音和发音标记去除) - 生成words-en-oov.txt...lexicon-en-iv.txt (数据集能在字典中取得的单词,及其对应的cmu音素) - 下载安装g2p_model(单词到音素模型,用于转换oov) - 生成lexicon-en-oov.txt (使用...这种中英文混用的单词会导致转换失败,会少21条数据,不知道对后面会不会有影响*) - 生成lexicon-en-phn.txt (merge in-vocab and oov lexicon) - 将cmu和拼音中无法转换的

    57920

    python爬取网易云音乐并分析:用户有什么样的音乐偏好?

    爬取动态数据 获取自己的id号,这个可以自己登陆自己的网易云音乐后获得,就是id=后面那个值 ? 构造爬取的id,因为我发现,每个人的id只要被获取到,他的歌单都是公开的!!!...new_line write2txt(new_line.encode('utf-8'),user) # mac写入文件需要改变字符...刚看到个好玩的,迫不及待的试了下,这是关于语种翻译的API接口,阿里云买的,0.01=1000条,买买买,买来玩玩试试自己歌曲语种 # -*- coding:utf-8 -*- # 调用的阿里云的API...legend: { orient: 'vertical', left: 'left', data:['中文','英文','俄语','法语','葡萄牙语...0KB,那么是文件没有写进去,对于win的用户,把代码写入的部门,编码方式去掉即可 有些win的小伙伴反应路径都加载对了,但是还是找不到exe,那么请在路径前面加r比如executable_path=r"F

    5.7K92

    谷歌最强NLP模型BERT官方中文版来了!多语言模型支持100种语言

    需要注意的是,训练集是机器翻译的(我们使用的是XNLI提供的翻译,而不是Google NMT)。...以下6种主要语言的评估结果: 前两行是XNLI baseline的结果,后三行是使用BERT的结果。 Translate Train 表示MultiNLI的训练集是从英语用机器翻译成外语的。...但是,训练和维护数十种单语言模型是不可行的。因此,如果你的目标是使用英语和中文以外的语言最大限度地提高性能,那么从我们的多语言模型开始,对你感兴趣的语言数据进行额外的预训练是有益的。...我们故意不使用任何标记来表示输入语言(以便zero-shot训练可以工作)。 因为中文没有空白字符,所以在使用WordPiece之前,我们在CJK Unicode范围内的每个字符周围添加了空格。...但我们不得不排除的唯一一种语言是泰语,因为它是唯一一种不使用空格来划分单词的语言(除了汉语),而且每个单词的字符太多,不能使用基于字符的tokenization。

    4.5K41

    hexo-butterfly-SEO优化

    用 API 推送后,索引量迅速回升 ​ 如果需要搜索引擎收录网站,则需要对应搜索引擎的管理平台进行提交,各自的验证码可以从管理平台获取 API提交方式收录(curl/post/php/ruby等多种不同的方式进行推送...->API access(API访问)->API Key(API秘钥)->Generate API Key,生成并记录API Key即可 ​ (需访问国外网站)访问Google Indexing...API ,根据提示在Google开发者平台创建项目、服务账号(IAM管理->服务账号),将服务账号添加为Google Search Console所有者,获取到相应的访问令牌 创建项目 添加服务账号(...http 代理,填0不使用 replace: 0 # 是否替换链接中的部分字符串,可选值:1 | 0(0:否;1:是) find_what: http://xxx.github.io/blog...Win10 可在 设置->代理处查看 replace:URL替换 ​ 针对域名解析的情况可将生成的github.io类型的url替换为对应的自定义域名,或者将中文域名替换成转码后的域名 replace

    2.2K20

    PHP使用swagger-php自动生成api文档(详细附上完整例子)

    安装swagger-ui前端 可以使用git 获取swagger-ui,也可以去github上下载压缩包 如果是使用 git 克隆 swagger-ui,可以在当前项目的public目录下执行如下命令...git clone https://github.com/swagger-api/swagger-ui.git 也可以在其github官网上下载 https://github.com/swagger-api...}] 复合结构 数组和对象可以构成复合结构,例: languages: - Ruby - Perl - Python websites: YAML: yaml.org Ruby:...nodeName: 'node' parent: ~ #使用~表示null string: - 哈哈 - 'Hello world' #可以使用双引号或者单引号包裹特殊字符...yyyy-MM-dd datetime: - 2018-02-17T15:02:31+08:00 #时间使用ISO 8601格式,时间和日期之间使用T连接,最后使用+代表时区 引用 &

    8.7K20

    谷歌正式开放Imagen 3访问权限!OpenAI的GPT-4o连续两周迎来两次更新!|AI日报

    今日热点OpenAI发布chatgpt-4o-latest AI模型,其为GPT-4o模型的更新,其中包括错误修复和性能改进OpenAI公司上周发布了gpt-4o-2024-08-06,API支持结构化输出...此次双重发布标志着该AI工具访问权限的显著扩展,该工具最初于5月份在Google I/O大会上宣布,6月份时仅限部分Vertex AI用户使用。...,且模型产生的干扰元素和错误也更少。...、印度尼西亚、日本、墨西哥和英国等6个国家8月15日,Google母公司Alphabet表示,将其搜索查询的AI摘要功能扩展到巴西、印度、印度尼西亚、日本、墨西哥和英国等6个新的国家,并提供葡萄牙语和印地语等当地语言版本...并且,谷歌还为该功能添加了更多超链接,链接将显示在人工智能生成的答案的右侧。该公司还在内部测试进一步的更新,将直接在概述文本中添加链接,这是“优先考虑为相关网站带来流量的方法”的努力的一部分。

    28210

    Python 编码规范(Google) (一)

    Python 风格规范(Google) 本项目并非 Google 官方项目, 而是由国内程序员凭热情创建和维护。...如果你关注的是 Google 官方英文版, 请移步 Google Style Guide 以下代码中 Yes 表示推荐,No 表示不推荐。...---- 行长度 每行不超过80个字符 以下情况除外: 长的导入模块语句 注释里的URL 不要使用反斜杠连接行。...Python会将 圆括号, 中括号和花括号中的行隐式的连接起来 , 你可以利用这个特点. 如果需要, 你可以在表达式外围增加一对额外的圆括号。..., 可以使用圆括号来实现隐式行连接: x = ('这是一个非常长非常长非常长非常长 ' '非常长非常长非常长非常长非常长非常长的字符串') 在注释中,如果必要,将长的URL放在一行上。

    60230

    python实现APP多语种翻译

    在此记录下过程: 在网上搜了一些如何用python实现google脚本,大致有三种: 1.调用google API的 2.使用别人已经封装好的库 3.类似爬虫方式获取(我没爬过,也不知道算不算) 这里采用第三种...,主要是看了利用python调用谷歌翻译API这篇文章,感觉蛮简单,也感觉比较靠谱,然后就开搞了。...按照API>这篇文章实现脚本以后,发现只能翻译成中文,而且不适合翻译多个句子。...(巴西),葡萄牙语(葡萄牙) # '葡萄牙语': 'pt', # '罗马尼亚语': 'ro', # '俄语': 'ru', # '瑞典语': 'sv', # '土耳其语...this_translate_list.clear() def replace_text(text): """ Android资源文件英文的双引号或单引号需要加斜杠,否则会报错,中文的双引号和单引号不需要

    2.2K30

    ChatGPT、Claude和Bard,三足鼎立之势已成

    由前OpenAI研究人员创立的人工智能公司Anthropic推出了其更新版的聊天机器人Claude 2,与 ChatGPT和Google Bard等竞争对手正面硬刚。...Claude2 如何与 ChatGPT 和谷歌的 Bard 相提并论呢?下面我们从几个方面对比一下。 注册门槛 ChatGPT:最为严格,邮箱+手机号的模式。 Claude:有邮箱即可。...Bard:Google账号直接登陆 普通用户使用费用(非API调用) ChatGPT:GPT-3.5 版本免费。使用 GPT-4 版本每月20美元的订阅费用。...Claude:支持10几种语言,除英语外,还擅长葡萄牙语、法语、普通话和德语等。 上下文处理 ChatGPT:ChatGPT Plus(GPT-4)支持8192个令牌,普通版少一些。...ChatGPT Plus 提供插件商店、代码解释器等,提供 API 支持。 Bard:聊天机器人仍处于实验阶段,但将有一个插件商店和Google Suite集成。提供对其 API 的有限访问。

    88430
    领券