首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

1400小时开源语音数据集,你想要都在这儿

整理 | 一一 出品 | AI科技大本营(ID:rgznai100) 3 月 1 日,由 Mozilla 基金会发起的 Common Voice 项目,发布新版语音识别数据集,包括来自 42000 名贡献者...,超过 1400 小时的语音样本数据,涵盖包括英语、法语、德语、荷兰语、汉语在内的 18 种语言。...他们邀请来自世界各地的志愿者通过网络和移动应用贡献语音记录的文本片段,当然,他们会非常严格地保护项目贡献者的隐私。...2017 年 11 月,Mozilla 基金会发布了第一批 Common Voice 英语数据集成果,该数据集包括大约 500 个小时的语音数据,以及来自 20,000 个志愿者贡献的 400,000...比如口音重、有背景噪音或者非常安静,而且他觉得一些“机械的”样本是通过文本转语音软件生成的。所以 Common Voice 能提供优质数据吗?

2.4K10

【Rust日报】2022-06-25 世界上最大的软件项目的内存安全

我们上一次发布是在两年前,从那以后我们修补了许多 bug,添加了许多特性,并增加了新的目标。这是许多人的工作,而我只是其中的一小部分。 我们破坏了你的工作流程吗? 如果破坏了,请给我们提issue。...这是一个在终端上显示 Github 贡献图的命令。 这是我第一次创建,所以我正在等待一个pr! !...作为内核的第二语言,Rust 有一个非常有趣的特性: 它保证不会发生任何未定义行为(只要unsafe的代码是健全的) ,特别是在内存管理方面。...这包括没有释放后使用的问题,不会重复释放内存,没有数据竞赛,等等。 Prosimo 是互联网安全研究小组(ISRG)的一个项目。...这种基础设施的一个关键例子是 Linux 内核,它用于世界上大多数服务器以及数十亿个设备中。

29920
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    厂商备战大数据 技术融合成趋势

    Lamport还因为并发编程和容错计算的理论及实践上的贡献获得过IEEE的Emanuel R. Piore奖。...大数据领域很少应用虚拟化技术,因为这个领域的计算任务十分繁重,并且拥有自己的调度器对资源进行调度,并不需要虚拟化带来的定制化和自动化控制——这是当前人们所广泛持有的观点。 事实果然如此吗?...华中科技大学的人员认为,当前Hadoop拥有数种任务调度器,但全部都没有将网络带宽考虑在内,因此,则将会“损失掉优化调度的机会”。...由于带宽问题而导致负载未能合理分配的现象显然确实存在,因为Hadoop的调度器仅仅考虑了计算,没有考虑网络。...论文显示BASS确实比其他任务调度器更快,特别低,还可以通过额外的Pre-BASS组件得到甚至更高的效率和更快的速度。

    54250

    2016年十大顶级开源项目

    挑选 10 个开源项目到我们的年度顶级项目列表中并不太容易,而且,也没有哪个如此短的列表能够包含每一个应该包含在内的项目。...Atom 是一个来自 GitHub 的可魔改的(hackable)文本编辑器。Jono Bacon 在今年的早些时候为它的“简单核心”写了一篇文章,对该开源项目所给用户带来的选择而大加赞赏。...请访问 MyCollab 网站来了解如何对项目做贡献。 MyCollab 是 AGPLv3 许可的,它的源代码托管在 GitHub 上。...社区管理员 Joshua Allen 在 2016 年 3 月报道了它的开源版本,在 Opensource.com 网站的其他动画相关的文章中它也有被提及,但是我们并没有深入介绍,敬请期待。...在 2016 年,你有什么喜爱的开源项目吗?喜爱的原因呢?请在下面的评论框发表。

    1.6K30

    在同一基准下对前端框架进行比较

    结论 大多数应用程序的得分都高于90,在性能方面,你可能感觉不到太多的差异。 指标 #2:大小 传输大小来自 Chrome 的 network 标签中。GZIPped 响应头加上服务器提供的响应主体。...指标 #3:代码行数 我们用了 cloc 计算每个 repo 的 src 文件夹中的代码行数。空行和注释行不计入在内。...有些实现使用了代码分割,有些则没有。其中一些托管在 GitHub 上,一些托管在 Now,还有一些托管在 Netlify。你还想知道哪一个是最好的吗?最好的应该是能够满足你需求的那个!...答:选择一个你不知道的库或框架! 常见问题 #1 为什么在这个比较中没有框架 X、Y 和 Z ? 因为 RealWorld repo 没有完成它的实现。你可以考虑贡献自己的代码!...其他调查【https://insights.stackoverflow.com/survey/2018/】回答了其中一些的问题。

    96020

    DeepMind 开源内部深度学习框架 Sonnet,研究通过梯度下降学习

    我们发现,编写详尽表述子模块的代码可以实现代码的更易重复使用及更快应用于实验 – Sonnet 提倡编写可以在内部同时表述其他子模块的模块或者在构建过程中可被其他模块传递的模块。...我们对来自社区的贡献感到非常兴奋。要了解更多关于 Sonnet 的信息,请访问我们的 GitHub repository。...注意如果模块没有连到 graph 上,就会显示错误,因为变量此时不存在,所以相关的 scope 是空的。 问:Sonnet中的所有内容都应该作为模块实现吗?...问:可以将其与其他高级TF API(如TF Slim)混合使用吗? 答:Sonnet模块一旦构建出来,就遵循Tensor-In-Tensor-Out的原理,因此可以与TF-Slim等的功能混合。...问:使用Sonnet与其他库与原始TF的开销(overhead)是多少? 答:没有。只有在构造计算图时才会涉及Sonnet。

    1.2K30

    2021 年开始使用开源的 10 种方式

    《为 COVID-19 贡献开源医疗项目》 你是否知道一家意大利医院通过 3D 打印机设备挽救了 COVID-19 患者的生命?...《GNOME 入门建议》 GNOME 是最受欢迎的 Linux 桌面之一,但是它适合你吗?本文分享了来自 GNOME 用户的建议,以及有关此主题的文章。 想要在配置桌面上寻找一些灵感吗?...不过,你仍然可能会认为 GNOME 不适合你——不用担心,最后你将找到指向其他 Linux 桌面和窗口管理器的链接。...《现在开始为开源做贡献的 3 个理由》 截至到 2020 年 6 月,Github 托管了超过 180,000 个公共仓库。现如今加入开源社区比过去更容易,但这是否意味着你应该加入开源?...本文介绍了她在 All Things Open 2019 会议上的闪电演讲的回顾以及包括她亲自演讲的视频。还记得吗? 《任何人如何在工作中为开源软件做出贡献》 需求是发明之母,尤其是在开源领域。

    57830

    设备集群上的Kubernetes | 系列文章(6)

    战胜了其他竞争对手之后,Kubernetes现在毋庸置疑地在云计算环境中占据垄断地位。...在收购了Heptio、Bitnami等颇有影响的初创公司之后,VMware成为Kubernetes全球社区中举足轻重的贡献者。...与此类似的,技术上可以实现支持其他边缘应用部署的Provider,而主从节点其实都在云侧,通过既有边缘计算平台的通道进行管理。...比如: 有必要把主节点放在云侧吗? 主节点在云侧、从节点在边缘最主要的价值是统一简化的管理。如果可以接受多层管理机制,及边缘侧较多的资源消耗,在这点可以让步。 有必要用Kubernetes吗?...总之,在现有条件下,用户需要根据自己的实际状况和需求选择适合自己的Kubernetes部署工具,如果Kubernetes是必要的话。没有放之四海而皆准的方案,也就是“没有银弹”。

    71020

    本周AI热点回顾:RTX3080被黄牛炒上天;百度资本助力AI 制药,已有十几位博士加入;百度联手打造AI沉浸互动展中国首秀

    第二个阶段:深度参与或主导发起新型精准药物和精准诊断产品的研发,携手合作伙伴,为社会贡献极具创新性的精准生命科学产品。...以生物计算平台为基础,百图生科还将大力投入关键底层数据设备和计算技术的研发,加速高通量类器官芯片、高分辨物质观测设备、新的组学采集分析设备、蛋白质模拟和生物计算专用芯片的研发,为生命科学行业带来新的数据轴和计算能力...在几个月的筹备过程中,来自全球顶尖的人工智能专家和艺术家们一起去探索“AI+艺术”的无限可能,开启了一场谱写计算机艺术历史新篇章的展览。...其中3.5M超轻量文字识别模型,堪称目前业界开源的最轻量OCR模型了。 质量上,如此轻量的模型,效果有保障吗?不看广告,直接看疗效。 先看几个常见的通用场景识别效果: ? ?...YouTube 作为大规模用 AI 代替人工的先行者,势必会踩坑,但同时也为其他公司甚至全社会,指明了人与 AI 协同关系中更加清晰的发展方向。

    48620

    云原生|KubeVela

    在互联网与云计算技术发展的日新月异过去五年中,应用研发人员对效率与敏捷的极致追求,终于把业界带进了一个崭新的云原生时代。...我能成为 KubeVela 项目的贡献者吗? 当然! 而成为 KubeVela 贡献者的主要基础,自然是 Go 语言啦。...这不,就在 KubeVela 开源的第二天,来自社区的贡献者就已经为 KubeVela 加上了Contour Ingress 控制器的支持。...类似的,KubeVela 里的其他特性比如 Autoscaler 等,都以 Kubernetes 原生的方式提供了大量的可扩展的空间。...对于这部分应用管理能力,只有你想不到,没有你做不到,未来的 KubeVela 具备什么能力,抽象怎么设计,你说了算! 然后是用户接口与模型层。

    1.3K30

    2021 年 Rust 生态调研报告 | 星辰大海 【上篇】

    任何没有进入 TIOBE 榜单前20的语言,其实都还需要进行营销和宣传,这意味着 Rust 依旧属于小众语言。 贡献者数量。Rust 贡献者数量截止目前为 3539 个。...我们对比一下Github开源的其他语言:流行的 Go 语言目前贡献者是 1758个;Kotlin 目前的贡献者是 516 个。看一下流行的框架 Rails 的贡献者是 4379个。...挑战主要来自两个方面: 领域的选择。一门语言唱的再好,如果不被应用,也是没有什么用处。Rust 语言当前面临的挑战就是在领域中的应用。...这不仅仅是来自其他维护者的信任,也来自所有编写代码的人的信任……这只是需要时间的”。 Rust 作为一门天生安全的语言,作为C的备选语言,在帮助内核开发者之间建立彼此的信任,是非常有帮助的。...人们现在已经谈论Rust在内核中的应用很久了,但它还没有完成,可能在明年,我们会开始看到一些首次用Rust编写的无畏的模块,也许会被整合到主线内核中。”

    1.8K20

    独家专访 ASF 董事会主席 Craig Russell:Apache 之道

    Craig Russell:我们的开源项目与其他项目有很大不同。...在使用 Apache 许可时,贡献者可以按照自己的意愿来自由地使用他们(参与贡献)的软件,而且当为 Apache 项目做贡献时,毋须放弃任何权益。...而且也有多个项目的主要参与者是来自中国,他们也使用 GitHub 来进行项目的日常沟通,他们通过让 GitHub 的日常沟通可以转发到开发的邮件列表中,从而达到满足所有人的需求。...所以,我们也没有说一定不能使用微信这样的即时通讯工具。但是任何实质性的内容还是要回归到异步通信工具中以便阅读和归档。 InfoQ:您可以简单介绍一下 Apache 董事会是如何运作的吗?...目前,Apache 孵化器中还有很多来自不同领域的项目,包括数据分析、数据库、深度学习、流计算、云计算、物联网、区块链和网络监控等。我们期待随着新技术的开发,这些领域中的一些项目能纳入 ASF。

    65420

    10万 npm 用户账号信息被窃、日志中保存明文密码,GitHub安全问题何时休?

    同时,这也显示了在将 JavaScript 包注册中心整合到 GitHub 的日志系统后,GitHub 在内部日志中存储了 “npm 注册中心的一些明文用户凭证”。...按照 GitHub 的说法,“经过内部发现和与 OAuth 令牌攻击无关的额外调查,GitHub 发现将 npm 整合到 GitHub 日志系统后,在内部日志中发现了一些 npm 注册表的明文用户凭证。...“大多数安全漏洞并非来自非常复杂的攻击事件或是零日漏洞,相反,往往是一些低成本的攻击,如社会工程、密码泄露,以及其他为攻击者提供访问受害者账户的攻击。”...切勿将凭据和敏感数据存储在 GitHub 上 GitHub 的目的是托管代码存储库。除了设置账户权限外,没有其他安全方法可以确保密钥、私人凭据和敏感数据可以一直处于可控和安全的环境中。...无论是在 GitHub 平台,还是一般的场景,开发者都应当遵守基本的安全准则:在每个贡献者的 GitHub 帐户上启用双因素身份验证、永远不要让用户共享 GitHub 帐号和密码、必须适当保护任何可以访问源代码的笔记本电脑或其他设备等等

    1.8K20

    微软“.Net社区虚拟大会”dotnetConf2015:关键词:.NET 创新、开源、跨平台

    自那时以来,已经有大约 3500 人在 GitHub 上进行了提交,而且贡献者的人数还在持续增长——他们不仅来自社区、还来自微软内部。...今天,微软召开了“.Net 社区虚拟大会”(dotnetConf),包括微软的 Scott Hanselman 和 Xamarin 的 Miguel De Icaza 在内的知名人士,都将在 Channel...下方的信息图展示了 GitHub 上的成长情况,其中有 62% 的“Pull Requests”来自社区(这表明健康度很高)。 ?...WPF作为Windows 平台上的Modern Desktop Application开发框架,在停滞更新若果年后,重新激活新的路线图 ? 有人会问WPF能够跨平台吗?...答案是目前不可以,将来也许可以,Xamarin Forms上已经是基于XAML的跨平台的框架。 ASP.NET5, 针对云计算的全新的实现,更加容易迎合弹性计算所需要的按需扩展! ?

    61070

    小伙整理了灵魂50问,GitHub日入2500星

    但Leetcode里好像没有这些呀?...可以以多快的速度为产品设置新的本地测试环境?(按照分钟/小时/天计数) 可以以多快的速度响应代码或依赖项中的安全问题? 是否允许所有开发人员拥有其计算机的本地管理员权限?...我能为FOSS项目做贡献吗?是否需要先获得批准? 是否会被要求签署非竞业协议等? 公司营收情况 公司目前赚钱吗? 如果没有,那距离赚钱还有多久? 公司目前的发展资金来自哪里?...谁在决定高层次的计划和方向? 公司靠什么赚钱? 是什么阻止公司赚更多的钱? 远程工作篇 公司远程工作的员工占比多少? 公司是否提供一些硬件设备,多长时间更新一次?...网友也贡献了一些自己的避坑指南,量子位大致整理了一下。 观点1:问过去半年最糟糕的一天是什么样的?

    1.9K30

    每个月在云上“狂烧”180万,Ruby On Rails 之父:我们要直接买硬件!

    所以其中大部分还是来自 HEY,全年数据库支出为 35.59 万美元(合每月 2.96 万美元),其余部分就是支持其他遗留服务的开销了。...事实上,虽然近年来云计算加速增长,但企业并没有放弃本地数据中心,很多企业继续依赖传统数据中心来处理其关键任务工作负载。...企业在延长硬件的使用周期 那么,企业总是想要最新、最好的技术来为其数据中心提供动力吗?实际上并不是。 根据 Uptime Institute 的研究,硬件更新周期在普遍延长而非缩短。...但真要下云的话,企业需要考虑是否像 37Signals 一样业务可预测、没有意外的流量涌入,同时也要算好自己的账,比如要更换的设备价值多少,如何收回部分投资以抵消升级的前期成本,哪些设备可以在内部重新部署...| 解读终端的 2022 VS Code 有多么不安全:一个扩展就可能导致公司 GitHub 中的所有代码被擦除?

    78420

    维护开源已经很困难了,而GitHub还在进一步破坏

    在经历过短暂的疑惑后,Jesse 终于意识到这些“神秘的消失”都是由于 GitHub 轻率地暂停了俄罗斯开发者的账户,而没有考虑到其破坏性的副作用所造成的。...同样,目前我还不清楚数据丢失是 GitHub 的目标还是这是一个失误。无论怎样,这都是一个巨大的问题。在没有通知的情况下删除这些数据是对信任的一种滥用。...我们还应该继续把重要数据存放在 GitHub 上吗? 除了此前发布的一篇声称会“为包括俄罗斯开发者在内的所有开发者提供服务”的声明外,GitHub 没有发布任何有关当下这一封禁举措的通知或沟通。...我不知道的是,GitHub 正悄悄地加入了西方世界其他国家的行列,以惩罚无辜的俄罗斯平民......我不明白删除 GitHub 账户和造成平民的食物短缺是谁的'胜利'。...据我所知,现在失踪的贡献者只是对社区开源项目感兴趣的普通 iOS 和 macOS 开发者。 来自 GitHub 的这些行为对开源项目和开源社区是有害的和破坏性的。

    36910

    四种使用物联网和人工智能加速获取价值的有效方法

    人工智能的潜力和事物的智能 人工智能驱动的互联智能设备和环境从更大的数据源网络(包括彼此)中学习,并为集体智慧做出了贡献。...事件流处理连续监视来自设备和设备的传感器数据,以寻找可能指示问题的趋势,相关性或异常情况。智能设备可以采取补救措施,例如通知操作员,移动负载或关闭电动机。 清洗并验证传感器数据。...帮助自动驾驶汽车在繁忙的十字路口机动,而不会撞到其他行驶中的车辆。现在做。延迟很重要。显然,许多类型的传感器和设备无法等待来自云的数据或命令。而对于其他用途,则没有必要。...随着物联网设备及其数据量的指数级增长以及对低延迟的需求,我们已经看到了将分析从传统数据中心转移到边缘设备(物联网)或接近边缘和云的其他计算资源的趋势。 4....AI将这些数据转换为有意义的实时洞察力,IoT设备可以据此采取行动。如果您还没有的话,关键是上手!如果您正在试用中,请确保您可以实际部署和扩展解决方案以满足业务需求。

    45410

    PyTorch 成为 Linux 基金会的顶级项目

    该项目将由新成立的 PyTorch 基金会 管理,并得到包括 Meta、AWS、NVIDIA、AMD、谷歌 和 微软 在内的多家大公司的支持。...据 Chintala 说: 一开始,PyTorch 只有一小群贡献者,多年来,这个团队一直在发展,并且变得多样化,所有人都带来了新的想法和创新,如果没有我们的社区,这些都是不可能实现的。...PyTorch 基金会受一个管理委员会监督,其成员来自 Meta 以及其他对项目有投资和贡献的大公司:计算机芯片制造商 NVIDIA 和 AMD;云服务提供商亚马逊科技(AWS)、微软 Azure 和谷歌云...其他用户想知道这一举动是否意味着 Meta 会减少对 PyTorch 的投资。...会有更多来自 Meta 的资源,以及更多来自其他贡献者的资源,现在,PyTorch 成了一个永久开放的社区项目……这可以确保它获得持续的支持,而不受制于一家公司的资源分配决策。

    46510

    GenAI遇上SLM:边缘计算的新纪元

    开放市场(例如 GitHub Models 和 Hugging Face)拥有预训练的 SLM。这些工具还有助于在边缘更广泛地采用生成式 AI。SLM 的上下文功能可以改变多个行业。...此外,WebAssembly 可以利用包括 GPU 在内的底层硬件功能来优化性能并加速推理任务。由于它将轻量级执行与强大的计算资源相结合,因此非常适合 SLM 应用程序。...通过增强的安全性在边缘进行协作学习 医疗保健和许多其他领域都在隐私敏感的环境中运作。然而,与边缘应用程序进行受控的数据共享可以帮助建立知识库,以使用 SLM 和其他医疗保健服务改进治疗程序。...让我们回到医院的例子。医院已决定加入与其他医院的合作计划,旨在建立一个更复杂的模型,以根据来自各种医疗记录的见解来改善预测和护理结果。...例如,在客户数据需要严格安全性的投资领域,来自投资模式共享参数的见解可以帮助银行业开发更有效的计划。联邦学习促进了贡献者(无论是个人、设备还是组织)之间的协作。

    9500
    领券