首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

C言中你可能不熟悉的头文件(stdlib.h)

C言中你可能不熟悉的头文件(stdlib.h) C Standard General Utilities Library (header) C标准通用工具库(头文件) 此头文件定义了一些通用功能函数...将字符串(char[])转换为double类型数, 即(char) array-> float(函数) atoi 字符串转换为整型(函数) atol 字符串转换为long类型(函数) atoll (c+...+11) 字符串转换为长整型long long类型(函数) strtod 字符串转换为double类型(函数) strtof (c++11) 字符串转换为浮点类型(函数) strtol...字符串转换为long integer类型(函数) strtold (c++11) 字符串转换为long double类型(函数) strtoll (c++11) 字符串转换为long long...注: itoa并不是一个标准的C函数,它是Windows特有的,如果要写跨平台的程序,请用sprintf。

1.5K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    多语言大模型新SOTA!Cohere最新开源Aya-23:支持23种语言,8B35B可选

    虽然LLM在过去几年中蓬勃发展,但该领域的大部分工作都是以英语为中心的,也就是说,虽然模型的能力很强,但也仅限于英语、汉语等使用人数多的语言,在处理资源匮乏的语言时往往性能不佳。...中文(简体和繁体)、捷克、荷兰、英语、法语、德语、希腊、希伯来、印地、印尼、意大利、日语、韩语、波斯、波兰、葡萄牙、罗马尼亚、俄语、西班牙、土耳其、乌克兰和越南。...在分词过程中,执行了NFC(Normalization Form C)规范化,即文本在分词前会被标准化,以确保一致性。数字被拆分成单独的token,以便于模型更好地理解和处理数字信息。...11种语言上取得了其类别中的最高分数。...还可以注意到,Mistral-7B和Mixtral-8x7B模型倾向于在提示中生成英语回复,也导致了模型在多语言摘要任务中的性能不佳。

    32410

    Facebook开源增强版LASER库,包含93种语言工具包

    LASER 的性能和功能亮点 LASER 在 XNLI 语料库 14 种语言中的 13 种语言上获得了零样本跨语言自然语言推理任务的当前最佳准确率结果。...该编码器可以推广到没有被训练过(即使作为单语言文本训练集)的语言中。研究者发现编码器在地区性语言上有良好表现,包括阿斯图里亚斯、法罗、弗里西语、卡舒比、北摩鹿加、皮埃蒙特、施瓦本、索布。...在 14 种目标语言中,模型在 8 种语言上的零数据表现是在应用于英语时性能的 5% 上下区间。这 8 种语言包括与英语亲属关系远的俄语、汉语、越南等。...该获胜系统确实是为此任务设计的,但 Facebook 研究者把德译英的 F1 分数从 85.5 提升到了 96.2,法译英的 F1 分数从 81.5 提升到了 93.9,俄译英从 81.3 改进到 93.3...该方法可用于在使用任意语言对的情况下,挖掘 90 多种语言中的平行数据。这有助于改进众多依赖平行训练数据的的 NLP 应用,包括低资源语言的神经机器翻译。

    1.4K10

    40种语言、9项推理任务,谷歌发布新的NLP基准测试Xtreme

    其中包括一些未被充分研究的语言,例如在印度南部、斯里兰卡和新加坡使用的达罗毗荼语系语言泰米尔,主要在印度南部使用的泰卢固和马拉雅拉姆,以及在非洲使用的尼日尔-刚果语系斯瓦希里和约鲁巴。...Xtreme评估了这些模型的零点跨语言转移性能(zero-shot cross-lingual transfer performance),也就是在其他语言中没有看到任务特定的数据。...对于在其他语言中可以使用标记数据的任务,Xtreme还比较了对语言内数据的微调,并通过获得所有任务的零概率得分最终得出一个综合分数。...其中,BERT对西班牙的准确率为86.9/100,日语则只有49.2/100,要转换成非拉丁文字也十分困难,而所有的模型都很难预测到在英语训练数据中没有看到的远方语言的实体,比如,在印度尼西亚和斯瓦希里上的准确率分别为...Research高级软件工程师Melvin Johnson和DeepMind科学家Sebastian Ruder在一篇博客文章中写道:“我们发现,尽管模型在大多数现有的英语任务中,表现已接近人类,但在许多其他语言中表现尚不足预期

    69720

    MIT开发新型无监督语言翻译模型,又快又精准

    给定一种语言的新单词,然后他们就可以找到另一种语言中匹配的单词和短语。 但是这种翻译数据耗时且难以收集,并且对于全世界使用的7000种语言中的许多语言而言可能根本不存在。...最近,研究人员一直在开发“单”模型,这些模型使两种语言的文本之间进行翻译,但两者之间没有直接的翻译信息。...在实验中,研究人员的模型与最先进的单模型一样准确,有时更准确,重要的是速度更快,而且仅使用一小部分计算能力。...“该模型将两种语言中的单词视为一组向量,并通过基本保留关系将这些向量从一组映射到另一组,”该论文的共同作者,CSAIL研究员Tommi Jaakkola表示,“这种方法可以帮助翻译低资源语言或方言,只要它们有足够的单内容...如果向量都非常接近,它们的分数将接近0,并且它们越远,分数越高。例如,法语和意大利等类似的浪漫语言得分接近1,而汉语与其他主要语言得分在6到9之间。

    75240

    ACL 2021 | 腾讯AI Lab、港中文杰出论文:用单记忆实现高性能NMT

    给定源语言中的输入 x,检索模型首先会根据相关函数 ? ,选择一些来自 Z 的可能有用的句子 ? ,其中 ? 。然后,翻译模型以检索到的集合 ? 和原始输入 x 为条件,使用概率模型 ?...检索模型 检索模型负责从大型单 TM 中为源语句选出最相关的语句。这可能涉及测量源语句和数百万个候选目标语句之间的相关性分数,带来了严重的计算挑战。...为了使从翻译输出到检索模型的梯度流有效,该研究将注意力分数与相关性分数进行了偏置处理,重写了等式(1)如下所示: ? 训练 该研究在负对数似然损失函数 ?...第二个任务是 token 级交叉对齐,其目的是在给定源语句表征的情况下预测目标语言中的 token,反之亦然。该研究使用词袋损失: ? 其中 ?...非参数领域自适应 由下表 4 可得,当仅使用双语数据时,与 non-TM 基线相比,TM 增强模型在数据较少的域中获得更高的 BLEU 分数,但在其他域中的分数略低。

    79730

    改变传统,吴恩达开源了一个机器翻译智能体项目

    例如,拉丁美洲的西班牙与西班牙的西班牙不同;加拿大的法语与法国的法语不同。...根据使用传统翻译数据集的 BLEU 分数进行评估的结果:这种工作流有时能与领先的商业产品竞争,但有时表现也不如它们。不过,它偶尔也能够得到非常好的结果,甚至优于商业产品。...例如,许多企业使用的是互联网上不常用的专业术语,而 LLM 可能不知道这些术语。此外,还有许多术语可能有多种翻译方式。...例如,「open source」在西班牙中可以是「Código abierto」或「Fuente abierta」;两者都可以,但最好选择一个并在单个文档中坚持长期使用。 术语表的使用和实施。...翻译智能体在不同语言中的表现会发生怎样的变化?有没有通过一些变动,使其在特定源语言或目标语言上表现更好的方法?

    14810

    资源 | FAIR & NYU开发XNLI语料库:15种语言(含低资源语言)

    行业应用的常规任务可能不包括自然语言推断(natural language inference,NLI),但研究者认为 NLI 是评估跨语言句子表征的良好测试平台,XNLI 的更好方法能够带来更好的跨语言理解...研究者使用文本蕴含标注这些句对,然后将这些句子翻译成 14 种语言:法语、西班牙、德语、希腊、保加利亚、俄语、土耳其、阿拉伯、越南、泰语、中文、印度、斯瓦西里和乌尔都,这就有 11.25...每个 premise 可与 15 种语言中的对应假设相关,一共有超过 150 万组合。 ? 该研究介绍了一个基准,即 XNLI 语料库,它将这些 NLI 语料库扩展到 15 种语言。...XNLI 语料库聚焦于开发数据和测试数据,因此构建它的目的是评估跨语言句子理解,其中模型必须在一种语言中训练,在其他不同的语言中测试。...研究展示了平行数据有助于在多语言中对齐句子编码器,以使使用 English NLI 数据训练的分类器能够正确地分类其他语言的句对。

    1.8K30

    对预训练语言模型中跨语言迁移影响因素的分析

    Anchor points Anchor points就是说在不同语言中都会出现的相同字符串,例如 DNA和Paris。...使用更高层的上下文特征的对齐能力比低层的要好 上下文word-level对齐 研究表明,对齐单语言模型(MLM对齐)获得了相对较好的性能,尽管它们的性能不如双语MLM,除了英语法语解析。...单对齐的结果表明,我们可以通过一个简单的线性映射对单BERT模型的上下文进行对齐,并将这种方法用于跨语言迁移。模型在中间层取得了最好的迁移对齐性能,而不是最后一层。...作者使用CKA神经网络相似性指数来研究BERT模型之间的相似性,并表明Transformer的底层比最后层的跨语言相似度更高 所有这些影响在关系更密切的语言中更强,这表明在距离更遥远的语言对中有显著改进的空间...最近文章 为什么回归问题不能用Dropout?

    79320

    教研室的故事——Excel公式之“争”

    她一直想将学生每次考试的答案和成绩放到Excel工作表中,并由Excel自动算出分数。因为她觉得,算分数,Excel应该最拿手了。...图2 吴老师满意地看着这个刚完成的表,一名同事突然说,这么简单的需求,能不能不使用IF函数,直接比较得出TRUE/FALSE,然后将其转换成1/0。...于是,公式又变成了: =--(C3=C$2) 吴老师心想,“平时看不出来,这位同事在Excel方面还是高手呀!”此时,她突然灵机一动,“能不能使用一个公式就能算出总分呢?”...“那能不能不使用数组公式,就像刚才单独计算每题的分数那样。”显然,吴老师对同事的得意有点不快。 “So easy.”同事没有在意吴老师略带不快的表情,依然眉飞色舞。...还没等吴老师反映过来,同事又抛出了惊人之。 “真有这样的公式……”吴老师有点不相信地看着同事。 同事笑了笑,在吴老师惊奇的眼神注视下,慢慢地开始了表演。

    61210

    开发 | Facebook 开源增强版 LASER 库:可实现 93 种语言的零样本迁移

    句子嵌入通过使用该数据集,可以在多语言相似性搜索上得到很好的结果,即使是在低资源的语言中也是如此。...、斯瓦比亚、索布)的表现也非常强大。...Facebook 的研究人员考虑进行零样本设置,换句话说,就是研究人员在没有微调或者目标语言资源的情况下,在英语上训练 NLI 分类器,然后将它应用到目标语言中。...这个获胜的系统就是专为该任务所设计的,基于这个系统,Facebook 研究人员把德/英的 F1 分数从 85.5 提高到了 96.2、法/英的 F1 分数从 81.5 提升到了 93.9、俄/英从 81.3...这使得研究人员能够基于最终句子嵌入,仅使用英文标注数据就学习一个分类器,并且在不做任何修改的情况下将该分类器迁移到 93 种语言中的任意一种中。

    1.4K30

    ASCII

    http://c.biancheng.net/c/ascii/ 转自C言中文网 ASCII(American Standard Code for Information Interchange,美国信息互换标准代码...后来呢,NUL 被用于C言中,表示字符串的结束,当一个字符串中间出现 NUL 时,就意味着这个是一个字符串的结尾了。...早在 1960s 年代,设计 ASCII 编码的美国人就已经想到了,ASCII 编码不仅仅能用于英文,也要能用于外文字符集,这很重要,定义 Shift In 和 Shift Out 正是考虑到了这点。...最开始,其意为在西里尔和拉丁之间切换。...我们现在习惯于随机访问一些存储介质,比如 RAM、磁盘等,但是在设计 ASCII 编码的那个年代,大部分数据还是顺序的、串行的,而不是随机访问的。

    1.5K50

    译|你不知道的CSS国际化

    在大多数情况下,你会使用像 zh 这样的两个字母代码来表示中文,但中文(在其他语言中,如阿拉伯)被认为是由许多语言组成的大语言,其中有更多的主语子标记。...有些人可能想知道从右到左的语言,如阿拉伯、希伯来或波斯(仅举几例),以及CSS是否也适用于这些文字。 简而言之,CSS不应该用于双向风格设计。...再有,某些事情在英语等语言中发生的频率较低,但是在很大程度上影响了诸如缅甸这样的文字的美观性。 字体变化 有两类用于访问OpenType功能的CSS属性,即高级属性和低级属性。...它是同一字符,但写法可能不同。 ?...有141个特征标签,从可选的分数到对齐,从可选的Ruby表示法到割零。这些CSS属性与字体文件本身的功能密切相关,因此,外部依赖性取决于你选择的字体。

    1.6K10

    跨语言嵌入模型的调查

    他们通过用居中矩阵C进行维数平均中心来捕捉这种直觉米CmCmC_m: 这就减少了最大化维数协方差的总和,只要3W与上述正交相似: 有趣的是,Faruqui和Dyer(2014)的方法类似于这个目标...因此,为了便于训练,作者最有可能用占位符替换源语言和目标语料库中的翻译对,以确保共同的向量表示,类似于后续模型的过程。...跨语言正则化术语反过来又鼓励经常彼此对齐的单词的表示类似: 其中一个一个A是矩阵捕获对齐分数, 是身份矩阵, 是克罗内克产品,和 是单词 .....双语跳读 Luong等人 将跳跃词扩展到跨语言环境,并使用跳跃词目标作为单和跨语言目标。与其仅仅预测源语言中的周围词语,他们使用源语言中的词语来额外地预测其在目标语言中的对齐词语,如图13所示。...这是通过首先使用每个语料库上的段向量来学习每种语言中文档的单表达来完成的。

    6.9K100

    XLM-RoBERTa: 一种多语言预训练模型

    尽管社区的单训练模型越来越多,但还有一种似乎不太受关注的替代方法:多语言模型。 在本文中,我们重点介绍XLM-R模型的关键要素,并探讨其在德语中的性能。...它比用来训练其前身的Wiki-100语料库大几个数量级,并且在资源较少的语言中,扩展尤其明显。它比用来训练其前版本的Wiki-100语料库大几个数量级,并且在资源较少的语言中,这种扩大尤其明显。...XLM-RoBERTa Large与GermEval18(分类)的最佳提交分数不相上下。在GermEval14(NER)上,该模型在F1的表现比在Flair的要好2.35%。 ? 评估结果。...这里是GermEval18 的排行榜,这里是Flair报告的分数 这些结果是在不进行大量超参数调整的情况下得出的,我们希望通过进一步调整学习率和batch大小可以改善这些结果。...我们认为,未来最好的模型可以从文本中学习,不仅可以从不同的领域而且可以从不同的语言中学习,这并不是不可思议的。

    2.8K20

    C语言常用的知识没多少之C语言的数据类型及变量与常量

    C言中有数值和数制之分,在这里就从数值和数制开始讲起。其实数值和数制这四个字就已经包含了本文的标题C语言的数据类型及变量与常量。 为了方便理解数值和数制,先联系一下现实生活中的数。...现实中的数学在数方面分为实数和虚数,而实数又分为整数、小数、分数、正数、负数、自然数等。这些把数根据某些标准分成几类称为数制。...在计算机中,实型是指小数(包括分数)。...所以也不能用双精度实型(double)代替整型(int)。...C言中会不停的使用常量与变量,初学者很容易搞混,最好多查阅和多度一些相关的资料。这样就能够分清什么是常量,什么是变量。

    1K20

    40种语言、9项推理任务,谷歌发布新的NLP基准测试XTREME

    针对在其他语言中也有标注数据的任务,作者也比较了模型在这些语言上进行微调后的性能,最终获得了 9 个XTREME任务的zero-shot得分,得出了综合分数。...具体分析包括五个部分: 最佳zero-shot模式分析:如上图所示,这部分主要说明为什么在不同的任务和语言中评估通用的多语言表征非常重要。...与训练前数据大小的相关性:如上图模型性能与各语言中维基百科文章数量的皮尔森相关系数ρ,表明除了结构化预测任务的任务外,多数任务的相关系数都很高。...跨语言的错误:因为对于其他测试集是从英语翻译过来的XNLI和XQuAD,这部分作者分析了这些方法在源语言和目标语言中是否会犯同样类型的错误。...更为具体一些是探讨了英语中正确和错误预测的例子是否在其他语言中被正确预测。结果是在XNLI和XQuAD数据集上有不同答案。

    1K10
    领券