首页
学习
活动
专区
圈层
工具
发布

​ LaVy 与 LaVy-Bench | 推进越南语多模态语言理解研究与基准测试 !

为了解决这一限制,促进越南语多模态语言理解的研究,作者推出了LaVy,这是越南语首个MLLM,并在越南语视觉语言任务上取得了最先进的表现。...然而,OpenViVQA数据集包含多种在作者的训练数据集中未出现的问题类型,例如OCR,这使得这个测试集对作者的模型来说尤其具有挑战性,更不用说作者的训练说明仅包括8,000张越南语抓取图像的描述了。...所收集的图片和手工制作的问题旨在在各个方面多样化测试集:文化、种族、图像类型...与表2中的mBLIP Baseline 相比,LaVy在所有类型的问题上都明显表现更好:对话(+30%)、详细描述(+64%...此外,与其他MLLMs一样,作者的模型仍然存在幻觉问题,它会生成不相关的信息、冗余的细节或错误信息。...6 Conclusion 在本论文中,作者介绍了LaVy,这是一个开创性的最先进的越南多模态大型语言模型(MLLM),旨在解决越南语在多模态方面高质量资源缺乏的问题。

28510

Win10上云、添加越南语

,要点:先搞英文再搞越南语 image.png 关于display language 越南语 的问题,微软官网写的,仅支持38种,越南语不在其中,server2016/2019实测都不支持,server2022...预览版实测也不支持,向微软咨询,微软明确答复不支持 我实测win10企业版、专业版、专业工作站版是支持越南语作为display language的 运行intl.cpl → 语言首选项 → 语言 → 添加...→ 输入vietnam → 下一步安装语言时对Set as my Windows display language打勾 我试了,中文版先安装越南语选不了显示语言为越南语,需要把英文装上后,这样才能选越南...后来在微软官网查到资料并经过实践证实了 一开始我自己无意间先把英文装了,然后装越南语一次性成功了,我没意识到它跟英文的相关性 https://answers.microsoft.com/zh-hans...像日本亚马逊它就是日本字,系统的显示语言、浏览器的显示语言调到越南语后,剩下的就看网站本身的内容了 https://www.amazon.co.jp/ 亚马逊日本,这个站点很典型,排查语言问题时 ,它即能识别机器所在地域

3.5K50
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    越南文识别技术:连接传统信息与数字世界的重要桥梁

    在数字化浪潮席卷全球的今天,如何将海量的纸质文档和信息快速、准确地转化为可编辑、可检索的数字数据,已成为一项关键挑战。光学字符识别(OCR)技术正是解决这一挑战的核心。...5.后处理: 利用自然语言处理(NLP)技术和越南语词典,对识别出的原始文本进行校正。...教育与研究:将越南语教材、古籍、研究论文数字化,便于建立电子图书馆和进行文本分析,促进知识传播与学术研究。...移动互联网应用:集成到手机APP中,实现即时翻译(摄像头对准越南语菜单或路牌即可翻译)、名片信息自动录入、扫描解题等便捷功能。物流与电商:自动读取运单上的地址和商品信息,优化分拣和配送流程。...越南文识别技术是人工智能与语言学深度结合的典范。随着深度学习技术的不断演进和高质量越南语数据集的日益丰富,该技术必将变得更加智能、精准和鲁棒。

    23310

    我们搞了个能自动翻译的客服系统,小语种也不在话下!

    gofly.v1kf.com 最近我们团队折腾出了一个挺有意思的东西——​​支持多语言自动翻译的在线客服系统​​。...说实话,做这个的初衷特别简单:现在跨境电商这么火,但很多商家客服根本搞不定小语种客户,看着客户发来的越南语、泰语干瞪眼,这单子不就飞了吗?...目前实测下来,像越南语、泰语这些东南亚语言翻译准确率大概85%,英语日语这些能到95%。...虽然比不上专业翻译软件,但对客服场景完全够用了——毕竟客户发个"tôi muốn hoàn tiền"(越南语退款),客服能秒懂意思比什么都强。...(敲键盘调出数据面板)最近接入了二十多家跨境电商,最夸张的一天处理了17种语言的对话。

    27310

    英语和汉语谁更高效?17大主流语言测试结果:没有优劣之分,带宽都是每秒39bit

    哪种语言是世界上最高效的语言?这个问题一直争论不休,也难以量化。 首先,不同语种的说话速度差异很大。...语速和信息密度成反比 研究语音的“带宽”,即信息速率,最核心的问题是计算不同语言单音节的信息量。早在1951年,信息论创始人香农就已经开始研究英语书面文字的信息熵问题。...最近,他们把研究的范围扩展到9个语系17种语言,包括越南语、英语、德语、意大利语、法语、日语、韩语、汉语普通话、粤语等等。...研究人员发现,日语只有643个音节,每个音节的信息密度约为5比特;英语的音节数量为6949,每个音节的密度为7比特;越南语最为复杂,平均每个音节包含8比特的信息,排在所有语言之首。...大脑限制了语言速率 里昂大学的语言学家François Pellegrino说:“由于语言科学长期关注语法复杂性等问题,这种信息传输速率被忽略了。”

    1.9K10

    如何完美解决跨境独立站多语言问题

    跨境独立站,面向的是全球国家,每个国家都有自己的语言,譬如:英语,德语,法语,俄语,西班牙语,葡萄牙语,韩语,日语,阿拉伯语,越南语,缅甸语,等等。每个国家通常使用自己的语言搜索和浏览网站。...跨境独立站如果支持多语言,那么就会带来更多的流量,更为广泛的用户群体,更强的品牌塑造。电商独立站实现多语言有哪些优势?...符合目标用户的搜索习惯提升SEO排名母语搜索更精准更有亲和力,吸引本土采购商彰显公司实力避开英语网站竞争跨境电商独立站实现多语言的难点1.需要系统功能支持目前的saas系统大多数不支持多语言,因为他们的核心是卖店铺...fecify 跨境saas独立站多语言解决方案一.多语言支持系统本身支持15种语言,包含:英语,德语,法语,俄语,繁体中文,简体中文,西班牙语,葡萄牙语,意大利语,日语,韩语,荷兰语,越南语,缅甸语,老挝语二...,翻译成15种其他的语言,你可以提交批量自动翻译任务,将您的所有的商品,分类,菜单,等业务数据翻译成相应的语言您只需要将翻译引擎api配置好即可提交批量翻译任务批量翻译数据任务脚本跑完后,您的商品数据,

    1.7K50

    越南首个大规模高质量法律问答数据集发布

    VLQA:首个全面、大规模且高质量的越南法律问答数据集大型语言模型(LLM)的出现推动了各个领域的重大成就,包括法律文本处理。利用LLM处理法律任务是自然演进且日益引人注目的选择。...然而,它们的能力常常被夸大。尽管取得了进展,但距离使用人工智能(AI)和自然语言处理(NLP)完全自动化法律任务的最终目标仍然遥远。此外,法律系统具有深刻的领域特异性,在不同国家和语言间存在显著差异。...因此,为不同自然语言构建法律文本处理应用的需求巨大且紧迫。然而,对于越南语等低资源语言的法律NLP而言,由于资源和标注数据的稀缺,面临着巨大挑战。...用于监督训练、验证和监督微调的标注法律语料库的需求至关重要。本文介绍了VLQA数据集,这是一个为越南法律领域量身定制的全面且高质量的资源。...数据集特点全面性:覆盖越南法律多个领域大规模:包含大量高质量问答对高质量:经过严格的质量控制和验证实验评估研究团队在以下任务上进行了实验:法律信息检索法律问答任务模型性能对比分析该数据集的发布为越南语法律

    15810

    盘点NLP最新进展:多语种40+任务最优结果任你查

    读者也可以自行在Github页面上添加新的结果,本文中大部分为英文NLP资源,还有少数汉语、印地语和越南语资源。...本文主要目标是为感兴趣的读者提供关于NLP基准数据集的快速概览,以及最新技术的进展,这些数据集和新进展可以作为进一步NLP研究的基础。...数据集 本文中收录的数据集,除了利用该数据集的论文之外,还应经过至少一篇已发表的其他论文的评估。 代码 我们建议添加指向实现的链接(如果可用)。如果代码不存在,您可以向表中添加代码列(见下文)。...具体索引内容和研究领域如下,绝大部分为英语,有少量资源为汉语、印地语和越南语。...关系预测 关系提取 语义文本相似度 语义解析 语义角色标记 情绪分析 浅语法 简单化 状态检测 概要 分类学习 时间处理 文字分类 词义消歧 中文 实体链接 中文词汇分割 印地语 分块 词性标注 机器翻译 越南语

    1.4K20

    谷歌翻译服务(Google Translator)的跨站漏洞

    临睡前准备放松一下,打算找部电影看看,但记不起电影的准确英文名了,于是打开了谷歌翻译网站translate.google.com,在其中输入了越南语,想把它转换成英语,之后,我突然发现了一些端倪,于是尝试在其中输入了其它验证性...于是我尝试看看谷歌的其它语言翻译界面是否存在该漏洞,但是好像不行,它们都实施了过滤编码,只有这里的越南语(Primary language)翻译为英语(Language after translation...Payload做一些相应的编码转换,然后把上述URL发送给受害者,XSS的执行是没问题的。...谷歌设置所谓的sandbox domains目的在于,针对提供给用户的前端服务中,避免用户植入木马、病毒等恶意程序从而影响到其它谷歌服务,因此实行沙箱隔离的一类域名。...最后我要感谢漏洞众测社区的网友,他们中的一些人帮我一起验证谷歌搞错了,并给了我鼓励。

    2.2K20

    libjpeg的问题

    游戏项目是基于cocos2d-x开发的,但线上发现一个bug就是玩家在设置完自定义头像后直接闪退。凡是在设置该玩家头像的地方,游戏就直接闪退。...最终定位到的问题是图片数据源有问题,我的机器是win7,图片能预览,但同事xp系统该图片是无法预览的,默认的系统自带的图片查看工具也无法显示图片。 ?...没有jpeg格式的结束标识0xff  0xd9 我在windows下调试代码,发现是在CCImageCommon_cpp.h中的_initWithJpgData方法调用jpeg_finish_decompress...CC_SAFE_DELETE_ARRAY(row_pointer[0]);     return bRet; } 后面我用jpegtran(https://github.com/imagemin/jpegtran-bin)工具复制有问题的图片时...参考文章: [1] 小议libjpeg解压损坏文件时的错误处理 [2] JPEG File Layout and Format 解决方案可以参考这篇文章:libjpeg解压损坏文件时的错误处理

    1.5K40

    问题:实际开发中的深浅拷贝问题

    实际使用的场景如上图所示,就是简单的数据回调,push的时候又将数据传过去而已 错误场景重现 errorDemo.gif 错误情况出现:理论上,数据是通过block回调的,回调方法是写在“保存...”按钮中,而errorDemo中,点击的是导航条的返回,竟然发现datas的数值也变了 ---- 为了避免空手套黄图的嫌疑,先上一下正确的版本,以证清白~ fixDemo.gif 这个问题,表面看上去很简单...,其实有一定的技术难点,如果不会lldb 进行debug调试的,可能做起来会有点吃力; 目测估计,只是要有1年的实际开发经验的才做的出来,因为问题的本质不是特别好发现; 友情提示,注意数据源的数据结构~...这道题有一定的技术点,如果在我放出答案前做出来或者有思路,或者发现问题本质的,可以换取github star一枚(因吹斯听~) 保不齐哪天就有同样考点的面试题出现了也说不定,有兴趣的可以当做面试上机题试试...~ 问题demo

    1.2K60

    1.5K Star免费开源的屏幕实时翻译工具,可识别英语,俄语,中文等语言

    2.简洁界面:该软件的主要目标是让用户不需要对每种情况进行手动调整,方便日常使用。 3.低延迟:软件实施了多种优化措施,以减少对系统性能的影响,并尽量减少文本出现和实际翻译之间的延迟。...5.支持的翻译平台:谷歌翻译、Yandex翻译、Naver Papago、DeepL。 6.支持的识别语言:英语、俄语、日语、简体中文、韩语。...7.支持的翻译语言:英语、俄语、日语、简体中文、韩语、法语、西班牙语、德语、葡萄牙语、意大利语、越南语、泰语、土耳其语。 使用步骤: 1.打开软件的设置。...Tesseract-Windows OCR:对系统性能的影响较小,适用于背景简单且字体常见的情况。...Windows OCR-EasyOCR:对于非常特殊且复杂的情况,可以禁用Tesseract引擎,避免不必要的文本干扰。

    3.6K40

    东南亚电商多语言适配难?轻量化更新如何让商品 3 天覆盖 10 国?

    在东南亚 6.7 亿人口的电商市场,语言壁垒像一道无形的墙:印尼语、泰语、越南语等 10 余种主流语言并存,仅印尼就有 700 多种方言。...破局的关键,藏在FinClip 小程序容器技术的 “轻量化更新” 能力中。...这种转变的核心,是用模块化、热更新的技术逻辑,让电商 App 从 “笨重的翻译机” 变为 “灵活的多语言生态平台”。一、多语言适配的 “三重死结”:传统模式为何寸步难行?...更致命的是,不同语言的排版差异(如越南语文字长度比中文长 30%)会导致按钮错位、文字溢出 —— 某美妆品牌的泰语版 App 因 “加入购物车” 按钮被文字遮挡,转化率骤降 40%。...某 3C 品牌实测显示,10 国语言版本的上线时间从 2 个月缩至 1 天;UI 智能适配:系统根据语言特性自动调整排版 —— 越南语文字过长时,FinClip 的自适应算法会缩小字号、换行优化,避免按钮遮挡

    36310

    如何把业务问题变成机器学习的问题?

    在机器学习成本分配中,最大比例在机器学习本身,调参、特征工程、模型评估、模型上线这些工程的事情占了大量的时间,而问题的定义、数据的采集占的时间非常小,我们认为这是有问题的。...开发新的数据源是有风险的。机器学习最怕的是说不清楚这是算法的问题,还是数据问题,还是问题定义的问题,所以让 MVP 环节中能出问题的环节越少越好。...前面我们介绍了问题定义的问题如何避免,而算法一般是不太容易出问题的,除非用错,而数据其实是很容易出问题的,所以我们尽量用简单、可靠、成熟的数据。 第三,我们讲到在建模的过程中,尽量使用成熟的工具。...如果不是,那就是这个问题没有解决。那还会有什么原因?是不是指定了错误的目标,用在了错误的环境,或者数据有问题。其实说白了,要么是目标有错,要么是模型用错,要么是数据有问题,基于这 3 点来检查。...在现实业务中,解决了一个问题,有时也会带来新的问题。

    1K90

    【背包问题】二维费用的背包问题

    二维费用的背包问题详解 前面讲到的01背包中,对物品的限定条件只有一个体积,而在二维费用的背包问题中,相当于增加了一个限定条件,比如: 【问题描述】 输入: 物品数量 N,每个物品有重量 wi​...二维费用的背包问题时01背包问题的一个延申,状态表示和状态转移方程的分析与01背包类似。 状态表示是dp[i][j][k],表示前i个物品,在重量限制j和体积限制k下的最大价值。...总结: 常规的0-1背包问题可以用动态规划来解决,状态通常是dp[i][j]表示前i个物品,在容量j下的最大价值。对于二维费用的情况,可能需要扩展状态到两个维度。...不过,可能可以通过优化来减少空间的使用,比如使用滚动数组。 空间优化: 在常规的0-1背包问题中,我们可以将二维的dp优化为一维数组,通过逆序遍历容量来避免覆盖之前的状态。...那么在二维费用的情况下,使用二维的dp数组,而不是三维的。例如,状态dp[j][k]表示在重量j和体积k的限制下能获得的最大价值。

    13110
    领券