首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#LLM

ENVISIONS:一种无需人类标注的LLM自训练框架

zenRRan

问题提出: 论文针对大型语言模型(LLMs)在神经符号场景下的应用,提出了两个主要挑战:符号数据的稀缺性和LLMs在处理符号语言上的局限性。

8010

现在LLM 的大小为什都设计成6/7B、13B和130B几个档次?

zenRRan

知乎:真中合欢 链接:https://www.zhihu.com/question/627258986/answer/3262812950

8810

​解密Prompt系列33. LLM之图表理解任务-多模态篇

风雨中的小七

TinyChart使用了更高效的像素合并和Program-of-Thoguhts让3B的MLLM一举超越了13B的ChartLLama。TinyChart的整体...

15710

在腾讯云云服务器上推理及微调Qwen2-7B大语言模型

buzzfrog

随着人工智能技术的迅速发展,大型预训练模型(LLMs)在各种语言、代码及数学问题解决方面展现出了巨大潜力。Qwen2系列模型的推出无疑为自然语言处理(NLP)和...

35210

在腾讯云云服务器上使用Qwen2-0.5B模型推理

buzzfrog

在人工智能(AI)的黄金时代,我们见证了技术的边界不断扩展,模型的能力日益增强。今天,我要介绍的主角是Qwen2-0.5B模型,千问最新的大语言模型,以及如何在...

12710

【Rust日报】moxin - 纯Rust实现的LLM Client

MikeLoveRust

纯血 Rust 实现的 LLM 大模型跨平台客户端,美得很,后台链接里 WasmEdge+llama.cpp (LLamaEdge)

7210

【论文解读】大模型的有效探索

合合技术团队

论文的奖励模型架构的另一个限制是,每个架构都只是一个“头”,它将LLM的最后一层嵌入作为输入。同时,还可以通过调整LLM的主干来提高性能。虽然高效探索所带来的优...

9010

「慕K体系」LLM应用开发平台特训营-入门

用户11190134

大语言模型(LLM)应用开发涵盖了使用预训练语言模型构建自然语言处理(NLP)应用程序的过程。以下是开发 LLM 应用的详细指南,包括安装、基础配置、常见应用场...

4610

Meta发布基于大语言模型的编译器LLM Compiler,不仅可以编译成汇编代码,还可以进行反编译

deephub

LLM Compiler是一个开源模型,旨在优化代码并彻底改变编译器设计。通过在庞大的语料库上训练,包括5460亿个LLVM-IR和汇编代码标记,Meta的研究...

16110

LLM最喜欢的随机数是什么?答案竟是ta!

新智元

【新智元导读】计算机程序可以生成很像真随机的「伪随机数」,而LLM表示,干脆不装了,我就有自己最喜欢的数。

7210

LLM惊现篡改代码获得奖励,欺骗人类无法根除逆转!Anthropic新作揭露惊人真相

新智元

【新智元导读】一直以来大模型欺骗人类,早已不是什么新鲜事了。可是,最新研究竟发现,未经明确训练的LLM不仅会阿谀奉承,甚至入侵自己系统修改代码获得奖励。最恐怖的...

7010

Slack 结合 AST 和 LLM 自动转换 15000 个单元测试,成功率达 80%

深度学习与Python

Slack 的工程师随后采用了一种混合方法,结合 AST 转换和 LLM 功能,并模仿人类行为。他们将被测试的 React 组件和由 AST 工具执行的转换作为...

5510

LEARN: LLM在快手电商广告推荐场景的应用

NewBeeNLP

今天继续分享一篇大模型在推荐系统中的落地应用工作,是快手今年5月份发表的论文《Knowledge Adaptation from Large Language ...

20510

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力,开源框架SymbCoT来了

NewBeeNLP

目前的趋势是将 LLMs 与符号求解器集成以提升性能,但这些尝试通常仅限于将 LLMs 作为文本到符号的翻译器,核心推理过程仍然依赖于传统的外部推理器。这种方法...

9810

小红书&中科大 | LLM在笔记推荐中的首次落地

Houye

本文来自小红书和中科大, 首次尝试了将LLM应用到笔记推荐(Note Recommendation)中. 更具体的,

7810

RAG与向量数据库

MySQLSE

如果仅使用LLM,查询仅依靠预训练时使用的数据集来提供结果,如果使用LLM+RAG的方式,查询会使用向量数据库作为额外的数据集来提供正确的结果。向量数据库是RA...

13210

LM4LV:用于低级视觉任务的冻结大型语言模型

用户1324186

上海交通大学 · 研究员 (已认证)

大语言模型(LLM)的巨大成功和推广性带来了多模态大型语言模型(MLLM)的新研究趋势。我们想知道 LLM 可以给计算机视觉带来多大的好处,以实现更好的性能并实...

11010

CALF:用于长期时间序列预测的高效跨模态LLM微调框架

VachelHu

研究者受之前 LLM 相关工作的启发,注意到 LLM 的文本嵌入层实际上包含了丰富的 token 之间的相关性知识,例如向量之间的夹角可以表示对应语义的相似度。...

13510
领券