首页
学习
活动
专区
圈层
工具
发布

#压缩

VFP AI 插件:超长上下文的识别(二)

firstxinjie

距离上一篇VFP AI 插件:超长上下文的识别(一)有些时间了。经过不断的试错和优化,终于完成了 VFP AI 插件的超长上下的识别。将时间从数小时压缩至最多几...

1400

ICDE 2026 | 【第1轮】时间序列(Time Series)论文总结(预测,异常检测,分析,压缩)

时空探索之旅

ICDE 2026在2026年5月4日至8日在加拿大蒙特利尔(Montréal, Canada)举行。

2300

ollama v0.17.7 最新发布:思考层级正确解析、上下文压缩强化,核心模块全面优化!

福大大架构师每日一题

2026 年 3 月 6 日,Ollama 正式推出了 v0.17.7 最新版本。这一版本相较于此前版本在“思考(thinking)模型”的解析逻辑、上下文压缩...

17410

2026-03-05:最大划分因子。用go语言,给定一个二维整数数组 points,其中每个元素 points[i] = [xi, yi] 表示平面上的一个点。 两点之间

福大大架构师每日一题

2026-03-05:最大划分因子。用go语言,给定一个二维整数数组 points,其中每个元素 points[i] = [xi, yi] 表示平面上的一个点。

6510

实战复盘:如何用 OpenClaw 把量化交易策略研发周期从两周压缩到 4 小时?

gavin1024

我之前习惯用高配CVM,觉得灵活。但对于量化策略研发,你根本用不上那么多自定义选项。光是配置安全组、挂载云盘、搭建 VPC,就得花大半天。轻量应用服务器把这些打...

23420

AI时代,为什么我极力推荐你开始写日记?

数字生命卡兹克

之前一直有开始记日记的想法,也断断续续记过一些,但是没有坚持下来。而现在,真正让我开始重新思考日记的,是两个人。

14910

AI Agent 记忆机制详解:是什么、为什么、怎么用

肥晨

随着交互历史增长,资源需求和延迟会增加,必须进行记忆压缩。以下是三种主流压缩技术:

18910

RAG优化字典:20种RAG优化方法全解析

腾讯云开发者

本文系统性地梳理了 RAG(Retrieval-Augmented Generation,检索增强生成)系统从基础到高级的 20 种优化方法,涵盖分块策略、检索...

22110

2026-02-23:交换元素后的最大交替和。用go语言,给定一个整数数组 nums,定义其交替和为下标偶数位置元素之和减去奇数位置元素之和(即

福大大架构师每日一题

2026-02-23:交换元素后的最大交替和。用go语言,给定一个整数数组 nums,定义其交替和为下标偶数位置元素之和减去奇数位置元素之和(即 nums[0]...

8510

ollama v0.16.3 发布:新增Cline集成、支持Gemma 3 / Llama 3 / Qwen 3架构、全新Zstd压缩支持与TUI交互升级详解

福大大架构师每日一题

2026年2月21日,ollama 团队正式发布 v0.16.3 最新版本。这一版本是继上次更新后的又一次重要功能升级与性能优化版本,不仅集成了全新的 Clin...

29210

深入解析OpenClaw上下文窗口压缩方案 :一切都是为了效果与省钱

腾讯云开发者

最近很火的 OpenClaw 的出镜率是越来越高了,内外网的技术文章,新产品的问世,Mac Mini 的涨价,自媒体的宣传层出不穷。作者是国外一个叫 Peter...

2K41

一个全新的大模型压缩工具,极限量化

Ai学习的老章

DeepSeek-R1 满血版 671B,光模型文件就几百 GB,普通人想都别想。就算用 Ollama 跑个量化版,4-bit 的 7B 模型也得 6-8 GB...

18510

极致压缩OpenClaw,超低成本,快速启动

Ai学习的老章

继续极限压缩 OpenClaw,PicoClaw 来了,比之前我介绍到的 nanoBot 更小巧,不需要 Macmini,10 块钱的硬件,10MB 内存,1 ...

85210

Go在AI对话上下文压缩处理上的实践

技术圈

你有没有遇到过这样的情况:和 AI 聊了十几轮,突然发现它"忘记"了之前说过的内容?或者 API 调用因为 Token 超限直接报错?

16110

Nature | 视觉皮层的紧凑型深度神经网络模型

DrugOne

长期以来,理解视觉皮层计算机制的重要路径之一,是构建能够预测神经元对任意图像响应的模型。深度神经网络已成为当前最强的预测工具,但其数千万级参数结构使内部计算过程...

8830

OpenClaw 的Agent记忆与 RAG 有何区别?

臻成AI大模型

你跟ChatGPT聊完一场,第二天它完全不知道你是谁。你说上次那个问题,它完全茫然。

72110

从提示工程转向 上下文工程,6种让LLM在生产环境中稳定输出的技术

deephub

压缩适用于文档篇幅长(单个超过5000 Token)、所需信息深埋在文本中、或按 Token 计费且需要成本优化的场景。如果文档本身已经很短(少于1000 To...

13910

RAG 中分块重叠的 8 个隐性开销与权衡策略

deephub

RAG 分块重叠提升了召回率但增加了隐藏成本,比如说索引膨胀、Embedding 开销、延迟、重排序负载和评估漂移。

9610

Claude Code2.1.3 官宣:Agent Skill 新王当立!

GoLang学习记

最近,Claude Code 发布了 2.1.3 版本,表面看是“小修小补”,实则暗藏玄机。它干了一件特别像人类的事:把家里乱七八糟的遥控器、充电线、说明书统统...

9710

实测|用 DracoOptimizer 把 glTF/GLB 模型压缩到极致:体积减90%,Web3D加载快到飞起

用户11938786

压缩完成后,点击「导出文件」,可选择将压缩后的文件保存到指定目录,同时生成压缩报告(体积、压缩率、耗时)。

29814
领券