首页
学习
活动
专区
圈层
工具
发布

#量化

.NET 数据摄取与向量化架构:构建企业级检索增强生成(RAG)管道

张善友

随着生成式人工智能(Generative AI)技术的迅猛发展,企业级应用开发正经历着一场深刻的范式转变。传统的事务处理系统正在向基于大语言模型(LLM)的智能...

7410

股票 API 对接,接入美国纳斯达克交易所(Nasdaq)实现缠论回测

FxStock Lab

想进行量化分析却不知道从何入手?本文将教你一步步利用 股票 API 构建一个完整的自动化回测系。无论是股票实时行情的监控,还是通过股票 API 和高频股票实时报...

12610

加速近200倍!RTX 5090生成高质量视频只要1.9秒!清华&生数等重磅开源TurboDiffusion

AI生成未来

文章链接:https://arxiv.org/pdf/2512.16093 代码链接: https://github.com/thu-ml/TurboDiff...

10310

股票 API 对接, 接入德国法兰克福交易所(FWB/Xetra)实现量化分析

FxStock Lab

如何实现实现量化分析,首先获取股票实时行情、股票历史数据和股票行情数据是进行量化交易和分析的关键。通过可靠的股票实时行情接口,如股票API,股票实时报价 API...

11610

scRNA FIgure1 降维聚类、注释可视化学习

医小北同学

单细胞转录组分析表明免疫抑制性肿瘤微环境与胰腺癌肝转移有关: https://www.nature.com/articles/s41467-023-40727-...

11410

宏病毒组量化指南:从丰度计算到差异挖掘

天意生信云

在上一篇教程中,我们利用 iPHoP 成功为病毒找到了宿主。现在,我们手中已经掌握了病毒的身份(Taxonomy)和关系(Host-Virus link)。

7010

LlamaIndex检索调优实战:七个能落地的技术细节

deephub

RAG系统搭完其实才是工作的开始,实际跑起来你会发现,答案质量参差不齐,有时候精准得吓人、有时候又会非常离谱。这个问题往往不模型本身,而是在检索环节的那些"小细...

13210

五年,终于等来Transformers v5

机器之心

紧跟技术前沿,v5 将量化作为 Transformers 的核心能力之一,确保它能够与主要功能完全兼容,并为训练与推理提供一个可靠的量化框架。

8810

Ascend C 算子开发高阶进阶:异构计算、算子融合与AI模型定制化优化

用户11944278

12610

基于历史数据的量化策略验证流程实现

用户11958489

在数据驱动的分析场景中,量化策略通常需要通过历史数据进行验证,才能评估其稳定性与有效性。

9810

口碑(Word of Mouth):增长的原始驱动力与终极信任货币

jack.yang

在一切营销手段出现之前,商业的起点是人与人之间的推荐。口碑 正是这种最古老、最强大、也最不容忽视的增长动力。它超越了所有可购买的广告,是用户用信任为你投下的、真...

17010

基于强化学习的量化交易框架 TensorTrade

deephub

打开交易图表,堆上十个技术指标,然后对着屏幕发呆不知道下一步怎么操作——这场景对交易员来说太熟悉了。如果把历史数据丢给计算机,告诉它“去试错”。赚了有奖励,亏了...

9700

vLLM 0.12.0 重磅更新:whisper终于支持verbose_json 时间戳了

井九

vLLM 0.12.0 发布了。这次更新堪称一次“地基级”升级:从执行引擎到推理并行、从推理加速到多模态支持,全线都有显著改动。

25610

ollama v0.13.4 发布——全新模型与性能优化详解

福大大架构师每日一题

llm/server.go 增加了 Flash Attention 用户显式设置检测逻辑,并完善了 KV 缓存量化兼容性处理。当使用量化 KV 缓存类型时必须启...

14510

推理成本太高、算力不够用?单纯堆卡没用,得靠极致的“压缩”与“调度” | AICon

深度学习与Python

宋晓辉将在演讲中展示 OPPO 最新的端侧化技术路线图,其核心突破在于自研的 QALFT 端侧量化感知训练框架。传统的离线量化(PTQ)往往会有精度损失,而 Q...

17310

PyTorch v2.8.0 正式发布:量化推理、编译优化与分布式检查点等多项重大更新

福大大架构师每日一题

近日,PyTorch 团队正式发布了 v2.8.0 版本,带来了多项重要功能更新、性能优化和错误修复。本文将详细介绍该版本的主要变化,帮助开发者更好地理解新特性...

15010

transformers v4.56.0发布:DINOv3、SAM 2等八大模型重磅登场,推理训练双优化

福大大架构师每日一题

具体改进包括:修复MXFP4量化器验证以允许使用反量化选项进行CPU推理;使GPT-OSS MXFP4在旧硬件(sm75+)上可用;修复MXFP4量化中的拼写错...

28110

lmdeploy v0.9.2 重磅发布:全面拥抱多模态与大模型,FP8量化、FA3加速与Qwen2.5-VL支持的飞跃

福大大架构师每日一题

量化技术是降低大模型部署成本、提升推理速度的核心手段。v0.9.2 在量化方面做出了重要改进。

13110

学术论文库智能化升级指南:6大向量数据库横向对比与腾讯云VDB深度解析

gavin1024

23410

模型速度对比分析

贺公子之数据科学与艺术

Qwen3-30B-A3B-AWQ采用30B参数量+AWQ量化(4bit),而Qwen3-14B-FP8为14B参数+FP8(8bit)精度。理论速度差异主要取...

11410
领券