首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >【开源项目】常见的金融领域开源大模型整理

【开源项目】常见的金融领域开源大模型整理

作者头像
子晓聊技术
发布2026-04-23 14:10:21
发布2026-04-23 14:10:21
2680
举报
文章被收录于专栏:子晓AI量化子晓AI量化

周末有同学问金融领域有哪些开源大模型,我之前收藏夹里并不少,这里一并梳理下,不让收藏夹吃灰。

在金融行业数字化转型的浪潮中,大语言模型(LLM)正逐步成为智能投研、风险控制、合规管理等场景的核心工具。面对金融文本的高专业性、数据敏感性和逻辑复杂性,开源社区涌现出一批针对金融场景优化的模型框架。


一、综合型金融大语言模型

轩辕(XuanYuan)系列

作为国内首个千亿级中文金融对话模型,轩辕系列基于国际主流架构进行深度本地化改造。其核心版本包括:

  • 轩辕70B:基于Llama2-70B架构的中文增强模型,通过超过300亿Token的金融文本预训练,显著提升对《资管新规》《证券法》等专业法规的理解能力。支持8k-16k超长上下文处理,在金融合同条款比对、招股书分析等场景表现优异。
  • 轩辕-FinX1:专为金融推理设计的版本,引入思维链(Chain-of-Thought)强化技术,在股票估值模型构建、财务指标关联性分析等任务中展现出类人逻辑推导能力。 开源地址:
  • 轩辕系列主仓库:https://github.com/Duxiaoman-DI/XuanYuan
  • Llama3-XuanYuan3-70B-Chat:https://wisemodel.cn/models/Duxiaoman-XuanYuan/Llama3-XuanYuan3-70B-Chat
FinGPT

由AI4Finance基金会打造的模块化金融框架,其核心创新在于构建了动态数据管道(Data-Centric Pipeline)。该模型整合了全球30+金融数据源的实时数据流,包括SEC文件、彭博终端新闻、Reddit投资社区讨论等,通过自适应清洗机制解决金融文本中的噪声问题。其RLHF训练框架支持个性化风险偏好配置,已在智能投顾系统部署中验证了市场情绪分析的实时性优势。 开源地址:

  • 主仓库:https://github.com/AI4Finance-Foundation/FinGPT
  • 配套NLP工具库:https://github.com/AI4Finance-Foundation/FinNLP

二、垂直领域优化模型

DISC-FinLLM(复旦大学)

复旦大学团队基于Baichuan-13B架构开发的金融知识增强模型,其突破性在于构建了四维能力矩阵:

  1. 金融咨询:支持理财产品对比、税务筹划方案生成
  2. 文本分析:实现年报关键信息提取与风险信号识别
  3. 数值计算:内嵌财务指标公式引擎(如ROE分解、DCF估值)
  4. 知识检索:对接企业图谱数据库进行关联查询 该模型开源了完整的训练数据样本和评测工具链,特别适合金融机构内部知识库的二次开发。 开源地址:https://github.com/FudanDISC/DISC-FinLLM
通义点金(Tongyi-Finance)

阿里云推出的金融大模型解决方案,通过三阶段训练策略实现能力跃升:

  1. 基座预训练:在通用语料基础上增量学习200亿金融Token
  2. 指令微调:使用3.8万道证券从业资格考题构建思维链数据
  3. 工具增强:集成Wind插件实现实时市场数据调用 其Multi-Agent架构支持任务分解与协同,例如在撰写投研报告时,自动调度行业分析Agent、财务建模Agent和合规审查Agent协同工作。 开源地址:
  • 代码仓库:https://github.com/aliyun/qwen-dianjin
  • 模型下载:https://huggingface.co/DianJin
PIXIU(貔貅)

聚焦金融文本多任务处理的开源框架,其创新点在于构建了层次化训练体系:

  • 基础层:使用136K条指令数据微调LLaMA,覆盖财报摘要、风险提示生成等场景
  • 增强层:引入对抗训练提升模型对误导性信息的辨别能力
  • 应用层:开发股票预测插件,支持技术面因子(MACD、RSI)与基本面数据的融合分析 在FinNLP竞赛中,PIXIU在金融情感分析任务上的F1值达到92.3%,超越商用API表现。 开源地址:
  • 主项目:https://github.com/The-FinAI/PIXIU
  • 数据集:https://github.com/chancefocus/PIXIU

三、轻量化与工具增强方案

Cornucopia(聚宝盆)

针对中小企业开发的轻量级解决方案,基于LLaMA-7B架构进行三方面优化:

  1. 知识蒸馏:将轩辕70B的金融知识迁移至小规模模型
  2. 指令优化:构建中文金融问答数据集FinQA-5K
  3. 工具链封装:提供RESTful API快速部署方案 该模型在4090显卡上可实现每秒15Token的生成速度,适合高频舆情监控场景。 开源地址:https://github.com/jerry1993-tech/Cornucopia-LLaMA-Fin-Chinese
FinGLM

专注上市公司年报分析的公益项目,其技术特色包括:

  • 文档解析引擎:支持PDF/Word格式年报的结构化提取
  • 关键指标追踪:自动生成ESG评分变化趋势图
  • 风险预警系统:基于管理层讨论章节的情感分析 项目团队开放了完整的微调教程和数据处理工具包,助力学术机构开展公司治理研究。 开源地址:https://github.com/MetaGLM/FinGLM

开源项目太多了,学不过来。 用好合适的工具辅助自己投资决策才是硬道理。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 子晓聊技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、综合型金融大语言模型
    • 轩辕(XuanYuan)系列
    • FinGPT
  • 二、垂直领域优化模型
    • DISC-FinLLM(复旦大学)
    • 通义点金(Tongyi-Finance)
    • PIXIU(貔貅)
  • 三、轻量化与工具增强方案
    • Cornucopia(聚宝盆)
    • FinGLM
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档