周末有同学问金融领域有哪些开源大模型,我之前收藏夹里并不少,这里一并梳理下,不让收藏夹吃灰。
在金融行业数字化转型的浪潮中,大语言模型(LLM)正逐步成为智能投研、风险控制、合规管理等场景的核心工具。面对金融文本的高专业性、数据敏感性和逻辑复杂性,开源社区涌现出一批针对金融场景优化的模型框架。
一、综合型金融大语言模型
轩辕(XuanYuan)系列
作为国内首个千亿级中文金融对话模型,轩辕系列基于国际主流架构进行深度本地化改造。其核心版本包括:
- 轩辕70B:基于Llama2-70B架构的中文增强模型,通过超过300亿Token的金融文本预训练,显著提升对《资管新规》《证券法》等专业法规的理解能力。支持8k-16k超长上下文处理,在金融合同条款比对、招股书分析等场景表现优异。
- 轩辕-FinX1:专为金融推理设计的版本,引入思维链(Chain-of-Thought)强化技术,在股票估值模型构建、财务指标关联性分析等任务中展现出类人逻辑推导能力。
开源地址:
- 轩辕系列主仓库:https://github.com/Duxiaoman-DI/XuanYuan
- Llama3-XuanYuan3-70B-Chat:https://wisemodel.cn/models/Duxiaoman-XuanYuan/Llama3-XuanYuan3-70B-Chat
FinGPT
由AI4Finance基金会打造的模块化金融框架,其核心创新在于构建了动态数据管道(Data-Centric Pipeline)。该模型整合了全球30+金融数据源的实时数据流,包括SEC文件、彭博终端新闻、Reddit投资社区讨论等,通过自适应清洗机制解决金融文本中的噪声问题。其RLHF训练框架支持个性化风险偏好配置,已在智能投顾系统部署中验证了市场情绪分析的实时性优势。
开源地址:
- 主仓库:https://github.com/AI4Finance-Foundation/FinGPT
- 配套NLP工具库:https://github.com/AI4Finance-Foundation/FinNLP
二、垂直领域优化模型
DISC-FinLLM(复旦大学)
复旦大学团队基于Baichuan-13B架构开发的金融知识增强模型,其突破性在于构建了四维能力矩阵:
- 金融咨询:支持理财产品对比、税务筹划方案生成
- 文本分析:实现年报关键信息提取与风险信号识别
- 数值计算:内嵌财务指标公式引擎(如ROE分解、DCF估值)
- 知识检索:对接企业图谱数据库进行关联查询
该模型开源了完整的训练数据样本和评测工具链,特别适合金融机构内部知识库的二次开发。
开源地址:https://github.com/FudanDISC/DISC-FinLLM
通义点金(Tongyi-Finance)
阿里云推出的金融大模型解决方案,通过三阶段训练策略实现能力跃升:
- 基座预训练:在通用语料基础上增量学习200亿金融Token
- 指令微调:使用3.8万道证券从业资格考题构建思维链数据
- 工具增强:集成Wind插件实现实时市场数据调用
其Multi-Agent架构支持任务分解与协同,例如在撰写投研报告时,自动调度行业分析Agent、财务建模Agent和合规审查Agent协同工作。
开源地址:
- 代码仓库:https://github.com/aliyun/qwen-dianjin
- 模型下载:https://huggingface.co/DianJin
PIXIU(貔貅)
聚焦金融文本多任务处理的开源框架,其创新点在于构建了层次化训练体系:
- 基础层:使用136K条指令数据微调LLaMA,覆盖财报摘要、风险提示生成等场景
- 增强层:引入对抗训练提升模型对误导性信息的辨别能力
- 应用层:开发股票预测插件,支持技术面因子(MACD、RSI)与基本面数据的融合分析
在FinNLP竞赛中,PIXIU在金融情感分析任务上的F1值达到92.3%,超越商用API表现。
开源地址:
- 主项目:https://github.com/The-FinAI/PIXIU
- 数据集:https://github.com/chancefocus/PIXIU
三、轻量化与工具增强方案
Cornucopia(聚宝盆)
针对中小企业开发的轻量级解决方案,基于LLaMA-7B架构进行三方面优化:
- 知识蒸馏:将轩辕70B的金融知识迁移至小规模模型
- 指令优化:构建中文金融问答数据集FinQA-5K
- 工具链封装:提供RESTful API快速部署方案
该模型在4090显卡上可实现每秒15Token的生成速度,适合高频舆情监控场景。
开源地址:https://github.com/jerry1993-tech/Cornucopia-LLaMA-Fin-Chinese
FinGLM
专注上市公司年报分析的公益项目,其技术特色包括:
- 文档解析引擎:支持PDF/Word格式年报的结构化提取
- 关键指标追踪:自动生成ESG评分变化趋势图
- 风险预警系统:基于管理层讨论章节的情感分析
项目团队开放了完整的微调教程和数据处理工具包,助力学术机构开展公司治理研究。
开源地址:https://github.com/MetaGLM/FinGLM
开源项目太多了,学不过来。 用好合适的工具辅助自己投资决策才是硬道理。