前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >为什么现在的大模型都用多少B来命名,比如7B、13B之类的?

为什么现在的大模型都用多少B来命名,比如7B、13B之类的?

原创
作者头像
Harry技术
发布于 2025-04-01 13:37:17
发布于 2025-04-01 13:37:17
1980
举报

为什么现在的大模型都用多少B来命名,比如7B、13B之类的?

为什么现在的大模型都用多少B来命名,比如7B、13B之类的。首先我得理解这里的B代表什么。B代表Billion,也就是十亿参数。所以模型名称中的数字B表示参数数量,比如7B就是70亿参数。


一、“B”的含义与参数规模

  • B代表“Billion”(十亿):例如,7B表示70亿参数,70B表示700亿参数。参数数量直接关联模型的复杂度,通常参数越多,模型学习和表达信息的能力越强。
  • 参数规模与性能的关系:
  1. 能力提升:参数规模越大,模型理论上能捕捉更复杂的模式和关联性,例如GPT-3(175B)在语言生成任务中的表现显著优于小规模模型。
  2. 资源需求增加:参数越多,训练和推理所需的计算资源(如显存、算力)也越高。例如,70B参数模型需要约320GB显存,通常需多张A100显卡支持。

二、参数命名的核心逻辑

  1. 直观标识技术门槛:
    • 参数规模是衡量大模型研发实力的关键指标。厂商通过突出参数量(如“70B”),展示技术领先性。
    • 例如,DeepSeek-R1系列以1.5B到671B区分不同规模的模型,便于用户根据需求选择。
  2. 简化用户选择:
    • 用户可通过参数规模快速判断模型适用场景。例如,7B模型适合普通开发者部署在单卡设备(如RTX 4090),而70B模型需企业级硬件支持。
  • 参数规模也与任务复杂度相关:数学推理、多模态生成等任务通常需要更大参数模型。
  1. 行业标准化趋势:
    • 主流厂商(如OpenAI、Meta、Google)均采用参数规模作为命名要素之一,形成行业共识。例如,LLaMA-2-7B、Gemini Pro Vision-1T等。
  • 部分厂商进一步结合 相对规模标识(如Small/Large/XL)或量化精度(如INT4、INT8),细化模型特性。

三、参数规模之外的补充信息

虽然参数规模是核心指标,但模型名称还可能包含以下关键信息:

  1. 功能定位:如“Chat”(对话优化)、“Math”(数学推理)、“Code”(代码生成)等后缀,表明模型的专项能力。
  2. 训练方法:如“SFT”(监督微调)、“RLHF”(人类反馈强化学习)等,反映模型优化方向。
  3. 量化与部署:如“GPTQ-Int4”表示4位整数量化版本,可降低显存占用,适合终端设备部署。

四、参数规模的局限性

  • 并非唯一标准:模型性能还受训练数据质量(如Token数量、多样性)、架构设计(如MoE混合专家)等因素影响。例如,DeepSeek-R1-70B可能在特定任务上优于参数量更大的低质量模型。
  • 资源与效率的权衡:参数越多,推理延迟越高。例如,70B模型生成速度约为15 token/s,远低于7B模型的50 token/s。

总结

模型名称中的“多少B”是一种高效的技术标识,既体现了参数规模对性能的基础性影响,也帮助用户快速匹配需求与资源。未来,随着量化技术(如INT4、GGUF)和架构优化(如MoE)的普及,参数规模可能不再是唯一核心指标,但短期内仍会是行业的重要参考

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
聊聊artemis的ResourceLimitSettings
activemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/settings/impl/ResourceLimitSettings.java
code4it
2020/02/26
4130
聊聊artemis的lastValueProperty
activemq-artemis-2.11.0/artemis-core-client/src/main/java/org/apache/activemq/artemis/core/message/impl/CoreMessage.java
code4it
2020/02/24
2940
聊聊artemis的lastValueProperty
activemq-artemis-2.11.0/artemis-core-client/src/main/java/org/apache/activemq/artemis/core/message/impl/CoreMessage.java
code4it
2020/02/07
3170
聊聊artemis的lastValueProperty
聊聊artemis的persistenceEnabled
activemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/config/impl/ConfigurationImpl.java
code4it
2020/01/26
6720
聊聊artemis的persistenceEnabled
聊聊artemis的HAManager
activemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/server/cluster/ha/HAManager.java
code4it
2020/02/15
5790
聊聊artemis的HAManager
聊聊artemis的MessageLoadBalancingType
activemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/server/cluster/impl/MessageLoadBalancingType.java
code4it
2020/02/16
2920
聊聊artemis的MessageLoadBalancingType
聊聊artemis的MessageLoadBalancingType
activemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/server/cluster/impl/MessageLoadBalancingType.java
code4it
2020/02/24
2750
聊聊artemis的groupRebalance
activemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/server/impl/QueueImpl.java
code4it
2020/02/02
2030
聊聊artemis的groupRebalance
聊聊artemis的maxDeliveryAttempts
activemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/settings/impl/AddressSettings.java
code4it
2020/01/27
4130
聊聊artemis的maxDeliveryAttempts
聊聊artemis的SlowConsumerReaperRunnable
本文主要研究一下artemis的SlowConsumerReaperRunnable
code4it
2020/01/25
3550
聊聊artemis的SlowConsumerReaperRunnable
聊聊artemis的scheduledDeliveryTime
activemq-artemis-2.11.0/artemis-core-client/src/main/java/org/apache/activemq/artemis/core/message/impl/CoreMessage.java
code4it
2020/01/28
5060
聊聊artemis的scheduledDeliveryTime
聊聊artemis的ActiveMQMetricsPlugin
activemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/server/metrics/ActiveMQMetricsPlugin.java
code4it
2020/01/20
6190
聊聊artemis的ActiveMQMetricsPlugin
聊聊artemis message的duplicateProperty
activemq-artemis-2.11.0/artemis-core-client/src/main/java/org/apache/activemq/artemis/api/core/Message.java
code4it
2020/01/30
5640
聊聊artemis message的duplicateProperty
聊聊artemis的transactionTimeoutScanPeriod
本文主要研究一下artemis的transactionTimeoutScanPeriod
code4it
2020/02/06
2700
聊聊artemis的transactionTimeoutScanPeriod
聊聊artemis的QuorumManager
activemq-artemis-2.11.0/artemis-core-client/src/main/java/org/apache/activemq/artemis/api/core/client/ClusterTopologyListener.java
code4it
2020/02/08
6710
聊聊artemis的QuorumManager
聊聊artemis message的duplicateProperty
activemq-artemis-2.11.0/artemis-core-client/src/main/java/org/apache/activemq/artemis/api/core/Message.java
code4it
2020/02/24
5000
聊聊artemis的ServerConnectionLifeCycleListener
本文主要研究一下artemis的ServerConnectionLifeCycleListener
code4it
2020/01/21
4780
聊聊artemis的ServerConnectionLifeCycleListener
聊聊artemis的gracefulShutdownEnabled
activemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/config/impl/ConfigurationImpl.java
code4it
2020/01/18
4280
聊聊artemis的gracefulShutdownEnabled
聊聊artemis的individualAcknowledge
activemq-artemis-2.11.0/artemis-jms-client/src/main/java/org/apache/activemq/artemis/jms/client/ActiveMQMessage.java
code4it
2020/02/24
4850
聊聊artemis的ExpiryScanner
activemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/postoffice/impl/PostOfficeImpl.java
code4it
2020/01/22
5380
聊聊artemis的ExpiryScanner
相关推荐
聊聊artemis的ResourceLimitSettings
更多 >
目录
  • 为什么现在的大模型都用多少B来命名,比如7B、13B之类的?
    • 一、“B”的含义与参数规模
    • 二、参数命名的核心逻辑
    • 三、参数规模之外的补充信息
    • 四、参数规模的局限性
    • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档