首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >大模型应用之:人工智能技术演进

大模型应用之:人工智能技术演进

作者头像
后台技术汇
发布2025-07-27 12:19:30
发布2025-07-27 12:19:30
1380
举报
文章被收录于专栏:后台技术汇后台技术汇

背景

►前世:始于上世纪80年代的浅层神经网络探索,受限于算力与数据,早期进展缓慢。

►今生:2017年Transformer架构被提出;2022年底,ChatGPT横空出世

关键事件

一、1950s-1990s:规则驱动的AI启蒙时代
  • 1956年达特茅斯会议:麦卡锡、明斯基等科学家首次提出"人工智能"概念,确立"搜索驱动"和"符号逻辑"两大范式。这一阶段的AI依赖专家系统,典型如1997年IBM深蓝通过穷举法击败国际象棋冠军,本质是规则驱动的确定性方法。
  • 局限性:系统仅能处理明确定义的问题,泛化能力近乎为零。
二、1990s-2000s:统计学习与机器学习的崛起
  • 1990年代中期:Vapnik提出的支持向量机(SVM)等统计学习方法成为主流,技术本质转向数据驱动算法。
  • 里程碑意义:机器学习开始从"设计具体解决方案"(如垃圾邮件分类)迈向"构建通用框架"(如Scikit-learn库)。
三、2006-2017:深度学习革命与神经网络复兴
  • 2006年:辛顿团队提出深度信念网络(DBN),突破神经网络训练瓶颈,学术界将这一年称为"深度学习元年"。
  • 2016-2017年:DeepMind的AlphaGo结合蒙特卡洛树搜索与深度强化学习,先后击败李世石、柯洁,证明AI在复杂决策中的潜力。此时技术本质已演变为端到端的表征学习。
四、2017-2020:Transformer与基础模型范式确立
  • 2017年:Google发布Transformer论文,其自注意力机制彻底解决长序列依赖问题,为GPT、BERT等模型奠定基础。
  • 2020年GPT-3:1750亿参数的规模效应展现零样本学习能力,标志预训练-微调范式成为行业标准。
五、2021-2024:AIGC爆发与智能体雏形
  • 2022年ChatGPT:基于GPT-3.5的对话系统实现人类级别的流畅交互,推动AI技术从实验室走向大众(全球月活用户1亿仅用2个月)。
  • 2024年GPT-4o:多模态实时交互能力让AI开始具备"智能体"特征,可结合视觉、语音进行环境感知。
六、2025展望:生态重构与成本革命
  • 技术趋势:训练成本降低(如MoE架构)、垂类应用落地(医疗、法律等)。
  • 中国力量:DeepSeek等国产模型在长文本理解、数学推理等场景突破,正在重构全球大模型竞争格局。

搭建个人知识库

Ollama是什么?安装部署指南

工具

型号

功能

文本

Coremail相关资料文档

预训练材料

LLM

deepseek-r1:7b

分析推理问题

嵌入Model

nomic-embed-text:latest等

文本进行向量化

模型平台

Ollama

管理LLM、Embedding 模型

知识库工具

AnythingLLM

提供UI界面接入大模型文本切割会话历史缓存

向量数据库

LanceDB,一款基于磁盘存储的Vector DB

存储Embedding模型编码后的向量

选择知识库工具,可以选AnythingLLM,也可以用open-web.ui,UI体验上两者差别不大,但后者还可以细化权限管理。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-07-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 后台技术汇 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、1950s-1990s:规则驱动的AI启蒙时代
  • 二、1990s-2000s:统计学习与机器学习的崛起
  • 三、2006-2017:深度学习革命与神经网络复兴
  • 四、2017-2020:Transformer与基础模型范式确立
  • 五、2021-2024:AIGC爆发与智能体雏形
  • 六、2025展望:生态重构与成本革命
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档