开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >专栏 >大模型应用之：人工智能技术演进

大模型应用之：人工智能技术演进

作者头像

后台技术汇

发布于 2025-07-27 12:19:30

发布于 2025-07-27 12:19:30

2490

举报

文章被收录于专栏：后台技术汇后台技术汇

背景

►前世：始于上世纪80年代的浅层神经网络探索，受限于算力与数据，早期进展缓慢。

►今生：2017年Transformer架构被提出；2022年底，ChatGPT横空出世

关键事件

一、1950s-1990s：规则驱动的AI启蒙时代

1956年达特茅斯会议：麦卡锡、明斯基等科学家首次提出"人工智能"概念，确立"搜索驱动"和"符号逻辑"两大范式。这一阶段的AI依赖专家系统，典型如1997年IBM深蓝通过穷举法击败国际象棋冠军，本质是规则驱动的确定性方法。
局限性：系统仅能处理明确定义的问题，泛化能力近乎为零。

二、1990s-2000s：统计学习与机器学习的崛起

1990年代中期：Vapnik提出的支持向量机（SVM）等统计学习方法成为主流，技术本质转向数据驱动算法。
里程碑意义：机器学习开始从"设计具体解决方案"（如垃圾邮件分类）迈向"构建通用框架"（如Scikit-learn库）。

三、2006-2017：深度学习革命与神经网络复兴

2006年：辛顿团队提出深度信念网络（DBN），突破神经网络训练瓶颈，学术界将这一年称为"深度学习元年"。
2016-2017年：DeepMind的AlphaGo结合蒙特卡洛树搜索与深度强化学习，先后击败李世石、柯洁，证明AI在复杂决策中的潜力。此时技术本质已演变为端到端的表征学习。

四、2017-2020：Transformer与基础模型范式确立

2017年：Google发布Transformer论文，其自注意力机制彻底解决长序列依赖问题，为GPT、BERT等模型奠定基础。
2020年GPT-3：1750亿参数的规模效应展现零样本学习能力，标志预训练-微调范式成为行业标准。

五、2021-2024：AIGC爆发与智能体雏形

2022年ChatGPT：基于GPT-3.5的对话系统实现人类级别的流畅交互，推动AI技术从实验室走向大众（全球月活用户1亿仅用2个月）。
2024年GPT-4o：多模态实时交互能力让AI开始具备"智能体"特征，可结合视觉、语音进行环境感知。

六、2025展望：生态重构与成本革命

技术趋势：训练成本降低（如MoE架构）、垂类应用落地（医疗、法律等）。
中国力量：DeepSeek等国产模型在长文本理解、数学推理等场景突破，正在重构全球大模型竞争格局。

搭建个人知识库

Ollama是什么？安装部署指南

工具	型号	功能
文本	Coremail相关资料文档	预训练材料
LLM	deepseek-r1:7b	分析推理问题
嵌入Model	nomic-embed-text:latest等	文本进行向量化
模型平台	Ollama	管理LLM、Embedding 模型
知识库工具	AnythingLLM	提供UI界面接入大模型文本切割会话历史缓存
向量数据库	LanceDB，一款基于磁盘存储的Vector DB	存储Embedding模型编码后的向量

选择知识库工具，可以选AnythingLLM，也可以用open-web.ui，UI体验上两者差别不大，但后者还可以细化权限管理。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2025-07-24，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自后台技术汇微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

目录

一、1950s-1990s：规则驱动的AI启蒙时代

二、1990s-2000s：统计学习与机器学习的崛起

三、2006-2017：深度学习革命与神经网络复兴

四、2017-2020：Transformer与基础模型范式确立

五、2021-2024：AIGC爆发与智能体雏形

六、2025展望：生态重构与成本革命