Ollama 是一个专注于人工智能(AI)模型部署和管理的开源平台,旨在简化 AI 模型的部署、扩展和监控。它支持多种深度学习框架(如 TensorFlow、PyTorch 等),并提供高效的资源管理、自动扩展和实时监控功能,帮助开发者更轻松地将 AI 模型应用于生产环境。Ollama 的核心优势在于其灵活性和可扩展性,适用于从小型项目到大规模企业级应用的多种场景。
官网地址:https://ollama.com/download
ollama pull <model_name>
从远程仓库下载指定的 AI 模型。ollama list
显示本地已下载的模型列表。ollama rm <model_name>
删除本地存储的指定模型。ollama serve
启动 Ollama 服务,准备接收请求。ollama run <model_name>
启动并运行指定的 AI 模型。ollama version
显示 Ollama 的当前版本信息。ollama help
显示 Ollama 的命令帮助信息。ollama logs
显示 Ollama 的运行日志。ollama status
查看 Ollama 服务的运行状态。ollama build -f <config_file>
根据配置文件构建自定义模型。ollama push <model_name>
将本地模型推送至远程仓库。这个模型虽然小,但是短小精干,很强大
Gemma3:4b 是一款轻量级但性能强大的开源 AI 模型,由 Google DeepMind 开发,属于 Gemma 系列的一部分。它基于 Google 的 Gemini 技术,专为高效推理和低成本部署设计
联网下载并断网运行