本环境基于高性能应用服务HAI-社区应用-QwQ-32B创建使用
环境中已预装QwQ-32B,Q4精度,使用Ollama部署
QwQ-32B是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。此外,在QwQ-32B中集成了与 Agent 相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。
1. 创建完成后,点击“算力连接”中“Open Webui”,并创建用户。(首次开机后需拉起服务,启动耗时约10~20s,若页面显示链接失败,可稍后刷新进入)
2. 进入聊天页面,输入问题后即可开始对话,首次对话需载入模型,耗时约1-2分钟
3. 进行对话交互
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。