首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >华为AI芯片-昇腾310安装k8s+KubeSphere进行NPU统一管理和调度

华为AI芯片-昇腾310安装k8s+KubeSphere进行NPU统一管理和调度

作者头像
编码如写诗
发布2026-05-22 20:09:59
发布2026-05-22 20:09:59
790
举报
文章被收录于专栏:编码如写诗编码如写诗

昇腾310是华为发布的首款NPU人工智能芯片,其增强版昇腾310B提供了20TOPS的算力,功耗却仅为8W,是一款面向边缘推理场景的AI处理器。这里我们将多颗昇腾310芯片构建成集群,实现统一调度,充分释放其边缘AI计算潜力。

1.产品属性

配置:4核12GB

1.1 NPU情况

1.2 系统

1.3 CPU

1.4 实物图

2.环境准备

2.1 卸载自带的docker

由于系统自带docker版本:18.09,非常低

这里我们直接卸载自带的docker,避免后续出现其他问题

卸载

代码语言:javascript
复制
sudo systemctl stop docker
sudo systemctl stop docker.socket
sudo systemctl stop containerd

sudo dnf remove -y docker \
                  docker-client \
                  docker-common \
                  docker-selinux \
                  docker-engine \
                  docker-ce \
                  docker-ce-cli \
                  containerd.io


sudo rm -rf /var/lib/docker
sudo rm -rf /var/lib/containerd
sudo rm -rf /etc/docker
sudo rm -rf /var/run/docker
sudo rm -rf /var/run/docker.sock
sudo rm -rf /var/log/docker*

2.2 上传k8s安装包

将离线制品、配置文件、kt和sh脚本等上传至其中一个节点(本文以master为例),后续在该节点操作创建集群。本文使用kt:3.1.14.1版本

2.3 修改配置文件

修改config-sample.yaml,主要修改节点信息部分(如下hosts和roleGroups部分)

代码语言:javascript
复制
kind: Cluster
metadata:
  name: sample
spec:
  hosts:
  - {name: master, address: 192.168.0.101, internalAddress: 192.168.0.101, user: root, password: "123213", arch: "arm64"}
  - {name: node1, address: 192.168.0.133, internalAddress: 192.168.0.133, user: root, password: "123213", arch: "arm64"}
  - {name: harbor, address: 192.168.0.232, internalAddress: 192.168.0.232, user: root, password: "123213", arch: "arm64"}
  roleGroups:
    etcd:
    - master
    control-plane:
    - master
    worker:
    - node1
    # 如需使用 kt 自动部署镜像仓库,请设置该主机组 (建议仓库与集群分离部署,减少相互影响)
    # 如果需要部署 harbor 并且 containerManager 为 containerd 时,由于部署 harbor 依赖 docker,建议单独节点部署 harbor
    registry:
    - harbor
  controlPlaneEndpoint:

2.3 系统初始化

解压kt-arm64.tar.gz文件后执行./kt init-os -f config-sample.yaml

3.创建私有仓库

执行./kt init resigtry -f config-sample.yaml -a artica*

安装过程报错,查看docker状态,发现系统缺少iptables

此时需要安装

代码语言:javascript
复制
dnf install iptables

再次执行安装harbor命令

等待一切安装成功后,创建 Harbor 项目

代码语言:javascript
复制
chmod +x create_project_harbor.sh && ./create_project_harbor.sh

4.创建k8s集群

代码语言:javascript
复制
./kt create cluster -f config-sample.yaml -a artifact-arm-k8s13014-ks4.1.3.tar.gz

此命令kt会自动将离线制品中的镜像推送到harbor 私有仓库

执行后会有如下提示,输入yes/y继续执行

等待最后提示安装成功,

等待一会 ,查看结果,可以看到两个节点都已经部署成功了

5.部署KubeSphere

代码语言:javascript
复制
helm upgrade --install -n kubesphere-system --create-namespace ks-core ks-core-1.1.5.tgz \
     --set global.imageRegistry=dockerhub.kubekey.local/ks \
     --set extension.imageRegistry=dockerhub.kubekey.local/ks \
     --set ksExtensionRepository.image.tag=v1.1.6 \
     --debug \
     --wait

等待一会看到成功的消息

6.验证

7.NPU调度

敬请期待

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 编码如写诗 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.产品属性
    • 1.1 NPU情况
    • 1.2 系统
    • 1.3 CPU
    • 1.4 实物图
  • 2.环境准备
    • 2.1 卸载自带的docker
    • 2.2 上传k8s安装包
    • 2.3 修改配置文件
    • 2.3 系统初始化
  • 3.创建私有仓库
  • 4.创建k8s集群
  • 5.部署KubeSphere
  • 6.验证
  • 7.NPU调度
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档