我正在尝试建立一个由8台计算机和一个主文件服务器组成的集群。理想情况下,我希望在pxe引导、准磁盘/准无状态环境(即唯一的本地存储空间是/var,类似于扭矩配置的地方)中设置它。8个计算节点中的每个节点都有4个NVIDIA Tesla K40m,但是根文件服务器没有GPU。
理想情况下,我希望能够在文件服务器(在/node)上创建完整的安装,然后将其引导到计算节点,但是,我还没有找到一种方法来安装NVIDIA驱动程序,而没有安装NVIDIA。我找到了NVIDIA论坛的一个问题关于有人是如何失败的.
或者,我可以将NVIDIA驱动程序安装到一个计算节点(其中一个正在其本地磁盘上运行CentOS
我觉得我可能还没来得及走到这里就开始冲刺了,但我已经快到了!我在Azure上有一个VM,我希望能够从该VM访问本地文件服务器。我们有以下设置:$COMPANY.net是本地域,$COMPANY.com是Azure域。它们使用Azure AD Connect连接,Azure上的VM使用AADDS;我们在Azure和我们的本地网络之间建立了站点到站点vpn设置。我可以输入本地文件服务器的IP地址并从Azure VM访问它,但如果我尝试这样做,我无法解析该名称。我认为这是DNS问题,我需要Azure VM使用我的本地DNS服务器来解析主机名,而不是AADDS地址。我是否需要在Azure上设置DNS服