腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
返回腾讯云官网
腾讯云网络专家服务
专栏成员
举报
31
文章
181060
阅读量
104
订阅数
订阅专栏
申请加入专栏
全部文章(31)
网络安全(8)
私有网络(7)
tcp/ip(6)
https(5)
云服务器(4)
负载均衡(4)
专线接入(4)
VPN 连接(4)
DNS 解析 DNSPod(3)
云联网(3)
NAT 网关(2)
http(2)
dns(2)
windows(2)
ipv6(2)
LLM(2)
2023腾讯·技术创作特训营 第三期(2)
javascript(1)
r 语言(1)
数据库(1)
云数据库 Redis®(1)
sql(1)
git(1)
github(1)
windows server(1)
负载均衡缓存(1)
容器镜像服务(1)
腾讯云可观测平台(1)
弹性网卡(1)
共享带宽包(1)
移动解析 HTTPDNS(1)
腾讯云测试服务(1)
混合云解决方案(1)
移动解析(1)
容器(1)
编程算法(1)
开源(1)
grep(1)
udp(1)
安全(1)
nat(1)
混合云(1)
路由(1)
公有云安全(1)
搜索文章
搜索
搜索
关闭
nccl-test 使用指引
LLM
2023腾讯·技术创作特训营 第三期
nccl-test 工具是 nvidia 开源的一项用于测试 NCCL 集合通信的工具。可以用于检测集合通信是否正常、压测集合通信速率。官方开源地址:https://github.com/NVIDIA/nccl-tests
quincyhu
2023-11-21
17.5K
3
浅谈大模型训练排障平台的建设
LLM
2023腾讯·技术创作特训营 第三期
OpenAI的Chat-GPT为我们揭示了通用人工智能的潜力,而GPT4-Turbo的发布进一步拓宽了我们对通用人工智能的想象边界,国内各种大型模型如同雨后春笋般涌现。同时,大模型训练所带来的各种工程化问题也接踵而至。 大模型训练通常涉及大量的参数、巨大的计算需求和复杂的网络结构,这使得整个训练过程变得极其复杂。在这种情况下,训练过程中可能出现的故障可以来自硬件、软件、网络、应用等多个方面,这使得故障定位和排除工作变得异常困难。 训练过程中的任何故障都可能导致训练中断,从而损失从上一个检查点到中断时的所有计算。重新启动训练任务也需要一定的时间,而昂贵的计算资源使得每一秒都显得尤为重要,毕竟“时间就是金钱”。 本文将专注于大模型训练的故障的定位,尝试提供一些解决思路和方法,希望能为读者带来一些帮助和启示。
quincyhu
2023-11-17
2.4K
3
云联网自定义路由表使用场景 --未完待续
私有网络
云联网
路由
公有云安全
自定义路由表(多路由表)功能是对当前云联网默认路由表功能的补充,弥补云联网默认打通全部绑定实例的需求;
pinkcchen
2023-09-26
308
0
策略型VPN对接strongswan
VPN 连接
参考https://cloud.tencent.com/document/product/554/52861
pinkcchen
2023-06-07
1.5K
0
腾讯混合云网络设计白皮书
混合云
专线接入
云联网
混合云解决方案
私有网络
从1999年,公认的云计算先驱-Saleforce.com公司成立,到2006年,Amazon发布了名声大噪的EC2(Elastic Compute Cloud),首次面向公众提供基础架构的云服务产品-IaaS,中间经历了七年的时间。
abelbai
2023-04-26
4.1K
1
关注专栏作者,随时接收最新技术干货
张兴龙-leoxzhang
腾讯云 | 网络技术服务专家
关注
用户7829998
关注
22
关注
Htroy
腾讯云 | 网络技术服务专家
关注
公有云产品NAT&EIP最佳实践指南
tcp/ip
nat
NAT 网关
云服务器
共享带宽包
NAT 网关(NAT Gateway 简称NAT)是一种支持 IP 地址转换服务,提供 SNAT 和 DNAT 能力,为私有网络(VPC)内的资源提供安全、高性能的 Internet 访问服务。适用于云上主动访问公网及对外提供公务服务能力等场景。
张兴龙-leoxzhang
2021-05-27
5.2K
0
ipv6 Windows服务器无法通信
ipv6
tcp/ip
windows server
windows
https
【问题】ipv6 windwos服务器不能访问ipv6网站,也不能被ipv6客户端访问,ipv4地址网络正常。
张晗
2021-04-15
7.3K
0
通过云联网、对等连接或者专线等产品打通后网络不通
容器镜像服务
容器
javascript
2、如上图发现系统内有docker网段路由172.17.0.0/16,刚好对端子机内网网段也是这个
张晗
2021-04-15
1.7K
0
【玩转腾讯云】解决使用腾讯云CVM跨境访问国外网站不通的办法
github
https
git
开源
网络安全
【问题描述】相信很多同学都遇到腾讯云CVM访问国外网站如亚马逊(www.amaon.com)、github(www.github.com)访问不了或者访问卡顿或者ping延时大/有丢包的问题。
张晗
2021-04-09
27.1K
3
CLB后端的CVM端口健康检查偶尔异常
云服务器
负载均衡
安全
grep
【排查步骤】 1、健康检查探测机制是clb的vip向后端cvm业务进行探测,所以先在cvm上抓包看是否有收到探测包
张晗
2021-03-09
1.5K
0
访问网站提示重定向的次数过多
https
http
网络安全
负载均衡
【客户架构】域名解析到clb的vip上,并且在clb控制台上配置了http重定向https
张晗
2021-02-27
8.8K
0
如何获取腾讯云控制台的RequestId(seqId)
私有网络
4、在右侧框里面找到"Response"标签,然后一直拉到最右边,即可看到seqId,如下图
张晗
2021-02-08
25K
1
访问CLB报404,直接访问后端的RS正常
tcp/ip
【原因分析】 核实到RS上的nginx设置了主机头(server name),如下图,如果访问10.20.0.2会匹配到下面数据,如果访问的不是10.20.0.2会匹配到上面默认的404
张晗
2021-02-07
1.4K
0
iperf3压测CVM带宽达不到预期
https
网络安全
编程算法
r 语言
1、看客户机型机型代号:IT5.16XLARGE256实例配置是CPU&MEM:64核+256G的网卡队列数16
张晗
2021-02-07
4.1K
0
Centos6.5系统无法获取IPV6地址
网络安全
udp
ipv6
tcp/ip
【问题描述】按照官方文档https://cloud.tencent.com/document/product/1142/47666配置ipv6环境,但是无法获取ipv6地址
张晗
2021-02-07
2.1K
0
clb健康检查
负载均衡缓存
网络安全
负载均衡
http
负载均衡可以定期向后端服务器发送 Ping 命令、尝试连接或发送请求来探测后端服务器运行的状况,这些探测称为健康检查。负载均衡通过健康检查来判断后端服务的可用性,避免后端服务异常影响前端业务,从而提高业务整体可用性。
王帅-smaitwang
2020-11-28
1.6K
0
专线相关操作指导—静态、BGP单通道对接
专线接入
腾讯云可观测平台
专线相关介绍可参考https://cloud.tencent.com/document/product/216
pinkcchen
2020-11-19
3.7K
0
clb连接数不均
负载均衡
负载均衡(Cloud Load Balancer,CLB)提供安全快捷的流量分发服务,访问流量经由 CLB 可以自动分配到云中的多台云服务器上,扩展系统的服务能力并消除单点故障。负载均衡支持亿级连接和千万级并发,可轻松应对大流量访问,满足业务需求。
王帅-smaitwang
2020-11-16
1.5K
0
腾讯云自建DNS---高可用篇
DNS 解析 DNSPod
大家好,上一篇写到如何在腾讯云CVM上用bind9 自建内网解析DNS服务。本篇承继上篇继续分享内容,分享一个如何实现腾讯云自建DNS高可用的方法。
22
2020-11-13
6.8K
0
VPN对接阿里云
VPN 连接
接上回 腾讯云VPN网关对接IDC侧打通,如果有多云互通的场景,就会涉及到多云厂商之间的VPN打通,本次以腾讯云与阿里之间对接为例,介绍多云互通场景云厂商之间VPN互通之间的操作。
pinkcchen
2020-11-08
6.5K
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档