张宇超:2017年清华大学优秀博士学位论文二等奖获得者
数据中心网络业务处理流程中的资源管理优化
Optimization of Resource ManagementThroughout the Application Processing in Datacenter Networks
作 者:张宇超
指导教师:徐恪
培养院系:计算机科学与技术系
学 科:计算机科学与技术
读博感言:做第三类人也挺幸福快乐哒!
研究背景/选题意义/研究价值
云计算的日益普及为广大用户提供了更为便捷的网络服务,而大规模数据中心内的资源多样性、配置异质性和管理复杂性,为提供良好服务质量带来了严峻的挑战。
本文追踪网络应用请求的整体服务周期,针对应用请求的四个主要阶段,分别实现了“公平接入控制、合理任务调度、可控区域通信、高效后端同步”的目标。
主要研究内容
1. 针对用户请求接入数据中心的过程,设计延时保证的动态区分服务算法,优化延迟敏感型业务。
2. 在任务进入服务器端系统的传输调度阶段,设计双重感知调度机制,改进数据传输协议。
3. 任务进入数据中心后端时,设计了感知通信的容器重分布机制,提升 90% 的系统吞吐量,为百度公司节省了巨额运维成本。
4. 为海量数据传输过程设计了新型的大数据传输平台 PieBridge,能大幅提
升数据同步效率。
容器重分布机制能够消除热点机器,平衡资源利用率,提升系统吞吐量。
为跨数据中心域的数据同步过程设计高效的传输调度系统,保证业务后端服务数据的及时更新。
主要创新点
1、提出了双重感知的任务调度机制,为数据中心的任务调度阶段提供了近似最优的调度结果。
2、提出了一种延迟保证的动态区分服务机制,采用延迟反馈算法,缩短交互负载流的响应时间。
3、剖析应用在实例化的不同容器之间的通信过程,设计了一种两阶段的调整策略,降低进程之间的通信开销,提升整体系统吞吐率。
4、针对海量数据的大规模同步过程,设计最大化系统流量的调度算法,显著缩短了任务传输时间,且消除了传输长尾、平衡了跨域带宽利用。
代表性学术发表
[1] Yuchao Zhang,Yusen Li, Ke Xu, DanWang, Xuan Cao,QingqingLiang. FreeContainer: TheManagement of Container Groups for High Performance VNFs. IEEE ICDCS,2017.
[2] Yuchao Zhang,Ke Xu, Guang Yao,Miao Zhang. PieBridge: ACross-DR scale Large Data Transmission Scheduling System. ACM SIGCOMMposter, 2016.
作者:张宇超
供图:张宇超
编辑:清华大学研究生院 周明坤 严颖巧
领取专属 10元无门槛券
私享最新 技术干货