阅读笔记 | Chameleon: scalable adaptation of video analytics

info: J. Jiang, G. Ananthanarayanan, P. Bodik, S. Sen, and I. Stoica, “Chameleon: scalable adaptation of video analytics,” in Proceedings of the 2018 Conference of the ACM Special Interest Group on Data Communication, Budapest Hungary: ACM, Aug. 2018, pp. 253–266. doi: 10.1145/3230543.3230574.

1.1 问题背景

基于CV和DNN的视频分析在各个领域得到广泛应用,例如交通控制、安全监控和工厂生产监测。视频分析流水线通常由多个视频处理模块组成,其不同的配置参数选择会影响资源消耗和准确性,并且最佳配置随时间动态变化。

阅读笔记 | Neural Network Meets DCN: Traffic-driven Topology Adaptation with Deep Learning

info: Wang M , Cui Y , Xiao S ,et al.Neural Network Meets DCN: Traffic-driven Topology Adaptation with Deep Learning[C]//Abstracts of the 2018 ACM International Conference.ACM, 2018.DOI:10.1145/3219617.3219656.

1.1 背景

传统有线数据中心常采用的静态网络拓扑结构日益难以应对新情况新挑战,引入OCS或无线通信组件构建可重构拓扑的DCN可以解决问题,但其实现存在问题与挑战。

注:OCS内通过电机控制镜片偏转来实现光路控制,进而实现光路交换。文章中的可配置拓扑是OCS或无线通信组件,其余有线拓扑结构是固定不变的(例如固定的Fat-tree)。

阅读笔记 | CODA: Toward Automatically Identifying and Scheduling COflows in the DArk

info: Zhang H , Chen L , Yi B ,et al.CODA: Toward Automatically Identifying and Scheduling Coflows in the Dark[C]//Conference on Acm Sigcomm Conference.ACM, 2016.DOI:10.1145/2934872.2934880.

1.1 问题背景

最近的一系列研究工作表明,利用coflows来利用应用层信息可以显著提高分布式数据并行应用程序的通信性能。但现有方案的无法实现coflows自动识别和调度。

阅读笔记 | AuTO: scaling deep reinforcement learning for datacenter-scale automatic traffic optimization

info: Chen L , Lingys J , Chen K ,et al.AuTO: scaling deep reinforcement learning for datacenter-scale automatic traffic optimization[C]//the 2018 Conference of the ACM Special Interest Group.ACM, 2018.DOI:10.1145/3230543.3230551.

1.1 问题背景

在数据中心中,网络流量具有高度集中性、长尾分布性、突发性、时空异质性和大规模性等特征,数据中心的流量优化对网络及其承载的应用的性能有着显著的影响。目前,流量优化主要依赖于手工设计的启发式方法,这些方法相对并不完善,而传统的深度强化学习方法则由于较长的处理时间无法用于数据中心规模的在线决策。

阅读笔记 | Design Guidelines for Robust Internet Protocols

info: Anderson T E , Shenker S , Stoica I ,et al.Design Guidelines for Robust Internet Protocols[J].ACM SIGCOMM Computer Communication Review, 2003, 33(1):125-130.DOI:10.1145/774763.774783.

1.1 问题背景

因特网在健壮性的设计上,早期在fail-stop故障模型的假设上进行。但这一假设在现实情况中的适用性不好,特别是在存在拜占庭故障的网络中。而已有的应对拜占庭故障的方法并不足够。此外不同组织设计的不同协议随时间也在变动,应对拜占庭故障变得更加困难。