阅读笔记 | Chameleon: scalable adaptation of video analytics

info: J. Jiang, G. Ananthanarayanan, P. Bodik, S. Sen, and I. Stoica, “Chameleon: scalable adaptation of video analytics,” in Proceedings of the 2018 Conference of the ACM Special Interest Group on Data Communication, Budapest Hungary: ACM, Aug. 2018, pp. 253–266. doi: 10.1145/3230543.3230574.

1.1 问题背景

基于CV和DNN的视频分析在各个领域得到广泛应用,例如交通控制、安全监控和工厂生产监测。视频分析流水线通常由多个视频处理模块组成,其不同的配置参数选择会影响资源消耗和准确性,并且最佳配置随时间动态变化。

阅读笔记 | Neural Network Meets DCN: Traffic-driven Topology Adaptation with Deep Learning

info: Wang M , Cui Y , Xiao S ,et al.Neural Network Meets DCN: Traffic-driven Topology Adaptation with Deep Learning[C]//Abstracts of the 2018 ACM International Conference.ACM, 2018.DOI:10.1145/3219617.3219656.

1.1 背景

传统有线数据中心常采用的静态网络拓扑结构日益难以应对新情况新挑战,引入OCS或无线通信组件构建可重构拓扑的DCN可以解决问题,但其实现存在问题与挑战。

注:OCS内通过电机控制镜片偏转来实现光路控制,进而实现光路交换。文章中的可配置拓扑是OCS或无线通信组件,其余有线拓扑结构是固定不变的(例如固定的Fat-tree)。

阅读笔记 | CODA: Toward Automatically Identifying and Scheduling COflows in the DArk

info: Zhang H , Chen L , Yi B ,et al.CODA: Toward Automatically Identifying and Scheduling Coflows in the Dark[C]//Conference on Acm Sigcomm Conference.ACM, 2016.DOI:10.1145/2934872.2934880.

1.1 问题背景

最近的一系列研究工作表明,利用coflows来利用应用层信息可以显著提高分布式数据并行应用程序的通信性能。但现有方案的无法实现coflows自动识别和调度。

阅读笔记 | AuTO: scaling deep reinforcement learning for datacenter-scale automatic traffic optimization

info: Chen L , Lingys J , Chen K ,et al.AuTO: scaling deep reinforcement learning for datacenter-scale automatic traffic optimization[C]//the 2018 Conference of the ACM Special Interest Group.ACM, 2018.DOI:10.1145/3230543.3230551.

1.1 问题背景

在数据中心中,网络流量具有高度集中性、长尾分布性、突发性、时空异质性和大规模性等特征,数据中心的流量优化对网络及其承载的应用的性能有着显著的影响。目前,流量优化主要依赖于手工设计的启发式方法,这些方法相对并不完善,而传统的深度强化学习方法则由于较长的处理时间无法用于数据中心规模的在线决策。

阅读笔记 | Interpreting Deep Learning-Based Networking Systems

info: Meng Z , Wang M , Bai J ,et al.Interpreting Deep Learning-Based Networking Systems[C]//SIGCOMM '20: Annual conference of the ACM Special Interest Group on Data Communication on the applications, technologies, architectures, and protocols for computer communication.ACM, 2020.DOI:10.1145/3387514.3405859.

1.1 问题背景

深度学习在计算机网络方面的应用取得重要成果,但DNN模型参数庞大,通常被视为黑盒,无法提供对其决策过程和内部运行机制的解释。这使得网络运营者难以理解模型,从而使模型难设计、难debug(牵一发而动全身)、难即席调整,又因性能要求高且决策时延高而难以部署。此外,现有方法在目标、通用性和模型的数据形式上均不适用于为网络运营者提供解释性。