[ODCC峰会焦点]腾讯陈明刚:《光网络实时性能数据采集技术规范》
传统依据工程师经验的网络管控方法难以为继,以光网络实时运行数据为驱动,基于系统运行内在逻辑,结合人工智能算法,自动化、智能化的系统精细化运营能力,是光网络精细化管控的演进方向。同时光网络精细化管控需要高分辨率系统运行数据,对光网络系统运行数据的采集提出了更高要求。
采集范围广,全面覆盖光网络系统的光学链路、数字通道、模块组件、设备平台的性能采集,做到全量覆盖、不留死角。
采集精度高,引入高精度传感器,提升物理指标的采集精度。在设备侧不做数据精度降低的处理,保证数据的准确、真实上报。
采集频率快,将光网络的设备性能数据采集频率提升到1秒。设备自身针对采集点的探测频率比1秒更快,达到毫秒级,使设备能够在1秒内探测到更多的数值,通过对毫秒级数据的统计聚合,使1秒数据的实际分辨率达到毫秒级别。
当前光网络产生数据的能力较低,数据也缺乏标准规范,如何推动系统提供更加实时的性能数据,对系统性能数据提供统一的标准,是推动光网络行业向实时精细化管控演进的关键。
腾讯联合多家单位在ODCC起草编订了《光网络实时性能数据采集技术规范》。该规范针对设备从采集点对目标物理指标进行测量,获取测量信息并将信息按照预定规则进行处理,最终准确传递给设备以外的数据采集系统,并针对完整链条的以下四个主要方面进行标准化:
采集点规范:性能采集点的选取规范;
采集方法规范:采集点采集方法的规范;
语义规范:采集点获取数据的处理规则规范;
协议规范:设备与数据采集系统交互协议规范;
高分辨率数据精细刻画了网络实际运行状态,为精细化识别链路的运行状态,快速质量态势感知,准确定位故障原因,精确判断故障影响奠定了数据基础。同时高分辨率数据也是解决光网络质量问题,提升带宽质量的基础。基于秒级实时数据,引入实时计算平台,提出了基于实时性能数据、分析定位光网络故障的新方法。针对异常运行状态的多维度数字描述,提供了精确的故障数据样本,提出了以典型数据样本,推动算法迭代、演进的新路径,为持续扩充系统故障数据样本集、加速算法的优化和演进提供有力支撑。