作者:张毅
1 引言
在过去20年中,全球网络流量以150%。1600/0的平均速度逐年增长。按照网络流量增长的历史规律,未来网络流量依然会稳定地持续增长。一方面,为满足上述带宽需求和提高成本效益的需求,接入网正向着更大容量、更广覆盖和更高效率的方向发展。10 Gbit/s无源光网络(lO-Gigabit-capable passive optical network,XG-PON)和10 Gbit/s以太网无源光网络(10 Gbit/s ethemet PON,10G-EPON)将下行速率提升至10 Gbit/s.上行速率提升到2.5 Gbit/s和最大10 Gbit/s,分支比提升到最大1:256和1:64。ITU-T G.989中的时分和波分复用(time and
wavelength division multiplexing,TWDM)PON吸取密集波分复用(dense WDM,DWDM)PON的大容量和TDM PON的高资源利用率优势,具备10 Gbit/s以上速率。同时,TWDM PON可以动态调度波长和时隙两维资源,将空闲资源调度给有需求的用户使用,充分利用已有的和新增的网络资源,提高成本效益。
另一方面,随着接入网络容量和覆盖范围的增加,生存性保证变得更加重要。一旦骨干光纤发生断纤故障,更多用户会受到故障的影响,故障后造成的影响十分恶劣。ITU-T G.984.1中描述了4种传统树型TDM PON的生存性保证方案。在DWDM PON中可以使用1:1或1:N共享保护通过在相邻光网络单元(optical network unit,ONU)间建立迂回路由对ONU和阵列波导光栅(arrayed waveguidegrating.AWG)间的分配线光纤进行保护。考虑到PON的树型拓扑不利于实现有成本效益的生存性保证,越来越多的方案开始考虑在接入网中引入环型主干光纤。
现有生存性保证方案大多针对波长静态配置网络设计,在具备动态波长调度能力的光接入网中应用会造成故障定位难的问题。这是因为在波长静态配置网络中,每个波长对应唯一的一些ONU,设备只需判断哪些波长的接收信号发生了故障就可以准确地定位故障。然而,对于波长动态调度网络,波长和ONU间没有直接对应关系。此外,业内缺少结合灵活光接入网动态波长调度能力的生存性保证方案。在设计和评价生存性保证方案时,还需要综合定量分析方案的成本和生存性两个相互制约的因素,提出具有最佳成本效益的方案。
为了解决上述问题,本文提出了具有成本效益的利用控制信道定位故障的和基于动态波长调度的生存性保证方案,并对所提方案进行了全网生存性和成本的综合定量分析。所提方案利用光纤环对故障后造成影响最大的主干光纤进行保护,利用控制信道定位和检测故障,通过中心站和远端节点分别切换起保护作用的光开关完成保护倒换。同时,所提方案利用波长动态调度能力转移故障中心站业务线卡的业务。
2 生存性保证方案
图1是一种波长动态调度TWDM光接入网网络结构的示意。该网络结构由中心站( central office,CO)、远端节点(remote node,RN)、ONU、DWDM光纤环和TWDM/TDM光纤树组成。中心站和远端节点通过双向传输的光纤环连接在一起。远端节点和ONU通过光纤树相连。光纤环上运行多个工作波长。中心站利用控制波长(A。Ad)控制远端节点动态地选择上下路业务波长(A.。、A.。、A2u.A2d)。网络的环树型拓扑便于有成本效益地实施生存性保证。下面以图1所示网络结构为例,具体介绍所提的生存性保证方案。
2.1 光纤环单点故障
网络正常运行时,下行业务沿环逆时针传输到各远端节点,而上行业务沿环顺时针传输。中心站通过控制波长与各远端节点周期性地交互。对于故障保护,一方面中心站通过交互判断各远端节点是否依然在线正常工作;另一方面远端节点通过交互确认与中心站间的连接是否依然正常。
当任意两个远端节点间的光纤断开时,故障下游节点(沿光纤环逆时针方向比故障点距离中心站远的节点)无法通过原有连接与中心站进行上下行业务传输。如图2所示,网络中有Ⅳ个远端节点。当远端节点i(i<Ⅳ)和/+1间的光纤断开后,故障下游节点i+1到Ⅳ会检测到无法收到控制信息,并判断与中心站间的连接发生故障。中心站在周期性地检测远端节点是否在线时,会检测到远端节点i+1到Ⅳ之间无信息反馈,失去响应,而远端节点1到i在线正常工作。于是中心站根据上述现象判断网络中发生了故障,可能的故障类型是远端节点i和i+1间发生了光纤环单点故障。
上述故障检测和定位方法是将n个相邻远端节点的控制信道故障判定为光纤环单点故障。事实上,n个相邻远端节点的控制信道故障也可能由n个相邻远端节点中的从控制器同时故障造成。但是该故障出现的概率极低(小于l.04xl0-12),与光纤环单点故障出现的概率(1.37x10-5/km)相比,可以忽略不计。
如图3所示,在故障发生后,通过远端节点自主切换保护光开关和中心站切换本地保护光开关,使单纤双向环变成两根双向光纤树。故障发生前,各远端节点沿一侧城域汇聚环纤与中心站进行双向通信。故障发生后,故障点上游远端节点仍沿原光纤与中心站进行双向通信,而故障点下游远端节点经倒换操作后沿光纤环另一侧与中心站进行双向通信。
中心站执行倒换操作后,对受故障影响的远端节点i+1N进行逐个测距。完成测距后,中心站重新启动动态资源分配机制和算法,恢复上下行业务传输。故障修复以后,网管系统下达修复还原命令,中心站控制网络恢复到正常的单纤双向环工作状态。
在中心站集中进行生存性保证,可以减少功率检测模块的数量。中心站还可以收集掌握全网工作状况,避免发生错误倒换,扩大故障影响,也便于后续进行故障修复。利用独立的控制波长进行故障检测和定位,可以解决由于波长动态调度带来的难于在中心站利用传统的根据接收到的业务信号,以信号丢失、信号失效、信号质量下降为依据的方法进行定位的问题,降低故障检测定位的复杂度,减少对器件的要求。利用已有的低速率控制信道实施,也不需要付出较多额外成本。
2.2 中心站业务线卡故障
网络正常运行时,中心站控制处于工作状态的业务线卡处理需要收发的数据。一旦处于工作状态的业务线卡发生故障,故障线卡将无法响应中心站控制单元的操作或者主动向控制单元报告发生的故障。中心站根据上述现象判断业务线卡发生故障。
中心站检测到业务线卡故障后,在动态分配波长和时隙时,不再使用故障业务线卡的上下行波长,将准备发往该线卡的业务数据转移到其他线卡。具体地,中心站只需要在动态分配波长和时隙时,将故障业务线卡的工作波长从可用波长中剔除。而动态波长、时隙分配机制和算法的其他部分、中心站的其他功能和网络其他网元,依然按照正常工作状态运行。当故障排除后,修复的业务线卡重新加入波长和时隙的动态分配中。
3 生存性成本分析
单纯追求成本,无保护方案的成本必然最低。而单纯追求生存性,受保护位置越多的方案生存性越好。实际上,成本和生存性是两个相互矛盾的因素,所以在设计生存性保证方案时应当综合考虑成本和生存性,找到成本效益最高的方案。本节将对比两种生存性保证方案:无保护方案和环型树主干光纤保护方案。无保护方案去除所提方案中用于保护的备份中心站和光开关。环型树主干光纤保护方案在所提方案的基础上增加了保护光纤和光开关,对树主干光纤进行保护。
定义网络生存性成本比是相对生存性与相对成本之比:
生存性成本比越高,生存性保证方案的成本效益越好。其中,方案;的相对成本和相对生存性分别为:
Cost。和S。(m)是方案i(i=1,2,3)的总成本和m点故障生存性。无保护方案、所提方案和环型树主干光纤保护方案分别对应方案1、方案2和方案3。
设Cx为设备或器件x的成本,Nic是中心站的业务线卡数,NRN是远端节点数,NIDM。嘛是每个远端节点下TDM分支的个数,No眦是每个TDM分支上的ONU数,NOA是光纤环上的光放大器数,LR x/T、L。和L。分别是光纤环、树主干光纤、树分支光纤和用于保护的光纤长度。则无保护方案、所提方案和环型树主干光纤保护方案的总成本依次为:
m点故障生存性指m点发生故障后,网络平均残余通信容量占全网正常通信容量的比例,即:
Jsfm)=虿(m)/C(0),m≥0(7)
其中,C(O)是全网无故障正常通信时的通信容量,C(m)是全网中指定的m点发生故障后的残余通信容量,C(m)是全网所有m点故障情形下的平均残余通信容量。
表1是不同方案在不同数量故障点情况下的相对生存性和相对成本。在计算中,中心站的业务线卡为8个,远端节点为8个,ONU总数为1 024个,光放大器为4个,光纤环长是100 km,树主干光纤取19.5 km,树分支光纤取0.5 km,用于保护的光纤长度是19.5 km。根据参考文献[21]确定不同设备或器件的成本Cx,其中欧洲的光纤铺设成本远高于亚洲。光纤的平均故障率取1.37xl0-5/km。从表1可以看出,与无保护相比,所提方案在欧洲多点故障场景下只需付出1%的生存性保证成本,就能带来54%的生存性提高。
图4是各种方案单点故障下的生存性成本比。可以看出,所提方案在亚洲和欧洲的成本效益都是最高的,而且在欧洲的成本效益更高。环型树主干光纤保护方案在欧洲的成本效益最低。造成上述现象的原因是,所提方案利用光纤环进行生存性保证,未增加冷备份保护光纤,成本增加相对少,而所提方案针对故障影响最大的主干光纤环进行保护,带来的生存性提高又大于付出的成本,所以生存性成本比大于其他生存性提升小于或等于成本的方案的生存性成本比。对于欧洲场景,由于光纤铺设成本是网络总成本的主要组成部分,所提方案付出的光开关等额外成本相对于巨额的光纤成本只占总成本的1%,又由于欧洲和亚洲的生存性不变,所以所提方案在欧洲的成本效益更高:环型树主干光纤保护方案保护的位置多,成本付出最多。特别是在欧洲场景,该方案需要增加156 km的备份光纤,而欧洲的光纤成本非常高。另外,在ONU总数为1 024个时,单点故障主要发生在树分支光纤,该方案的生存性优势又没有充分显现出来。
综上,所提方案针对故障影响最大的主干光纤环进行保护,并且利用光纤环进行生存性保证,未增加冷备份保护光纤。所提方案最优时只需付出1%的生存性保证成本,就能带来54%的生存性提高。与其他方案相比,在最经常出现的单点故障下,所提方案具备最高的成本效益。
4 保护倒换时间
定义保护倒换时间为从故障发生到受故障影响的ONU再次根据带宽授权发送业务数据之间的时间。所提生存性保证方案的保护倒换时间由以下时延组成。
远,比中心站晚检测到故障。考虑环长100 km,远端节点
最多晚一个周期响应测距请求),则此时的远端节点测距
时间为上限时间:
其中,为受故障影响的远端节点数,2xLK/cr为每个远端节点测距所需的时间。该时间忽略处理时延,并且考虑需要按最远传输距离为每个远端节点开窗。若光开关倒换完成时,中心站刚好可以在当前周期发起对远端节点的测距,远端节点也能响应测距请求,则此时远端节点测距的下限时间为:
(4)业务恢复时间
为从中心站完成远端节点测距到ONU再次根据带宽授权发送业务数据之间的时间。在这段时间,中心站首先需要为远端节点计算均衡时延,然后根据远端节点均衡时延的调整值,为ONU计算均衡时延,最后向远端节点和ONU通知均衡时延。所以,忽略处理时延,业务恢复时间的上限为:
其中,k是从远端节点到ONU的最远传输距离。业务恢复时间的下限为:
(5)处理时间
网络中的处理时间包括中心站监测到故障后判断故障类型的时间、中心站计算均衡时延的时间、远端节点和ONU处理中心站测距和带宽授权信息的时间。处理时延通常只有几或几十微秒,对毫秒量级的保护倒换时间影响不大。因此为了使分析更加简洁,在本节的保护倒换时间分析和计算中不考虑处理时间。
综上,保护倒换时间的上下限分别为:
本文在£R取100 km,LA取20 km,从12.5 km变化到100 km,N础。从8个变化到1介,TOS取最差值20 ms,k。为2 ms,c fcheJ为200 km/ms的条件下,对所提生存性保证方案的保护倒换时间进行了计算。
从图5可以看出,全网的保护倒换时间最大为41 ms,满足标准的50 ms保护倒换时间要求。随着故障位置逆时针方向与中心站的距离越来越远,保护倒换时间逐渐下降。造成上述趋势的原因是:首先,由于光开关切换时间固定,保护倒换时间主要受故障监测时间、远端节点测距时间和业务恢复时间的影响。然后,对于远端节点测距时间,故障位置越远,受故障影响的远端节点越少,用于远端节点测距的时间也越短:对于业务恢复时间,随着故障位置逆时针方向与中心站的距离越来越远,保护倒换后,中心站与受故障影响的远端节点反而更近,控制信息在光纤中的传播时延下降;对于故障监测时间,因为中心站和全部远端节点都需要发现故障,所以故障监测时间取最后发现故障设备的故障监测时间。故障位置远时,中心站发现故障的时间长,而故障位置近时远端节点发现故障的时间长。因此,实际上故障监测时间随故障位置变远而先变小再变大。综上,远端节点测距时间和业务恢复时间呈现变小趋势,而故障监测时间先变小再变大。又因为远端节点测距时间和业务恢复时间的下降幅度比故障监测时间的变化幅度大,所以保护倒换时间最终呈现出故障位置越远保护倒换时间越小的变化规律。
5 结束语
本文所提生存性保证方案,利用控制信道定位和检测故障,通过中心站和远端节点分别切换保护光开关完成保护倒换,利用波长动态调度能力转移故障中心站业务线卡的业务。所提方案能降低故障检测定位的复杂度,不借助备份实现对中心站业务线卡的生存性保证,降低为采取生存性保证付出的成本。所提方案还针对故障影响最大的主干光纤进行保护,并且利用光纤环进行生存性保证,不需要增加备份保护光纤。本文进行了全网生存性和成本的综合定量分析。分析计算表明,所提方案最优时只需付出1%的生存性保证成本,就能带来54%的生存性提高。与其他方案相比,所提方案具备最高的成本效益,所提方案的保护倒换能控制在50 ms内完成。
6摘要:
如何在波长动态调度的时分波分复用光接入网中正确定位故障并进行保护倒换,以保证强生存性是需要解决的关键技术问题。为解决上述问题,提出了一种具有成本效益的利用控制信道定位故障的和基于动态波长调度的生存性保证方案,并对方案进行了生存性和成本的综合定量分析。分析计算表明,所提方案最优时只需付出1%的生存性保证成本,就能带来54%的生存性提高,并且保护倒换能控制在50 ms内完成。
下一篇:返回列表