论文部分内容阅读
摘 要:目前全省已大规模部署IPTV业务,随之而来是IPTV故障逐渐增多。对于IPTV这种端到端的业务,涉及多厂家,穿越多种网络类型的业务,如何保障业务质量,如何快速定位故障原因?是当前急需考虑的问题。本文将对1起IPTV业务出现卡顿和花屏的故障案例进行分析,并通过该案例总结梳理IPTV业务处理流程。
关键词:IPTV;卡顿;花屏;ME60
中图分类号:TN948.55 文献标识码:A 文章编号:1004-7344(2018)18-0257-02
1 背景描述
随着视屏业务的发展,用户对IPTV网络感知越来越敏感。影响IPTV视频质量的不仅仅是网络质量,IPTV平台的视频编解码质量,机顶盒、家庭终端等设备都可能会影响IPTV业务感知,对于IPTV业务出现卡顿和花屏感知类故障处理时,需要进行端到端的通盘考虑和定位,并对端到端所使用到的各类协议、涉及的设备功能以及实现等都要了解,才能够快速、准确地定位问题。
2 典型案例
(1)故障现象:ME60下采用DHCP方式接入的多个用户,在晚上高峰期收看IPTV节目时出现卡屏。在同一终端使用PPPoE模式收看IPTV不卡屏,但使用DHCP模式收看IPTV卡屏。卡屏出现在晚上业务高峰期,白天业务轻载时没有问题。卡屏问题终端集中在某ME60的1/0/3接口下。
(2)组网情况:常见IPTV端到端网络拓扑如下,本案例涉及到的设备路径为:ME60→S9306→OLT→HG8245→STB。
(3)分析及处理:由于在高峰期才会出现卡屏,并且使用PPPoE方式的用户没有出现卡屏问题,可以初步推断原因为,在IPoE方式下因高峰期某设备接口带宽不足导致的丢包,且丢包的点应该在ME60及以下设备,因此需要逐个排查MA5600T、S9306、ME60,以确认丢包发生的段落。
①在MA5600T设备上排查。在MA5600T(OLT)上进行抓包,确认丢包发生在MA5600T上游设备还是MA5600T及下游设备。在OLT上行口镜像抓包,配置如下:
镜像命令配置,将0/20/0的MACf8e8-11b3-86ef的报文镜像到0/20/1,在0/20/1抓包。
将抓到的数据报文进行分析,发现有9.5%的报文丢包,说明在OLT上游就发生了丢包,需要继续进行确认。
②在S9306设备上排查。确认丢包是发生在S9306上游设备还是S9306及其下游设备。在S9306上行接口(与ME60相连的接口)进行镜像抓包,发现S9306上行存在丢包,说明丢包可能发生在ME60设备上。
③在ME60设备上排查。查看G1/0/3的接口信息,发现在ME60设备1/0/3接口晚上业务高峰期Output(下行方向)端口利用率超过80%,很可能是因为ME60设备1/0/3接口业务拥塞出方向丢包导致IPTV业务卡屏。
端口的上下行流量统计值(Input/Output bandwidth utilization80.57%)为统计平均值,由于业务本身流量是突发的,所以端口利用率超过80%时,实际业务峰值流量可能超过端口带宽,出现丢包。
④对比两种上线方式信息。分别查看PPPoE上线用户详细信息和DHCP上线用户详细信息,并进行差异对比。发现DHCP上线方式,没有对用户带宽进行限制。PPPoE上线方式,由Radius对用户带宽进行了限制。
由上可以看出,ME60上DHCP方式用户没有限速,PPPOE方式用户是存在限速的。经询问厂家得知:ME60设备内部转发时只能保证队列的CIR保证带宽不丢包,当队列超出该值时只会尽量转发,但不保证不丢包。当端口出现拥塞,在流量突发高峰时总流量超过端口带宽(1Gbit/s),用戶超过CIR保证带宽的流量会被丢弃。(用户带宽限制中:CIR Committed Information Rate承诺信息速率,PIR Peak information rate标峰值信息速率。)
(4)故障原因定位。对DHCP方式用户如不配置带宽进行限制,则用户的默认CIR值为128Kbit/s,PIR值为1Gbit/s,端口拥塞出现时,只能保证128Kbit/s的带宽,部分报文被丢弃。PPP拨号用户上线时,会根据用户的带宽情况如2Mbit/s、3Mbit/s或100Mbit/s来分配独立CIR用户队列,能够保证用户CIR带宽。
(5)解决方案。通过在ME60上的用户域下配置用户CIR保证带宽,解决卡屏问题。
(6)处理建议及总结
本案例中,业务高峰时ME60端口的平均占用率已经达到80%,应及时对ME60端口进行扩容,避免突发流量超端口带宽导致的丢包。如无法及时扩容,可根据现网实际业务发放方案,在ME60的用户域下配置用户CIR保证带宽,可以在一定程度上避免此问题发生。现网中,要根据实际业务发放方法配置,如通过Radius下发用户带宽配置。
3 经验总结
对于IPTV常见故障,一般可分为通断类故障和质量类故障。通断类故障现象明显,排查较为容易。质量类故障,故障频次和范围无规律,通常需要端到端的进行梳理排查故障。下面对质量类故障进行重点归纳总结。
3.1 质量类故障场景归类
全部BTV业务质量差指客户可以正常使用IPTV业务,但所有BTV均出现质量问题,比如马赛克,花屏等情况。
部分BTV业务质量差指客户可以正常使用IPTV业务,但部分BTV频道质量差,部分BTV频道质量正常。
VOD业务质量差指客户可以正常使用IPTV业务,但其观看的VOD节目质量差,比如马赛克,花屏等。
操作体验差指出现EPG显示慢,频道切换慢,VOD点播慢等操作体验差的情况。
3.2 IPTV基本故障定位思路
在日常对IPTV业务的维护经验积累中发现,单个的IPTV用户故障原因多数是由于用户侧自身问题造成;如果可以确定为群障,那么一定会在上层网络侧有着共同的组网环境。所以IPTV的故障定位遵循的基本原则是:先定界再定位,先用户侧再网络侧。
(1)家庭网络问题排查:排除基本家庭网络问题、收集故障信息。首先对家庭网络设备检查如STB连接方式含端口协商模式和设备使用情况。再收集问题现象和相关信息,如对用户高速上网时导致质量差,可检查接入设备QOS设置。
(2)根据问题范围,分责定界:根据用户故障发生的区域范围(个体、区域、全网等)初步确定故障范围。可使用SQM分支路径方案辅助分析,同时可根据报障点分布进行分析。
(3)逐段分析排查:根据问题范围,按照定位流程排查可能的故障点。如为个体问题,检查接入带宽配置、线路质量;如为区域问题,检查故障段路径上各设备的性能、端口流量、QOS配置;如为全网问题:检查IPTV平台系统服务器性能、平台网络质量、片源质量。
(4)疑难问题抓包分析定位:疑难问题,通过抓包进行分析定位具体故障点。在初判的故障段上,逐点抓取视频流报文进行分析;如遇无规律的质量差问题,请厂家工程师配合在各相关节点进行监控或者抓包,分析定位故障原因。
提示:由于IPTV的业务流向是从城域网的最末端一直到最上层的应用端,且视频类业务对网络质量的要求非常高,所以在条件允许的情况下,多多借助工具能够有效的提升问题处理效率,比如STB一键式诊断工具、SQM质量监控平台等。
参考文献
[1]许永明,谢质文,欧阳春.IPTV技术与应用实践.北京:电子工业出版社,2006.
[2]史林林.论IPTV技术及应用.电子技术与软件工程,2016,07.
[3]刘 玺.IPTV多终端视频切换的研究与实现[D].成都:电子科技大学,2013.
[4]王 钟.支持“三屏融合”的IPTV系统研究[D].北京:北京邮电大学,2014.
收稿日期:2018-5-22
作者简介:赵 兴(1978-),女,主要从事数据网络维护工作。
关键词:IPTV;卡顿;花屏;ME60
中图分类号:TN948.55 文献标识码:A 文章编号:1004-7344(2018)18-0257-02
1 背景描述
随着视屏业务的发展,用户对IPTV网络感知越来越敏感。影响IPTV视频质量的不仅仅是网络质量,IPTV平台的视频编解码质量,机顶盒、家庭终端等设备都可能会影响IPTV业务感知,对于IPTV业务出现卡顿和花屏感知类故障处理时,需要进行端到端的通盘考虑和定位,并对端到端所使用到的各类协议、涉及的设备功能以及实现等都要了解,才能够快速、准确地定位问题。
2 典型案例
(1)故障现象:ME60下采用DHCP方式接入的多个用户,在晚上高峰期收看IPTV节目时出现卡屏。在同一终端使用PPPoE模式收看IPTV不卡屏,但使用DHCP模式收看IPTV卡屏。卡屏出现在晚上业务高峰期,白天业务轻载时没有问题。卡屏问题终端集中在某ME60的1/0/3接口下。
(2)组网情况:常见IPTV端到端网络拓扑如下,本案例涉及到的设备路径为:ME60→S9306→OLT→HG8245→STB。
(3)分析及处理:由于在高峰期才会出现卡屏,并且使用PPPoE方式的用户没有出现卡屏问题,可以初步推断原因为,在IPoE方式下因高峰期某设备接口带宽不足导致的丢包,且丢包的点应该在ME60及以下设备,因此需要逐个排查MA5600T、S9306、ME60,以确认丢包发生的段落。
①在MA5600T设备上排查。在MA5600T(OLT)上进行抓包,确认丢包发生在MA5600T上游设备还是MA5600T及下游设备。在OLT上行口镜像抓包,配置如下:
镜像命令配置,将0/20/0的MACf8e8-11b3-86ef的报文镜像到0/20/1,在0/20/1抓包。
将抓到的数据报文进行分析,发现有9.5%的报文丢包,说明在OLT上游就发生了丢包,需要继续进行确认。
②在S9306设备上排查。确认丢包是发生在S9306上游设备还是S9306及其下游设备。在S9306上行接口(与ME60相连的接口)进行镜像抓包,发现S9306上行存在丢包,说明丢包可能发生在ME60设备上。
③在ME60设备上排查。查看G1/0/3的接口信息,发现在ME60设备1/0/3接口晚上业务高峰期Output(下行方向)端口利用率超过80%,很可能是因为ME60设备1/0/3接口业务拥塞出方向丢包导致IPTV业务卡屏。
端口的上下行流量统计值(Input/Output bandwidth utilization80.57%)为统计平均值,由于业务本身流量是突发的,所以端口利用率超过80%时,实际业务峰值流量可能超过端口带宽,出现丢包。
④对比两种上线方式信息。分别查看PPPoE上线用户详细信息和DHCP上线用户详细信息,并进行差异对比。发现DHCP上线方式,没有对用户带宽进行限制。PPPoE上线方式,由Radius对用户带宽进行了限制。
由上可以看出,ME60上DHCP方式用户没有限速,PPPOE方式用户是存在限速的。经询问厂家得知:ME60设备内部转发时只能保证队列的CIR保证带宽不丢包,当队列超出该值时只会尽量转发,但不保证不丢包。当端口出现拥塞,在流量突发高峰时总流量超过端口带宽(1Gbit/s),用戶超过CIR保证带宽的流量会被丢弃。(用户带宽限制中:CIR Committed Information Rate承诺信息速率,PIR Peak information rate标峰值信息速率。)
(4)故障原因定位。对DHCP方式用户如不配置带宽进行限制,则用户的默认CIR值为128Kbit/s,PIR值为1Gbit/s,端口拥塞出现时,只能保证128Kbit/s的带宽,部分报文被丢弃。PPP拨号用户上线时,会根据用户的带宽情况如2Mbit/s、3Mbit/s或100Mbit/s来分配独立CIR用户队列,能够保证用户CIR带宽。
(5)解决方案。通过在ME60上的用户域下配置用户CIR保证带宽,解决卡屏问题。
(6)处理建议及总结
本案例中,业务高峰时ME60端口的平均占用率已经达到80%,应及时对ME60端口进行扩容,避免突发流量超端口带宽导致的丢包。如无法及时扩容,可根据现网实际业务发放方案,在ME60的用户域下配置用户CIR保证带宽,可以在一定程度上避免此问题发生。现网中,要根据实际业务发放方法配置,如通过Radius下发用户带宽配置。
3 经验总结
对于IPTV常见故障,一般可分为通断类故障和质量类故障。通断类故障现象明显,排查较为容易。质量类故障,故障频次和范围无规律,通常需要端到端的进行梳理排查故障。下面对质量类故障进行重点归纳总结。
3.1 质量类故障场景归类
全部BTV业务质量差指客户可以正常使用IPTV业务,但所有BTV均出现质量问题,比如马赛克,花屏等情况。
部分BTV业务质量差指客户可以正常使用IPTV业务,但部分BTV频道质量差,部分BTV频道质量正常。
VOD业务质量差指客户可以正常使用IPTV业务,但其观看的VOD节目质量差,比如马赛克,花屏等。
操作体验差指出现EPG显示慢,频道切换慢,VOD点播慢等操作体验差的情况。
3.2 IPTV基本故障定位思路
在日常对IPTV业务的维护经验积累中发现,单个的IPTV用户故障原因多数是由于用户侧自身问题造成;如果可以确定为群障,那么一定会在上层网络侧有着共同的组网环境。所以IPTV的故障定位遵循的基本原则是:先定界再定位,先用户侧再网络侧。
(1)家庭网络问题排查:排除基本家庭网络问题、收集故障信息。首先对家庭网络设备检查如STB连接方式含端口协商模式和设备使用情况。再收集问题现象和相关信息,如对用户高速上网时导致质量差,可检查接入设备QOS设置。
(2)根据问题范围,分责定界:根据用户故障发生的区域范围(个体、区域、全网等)初步确定故障范围。可使用SQM分支路径方案辅助分析,同时可根据报障点分布进行分析。
(3)逐段分析排查:根据问题范围,按照定位流程排查可能的故障点。如为个体问题,检查接入带宽配置、线路质量;如为区域问题,检查故障段路径上各设备的性能、端口流量、QOS配置;如为全网问题:检查IPTV平台系统服务器性能、平台网络质量、片源质量。
(4)疑难问题抓包分析定位:疑难问题,通过抓包进行分析定位具体故障点。在初判的故障段上,逐点抓取视频流报文进行分析;如遇无规律的质量差问题,请厂家工程师配合在各相关节点进行监控或者抓包,分析定位故障原因。
提示:由于IPTV的业务流向是从城域网的最末端一直到最上层的应用端,且视频类业务对网络质量的要求非常高,所以在条件允许的情况下,多多借助工具能够有效的提升问题处理效率,比如STB一键式诊断工具、SQM质量监控平台等。
参考文献
[1]许永明,谢质文,欧阳春.IPTV技术与应用实践.北京:电子工业出版社,2006.
[2]史林林.论IPTV技术及应用.电子技术与软件工程,2016,07.
[3]刘 玺.IPTV多终端视频切换的研究与实现[D].成都:电子科技大学,2013.
[4]王 钟.支持“三屏融合”的IPTV系统研究[D].北京:北京邮电大学,2014.
收稿日期:2018-5-22
作者简介:赵 兴(1978-),女,主要从事数据网络维护工作。