面向5G通信的高速PAM4信号时钟与数据恢复技术

来源 :中兴通讯技术 | 被引量 : 0次 | 上传用户:aspoptyy4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:针对5G通信中4级脉幅调制(PAM4)格式数据的高速传输,提出了可集成的数据与时钟恢复中若干关键技术,包括波特率采样、边沿选择、最优采样和阈值调节等。在单路50 Gbit/s以上速率可有效降低芯片硬件开销,降低系统功耗,降低误码率(BER),并可以提升芯片工作鲁棒性。上述技术在65 nm互补金属氧化物半导体(CMOS)工艺下通过芯片设计及流片加工得到验证,测试结果表明:该芯片恢复时钟具备1.08 ps均方根值(RMS)的时域抖动;恢复数据最高速率在51 Gbit/s可实现3.4×10-9的PAM4信号BER,以及低至6.27 pJ/bit的能耗效率。
  5G;PAM4;时钟与数据恢复;CMOS
  Key techniques including baud-rate sampling, edge-selection, optimal sampling and threshold adjusting techniques are proposed for 4-level pulse amplitude modulation (PAM4) high-speed transmitting in 5G communications. Significant improvements are derived in terms of the hardware cost, system power consumption, bit-error rate (BER) and operation robustness above 50 Gbit/s. The proposed techniques are verified through chip design and tape-out fabrication in
  65 nm complementary metal oxide semiconductor (CMOS) process. Measurement results show that the clock and data recovery (CDR) features 1.08 ps root meam square (RMS) clock jitter, 3.4×10-9 PAM4 data recovery BER and 6.27 pJ/bit power efficiency.
  5G; PAM4; CDR; CMOS
  1 光通信中的時钟与数据
  恢复
  随着大数据和云计算技术的诞生,数据量呈现爆发式的增长,数据通信的带宽需求日益旺盛,而传统的电互连技术已经无法满足高速信息传输的需求。在此背景下,为了实现信息的更高速率的传输,利用光波作为传输介质,光信号作为信息载体的数据传输方案即光互连受到了越来越多的关注。光互连可以理解为光通信技术在短距离场景替代传统的电通信技术的一种实现形式,在具备光通信的所有技术优点的基础上,还具有更高性能的集成化、低功耗、低成本等特点,因此光互连能够实现超低功耗、较长距离、超高速、超高密度的数据通信,同时还具备无电磁干扰、短延时、长寿命、安全可靠等特点。由此可见,光互连技术代表了未来中长距离数据通信技术的发展方向。光互连具有低功耗和高集成度的特点,其中的核心是集成光子技术和集成电路技术,主要包括:高速激光器芯片技术、高速调制器芯片技术、集成光波导技术、集成驱动芯片技术、光电探测芯片技术、集成数字信号处理技术等[1-4]。
  光互连系统是电光混合集成,由高速激光器和高速调制器将电信号加载到光波上,因此需要高速驱动芯片对激光器和调制器进行电信号到光信号的转换。当不归零码(NRZ)数据传输速率超过40 Gbit/s,电光转换的带宽成为限制光互连速度的瓶颈。4级脉幅调制(PAM4)由于具有在相同带宽下2倍的数据传输速率,得到越来越广泛的应用。在光互连系统中,当单通道数据速率达到25 Gbit/s时,无论在接收端和发射端都需要采用时钟与数据恢复(CDR)电路从高损耗的信号里恢复出高质量的数据,再通过驱动电路将数据加载到光波上。如图1所示,PAM4调制的CDR电路在收发两端的电-光和光-电转换都是核心部件。在电-光转换接口,高速串行电信号经过高损耗电路板导致信号质量严重下降,通过PAM4 CDR对信号进行恢复,得到低抖动的时钟和数据。在光-电转换接口,由于电光调制器的插入损耗及光纤传输损耗等,光电探测器接收到的有损信号同样需要CDR进行数据恢复。
  CDR相对于锁相环(PLL)的区别主要在于鉴相器的设计上,CDR基本的组成部分包括鉴相器(PD)、电荷泵(CP)、环路滤波器、压控振荡器(VCO)等。鉴相器通过用VCO的输出时钟对输入数据进行采样来获得控制信号,控制信号输出到电荷泵产生控制电压来调节VCO的振荡频率,由此恢复高质量的时钟信号和数据。PAM4 CDR相对于NRZ信号的CDR而言,其设计难度增加很多,体现在:首先,高速多幅度信号的量化。PAM4信号与NRZ信号相比,对信噪比和电路的线性度要求很高,在对PAM4信号进行量化时,需要3个阈值,由于每级信号间的幅度降低为NRZ信号的三分之一,那么对于阈值的偏差容限也降低了很多,如何准确地选择合适的阈值是一个难点。此外,由于PAM4信号具有确定性抖动,对于高速信号而言,采样时钟的窗口变小,对时钟抖动的要求提高,增加了时钟链路的设计难度。其次,PAM4信号中多种幅度转换类型下的时钟和数据对齐。PAM4信号有12种电平转换模式,远多于NRZ信号的2种,在进行时钟数据边沿对齐时,其复杂度会增大很多。因此,需要选择合适的转换边沿来进行时钟与数据对齐,来降低鉴相器设计难度,减小误码率。由此可见,高速PAM4 CDR电路不仅需要考虑传统高速电路设计中的电路带宽、抖动、功耗等问题,还要结合新的调制格式下数据的特点来进行电路设计。   2 PAM4时钟与恢复关键
  技术
  光通信中采用时钟与数据恢复技术实现2个功能:首先,利用本地产生的多相位时钟对数据多次采样,判断数据比特的边沿,并通过PLL将时钟边沿与其对齐,从而实现与数据同频率、同相位时钟的恢复。其次,利用已同步时钟的最优相位对输入数据采样,使其实现最高的输入信噪比,并把采样结果作为已恢复数据输出。如图2a)所示为传统的过采样型CDR,其中每比特数据采用数据(Dn)和边沿(Edge)2个时钟相位进行采样,并最终将Edge相位的时钟与数据边沿过零点对齐。其工作原理基于Edge相位采样的数据值分别与上一周期数据Dn及本周期数据Dn+1进行比较的结果:当Edge与Dn的结果同为逻辑1或0时,表明Edge相位超前于数据跳转边沿,判决结果为“超前(Early)”;而当Edge与Dn+1的结果相同时,表明Edge相位滞后于数据跳转边沿,判决结果为“滞后(Late)”。随后锁相环路根据此结果反向调节时钟相位,最终实现时钟相位与数据边沿的对齐。不难看出:过采样型CDR需要2倍于数据率Nyquist频率的时钟以产生足够多的相位进行采样,这带来了硬件开销的增大和系统功耗的上升。
  2.1 波特率采样技术
  本文中,我们提出一种新型的采样技术,每个数据比特仅需要1个采样时钟相位便可实现时钟与数据边沿的对齐。具体来说,本技术使用积分型电路计算两次采样之间电容极板上电荷的累加值,对应于计算图中数据比特覆盖的阴影区面积(如图2a)所示)。当差分输入进行数据翻转时,阴影面积在过零点之前为正,过零点之后为负(正相和反相信号以水平线为轴进行反转)。因此,当时钟与数据边沿对齐时正负面积相等,积分值恰好为零;而当时钟超前于数据时,正相面积大于负相,积分值为正数非零值;反之当滞后时积分值为负。由于此技术下时钟频率仅需要和数据Nyquist频率相同,因此称之为波特率采样技术,此种类型的CDR会带来硬件开销的节省和系统功耗的下降。
  2.2 边沿选择技术
  图2b)中所示为PAM4信号边沿的瞬态特性:PAM4差分信号逻辑电平变化时会产生多个“过零点”(差分信号电压相等的瞬间),而上述过零点在时间上并不平均分布于数据边沿附近,其分布与前后比特码型相关,并由此集中于几个分离的时间点附近[1]。CDR环路试图将时钟相位(例如:上升沿)向数据转换的边沿对齐,在这种情况下最终锁定的时钟相位将分布于多个时间点,相当于在上述区间内随机游走造成时域抖动。本文中我们采用的策略为只选择其中具有最大发生几率的信号边沿,即仅选择逻辑±3向±3、±1向±1的数据比特作为时钟/数据同步的判据。在此策略下,所有数据边沿试图向同一个时间点对齐,避免多个过零点导致的CDR锁定后时钟相位的随机游走,也避免了由此引入的时域抖动。
  2.3 最优采样与阈值调节
  PAM4调制信号相比NRZ信号,虽然在占用相同硬件带宽的前提下实现了等效数据率的翻倍,但在信号处理及其硬件实现上带来了额外设计挑战。首先,PAM信号对码间干扰(ISI)更加敏感,而逻辑±3之间所需转换时间比逻辑±1之间更长。这就意味着比特边沿具备相同上升/下降时间(或硬件带宽)前提下,前者拥有更少的剩余稳定时间;极端情况下±3之间短比特来不及完全建立到其理想电压值,但后者逻辑±1之间的转换建立时间充足。如图3所示,描述了上述情况的结果,如果沿用传统过采样原理使用与边沿相差0.5 UI的时钟相位采样数据,由于最高幅度信号建立未完成无法获得最高的输入信号信噪比,实际的最高信噪比采样点相对图中0.5 UI处存在偏移。
  其次,在多幅值调制中特有的难题是PAM4信号的非线性失真。具体来说,由于电信号输入信道的损耗或者电-光转换时引入的非线性,PAM4信号的3个内眼可能具备不同的眼高与眼宽,这种情况下如果CDR使用线性分布的阈值(图3中横向黑色虚线)判别逻辑电平数值,将带来判决误码率的上升。例如:在直接調制型垂直腔体表面发射激光器(VCSEL)的光电发射机中,由于激光器本身非线性会导致光眼图的上升、下降时间不对称;而VCSEL偏置电流较高时,其逻辑高的光功率受到压缩不再与输入电流成正比例关系,导致PAM4信号中逻辑±3的眼高略低于逻辑±1的3倍。
  3 系统级设计
  基于PAM4信号CDR的关键技术,我们设计并实现了一款50 Gbit/s PAM4输入的CDR芯片,其系统架构如图4所示。25 G Baud/s的PAM4信号进入CDR后到达PD模块,PD由4个时间交织的1/4速率同路并行而成,每条通路工作在6.25 Gbit/s。每条PD通路由1个前端电路(PD-FE)、重定时寄存器、PAM4译码器和1个逻辑电路模块构成。其中PD-FE采用了3个并行的判决器来量化具有4个电平信息的PAM4信号,并将其输出为3位温度计码判决结果;译码器负责将温度计码转换为二进制码,即代表2倍权重位的最高权重位(MSB)和1倍权重位的最低权重位(LSB)(图4中MSB_6G和LSB_6G)信号。需要注意的是:PD时间交织的采样后,MSB_6G和LSB_6G均为6.25 Gbit/s的NRZ数据;该数据通过串行转化器进行4:1变换,并汇聚到单路25 Gbit/s再输出给驱动器供光器件或测试仪器使用。在串行转换中,相比于传统结构需要多次重定时,我们使用CDR恢复出的正交相位数据[4],天然满足了转换中对各路数据相对延时的需求。如图4所示,PD-FE中除3位判决器之外我们还设计一种新型的积分器,用来实现前述相邻数据的积分,并据此给出调节时钟相位的超前(DN)/滞后(UP)信号,进而控制锁相环路中的CP对环路滤波器(LPF)充放电流,闭环调节时钟相位。本文中CDR芯片集成工作于12.5 GHz频段的电感电容型压控振荡器(LC-VCO),其输出信号经过分频器除2(/2)之后可以形成4相位6.25 GHz时钟作为PD采样所用。CDR的锁相环路由PAM4 PD、CP、低通滤波器(LPF)、VCO、/2分频器和占空比矫正器(DCC)组成,它的带宽设计为5~15 MHz可调节,并通过片上寄存器配置电荷泵充放电电流、环路滤波器电阻电容来实现。   4 电路模块级设计
  PAM4信号的时钟与数据恢复中最关键的电路模块是PD,因其工作在整个CDR的最高速率25G Baud/s,并且负责对带有码间干扰和非线性失真的PAM4信号的逻辑判决。如图4所示,PD的核心部分是其前端电路(图中简写为PD-FE),它由并行的3条数据通路和1条边沿通路构成,而每条通路均包含了1个判决器。由于PAM4信号具有4个不同的逻辑电平,因此判决器需依据3个不同的电压阈值来判决上述逻辑,分别为对应于+/-符号判决的逻辑阈值0,以及对应于±3逻辑电平的判决阈值±2。每路PD-FE的输出先进入灵敏放大器(SA)进一步放大,再送入SR型锁存器进行逻辑电平再生。此时PD判决出的3位数据逻辑信号(DataA, B, C)表现出温度计编码特性,需要在数据输出之前转换为二进制码;并且通过双值逻辑产生出当前时刻数据和时钟边沿相对位置关系的指示信号,指导锁相环路进行时钟恢复达到数据与时钟边沿的实时对齐。
  图5描述了本文提出的波特率采样技术的工作原理。其中,?0、?90、?180和?270分别为采样时钟一个周期中的4个相位0°、90°、180°和270°;PD前端在1个时钟周期内,将采样过程分成3个步骤进行:积分阶段、保持阶段和复位阶段。在积分阶段,输入差分信号根据幅值和正负关系通过电容放电将输出电压分开;在保持阶段,上述差分电压输出被保持一段时间不变,以作为后级SR锁存器的输入保持稳定;上述阶段完成时数据判决结束,进入复位阶段,输出节点重新被上拉到电源电压,等待下一采样周期的电容放电过程。需要注意的是:上述过程中,仅需要数据比特中心相位的时钟采样点,而节省了边沿相位采样点。
  本文应对信号多过零点的数据转换边沿,仅选择其中对称变化的码型进行时钟对齐。具体来说,鉴相器恢复的温度计码数据在向二进制转换之前直接交给边沿选择器,其中A<2:0>和B<2:0>分别代表鉴相器输出的前一比特和当前比特信息。以逻辑±3之间的转换为例,边沿选择器中的组合逻辑部分当且仅当识别出上述码型时,输出逻辑高电平判断结果。此结果在单相位时钟型寄存器(TSPC)型与门逻辑中进行重定时,并作为选通信号控制BB逻辑的时钟相位调节指示信号,仅在有效码型的前提下将相位调节传递给下一级,否则整个锁相环路无动作。
  由于本文CDR采用1/4速率时间交织形式采样数据,每路恢复数据初始速率在6.25 Gbit/s;上述4比特数据在6.25 GHz和12.5 GHz时钟的控制下分别进行2次2:1并行至串行转换,并最终使用电压型串连电阻终端(SST)的驱动器进行输出。输出端反相器导通电阻连同输出端串联电阻构成匹配终端50 ohm,吸收来自负载信道的信号反射。传统结构2:1并行至串行转换采用5个锁存器,先将两路数据时序对齐再彼此平移错开180°;本文中我们在第2次2:1转换中采用直通结构,利用多相位之间时序差节约上述动态锁存器电路。
  5 测试结果
  本文中我们提出的PAM4信号时钟与数据恢复技术分别在65 nm和40 nm 互补金属氧化物半导体(CMOS)工艺下进行2次流片得到验证:如图6中所示为利用波特率采样技术的65 nm 50 Gbit/s PAM4 CDR芯片,该芯片共占用面积1.36 mm 2并包含焊盘和3 kV 静电损伤(ESD)保护环。芯片的功能和性能测试均采用直接PCB金线键合的封装形式。为测量CDR误码率,25 G Baud/s的PAM4 信号采用PRBS-9编码作为输入,该信号在到达待测芯片之前经历同轴电缆线和板上传输线的高频损耗。CDR芯片从输入PAM4信号中恢复出2路25 Gbit/s的NRZ信号,分别对应于PAM4解调之后的MSB和LSB位,并输出给30 G误码仪分别进行测量对应的BER。
  在时钟恢复性能的相关测量中,双通道64 GSs采样率的任意波形发生器用来产生50 Gbit/s PAM4输入信号,而80 GSs实时采样示波器用来测量CDR恢复的12.5 GHz时钟。如图7所示,该时钟具备均方根时域(RMS)抖动为1.08 ps,峰-峰值时域抖动为8.4 ps;而CDR锁相环路的闭环相位噪声分别在1 kHz、8.1 MHz以及120 MHz频偏处,测试得到的结果为:-93 dBc/Hz、
  -112 dBc/Hz以及-122 dBc/Hz。
  图8所示为本文中CDR芯片实时数据恢复的误码率(BER),测量时芯片输出到误码仪并实时与信号源的原始数据逐个比特进行对比。其中,MSB数据输出所对应的BER为0(低于10-12认为无误码输出);LSB数据对应的BER约为3×10-9,满足带前向纠错功能的PAM4通信网络的需求(常见数值为10-4~10-6)。通过测试发现:由于该芯片CDR输入未集成信道均衡,PAM4信號到达CDR已存在较明显码间干扰,进而限制了BER未完全达到0。
  6 结束语
  本文中我们介绍了单路50 Gbit/s速率光通信高速PAM4调制下电路设计的挑战和潜在解决方法,提出了一种基于积分前端电路的数据与时钟恢复技术,该技术能够在高速率下节省鉴相器和时钟网络近一半硬件开销和功耗代价。上述技术通过65nm CMOS工艺进行流片验证,实测获得最高51 Gbit/s PAM4信号输入下恢复时钟1.08 ps RMS的时域抖动,并且还实现了3×10-9的数据误码率以及6.27 pJ/bit的能耗效率。
  参考文献
  [1] ZERBE J L, WERNER C W, STOJANOVIC V, et al.Equalization and Clock Recovery for a 2.5-10-Gb/s 2-PAM/4-PAM Backplane Transceiver Cell [J].IEEE Journal of Solid-State Circuits, 2003, 38(12):2121-2130. DOI: 10.1109/JSSC.2003.818572
  [2] LEEJ, CHIANG C P, PENG P J, et al. Design of 56 Gb/s NRZ and PAM4 SerDes Transceivers in CMOS Technologies [J].IEEE Journal of Solid-State Circuits, 2015, 50(9):2061-2073.DOI:10.1109/JSSC.2015.2433269
  [3] TOIFLT, MENOLFI C, RUEGG M, et al. A 22 Gb/s PAM-4 Receiver in 90 nm CMOS SOI Technology [J].IEEE Journal of Solid-State Circuits, 2006, 41(4):954-965
  [4] CHEN E, HOSSAIN M, LEIBOWITZ B, et al. A 40 Gb/s Serial Link Transceiver in 28 nm CMOS Technology [C]//2014 Symposium on VLSI Circuits Digest of Technical Papers. USA:IEEE, 2014. DOI: 10.1109/VLSIC.2014.6858361
其他文献
一、教学策略    本课的教学重点是认识鼠标,教学难点是学会鼠标的移动、单击、拖拽、双击四种操作方法,并能将这些操作灵活运用于计算机操作中。教学对象是小学三年级学生。他们对电脑仅仅有一种模糊的认识,有的甚至是刚刚接触电脑,动手能力不够强,甚至可能还对电脑存在着一定的恐惧心理。  配合教学实际需求,我尝试采用情境教学法,创设一个到神秘城堡探秘寻宝的虚拟情境,并用多媒体技术制作了一个形象生动的卡通鼠标
期刊
初中物理新课程基本理念是:注重全体学生的发展;改变学科本位的观念;从生活走向物理,从物理走向社会;注重科学探究,提倡学习方式多样化。按照物理新课程基本理念进行教学,CAI是强有力的技术手段。    一、 CAI在初中物理新课程中应用的几个视角    1.展示情境,提出问题  科学探究的最终目标之一就是发展学生的创造力。CAI展示物理情境,帮助学生从日常生活、自然现象或实验现象的观察中发现与物理学有
期刊
教学目标 知识目标    1.认识条形统计图及其特点,知道制作条形统计图的一般步骤和方法,学会在有横轴和纵轴的图上画出条形,表示要说明的数据。  2.能看懂条形统计图,能根据条形统计图的数据作数量的简单分析。    态度、情感、价值观目标  1.体会数学与生活的联系,初步认识统计图的意义和作用,初步形成统计的思想。  2.通过研究小组的交流协作,培养合作学习的精神。    能力目标  1.培养学生
期刊
在课件制作中,我们经常会接触到字幕的制作工作,有时需要为课件画面配上文字说明,有时要为课件中的音乐、对白、解说配上字幕等等。Premiere是一套功能强大并且操作简便的非线性编辑软件,本文从多角度介绍利用该软件制作各种功能实用的字幕技术。    一、认识premiere 6.5字幕窗口    Premiere 6.5的字幕窗口比早期版本的字幕窗口要复杂得多(图1)。各种功能如下。    (1)[T
期刊
在高山上用不同的水平初速度抛出物体。若初速度一次比一次大,物体落地点就一次比一次远;当初速度足够大时,物体就再也不落回地面,而是做以地心为一个焦点的不同轨道的椭圆(或圆)运动。当物体向近地点(或远地点)运动时,物体的速度将变大(或变小)。用Flash MX动态显示上述“牛顿草图”时,可以在动态文本框中呈现不同时刻物体的速度变化。   本
期刊
信息技术教育主要有两种形式,一是作为主渠道的信息技术课程教学,二是信息技术与课程整合。第七届全球华人计算机教育应用大会(GCCCE2003)对这两种形式的教学情况进行了案例征集,以考察我国信息技术教育的现状。本文主要对信息技术与课程整合的案例进行分析,从中总结经验,发现不足,以图改进。
期刊
多媒体教学演示包含大量与教学内容讲解过程有关的视频效果,如闪烁的红框、文字说明等。教学中的重点、难点或教学过程中要注意的细节通过视频演示,能够起到强调的效果。Premiere支持多轨操作,因此,在Photoshop中制作特殊强调效果之后,再利用Premiere中的多视轨(Video)进行Alpha通道或白色Alpha通道遮罩效果处理合成后,效果颇理想。但是,这种方法要求用户非常熟悉Photo-sh
期刊
信息技术课程正在实现从计算机教育走向信息技术教育,从技能训练走向信息素养培养的变革。在继承与创新中进行信息技术课程教学方法的建设是课程改革的基本任务,它最终决定着信息技术课程改革的成败。梳理中小学信息技术教学模式与方法将有助于一线教师积极主动地参与到信息技术教学创新中。我们推介几种教学模式,目的不在于要教师照搬,而在于希望他们能够参照这些教学模式大胆实践,进行教学反思,从而真正实现创新。    任
期刊
重庆邮电大学二级教授、博士生导师,享受国务院政府特殊津贴专家,现为重慶邮电大学副校长、移动通信技术重庆市重点实验室主任、中国通信学会会士、重庆市电子学会副理事长兼秘书长;获得国家科技进步二等奖、重庆市技术发明一等奖、重庆市科技进步一等奖等奖项;主持国家和省部级重点项目等各类科研项目20余项;获得授权国家发明专利92项(采用或转让27项),发表学术论文100余篇。  为了使以5G为代表的无线网络更加
期刊
专题策划人  唐雄燕  工学博士,教授级高工,中国联通网络技术研究院首席科学家,中国联通智能网络中心总架构师,下一代互联网宽带业务应用国家工程实验负责人,“新世纪百千万人才工程”国家级人选,任北京邮电大学兼职教授、博士生导师,工业和信息化部通信科技委委员,北京通信学会副理事长,中国通信学会理事,国际开放网络基金会(ONF)董事会成员;拥有20余年的电信新技术、新业务研发与技术管理经验,主要专业领域
期刊