- SRv6網絡部署指南
- 金閩偉 李振斌主編
- 3512字
- 2025-07-11 16:39:37
| 3.2 IFIT技術簡介 |
隨著移動承載、專網專線以及云網架構的快速發展,承載網絡面臨著超大帶寬、海量連接及高可靠、低時延等新需求與新挑戰。IFIT(In-situ Flow Information Telemetry,隨流檢測)是一種通過對網絡真實業務流進行特征標記,以直接檢測網絡的時延、丟包、抖動等性能指標的檢測技術。IFIT在業務可管可控、故障定位、服務質量檢測等方面都可以發揮重要作用。
1.產生背景
傳統的網絡運維方法并不能滿足5G和云時代新業務的SLA要求,其中突出的問題是業務受損被動感知和定界定位效率低下。
● 業務受損被動感知:運維人員通常只能根據收到的用戶投訴或周邊業務部門派發的工單判斷故障范圍。在這種情況下,運維人員故障感知延后、故障處理被動,導致其面臨的排障壓力大,最終可能造成不好的用戶體驗。因此,當前網絡需要能夠主動感知業務故障的業務級SLA檢測手段。
● 定界定位效率低下:故障定界定位通常需要多團隊協同,如果團隊間缺乏明確的定界機制,就會導致定責不清;人工逐臺設備排障找到故障設備進行重啟或倒換,這種方法的排障效率低下;此外,傳統OAM(Operation、Administration and Maintenance,操作、管理和維護)技術通過測試報文間接模擬業務流,無法真實復現性能劣化和故障場景。因此,當前網絡需要基于真實業務流的高精度、快速檢測手段。
為了滿足智簡網絡準確識別用戶意圖、實現網絡的端到端自動化配置、實時感知用戶體驗并進行預測性分析和主動優化的需求,IFIT技術應運而生。IFIT可以支持多種帶內流檢測機制,本書主要以交替染色法為例進行介紹。
2.技術價值
IFIT的技術價值主要體現在高精度、多維度檢測真實業務質量,靈活適配大規模、多類型業務場景,提供可視化的用戶界面,以及構建閉環的智能運維系統4個方面。
在高精度、多維度檢測真實業務質量方面,IFIT提供的隨流檢測能力基于真實業務報文展開。這種檢測方式具有很大優勢,具體表現在以下幾點。
● IFIT可以真實還原報文的實際轉發路徑,精準檢測每個業務的時延、丟包、亂序等多維度的性能信息。
● IFIT配合Telemetry秒級數據采集功能,能夠實時監控網絡SLA,快速實現故障定界和定位。
● IFIT可以實現對靜默故障的完全檢測、秒級定位。
在靈活適配大規模、多類型業務場景方面,IFIT憑借其部署簡單的特點,可以靈活適配大規模、多類型的業務場景,具體表現在以下幾點。
● IFIT支持用戶一鍵下發、全網使能。IFIT檢測流既可以由用戶配置生成(靜態檢測流),也可以通過自動學習或由帶有IFIT報文頭的流量觸發生成(動態檢測流);既可以是基于五元組等信息唯一創建的明細流,也可以是隧道級聚合流或VPN級聚合流。因此,IFIT能夠同時適用于檢測特定業務流以及端到端專線流量的不同檢測粒度場景。
● IFIT對現有網絡的兼容性較好,不支持IFIT的設備可以透傳IFIT檢測流,這樣能夠避免與第三方設備的對接問題,可以較好地適應設備類型較多的網絡環境。
● IFIT無須提前感知轉發路徑,能夠自動學習實際轉發路徑,避免了需要提前設定轉發路徑以對沿途所有網元逐跳部署檢測所帶來的規劃部署負擔。
● IFIT適配豐富的網絡類型,適用于各種三層網絡,也適用于多種隧道類型,可以較好地滿足現網需求。
在提供可視化的用戶界面的能力方面,IFIT不僅可以提供可視化的運維能力,也可以讓用戶通過控制器可視化界面,根據需要下發不同的IFIT監控策略,實現日常主動運維和報障快速處理。
在構建閉環的智能運維系統方面,IFIT與Telemetry、大數據分析和智能算法等技術相結合,將被動運維轉變為主動運維,打造智能運維系統。智能運維系統通過真實業務的異常主動感知、故障自動定界、故障快速定位和故障自愈恢復等環節,構建了一個自動化的正向循環,以適應復雜多變的網絡環境。
3.基本原理
交替染色是IFIT實現帶內測量的重要機制,IFIT可以通過在真實業務報文中插入交替染色報文頭實現故障定界和定位。RFC 9341、RFC 9342、RFC 9343定義了交替染色的標準[28-30]。本文以IFIT over SRv6場景為例,展示交替染色報文頭結構,再通過對染色標記位和統計模式位這兩個關鍵字段功能的介紹,說明IFIT如何實現故障的精準定位。
在IFIT over SRv6場景中,交替染色報文頭封裝在IPv6擴展頭中,如圖3-3所示。在該場景中,交替染色報文頭只會被指定的SRv6 Endpoint節點(接收并處理SRv6報文的任何節點)解析。運維人員只需在指定的、具備IFIT數據收集能力的節點上進行IFIT檢測,就可有效地兼容傳統網絡。
交替染色報文頭基于SRv6的擴展在IETF草案draft-fz-spring-srv6-alt-mark中進行定義[31],主要包含以下內容。
● FII(Flow Instruction Indicator,流指令標識):FII標識交替染色報文頭的開端,并定義交替染色報文頭的整體長度。
● FIH(Flow Instruction Header,流指令頭):FIH可以唯一地標識一條業務流,L和D字段提供了對報文基于交替染色法統計丟包和時延的能力,NextHeader字段表明是否攜帶擴展頭。
● FIEH(Flow Instruction Extension Header,流指令擴展報文頭):FIEH能夠通過E字段定義端到端或逐跳的統計模式,通過F字段控制對業務流進行單向或雙向檢測。此外,FIEH還可以支持逐包檢測、亂序檢測等擴展功能。

圖3-3 交替染色報文頭的結構
其中,丟包率和時延是網絡質量的兩個重要指標。丟包率是指在轉發過程中丟失的數據包數量占所發送數據包數量的比率。設備通過丟包統計功能可以統計某個測量周期內進入網絡與離開網絡的報文數量的差值,從而計算出丟包數或者丟包率。時延則是指數據包從網絡的一端傳送到另一端所需要的時間。設備通過時延統計功能可以對業務報文進行抽樣,記錄業務報文在網絡中的實際轉發時間,從而計算出指定的業務流在網絡中的傳輸時延。
IFIT的丟包統計和時延統計功能通過對業務報文的交替染色來實現。所謂染色,就是對報文進行特征標記。IFIT通過將丟包染色位L和時延染色位D置0或置1來實現對特征字段的標記。如圖3-4所示,業務報文從PE1進入網絡,報文數記為Pi;從PE2離開網絡,報文數記為Pe。通過IFIT可以對該網絡進行丟包統計和時延統計。
這里以染色位L置1的一個統計周期(T2)為例,對從PE1到PE2方向的IFIT丟包統計過程描述如下。
① t0時刻:PE1對入方向業務報文的染色位L置1,計數器開始計算本統計周期內接收到的染色位L置1的業務報文數。
② t1時刻:經過網絡轉發和網絡時延,在網絡中設備時鐘同步的基礎上,當PE2出接口接收到本統計周期內第一個帶有Flow ID的業務報文并觸發生成統計實例后,計數器開始計算本統計周期內接收到的染色位L置1的業務報文數。
③ t2/t3時刻:為了避免網絡延遲和報文亂序導致統計結果不準,在本統計周期的x(范圍是1/3~2/3)時間處,PE1/PE2讀取上個統計周期 + 截至目前本統計周期內染色位L置0的報文計數,然后將計數器中的該計數清空,同時將統計結果上報給控制器。
④ t4/t5時刻:PE1入方向處及PE2出方向處對本統計周期內染色位L置1的業務報文計數結束。
⑤ t6/t7時刻:PE1/PE2上計數器統計的染色位L置1的報文數分別為Pi和Pe(計數原則與t2/t3時刻相同)。

圖3-4 基于交替染色法的IFIT檢測指標
據此可以計算出:丟包數=Pi-Pe;丟包率=(Pi-Pe)/Pi。
PE1和PE2間的IFIT時延統計過程描述如下。
① t1時刻:PE1對入方向業務報文的染色位D置1,計數器記錄報文發送時間戳t1。
② t2時刻:經過網絡轉發及延遲后,PE2出方向接收到本統計周期內第一個染色位D置1的業務報文,計數器記錄報文接收時間戳t2。
③ t3時刻:PE2對入方向業務報文的染色位D置1,計數器記錄報文發送時間戳t3。
④ t4時刻:經過網絡轉發及延遲后,PE1出方向接收到本統計周期內第一個染色位D置1的回程報文,計數器記錄報文接收時間戳t4。
據此可以計算出:PE1至PE2的單向時延=t2-t1,同理,PE2至PE1的單向時延 = t4-t3,雙向時延=(t2-t1)+(t4-t3)。
通過對真實業務報文的直接染色,輔以部署1588v2時鐘等同步協議,IFIT可以主動感知網絡的細微變化,真實反映網絡的丟包和時延情況。
現有檢測方法中常見的數據統計模式一般分為E2E(End to End,端到端)和Trace(逐跳)兩種。E2E統計模式適用于需要對業務進行端到端整體質量監控的檢測場景,逐跳統計模式則適用于需要對低質量業務進行逐跳定界或對VIP(Very Important Person,重要客戶)業務進行按需逐跳監控的檢測場景。交替染色同時支持E2E和逐跳兩種統計模式。
E2E統計模式僅需在頭節點部署交替染色檢測點觸發檢測,在尾節點使能交替染色即可實現。在這種情況下,僅頭尾節點感知交替染色報文并通過Telemetry上報檢測數據,中間節點則做旁路處理,如圖3-5所示。

圖3-5 E2E統計模式
逐跳統計模式需要在頭節點部署交替染色檢測點觸發檢測,同時,在業務流途經的所有支持交替染色的節點上使能交替染色,如圖3-6所示。
在實際應用中,一般是“E2E + 逐跳”組合使用,當E2E的檢測結果達到閾值時,會自動觸發逐跳模式,在這種情況下,可以真實還原業務流轉發路徑,并對故障點進行快速定界和定位。
為了自動觸發交替染色檢測,控制器需要感知網絡中設備對交替染色的支持情況,可以通過擴展IGP/BGP通告網絡設備支持交替染色的能力,通過擴展BGP-LS協議將設備支持情況匯總并通告給控制器??刂破鞲鶕蠄蟮男畔⒋_定是否可以在指定路徑中使能交替染色。以上協議擴展的具體內容可參考IETF草案中的定義[32-35],此處不贅述。

圖3-6 逐跳統計模式
- Building E-commerce Sites with VirtueMart Cookbook
- 光網絡評估及案例分析
- Twilio Cookbook
- 5G承載網網絡規劃與組網設計
- Learning Karaf Cellar
- HTML5 Game development with ImpactJS
- 物聯網通信技術
- IPv6網絡切片:使能千行百業新體驗
- 2小時讀懂物聯網
- Bonita Open Solution 5.x Essentials
- 局域網組成實踐
- 深入理解Nginx:模塊開發與架構解析
- 圖神經網絡前沿
- 信息技術安全評估準則:源流、方法與實踐
- Python API Development Fundamentals