Work

banking-system

System Architecture

Banking

Microservices

Cloud Native

High Availability

2025年12月14日

深入剖析支撐全球金融業的企業級平台 TCS BaNCS 的底層技術架構。從微服務、雲原生設計到高頻交易處理引擎，全面解析其設計哲學與關鍵組件。

TCS BaNCS 深度技術架構解析

本文將從最底層的技術架構開始，深入剖析這個支撐全球金融業的企業級平台。TCS BaNCS 不僅是一個銀行系統，更是一個集成了現代化技術堆疊的複雜生態系統。

一、核心架構設計哲學

1. 微服務與事件驅動架構 (Event-Driven Microservices)

TCS BaNCS 採用高度解耦的微服務架構，將每個業務功能（如支付處理、帳戶管理、風險計算）拆分為獨立的服務單元。這種設計確保了系統的靈活性與可維護性。

關鍵技術點：

1. 事件溯源 (Event Sourcing): 不只是記錄現在，而是記錄歷史
- 核心概念：傳統資料庫只儲存「現在的餘額是 100 元」。Event Sourcing 儲存的是「開戶存 50 -> 領出 20 -> 轉入 70」，現在的餘額是通過重播這些事件算出來的。
- 深度解析：
  - The Log is the Database (日誌即本體)：
    - 觀念翻轉：在傳統資料模型中，資料庫裡的 Table（如 User 表內的餘額）被視為本體，Log（如交易紀錄）往往只是附屬品。
    - Event Sourcing 的視角：Log（發生過的事件序列）才是資料的本體與真理 (Source of Truth)。Table 裡的數據（如「餘額 100 元」）只不過是這些 Log 播放到最後一秒的暫存視圖 (View)，這就是一種以「行為」而非「狀態」為核心的資料模型。
    - 為什麼這很重要：這代表我們可以隨時刪除那個 Table，只要重跑一遍 Log，狀態就能完美重生。這給了架構極大的容錯性與演進空間。
  - Immutability (不可變性)：事件一旦發生就寫入歷史，絕對不能修改。如果發生錯誤（例如轉錯帳），不能回頭改舊資料，必須新增一筆「紅字沖銷」的修正事件。這與會計帳本的原則完全一致。
  - Snapshot (快照)：為了避免每次查詢餘額都要從開戶那天開始重算，系統會定期建立「快照」（例如：昨晚的日終結餘），查詢時只需從快照開始疊加後續事件。
- 金融業的殺手級應用：
  - 完美的審計 (Audit)：誰、什麼時候、為了什麼原因改變了帳戶狀態，所有軌跡一清二楚，無法抵賴。
  - 時光旅行 (Time Travel)：系統可以隨意重建並檢視「上個月 13 號下午 2 點 05 分」當下的完整狀態，這對於除錯、詐欺調查及法規監管至關重要。
2. CQRS 模式 (Command Query Responsibility Segregation): 讀寫分離的極致
- 深度解析：什麼是「資料模型 (Data Model)」？
  - 定義：資料模型是資料在資料庫中的結構 (Structure) 與 關係 (Relationship)。它決定了我們如何存取數據。
  - 傳統 CRUD 的痛點 (單一模型)：
    - 寫入時 (Write)：為了確保資料不冗餘且一致，我們傾向使用高度正規化 (Normalized) 的關聯式表格（如：訂單表、商品表、客戶表分開存）。
    - 讀取時 (Read)：為了顯示資訊（如：訂單詳情頁），我們需要將上述多張表 Join 起來，這非常消耗效能。
    - 衝突：傳統架構強迫「寫入」和「讀取」共用同一套表格結構。為了讀取方便，我們可能會加冗餘欄位，但這讓寫入邏輯變複雜（要同步改多個地方）；為了寫入單純，我們拆解表格，但這讓讀取變慢。這就是「單一資料模型」的物理極限。
- CQRS 的革命：雙模型策略 (完全不同的兩個世界)
- 實作核心：怎麼做？ (從原子到視圖的旅程) * 1. Command Model (寫入端) - 守護商業規則 * 核心目標：不考慮怎麼查詢，只考慮這一筆操作是否合法。 * 技術實作 (Aggregate Root)： * 我們不直接操作 Table，而是操作 Aggregate (聚合)。例如「訂單 (Order)」是一個聚合，它包含「訂單詳情 (OrderItems)」和「付款資訊」。 * 商業不變性 (Invariants)：在寫入前，必須檢查所有規則。例如：「訂單總金額必須等於所有商品單價總和」、「庫存必須 > 0」。 * 結果：檢核通過後，不直接修改欄位，而是生成一個 Event (事件)，如 OrderCreated 或 ItemAdded，並存入 Event Store。 * 2. Projector (投影機) - 幕後的轉譯者 * 角色：這是一個背景程式，負責監聽 Event Store 發出的新事件。 * 工作：它像一個翻譯官，拿到 ItemAdded 事件後，把它轉換成適合讀取端看懂的格式，然後寫入讀取資料庫。 * 3. Query Model (讀取端) - 為 UI 量身打造 * 核心目標：不考慮正規化，只考慮前端畫面要什麼，我就存什麼。 * 技術實作 (Materialized Views)： * 針對性優化：我們可以為同一個資料建立多個不同的 View。 * 列表頁 View：只存 id, title, status，放在 Redis 裡，讀取速度極快。 * 詳情頁 View：包含 customer_info, shipping_history 等大包 JSON，放在 MongoDB 裡，一次取出不用 Join。 * 搜尋頁 View：將關鍵字索引放入 ElasticSearch。 * 結果：前端發 API 請求時，後端不再做任何計算或 Join，直接 SELECT * FROM View WHERE id = ?，效能是飛躍性的提升。
  - 這就是「讀寫分離」嗎？ (CQRS vs Master-Slave)
    - 傳統讀寫分離 (Master-Slave)：是物理上的分離，邏輯上還是同一個模型。主庫 (Master) 和從庫 (Slave) 原封不動地複製同一套 Table 結構。Slave 只是 Master 的影子，雖分擔了流量，但沒有解決複雜查詢的 Join 問題。
    - CQRS (讀寫責任分離)：是邏輯上的徹底分離。讀取端的資料庫結構可以長得完全不像寫入端。寫入端用 SQL 算錢確保精準，讀取端用 ElasticSearch 讓使用者搜尋商品確保快速。這才是「讀寫分離」的終極型態。
- 代價 (Trade-off)：
  - 複雜度爆炸：你現在要維護兩個資料庫，還要處理由消息隊列 (Message Queue) 連接的同步機制。
  - 最終一致性：使用者改了資料，可能要過幾百毫秒才能在查詢頁面看到，前後端都需要適應這種非同步特性。
3. Saga 模式: 沒有「上帝」的分散式交易
- 核心概念：在單體架構 (Monolith) 中，資料庫交易 (Transaction) 就像上帝，可以保證 ACID（原子性），說有就有，說沒就沒。但在微服務架構下，服務分家了，沒有上帝，只有協議。
- 深度解析：
  - 為什麼 2PC (兩階段提交) 已死：傳統的 2PC 會同時鎖住所有參與服務的資料庫，只要一個服務網路卡頓，整個系統就會卡死。在大規模高均發系統中，這是效能殺手。
  - Saga 的運作 (Long Running Process)：將一個跨服務的大交易，拆解成一串連鎖的「本地小交易」。
    - 例如：訂房網站預定行程：T1(扣款) -> T2(訂機票) -> T3(訂飯店)
  - 補償交易 (Compensating Transaction)：這是 Saga 的精髓。如果 T2 成功但 T3 失敗了怎麼辦？系統不能只報錯，必須回頭執行 C2 (退機票) 和 C1 (退款) 來抵銷之前的操作。
- 兩大流派：
  - 編排式 (Orchestration)：有一個中心化的「指揮官」服務（如 Camunda），像交響樂指揮一樣，明確告訴每個服務「A 做完換 B，B 失敗了 A 要退款」。適合複雜的業務流程。
  - 協調式 (Choreography)：像舞團表演，沒有指揮。A 服務做完發一個廣播「我扣款了」，B 服務訂閱到這個廣播就自動開始訂票。適合流程較簡單、服務間解耦要求高的場景。

2. 多租戶雲原生架構 (Multi-Tenant Cloud-Native)

為了支撐全球 450+ 部署實例，架構必須具備極致的彈性與隔離性。

命名空間隔離與資源配額
- 利用 Kubernetes 的 Namespace 實現邏輯隔離。
- 為每個金融機構設定獨立的計算 (CPU/Mem) 和儲存配額 (Quota)，防止鄰居干擾 (Noisy Neighbor)。
資料庫分片策略 (Database Sharding)
- 面對 10 億帳戶級別的海量資料，單一資料庫無法負荷。
- 水平分片 (Horizontal Sharding)：依據客戶 ID、地理位置等維度將資料分散至不同節點。
- 垂直分片 (Vertical Sharding)：依據業務領域（如存款、貸款、投資）將資料拆分至獨立的資料庫叢集。
讀寫分離與快取層
- 採用主從複製 (Master-Slave) 架構分散讀取壓力。
- 引入 Redis/Hazelcast 等分散式快取，緩解資料庫熱點存取。

3. 高可用與災難恢復 (HA/DR)

對於金融級系統，穩定性是不可妥協的核心要求。

多活資料中心 (Active-Active)：不只是傳統的主備切換，而是多個資料中心同時承載流量，最大化資源利用率。
** CDC 資料同步**：使用變更資料擷取 (Change Data Capture) 技術，實時捕捉資料庫變更並同步，將延遲控制在毫秒級。
自動故障轉移：基於實時健康檢查的自動路由切換，確保 RTO (恢復時間目標) < 1分鐘。

二、關鍵技術組件深度解析

1. 核心銀行系統 (Core Banking)

處理 10 億帳戶的技術挑戰在於極致的 I/O 吞吐與並發控制。

高性能交易處理引擎
- 記憶體內計算 (In-Memory Computing)：利用 Apache Ignite 或 Hazelcast 等 IMDG 技術，讓熱點資料常駐記憶體，消除磁碟 I/O 瓶頸。
- 批次與即時混合處理：
  - 日終批次：使用 MapReduce/Spark 進行利息計算、報表生成等大規模吞吐任務。
  - 即時交易：使用 Kafka Streams/Flink 等流處理引擎，毫秒級處理即時支付與餘額更新。
並發控制 (Concurrency Control)
- 樂觀鎖 (Optimistic Locking)：使用版本號 (Versioning) 或時間戳，假設衝突很少發生，從而避免昂貴的資料庫鎖。
- 分散式鎖：對於必須序列化的操作，基於 Zookeeper/etcd 實現跨節點的協調鎖。

2. 清算結算系統 (Clearing & Settlement)

服務全球 25+ 市場，核心在於多標準適配與算法效率。

多協議適配層
- 原生支援 SWIFT, ISO 20022, FIX 等金融標準。
- 訊息轉換引擎：內嵌 Drools 等規則引擎，實現不同格式訊息間的無縫轉換與驗證。
配對與軋差演算法
- 高效能配對：使用紅黑樹、B+樹等高效資料結構，實現 O(log n) 時間複雜度的訂單配對。
- 多邊淨額結算 (Multilateral Netting)：運用圖論演算法優化結算路徑，最小化資金流動需求。
交易完整性
- 分散式交易協調器：確保跨銀行、跨市場交易的原子性 (Atomicity)。
- 冪等性設計 (Idempotency)：確保即使網絡抖動導致訊息重發，系統也不會重複處理交易。

3. 託管系統 (Custody)

被全球前 10 大託管行中的 8 家採用，顯示其處理複雜資產的能力。

複雜資產處理
- 多資產定價引擎：支援股票、債券、衍生品、另類投資等數百種結構各異的資產。
- 企業行為自動化 (Corporate Actions)：集成 Camunda 等工作流引擎，自動化處理股利發放、拆股、併購等複雜生命週期事件。
監管科技 (RegTech)
- 合規規則引擎：可配置化設計，快速適應 MiFID II, Dodd-Frank 等不同司法管轄區的法規變更。
- 大數據分析：利用 Hadoop/Spark 進行反洗錢 (AML) 與交易監控。

三、橫切關注點 (Cross-Cutting Concerns)

1. API 管理與整合層

API Gateway：負責速率限制 (Rate Limiting)、認證授權 (OAuth 2.0/JWT) 與協議轉換。
GraphQL 支援：允許前端精確查詢所需欄位，解決 REST API 常見的 Over-fetching 問題。
ESB/Integration Fabric：作為連接遺留系統 (Legacy Systems) 與現代化微服務的橋樑，支援同步 (REST/SOAP) 與非同步 (MQ/Kafka) 通訊。

2. 安全架構

零信任模型 (Zero Trust)：
- mTLS：服務間通訊全面採用雙向 TLS 加密驗證。
- 細粒度權限：結合 RBAC (角色) 與 ABAC (屬性) 進行動態權限控制。
資料保護：
- 欄位級加密：敏感資訊 (PII) 使用 AES-256 加密，並配合 HSM 硬體安全模組管理金鑰。
- 代幣化 (Tokenization)：在非核心流程中使用 Token 替換真實敏感資料，降低洩露風險。

3. AI/ML 整合

智能化能力：
- 即時詐欺偵測：部署隨機森林、神經網路模型，實時評分每一筆交易。
- 客戶行為預測：推薦引擎分析消費模式，提供個性化理財建議。
MLOps 流程：建立從模型訓練 (Kubeflow) 到線上服務 (TensorFlow Serving) 的完整自動化管道，並包含 A/B 測試與模型監測機制。

四、可觀測性與 DevOps

1. 監控三大支柱

Metrics：使用 Prometheus 收集系統吞吐量、延遲等黃金指標。
Logging：ELK/EFK 堆疊實現日誌的集中收集與檢索。
Tracing：引入 Jaeger/Zipkin 進行分散式追蹤，可視化請求在微服務間的完整調用鏈路。

2. 持續交付

部署策略：全面採用藍綠部署 (Blue-Green) 或金絲雀發布 (Canary)，確保上線零停機。
測試金字塔：嚴格執行單元測試 -> 整合測試 -> 端到端測試的自動化流程。
混沌工程 (Chaos Engineering)：主動在生產環境注入故障（如延遲、斷網），驗證系統的自我修復能力。

五、未來展望與技術創新

TCS BaNCS 持續演進，探索前沿技術的應用：

超低延遲架構：引入 RDMA (遠程直接記憶體存取) 技術，讓數據傳輸繞過 CPU，實現微秒級的極致延遲。
量子抗性加密：未雨綢繆，研發抗量子密碼算法 (Post-Quantum Cryptography)，防禦未來的算力威脅。
區塊鏈整合：深度集成 DLT 技術，優化跨境支付與貿易融資流程。
邊緣計算：將部分計算邏輯推送到分支機構或 ATM 端點，降低中心化負載並提升響應速度。