Skip to content

データパイプライン

データが最初に着地する場所から、アナリストやモデルが触れる 場所へと動かすこと。

定番の ETL

ありうる中で最もシンプルなパイプラインを、最もシンプルな形で。 直列、ノードサイズ均一、テーマカラー 1 つ — 意図的にフラットに することで、続く例が発展形として読めます。

コンシューマを伴うストリーミング

Kafka 流のイベントログから 3 つのコンシューマへファンアウト します。ログノードは sizeScale で視覚的な重みを持ち、紫テーマが 「ストリーム領域」を示唆します。

ラムダアーキテクチャ(速度 + バッチ)

同じイベントに対する 2 レーンです。リージョンでリアルタイム帯と スケジュール帯を視覚的に分け、注釈でレイテンシを記します。

CDC → レイク → カタログ

変更データキャプチャをレイクへ流し、カタログから発見可能に します。バッジで各 CDC フィードの「健全性」を示します。

このページを編集Last updated: