<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	
	xmlns:georss="http://www.georss.org/georss"
	xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"
	>

<channel>
	<title>ETL &#8211; 科技島-掌握科技新聞、科技職場最新資訊</title>
	<atom:link href="https://www.technice.com.tw/tag/etl/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.technice.com.tw</link>
	<description>專注於科技新聞、科技職場、科技知識相關資訊，包含生成式AI、人工智慧、Web 3.0、區塊鏈、科技職缺百科、生物科技、軟體發展、雲端技術等豐富內容，適合熱衷科技及從事科技專業人事第一手資訊的平台。</description>
	<lastBuildDate>Wed, 25 Mar 2026 01:00:40 +0000</lastBuildDate>
	<language>zh-TW</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.4.2</generator>

<image>
	<url>https://www.technice.com.tw/wp-content/uploads/2022/12/cropped-wordpress_512x512-150x150.png</url>
	<title>ETL &#8211; 科技島-掌握科技新聞、科技職場最新資訊</title>
	<link>https://www.technice.com.tw</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">223945996</site>	<item>
		<title>當 ETL 不再需要工程師：Databricks、Fabric、Snowflake 開戰，資料人的下一站在哪？｜專家論點【黃婉中】</title>
		<link>https://www.technice.com.tw/opinion/210510/</link>
					<comments>https://www.technice.com.tw/opinion/210510/#respond</comments>
		
		<dc:creator><![CDATA[林育如]]></dc:creator>
		<pubDate>Thu, 09 Apr 2026 01:00:48 +0000</pubDate>
				<category><![CDATA[專家論點]]></category>
		<category><![CDATA[ETL]]></category>
		<category><![CDATA[工程師]]></category>
		<category><![CDATA[黃婉中]]></category>
		<guid isPermaLink="false">https://www.technice.com.tw/?p=210510</guid>

					<description><![CDATA[<p><img width="669" height="386" src="https://www.technice.com.tw/wp-content/uploads/2026/03/h3.jpg" class="attachment-post-thumbnail size-post-thumbnail wp-post-image" alt="工程師的日常工作，有大半時間在解決一個問題：「怎麼把資料從 A 點搬到 B 點？」（圖／黃婉中提供）" decoding="async" srcset="https://www.technice.com.tw/wp-content/uploads/2026/03/h3.jpg 669w, https://www.technice.com.tw/wp-content/uploads/2026/03/h3-300x173.jpg 300w" sizes="(max-width: 669px) 100vw, 669px" title="當 ETL 不再需要工程師：Databricks、Fabric、Snowflake 開戰，資料人的下一站在哪？｜專家論點【黃婉中】 1"></p>
<p>分析雲端架構從複雜 ETL 轉向「垂直整合」的趨勢，消除資料搬運成本與延遲，使架構師價值從「規劃路徑」轉向「資料治理」。<content>作者：黃婉中（雲端架構師）</p>
<p><span style="font-weight: 400;">分析雲端架構從複雜 ETL 轉向「垂直整合」的趨勢，消除資料搬運成本與延遲，使架構師價值從「規劃路徑」轉向「資料治理」。</span></p>
<p>[caption id="attachment_210511" align="alignnone" width="872"]<img class=" wp-image-210511" src="https://www.technice.com.tw/wp-content/uploads/2026/03/h3-300x173.jpg" alt="工程師的日常工作，有大半時間在解決一個問題：「怎麼把資料從 A 點搬到 B 點？」（圖／黃婉中提供）" width="872" height="503" /> 工程師的日常工作，有大半時間在解決一個問題：「怎麼把資料從 A 點搬到 B 點？」（圖／黃婉中提供）[/caption]</p>
<p><span style="font-weight: 400;">身為雲端架構師，我觀察許多工程師的日常工作，有大半時間在解決一個問題：「怎麼把資料從 A 點搬到 B 點？」</span></p>
<p><span style="font-weight: 400;">在過去 10 年的大數據時代，我們的架構圖長得像迷宮。</span><b>業務系統（OLTP）</b><span style="font-weight: 400;">收到資料後，我們會寫一套 ETL 程序，把原始資料抽出來，洗乾淨後放進</span><b>數據湖（Data Lake）</b><span style="font-weight: 400;">。</span><span style="font-weight: 400;"><br />
</span><span style="font-weight: 400;">為了讓老闆看報表，我們再從湖裡撈出來，轉成特定格式，放進</span><b>資料倉儲（Data Warehouse, DW）</b><span style="font-weight: 400;">。</span></p>
<p><span style="font-weight: 400;">如果資料科學家要做 AI 模型，可能又要再搬一次。</span></p>
<p><span style="font-weight: 400;">這種架構，養活了許多工具供應商，但代價是：</span></p>
<ul>
<li style="font-weight: 400;" aria-level="1"><b>資料延遲</b><span style="font-weight: 400;">：報表是昨天的</span></li>
<li style="font-weight: 400;" aria-level="1"><b>成本昂貴</b><span style="font-weight: 400;">：同一份資料存了 3 次、算了 3 次</span></li>
<li style="font-weight: 400;" aria-level="1"><b>維護複雜</b><span style="font-weight: 400;">：只要一個關卡斷了，流程就癱瘓</span></li>
</ul>
<p><span style="font-weight: 400;">但我最近觀察到，這個情況正在改變。資料領域的供應商們不再各自為政，而是開始「垂直整合」。</span></p>
<h2><b>3 大巨頭的「越界」戰爭</b></h2>
<p><span style="font-weight: 400;">如果你也在觀察最近的趨勢，會發現資料界的領頭羊們，功能做得越來越重疊，邊界也越來越模糊。</span></p>
<h3><span style="font-weight: 400;">1. Snowflake：從資料倉庫轉型 AI 平台</span></h3>
<p><a href="https://www.snowflake.com/en/"><span style="font-weight: 400;">Snowflake</span></a><span style="font-weight: 400;"> 曾是「雲端資料倉儲」的代名詞，當年靠著運算與儲存分離的架構一戰成名，讓擴展這件事變得輕而易舉。</span></p>
<p><span style="font-weight: 400;">不過 Snowflake 顯然不滿足於只當個存放資料的倉庫。</span></p>
<p><span style="font-weight: 400;">最近，他們往 AI 領域進攻的腳步很快（像是 </span><a href="https://www.snowflake.com/en/product/features/cortex/"><span style="font-weight: 400;">Cortex AI</span></a><span style="font-weight: 400;"> 服務）。邏輯很直覺：「資料在哪，AI 就在哪。」 與其讓客戶費工夫把資料搬出去訓練模型，不如直接在資料倉儲裡內建 AI 能力。</span></p>
<p><span style="font-weight: 400;">觀察這陣子的佈局，Snowflake 已經跳脫單純查詢引擎的框架，轉向打造一個完整的 AI 資料平台。</span></p>
<h3><span style="font-weight: 400;">2. Databricks：從 ML 專家跨足資料庫</span></h3>
<p><a href="https://www.databricks.com/"><span style="font-weight: 400;">Databricks</span></a><span style="font-weight: 400;"> 的路徑剛好相反。這家以 </span><a href="https://spark.apache.org/"><span style="font-weight: 400;">Apache Spark</span></a><span style="font-weight: 400;"> 起家、專精大數據與機器學習（ML）巨頭，核心概念是「</span><a href="https://www.databricks.com/blog/2020/01/30/what-is-a-data-lakehouse.html"><span style="font-weight: 400;">Lakehouse</span></a><span style="font-weight: 400;">」，想把資料湖變得跟倉儲一樣好用。</span></p>
<p><span style="font-weight: 400;">最近，他們做得更徹底：發表 </span><a href="https://www.databricks.com/product/lakebase?scid=7018Y000001f8FIQAY&amp;utm_medium=paid+search&amp;utm_source=google&amp;utm_campaign=23582845343&amp;utm_adgroup=192169963103&amp;utm_content=product+page&amp;utm_offer=lakebase&amp;utm_ad=797830309816&amp;utm_term=lakebase&amp;gad_source=1&amp;gad_campaignid=23582845343&amp;gbraid=0AAAAABYBeAje_6reWitsulQVWuRgVRldN&amp;gclid=Cj0KCQjw9-PNBhDfARIsABHN6-0TgvyQ9B4x5vMEl93Kg_tHaOPG6mVo_xHYGNU1AO8ii-azc70B8TYaAnlUEALw_wcB"><span style="font-weight: 400;">Lakebase</span></a><span style="font-weight: 400;">，正式跨足 OLTP（交易型資料庫）。</span></p>
<p><span style="font-weight: 400;">以前他們是等資料搬過來再處理，現在提供一個基於 PostgreSQL 的資料庫，讓你的業務系統直接長在上面。</span></p>
<p><span style="font-weight: 400;">邏輯很簡單，既然資料最終都要進湖，做分析或跑模型，那為什麼不一開始就讓它「生」在我的平台裡？</span></p>
<p><span style="font-weight: 400;">這個舉動顯示 Databricks 正逆流而上。不只當後端的分析工具，也想成為底層資料庫。</span></p>
<h3><span style="font-weight: 400;">3. Azure Fabric：讓搬運隱形的 Mirroring 技術</span></h3>
<p><span style="font-weight: 400;">至於我最熟悉的 Azure，則推出了 </span><a href="https://learn.microsoft.com/en-us/fabric/fundamentals/microsoft-fabric-overview"><span style="font-weight: 400;">Fabric</span></a><span style="font-weight: 400;">。核心是 </span><a href="https://learn.microsoft.com/en-us/fabric/onelake/onelake-overview"><span style="font-weight: 400;">OneLake</span></a><span style="font-weight: 400;">（概念就像資料界的 </span><a href="https://onedrive.live.com/login"><span style="font-weight: 400;">OneDrive</span></a><span style="font-weight: 400;">）。</span></p>
<p><span style="font-weight: 400;">Fabric 強調 End-to-End 的流程整合，不僅包含資料庫與倉儲，連 AI、Spark 與報表工具都整合在一起， 也消除了 OLTP（交易處理）與 OLAP（分析處理） 之間的界線。</span></p>
<p><span style="font-weight: 400;">過去我們得手動開通多個服務，串接資料流。現在 Fabric 透過 </span><a href="https://learn.microsoft.com/en-us/fabric/mirroring/overview"><span style="font-weight: 400;">Mirroring</span></a><span style="font-weight: 400;"> 技術，讓業務資料庫的變動，能即時同步到分析層，達成「湖倉一體」。</span></p>
<p><span style="font-weight: 400;">大家好奇，為什麼不需要進去查資料表也能同步？祕訣在於它讀取的是資料庫的「</span><b>異動日誌</b><span style="font-weight: 400;">」。</span></p>
<p><span style="font-weight: 400;">想像資料庫是一間繁忙的餐廳廚房。資料表（OLTP）就像是「冰箱裡的庫存」，你要盤點剩幾顆蛋，得開門進去數，這會擋住廚師的路（影響效能）。</span></p>
<p><span style="font-weight: 400;">而異動日誌則像是冰箱旁的庫存單，每進出一次，庫存單就記錄：「拿走 2 顆蛋」。</span></p>
<p><span style="font-weight: 400;">Mirroring 技術就是直接檢查那份庫存單，譬如看到廚房拿走 2 顆蛋，就同步在分析室（OLAP）的帳本上更新。</span></p>
<p><span style="font-weight: 400;">因為看的是「庫存單」而不是「冰箱」，所以不會撞到廚師，讓交易與分析能在同一個生態系中完成。</span></p>
<h3><span style="font-weight: 400;">為什麼這對你很重要？</span></h3>
<p><span style="font-weight: 400;">總結一下我們的觀察：</span></p>
<ul>
<li style="font-weight: 400;" aria-level="1"><span style="font-weight: 400;">Snowflake：由上而下（從倉儲往 AI 走）</span></li>
<li style="font-weight: 400;" aria-level="1"><span style="font-weight: 400;">Databricks：由下而上（從機器學習往資料庫走）</span></li>
<li style="font-weight: 400;" aria-level="1"><span style="font-weight: 400;">Azure Fabric：橫向掃蕩（用一個生態系把所有東西包起來）</span></li>
</ul>
<p><span style="font-weight: 400;">不論是 Snowflake、Databricks 還是 Azure，雖然切入點不同，但目標都是：</span><b>縮短資料從產生到發揮價值的距離</b><span style="font-weight: 400;">。</span></p>
<p><span style="font-weight: 400;">對於企業來說，搬運與格式轉換的苦功正逐漸消失，而我們也能把更多精力放在挖掘商業洞見上。</span></p>
<p><span style="font-weight: 400;">當供應商完成垂直整合，對 IT 實務會帶來 3 個轉變：</span></p>
<h2><b>1. 「資料治理」越來越重要</b></h2>
<p><span style="font-weight: 400;">過去，工程師投入大量時間在處理資料搬運與格式轉換。隨著供應商將交易、分析與 AI 整合在同一平台，這些重複性的工作量將大幅減少。</span></p>
<p><span style="font-weight: 400;">架構師的價值，將從「規劃資料路徑」轉向「制定管理規則」。我們會花更多心思在資料的安全控管、確認資料正不正確，以及如何讓業務部門能自己撈資料、解決自己的問題。</span></p>
<h2><b>2. 成本結構更單純</b></h2>
<p><span style="font-weight: 400;">以前資料在不同服務間搬運，就像出國換匯，每換一次就被抽一次手續費（運算費）和匯差（存儲空間）。</span></p>
<p><span style="font-weight: 400;">現在一體化平台推動「一份資料、多種用途」。平台走向一體化，資料能做到只儲存一份，卻能同時被 SQL、Spark 或 AI 讀取。大幅減少了格式轉換產生的運算損耗，帳單更好懂了。</span></p>
<p><span style="font-weight: 400;">對企業管理層而言，也代表預算分配與資源利用率變得更清晰。</span></p>
<h2><b>3. 加速決策</b></h2>
<p><span style="font-weight: 400;">這是我最有感的轉變。</span></p>
<p><span style="font-weight: 400;">以前主管問現在的狀況，我們可能要回答「等明天的報表出來再說」。但在現在這種架構下，資料一進來就能直接分析。</span></p>
<p><span style="font-weight: 400;">當一筆交易產生的同時，AI 就能同步偵測異常或給出建議。讓技術支援與業務目標保持一致。</span></p>
<h2><b>凡事總有不好</b></h2>
<p><span style="font-weight: 400;">雖然整合很方便，但身為架構師，還是要提醒：凡事總有好不好。</span></p>
<p><span style="font-weight: 400;">選擇高度整合的平台，也代表「供應商鎖定」。哪天想換掉其中一個服務，成本會變高。</span></p>
<p><span style="font-weight: 400;">另外，整合平台並不代表能省去架構設計。相反地，因為操作門檻降低，資料量增長的速度會比以往更快。</span></p>
<p><span style="font-weight: 400;">當搬運變簡單了，垃圾資料（Garbage in, Garbage out）產生的速度也會變快。如果缺乏良好的資料治理，原本期待的一體化平台，可能在短時間內就堆積出大量資料，增加維護成本。</span></p>
<h2><b>小結</b></h2>
<p><span style="font-weight: 400;">觀察這些改變，可以幫助我們理解趨勢。這些整合是為了提高資料流動性，讓技術能跟上業務的速度。</span></p>
<p><span style="font-weight: 400;">如果你負責決策，現在是重新檢視「資料孤島」的好時機。</span></p>
<p><span style="font-weight: 400;">如果你是開發者，請不要只學工具操作，要理解背後的架構邏輯。</span></p>
<p><span style="font-weight: 400;">當你發現原本要寫好幾天的資料整合，現在能很快完成時，這代表技術替你省下了體力活。這多出來的時間，正好讓我們回歸本質，去思考更有價值的核心問題。</span></p>
<p>[caption id="attachment_210507" align="alignnone" width="845"]<img class=" wp-image-210507" src="https://www.technice.com.tw/wp-content/uploads/2026/03/222-300x109.jpg" alt="專家論點【黃婉中】" width="845" height="307" /> 專家論點【黃婉中】[/caption]</content></p>
<p>這篇文章 <a rel="nofollow" href="https://www.technice.com.tw/opinion/210510/">當 ETL 不再需要工程師：Databricks、Fabric、Snowflake 開戰，資料人的下一站在哪？｜專家論點【黃婉中】</a> 最早出現於 <a rel="nofollow" href="https://www.technice.com.tw">科技島-掌握科技新聞、科技職場最新資訊</a>。</p>
]]></description>
		
					<wfw:commentRss>https://www.technice.com.tw/opinion/210510/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">210510</post-id>	</item>
	</channel>
</rss>
