<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>數據產品 &#8211; 科技島-掌握科技新聞、科技職場最新資訊</title>
	<atom:link href="https://www.technice.com.tw/tag/%e6%95%b8%e6%93%9a%e7%94%a2%e5%93%81/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.technice.com.tw</link>
	<description>專注於科技新聞、科技職場、科技知識相關資訊，包含生成式AI、人工智慧、Web 3.0、區塊鏈、科技職缺百科、生物科技、軟體發展、雲端技術等豐富內容，適合熱衷科技及從事科技專業人事第一手資訊的平台。</description>
	<lastBuildDate>Thu, 15 Feb 2024 09:09:26 +0000</lastBuildDate>
	<language>zh-TW</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.4.2</generator>

<image>
	<url>https://www.technice.com.tw/wp-content/uploads/2022/12/cropped-wordpress_512x512-150x150.png</url>
	<title>數據產品 &#8211; 科技島-掌握科技新聞、科技職場最新資訊</title>
	<link>https://www.technice.com.tw</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>有了模型然後呢？從資料模型到數據產品，你還需要具備這一思考｜專家論點【維元】</title>
		<link>https://www.technice.com.tw/opinion/24826/</link>
					<comments>https://www.technice.com.tw/opinion/24826/#respond</comments>
		
		<dc:creator><![CDATA[維元]]></dc:creator>
		<pubDate>Fri, 28 Oct 2022 08:10:00 +0000</pubDate>
				<category><![CDATA[專家論點]]></category>
		<category><![CDATA[雲端]]></category>
		<category><![CDATA[數據產品]]></category>
		<category><![CDATA[科技業]]></category>
		<category><![CDATA[維元]]></category>
		<category><![CDATA[資料模型]]></category>
		<category><![CDATA[資料科學]]></category>
		<guid isPermaLink="false">https://www.technice.com.tw/?p=24826</guid>

					<description><![CDATA[<p><img width="1200" height="627" src="https://www.technice.com.tw/wp-content/uploads/2022/10/image-4-5.png" class="attachment-post-thumbnail size-post-thumbnail wp-post-image" alt="image 4 5" decoding="async" srcset="https://www.technice.com.tw/wp-content/uploads/2022/10/image-4-5.png 1200w, https://www.technice.com.tw/wp-content/uploads/2022/10/image-4-5-300x157.png 300w, https://www.technice.com.tw/wp-content/uploads/2022/10/image-4-5-1024x535.png 1024w, https://www.technice.com.tw/wp-content/uploads/2022/10/image-4-5-768x401.png 768w" sizes="(max-width: 1200px) 100vw, 1200px" title="有了模型然後呢？從資料模型到數據產品，你還需要具備這一思考｜專家論點【維元】 1"></p>
<p>資料科學是一種從資料到決策過程的方法，探討用模型去解讀不同的資料與其意涵。在管理學院中有一門知識管理的課程，將利用原始資料產生知識的過程分成四個階段。<content><!-- wp:image {"id":24833,"sizeSlug":"large","linkDestination":"none"} --></p>
<figure class="wp-block-image size-large"><img src="https://www.technice.com.tw/wp-content/uploads/2022/10/image-4-5-1024x535.png" alt="" class="wp-image-24833"/><figcaption>圖片來源：freepik</figcaption></figure>
<p><!-- /wp:image --></p>
<p><!-- wp:heading --></p>
<h2 id="從知識管理到資料科學">從知識管理到資料科學</h2>
<p><!-- /wp:heading --></p>
<p><!-- wp:paragraph --></p>
<p>資料科學是一種從資料到決策過程的方法，探討用模型去解讀不同的資料與其意涵。在管理學院中有一門知識管理的課程，將利用原始資料產生知識的過程分成四個階段。根據<a href="https://zh.wikipedia.org/zh-tw/%E7%9F%A5%E8%AF%86%E7%AE%A1%E7%90%86" target="_blank" rel="noreferrer noopener">維基百科</a>的定義，知識管理（Knowledge Management，KM）包括一系列的定義、創建、傳播、採用新的知識和經驗的戰略和實踐，可以用於個人知識或組織中商業流程的實踐。知識管理的目標是幫助人類如何系統性地累積經驗、管理知識，成為一個更有智慧的人類，這其中「經驗」扮演重要的齒輪。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:paragraph --></p>
<p>從知識管理到資料科學，知識或決策的產生方式正在改變。如果可以利用機器的優勢來轉換知識，降低對經驗的依賴，那人們就得以更加專注於「決策」。換句話說，資料科學是一種利用數據幫助人進行決策的方法。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:heading --></p>
<h2><a href="https://i.imgur.com/xVdKQov.png"></a>數位化與人工智慧</h2>
<p><!-- /wp:heading --></p>
<p><!-- wp:quote --></p>
<blockquote class="wp-block-quote">
<p>「從資料開始，透過一連串的過程發現隱藏在資料中的規則，利用這些規則完成一些有趣的應用。」。</p>
</blockquote>
<p><!-- /wp:quote --></p>
<p><!-- wp:paragraph --></p>
<p>資料科學的的目的是從資料中找關係，具體來說可以分成幾個階段：「取得資料」→「資料前處理」→「資料轉換」→「資料分析」→「資料解釋」→『發現知識」的六個階段 。 就像以下這張圖來自 Fayyad 在 The KDD Process for Extracting Useful Knowledge from Volumes of Data 所提到的資料科學的處理流程。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:paragraph --></p>
<p>不過這個過程並看似單一的線性流程，不過實際上並非從左邊一步一步做到右邊就可以打完收工。這個過程其實是需要重複不斷的嘗試，一層一層探索，最終才得以找到真正具有價值的知識。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:image {"align":"center","sizeSlug":"large"} --></p>
<figure class="wp-block-image aligncenter size-large"><img src="https://d3i71xaburhd42.cloudfront.net/6d962e9f04c653f732da82073a3446f75a371055/3-Figure1-1.png" alt=""/><figcaption>The KDD Process for Extracting Useful Knowledge from Volumes of Data</figcaption></figure>
<p><!-- /wp:image --></p>
<p><!-- wp:paragraph --></p>
<p>KDD（Knowledge Discovery in Database）是資料庫領域在資料探勘（Data Mining）前慣用的一種名稱（也有人說 Data mining 是 KDD 的一個環節），資料探勘領域中的知名的會議就叫做&nbsp;<a href="https://www.kdd.org/" target="_blank" rel="noreferrer noopener">SIGKDD</a>。這邊用「Knowledge」這個字其實就是呼應知識管理中的「Knowledge」。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:heading --></p>
<h2 id="從資料模型到數據產品"><a href="https://blog.v123582.tw/2021/04/30/%E6%9C%89%E4%BA%86%E6%A8%A1%E5%9E%8B%E7%84%B6%E5%BE%8C%E5%91%A2%EF%BC%9F%E5%BE%9E%E5%88%86%E6%9E%90%E6%A8%A1%E5%9E%8B%E5%88%B0%E6%95%B8%E6%93%9A%E7%94%A2%E5%93%81/#%E5%BE%9E%E8%B3%87%E6%96%99%E6%A8%A1%E5%9E%8B%E5%88%B0%E6%95%B8%E6%93%9A%E7%94%A2%E5%93%81"></a>從資料模型到數據產品</h2>
<p><!-- /wp:heading --></p>
<p><!-- wp:paragraph --></p>
<p>傳統的資料科學模型通常只考慮到「產出模型」為止，著重的是如何訓練一個「好」的模型，產生交付的通常是一個模型。但有了一個好的模型之後，然後呢？</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:image {"align":"center","sizeSlug":"large"} --></p>
<figure class="wp-block-image aligncenter size-large"><img src="https://imgur.com/qWyL2QZ.png" alt=""/><figcaption>從資料模型到數據產品</figcaption></figure>
<p><!-- /wp:image --></p>
<p><!-- wp:paragraph --></p>
<p>模型相對來說是抽象的數學公式或是程式演算法，其實不易直接讓面向使用者。大部分的情況是具有「資料素養」的專業工作者，例如資料分析師、資料科學家會將模型解讀成一般人可以理解的資訊。因此「產生一個分析報吿、說一個好故事」是許多資料科學工作者需要訓練的基礎能力，例如資料視覺化（Data Visualization）或說故事（Storytelling）的技能。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:paragraph --></p>
<p>不過當你想要打造的是一個「數據產品」時，僅有資料模型的解讀靜態報告是遠遠不足的。我們需要的是更貼近使用者應用場景的解決方案。所以一般來說，從資料模型到數據產品需要思考的是「如何將模型部署成一個可持續使用的線上系統」。除此之外，也必須思考如何將模型應用更真實、更大量的資料中。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:nextpage --><br />
<!--nextpage--><br />
<!-- /wp:nextpage --></p>
<p><!-- wp:heading --></p>
<h2 id="從實驗資料到真實資料"><a href="https://blog.v123582.tw/2021/04/30/%E6%9C%89%E4%BA%86%E6%A8%A1%E5%9E%8B%E7%84%B6%E5%BE%8C%E5%91%A2%EF%BC%9F%E5%BE%9E%E5%88%86%E6%9E%90%E6%A8%A1%E5%9E%8B%E5%88%B0%E6%95%B8%E6%93%9A%E7%94%A2%E5%93%81/#%E5%BE%9E%E5%AF%A6%E9%A9%97%E8%B3%87%E6%96%99%E5%88%B0%E7%9C%9F%E5%AF%A6%E8%B3%87%E6%96%99"></a>從實驗資料到真實資料</h2>
<p><!-- /wp:heading --></p>
<p><!-- wp:paragraph --></p>
<p>在初期模型訓練過程中，可能會有「比較嚴謹」的分析過程。例如資料會經過標準的抽樣過程，資料也必須滿足一定的統計代表性。但隨著大數據（Big Data）的觀念跟方法逐漸成熟，比起嚴謹可能更重視「可用」與「有效」。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:paragraph --></p>
<p>在《Big Data》這本書中，告訴我們在資料量夠完整的情況下對於資料的誤差容忍性是比較強的。不過這不代表可以忽略資料搜集的量測誤差，建議對統計解讀有興趣的朋友可以參考 <a href="https://medium.com/@taweihuang1/%E9%82%A3%E4%BA%9B%E9%97%9C%E6%96%BC-%E5%A4%A7%E6%95%B8%E6%93%9A-%E7%9A%84%E8%AC%AC%E8%AB%96-%E8%AB%8B%E4%B8%8D%E8%A6%81%E5%9C%A8%E8%AA%AA%E6%A8%A3%E6%9C%AC%E5%8D%B3%E6%AF%8D%E9%AB%94%E4%BA%86-181329b53dd5" target="_blank" rel="noreferrer noopener">那些關於「大數據」的謬論：不要再說樣本即母體了！</a> 和 <a href="http://yenchic-blog.logdown.com/posts/3071851-large-samples-of-data-and-errors" target="_blank" rel="noreferrer noopener">大數據與偏差樣本</a> 這兩篇文章。所以從實驗資料到真實資料的情境中，會有幾個現實需要面對：</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:list {"ordered":true} --></p>
<ol>
<li>收集到的資料可能更多、更快、更髒</li>
<li>產生的結果通常是比較模糊的</li>
</ol>
<p><!-- /wp:list --></p>
<p><!-- wp:paragraph --></p>
<p>需要思考的是如何在有限的時間中，產生可以用的模型。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:heading --></p>
<h2 id="從模型到系統部署"><a href="https://blog.v123582.tw/2021/04/30/%E6%9C%89%E4%BA%86%E6%A8%A1%E5%9E%8B%E7%84%B6%E5%BE%8C%E5%91%A2%EF%BC%9F%E5%BE%9E%E5%88%86%E6%9E%90%E6%A8%A1%E5%9E%8B%E5%88%B0%E6%95%B8%E6%93%9A%E7%94%A2%E5%93%81/#%E5%BE%9E%E6%A8%A1%E5%9E%8B%E5%88%B0%E7%B3%BB%E7%B5%B1%E9%83%A8%E7%BD%B2"></a>從模型到系統部署</h2>
<p><!-- /wp:heading --></p>
<p><!-- wp:paragraph --></p>
<p>模型跟報告是相對抽象跟靜態的，可能難以讓使用者直接有感。因此，從資料模型到數據產品的另外一個重點在於「如何將模型部署成一個可持續使用的線上系統」。例如像推薦系統或是圖形辨識系統之類的系統，就是以應用為目的，模型只是其中的部分而已。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:paragraph --></p>
<p>從這些角度來看，是否可以更早期就把最終的應用考慮進來，或是需不需要讓資料料工作者也具備系統部屬的產出能力都是打造數據產品時的重點。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:paragraph --></p>
<p>而最近流行的 DataOps、MLOps 和 AIOps 各種 Operation 方法，就是在探討如何導入敏捷開發的原則。讓資料開發的 Pipeline 可以有更好的分析、部署、迭代的過程，進而實踐自動化運行的目標。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:separator --></p>
<hr class="wp-block-separator has-alpha-channel-opacity"/>
<!-- /wp:separator --></p>
<p><!-- wp:paragraph --></p>
<p>嗨，我是維元，目前是一名資料科學與網頁開發的雙棲工程師。近期也擔任科技島社群的<a href="https://www.technice.com.tw/tag/%e7%b6%ad%e5%85%83/">駐站專家</a>，持續分享發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的文章。如果對於內文有疑問都歡迎與我們進一步的交流，都可以追蹤資料科學家的工作日常&nbsp;<a href="https://pse.is/3cazqk" target="_blank" rel="noreferrer noopener">Facebook 粉專</a>&nbsp;或&nbsp;<a href="https://www.instagram.com/___dsdaily___/" target="_blank" rel="noreferrer noopener">Instagram 帳號</a>，也會不定時的舉辦分享活動，一起來玩玩吧！</p>
<p><!-- /wp:paragraph --></content></p>
<p>這篇文章 <a rel="nofollow" href="https://www.technice.com.tw/opinion/24826/">有了模型然後呢？從資料模型到數據產品，你還需要具備這一思考｜專家論點【維元】</a> 最早出現於 <a rel="nofollow" href="https://www.technice.com.tw">科技島-掌握科技新聞、科技職場最新資訊</a>。</p>
]]></description>
		
					<wfw:commentRss>https://www.technice.com.tw/opinion/24826/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
