<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	
	xmlns:georss="http://www.georss.org/georss"
	xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"
	>

<channel>
	<title>機率分佈 &#8211; 科技島-掌握科技新聞、科技職場最新資訊</title>
	<atom:link href="https://www.technice.com.tw/tag/%e6%a9%9f%e7%8e%87%e5%88%86%e4%bd%88/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.technice.com.tw</link>
	<description>專注於科技新聞、科技職場、科技知識相關資訊，包含生成式AI、人工智慧、Web 3.0、區塊鏈、科技職缺百科、生物科技、軟體發展、雲端技術等豐富內容，適合熱衷科技及從事科技專業人事第一手資訊的平台。</description>
	<lastBuildDate>Fri, 10 Nov 2023 08:48:02 +0000</lastBuildDate>
	<language>zh-TW</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.4.2</generator>

<image>
	<url>https://www.technice.com.tw/wp-content/uploads/2022/12/cropped-wordpress_512x512-150x150.png</url>
	<title>機率分佈 &#8211; 科技島-掌握科技新聞、科技職場最新資訊</title>
	<link>https://www.technice.com.tw</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">223945996</site>	<item>
		<title>運用機率分佈預測詞彙　一窺AI生成文字步驟</title>
		<link>https://www.technice.com.tw/issues/ai/72402/</link>
					<comments>https://www.technice.com.tw/issues/ai/72402/#respond</comments>
		
		<dc:creator><![CDATA[進化者]]></dc:creator>
		<pubDate>Thu, 28 Sep 2023 08:22:55 +0000</pubDate>
				<category><![CDATA[AI人工智慧]]></category>
		<category><![CDATA[產業應用]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[人工智慧]]></category>
		<category><![CDATA[機率分佈]]></category>
		<category><![CDATA[生成式AI]]></category>
		<category><![CDATA[產業供應]]></category>
		<guid isPermaLink="false">https://www.technice.com.tw/?p=72402</guid>

					<description><![CDATA[<p><img width="1200" height="627" src="https://www.technice.com.tw/wp-content/uploads/2023/09/168598342_fb-link_normal_none.jpg" class="attachment-post-thumbnail size-post-thumbnail wp-post-image" alt="168598342 fb link normal none" decoding="async" srcset="https://www.technice.com.tw/wp-content/uploads/2023/09/168598342_fb-link_normal_none.jpg 1200w, https://www.technice.com.tw/wp-content/uploads/2023/09/168598342_fb-link_normal_none-300x157.jpg 300w, https://www.technice.com.tw/wp-content/uploads/2023/09/168598342_fb-link_normal_none-1024x535.jpg 1024w, https://www.technice.com.tw/wp-content/uploads/2023/09/168598342_fb-link_normal_none-768x401.jpg 768w" sizes="(max-width: 1200px) 100vw, 1200px" title="運用機率分佈預測詞彙　一窺AI生成文字步驟 1"></p>
<p>運用AI生成文字，已是現今人類社會相當普遍事宜，然而，又有多少人知道AI是如何產出及預測文字？智用研究院AI產品總監周奇民以GPT-4為例，只要給ChatGPT一段上下文，GPT會預測下個字中機率最高的那個字，然後根據生成的字，再為上下文預測下一個字，如果細分來看，可分為上下文編碼、詞彙表與嵌入層、上下文與詞彙表交互、Softmax函數及機率分佈（Probability distribution）等5大步驟。<content><!-- wp:paragraph --></p>
<p>記者／陳士勳</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:paragraph --></p>
<p>運用<a href="https://www.technice.com.tw/?s=AI">AI</a>生成文字，已是現今人類社會相當普遍事宜，然而，又有多少人知道AI是如何產出及預測文字？智用研究院AI產品總監周奇民以GPT-4為例，只要給<a href="https://www.technice.com.tw/?s=ChatGPT">ChatGPT</a>一段上下文，GPT會預測下個字中機率最高的那個字，然後根據生成的字，再為上下文預測下一個字，如果細分來看，可分為上下文編碼、詞彙表與嵌入層、上下文與詞彙表交互、<a href="https://www.technice.com.tw/?s=Softmax%E5%87%BD%E6%95%B8">Softmax函數</a>及機率分佈（Probability distribution）等5大步驟。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:image {"id":72403,"sizeSlug":"large","linkDestination":"none"} --></p>
<figure class="wp-block-image size-large"><img src="https://www.technice.com.tw/wp-content/uploads/2023/09/168598342_fb-link_normal_none-1024x535.jpg" alt="" class="wp-image-72403"/><figcaption class="wp-element-caption">AI會透過文字資料間的關聯程度來預測或生成文字。示意圖：123RF</figcaption></figure>
<p><!-- /wp:image --></p>
<p><!-- wp:heading --></p>
<h2 class="wp-block-heading"><strong>將上下文資訊進行編碼</strong></h2>
<p><!-- /wp:heading --></p>
<p><!-- wp:paragraph --></p>
<p>周奇民表示，以「今天天氣真好」這6個字來說，輸入「今天天氣真」這5個字給模型，GPT會去計算下一個字在幾千、幾萬個中文漢字中出現的機率最高，假設計算出來得知「好」為機率最高的字，就會把「好」這個字加進去，在生成文字之前，會先將上下文資訊進行編碼，上下文資訊也可包括前文的所有詞彙、句子，甚至前一段文字，取決於任務和模型的設計，編碼過程將上下文資訊轉換為向量或矩陣，以便模型利於處理。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:heading --></p>
<h2 class="wp-block-heading"><strong>上下文與詞彙表交互產生各詞彙的關聯性</strong></h2>
<p><!-- /wp:heading --></p>
<p><!-- wp:paragraph --></p>
<p>接著，大型語言模型（Large Language Model，LLM）經由自身所擁有涵蓋動詞、名詞、形容詞等各種詞彙和標記的詞彙表，每個詞彙都與透過模型訓練過程學習得到的嵌入向量相關聯，再讓上下文資訊與詞彙表中詞彙互動，計算上下文編碼向量與詞彙表中每個詞彙嵌入向量之間的相似度或關聯度，相似度的高低也反映每個詞彙在給定上下文下的可能性。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:paragraph --></p>
<p>更多新聞：<a href="https://www.technice.com.tw/issues/ai/72369/">剖析生成式AI潛能　設定角色可防止演算法疏失</a></p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:heading --></p>
<h2 class="wp-block-heading"><strong>運用Softmax函數將關聯程度轉成機率分佈</strong></h2>
<p><!-- /wp:heading --></p>
<p><!-- wp:paragraph --></p>
<p>若計算出每個詞彙與上下文的關聯程度，接下來會藉「Softmax函數」將一系列關聯度分數轉化為機率，且確保所有分數總和等於1，以機率分佈呈現最終結果，使LLM能夠選擇最有可能的詞彙來產生連貫的文本。</p>
<p><!-- /wp:paragraph --></content></p>
<p>這篇文章 <a rel="nofollow" href="https://www.technice.com.tw/issues/ai/72402/">運用機率分佈預測詞彙　一窺AI生成文字步驟</a> 最早出現於 <a rel="nofollow" href="https://www.technice.com.tw">科技島-掌握科技新聞、科技職場最新資訊</a>。</p>
]]></description>
		
					<wfw:commentRss>https://www.technice.com.tw/issues/ai/72402/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">72402</post-id>	</item>
	</channel>
</rss>
