<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	
	xmlns:georss="http://www.georss.org/georss"
	xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"
	>

<channel>
	<title>自動語音辨識 &#8211; 科技島-掌握科技新聞、科技職場最新資訊</title>
	<atom:link href="https://www.technice.com.tw/tag/%e8%87%aa%e5%8b%95%e8%aa%9e%e9%9f%b3%e8%be%a8%e8%ad%98/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.technice.com.tw</link>
	<description>專注於科技新聞、科技職場、科技知識相關資訊，包含生成式AI、人工智慧、Web 3.0、區塊鏈、科技職缺百科、生物科技、軟體發展、雲端技術等豐富內容，適合熱衷科技及從事科技專業人事第一手資訊的平台。</description>
	<lastBuildDate>Thu, 09 Mar 2023 03:01:08 +0000</lastBuildDate>
	<language>zh-TW</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.4.2</generator>

<image>
	<url>https://www.technice.com.tw/wp-content/uploads/2022/12/cropped-wordpress_512x512-150x150.png</url>
	<title>自動語音辨識 &#8211; 科技島-掌握科技新聞、科技職場最新資訊</title>
	<link>https://www.technice.com.tw</link>
	<width>32</width>
	<height>32</height>
</image> 
<site xmlns="com-wordpress:feed-additions:1">223945996</site>	<item>
		<title>Google建構YouTube通用語音模型　可辨識100種語言</title>
		<link>https://www.technice.com.tw/uncategorized/41239/</link>
					<comments>https://www.technice.com.tw/uncategorized/41239/#respond</comments>
		
		<dc:creator><![CDATA[科技新知]]></dc:creator>
		<pubDate>Thu, 09 Mar 2023 03:01:07 +0000</pubDate>
				<category><![CDATA[其他]]></category>
		<category><![CDATA[YouTube]]></category>
		<category><![CDATA[自動語音辨識]]></category>
		<category><![CDATA[通用語音模型]]></category>
		<guid isPermaLink="false">https://www.technice.com.tw/?p=41239</guid>

					<description><![CDATA[<p><img width="1200" height="627" src="https://www.technice.com.tw/wp-content/uploads/2023/03/0309-2.jpg" class="attachment-post-thumbnail size-post-thumbnail wp-post-image" alt="0309 2" decoding="async" srcset="https://www.technice.com.tw/wp-content/uploads/2023/03/0309-2.jpg 1200w, https://www.technice.com.tw/wp-content/uploads/2023/03/0309-2-300x157.jpg 300w, https://www.technice.com.tw/wp-content/uploads/2023/03/0309-2-1024x535.jpg 1024w, https://www.technice.com.tw/wp-content/uploads/2023/03/0309-2-768x401.jpg 768w" sizes="(max-width: 1200px) 100vw, 1200px" title="Google建構YouTube通用語音模型　可辨識100種語言 4"></p>
<p>記者／竹二 Google曾表示，未來將要建構一個能夠支援1,000種語言的機器學習模型，主要用於YouTube &#8230;<content><!-- wp:paragraph --></p>
<p>記者／竹二</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:paragraph --></p>
<p>Google曾表示，未來將要建構一個能夠支援1,000種語言的機器學習模型，主要用於YouTube，近日釋出了階段性研究成果，通用語音模型USM已經能夠支援100種語言。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:image {"id":41240,"sizeSlug":"large","linkDestination":"none"} --></p>
<figure class="wp-block-image size-large"><img src="https://www.technice.com.tw/wp-content/uploads/2023/03/0309-2-1024x535.jpg" alt="" class="wp-image-41240"/><figcaption class="wp-element-caption">Google近日公開了階段性研究成果，他們的通用語音模型USM已經能夠支援100種語言。（圖／截取自Google Research）</figcaption></figure>
<p><!-- /wp:image --></p>
<p><!-- wp:paragraph --></p>
<p>相關研究人員表示，傳統的監督式學習方法欠缺可擴展性，想要將語音技術擴展到更多的語言，需要有足夠多的資料訓練高品質模型，過去資料準備的常見方法，要以人工手動標記音訊資料，是非常耗時且昂貴的過程，再加上對於缺乏資源的語言，難以收集足夠的訓練資料，而自我監督式的學習，反而可以利用純音訊資料，因此更能達到擴展至數百種語言的目標。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:paragraph --></p>
<p>這款Google的通用語音模型就是使用自我監督式學習，運用大型未標記的多語言資料集預訓練模型編碼器，並使用較小的標記資料集進行微調，讓模型能夠辨識缺乏資源的語言，通用語音模型具有20億參數，使用1,200小時的語音和280億條文句進行訓練。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:paragraph --></p>
<p>通用語音模型主要用於YouTube，可對英語和漢語執行自動語音辨識，還能辨識資源缺乏的阿薩姆語、馬達加斯加語和宿霧語等，目前已能夠對100多種語言執行自動語音辨識。</p>
<p><!-- /wp:paragraph --></p>
<p><!-- wp:paragraph --></p>
<p>據了解，通用語音模型在其中的73種語言，平均每種語言的訓練資料不到3,000小時，卻已經實現了低於305的單詞錯誤率，這是Google過去從未達到的成果。目前在各種公開的資料集測試，像是CORAAL、SpeechStew和FLEURS，通用語音模型的單詞錯誤率都較低。</p>
<p><!-- /wp:paragraph --></content></p>
<p>這篇文章 <a rel="nofollow" href="https://www.technice.com.tw/uncategorized/41239/">Google建構YouTube通用語音模型　可辨識100種語言</a> 最早出現於 <a rel="nofollow" href="https://www.technice.com.tw">科技島-掌握科技新聞、科技職場最新資訊</a>。</p>
]]></description>
		
					<wfw:commentRss>https://www.technice.com.tw/uncategorized/41239/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
		<post-id xmlns="com-wordpress:feed-additions:1">41239</post-id>	</item>
	</channel>
</rss>
