您現在可以使用 Intl.Segmenter敬上 適用於依語言代碼區分的文字區隔,將字串拆成字詞、語句 圖形或圖形
許多非拉丁語系語言,例如中文和日文 請勿使用空格來分隔字詞。因此,使用 JavaScript split() 將文字分割成字詞的方法,傳回錯誤結果。
使用Intl.Segmenter Intl.segmenter() 建構函式; 傳入 locale 和 granularity 等選項,這可 值為 "grapheme"、"word" 或 "sentence"。下列 範例會為日文建立新的 Intl.Segmenter 物件,以分割字詞。
const segmenter = new Intl.Segmenter('ja-JP', { granularity: 'word' }); 呼叫 segment()敬上 方法為包含文字字串的 Intl.Segmenter 物件方法 會傳回可疊代:
const segments = segmenter.segment(str); console.table(Array.from(segments)); 在 JavaScript 中使用 Intl.Segmenter 的國際文字區隔 還有其他範例,包括如何將 Intl.Segmenter 與表情符號搭配使用。