コード日進月歩

しんくうの技術的な小話、メモ、つれづれ、など

2021-12-04から1日間の記事一覧

UnicodeのCombining Character Sequenceの考え方とその正規化についてざっくりまとめる

Unicodeでポなどがホと半濁点の記号に分離されても一つの文字として見えてしまう現象に関してざっくりまとめる TL;DR Unicodeでは2つの文字符号位置を合わせて1つの文字を表す Combining Character Sequence という概念が存在する。 日本語の濁音と半濁音に…