コード日進月歩

しんくうの技術的な小話、メモ、つれづれ、など

黒いひし形にはてなマークが出る文字(�)はUTF-8変換時のときに変換後の対象がない置き換え文字

� という文字があるがクエスチョンマークだし、ググりにくいしはで、実際コレはなんなんだというメモ

� とは

ブラウザによっては見えない可能性があるので以下の画像のような文字

https://upload.wikimedia.org/wikipedia/commons/thumb/7/7f/Replacement_character.svg/1920px-Replacement_character.svg.pngSpecials (Unicode block) - Wikipedia) より引用

これは代替文字(REPLACEMENT CHARACTER)と呼ばれるもの。

REPLACEMENT CHARACTER

UTF-8だと U+FFFD とされる文字であり、他の文字コードからUTF-8に置き換えたときに該当する文字がないときなどに使用される、らしい。

これらの変換はエディタや環境でよしなにやる部分なので、該当する文字があっても、表示時にない場合はコレに置き換えてしまうことがある様子。

関連リンク