問題はUTF-8の文字境界単位のトラップ、最大4byteで考えるか6byteで考えるかなんだよな。今は4byteだけどかつては6byteな仕様だったし…また6byteに戻しますとか言い出す可能性もあるだろうし。

フォロー

@uaa CESU-8みたいなアホ実装にしないべく、6オクテットまで対応にするのが望ましいのでは? 変換元・先がEUC-JPなので、その意味があるかどうかはさておき

ログインして会話に参加
:realtek:

思考の /dev/null