「何かの日記」3月31日、「re: 字体弄り」に対してより。
ご指摘を拝見させて貰つた範囲内で言へば、北村さんはどうも「 unicode の外字領域を使用して表示させるのは良くないから、画像でちやんと見られるやうにして呉れ」と云ふ事を言つてゐるんだと思ひます。
画像の使用はひとつの案としてすすめただけで、そんな命令口調で言っているつもりはないです。それはともかく、「unicode の外字領域を使用して表示させるのは良くない
」ことを指摘しています。
ですが、あの場合さう云ふ事では無く、此れは「裏の意図」として一部の文字が見えないと云ふ効果を利用してゐます。詰り、「「人名用漢字許容字体表」が、文字コードの例示字体を無視 して作成されたが為に、こんなに表示できない文字があるんだよ」と云ふ内容であり、又、「こんな些細な違ひで別の字体に区別されてゐるんだよ」と云ふ内容を言ひたいからあのやうにしてゐるのです。当時、ちやんと体系的に物事を考へて事に当つてゐればこのやうな事にはならなかつた筈です。
petroniusさんの「裏の意図」はここを読んで漸くわかったのですが、果たして現在の字体弄りの変遷のページで、その「裏の意図」が読む人に伝わるでしょうか。
「2000年6月8日以降に更新されたMS ゴシック・MS 明朝」を表示に使っている人であれば、単に「日本国内での字体の移り変りを示したもの
」として読むでしょう。文字化けはしてないので、「裏の意図」には気づきもしないと思います。
また、それ以外のフォントを使っている人にとっては、外字の文字参照部分は文字化けして見えることでしょう。が、文字化けから「裏の意図」を読み取れる人はいるでしょうか。多くの人は文字化けに出会ったら単に読めないものとみなして読みとばしてしまうだけような気がします。文字化けの原因が外字領域の文字参照であると分かった自分も、「re: 字体弄り」に対してを読むまではそんな裏の意図があるとは思いもしませんでした。しかもこの場合は字の比較が一部できなくなるので「表の意図」を伝えるのにも十分ではありません。
そのことから考えてみると、画像を使えば、フォントとは関わりなくより多くの環境で字体の比較が可能になるし、しかも「人名用漢字許容字体表が文字コードの例示字体を無視して作成されたが為に、画像でしか表示できない文字がこんなにあるんだよ」という意味をも含めることができるので一石二鳥、という気もしますが、いかがでしょう。
意図は別にしても、HTML文書として問題があると思います。
大体、外字領域のコードでしか表現できない字体が、戸籍法施行規則に規定されてゐる事、其れ自体がをかしいんぢやないですか。私はさう思ふよ。
先にも述べたとおり、外字領域のコードはいかなる特定の文字とも定められていません。外字領域のコードで何か特定の文字を表現できると考えること自体、よくないことではないでしょうか。
ウェブでよく見かける例にたとえれば、Windows環境で読めるからという理由で「○の中に1」の文字(0x8740)をShift_JISの文書にそのまま使うことと似た誤りをおかしていると思います。「○の中に1」の記号はUnicodeにはあるので&9312;と文字参照を使えば(またはUTF-8などの文字コードを使えば)よいですが、外字領域のコードは元から何の字とも対応していないのでさらに問題です。同じ外字セットを共有する環境下ならともかく、広くウェブで公開する文書としては適当でないと思います。
petroniusさんは半角カナについて、やりたいのなら、unicode の実体参照で指定なさい
、と以前述べてましたが、「Windowsで半角カナや○つき数字をそのまま書いても、同じWindows環境では見られるのだから、その限りでは文書データとしても問題ない」とお考えでしょうか。
他にも、JIS漢字には「包摂」というルールがあるので細かい字体差は包摂の範囲内とみなされるのでは、とか、縁の旧字(緣)や温の旧字(溫)はUnicodeにある字(32227,28331)なのになぜ57995,57997のコードを使うのか、ということが思い浮かんだのですが、詳しい言及は略します。特に、文字コードにはあまり詳しくないので……。
以上、書いてはみたもののさほど自信があるわけではないので、自分の記述に誤りがありましたら指摘頂けると有難いです。
(2002年3月31日)
北村曉 kits@akatsukinishisu.net