文字・コードに関する覚え書き

計算機で使う東アジア文字集合の概要についてはすでに Ken Lunde 氏の CJK.inf という詳細な記事がありますが, こちらの方がより新しい情報を含み, かつ日本語で書いてあるために漢字に関する議論がわかりやすくなっています。

京大の安岡氏のページに ISO に登録された文字集合の一覧(GIF で文字表を入手できる) が見られます。 X Window 用の大量のフォントも入手できます。

Unicode Consortium の ftp サイトにあるマッピングテーブルは重要です。 ただし正確でないものもあるようです。


東アジアの文字集合の概要

(古い文章が多く, 現状を反映していない場合がある。要注意)


ローマ字関係

東アジア諸言語のローマ字表記

東京近郊駅名ローマ字つづり (2000-04-19)

明治33年小学校令施行規則第16条および第1..3号表 (1998-06-25)

王力ローマ字について (2008-01-15)

Saikin no ikutsuka no kairyô Rômaji an ni tsuite (2003-08-07)


キーボード入力関係

キーボード配列によるかな入力効率の比較 (2005-05-06)

五筆字型輸入法の紹介 (2001-03-29)

倉頡輸入法の紹介 (2001-04-03)


そのほか

euro 通貨記号対応について (1998-12-23)

IBM EBCDIC 日本語符号化文字集合 (1998-06-14)

UCS BMP (Unicode)にない漢字 (2002-07-29)

GB2312-80 一般符号名称, および UCS BMP との関係 (1998-02-14)

JIS記号の UCS BMP へのマッピングの問題および MS漢字とシフトJISの違い (1998-03-29)

巷で見かける変わった文字たち (1998-05-11)


注: 文字のコード値を書く必要があるときは, 原則として 16進で書いています。

ホームページへ