五筆字型輸入法の紹介

目次

以下のリンクも参考にしてください。

シカゴ大, Joe Wicentowski(魏偉)氏の中国のページ(英語)
五筆字型・五筆画のチュートリアルがあります。
黄魚(Yu Huang)氏による五筆字型“電脳”講座(中国語/GB)
もともと 1993年にニュースグループ alt.chinese.text へ 9分割ポストされたものです。 オンラインで読める五筆字型の記述としては現在のところ最も周到なものでしょう。
なお最後に「黄宇」と書いてあるのが本名で, 「黄魚」というのはペンネームなのだろうと思います。
ifcss のコード・入力法関係のデータ集 および 同様のデータを置いた anonymous ftp site
wb-cj-input.zip というのが五筆・倉頡入力の簡単な説明(中国語/GB, 字根表のPCX画像もあり)です。 英国サザンプトン大の伍良盛(Liangsheng Wu, L.S.Ng)氏の作です。 ほかにもピンイン順の五筆字型コード索引など, いくつか五筆入力関係の資料があります。

1.五筆字型とは

“五筆字型”は中国語の入力方法としてかなりよく普及している, 文字の形によって漢字を入力する入力方法です。 1983年に王永民という人が考案したので, “王碼”とも呼びます。 ピンイン入力とともに, ほとんどの中国語入力システムで利用することができます。

“五筆字型”では, 文字を約200種類の“字根”という部品に分解することによって, 1文字をアルファベット 1..4打で入力することができます。 慣れれば普通の人間で分速100字くらいは軽く打てるそうです(分速270字という怪物もいるそうな)。 日本では仮名漢字変換以外の漢字入力方法がほとんど普及していないので, “五筆字型”のような, 字音によらない入力方法には抵抗があると思いますが, 次のような人にはお勧めできます。

“五筆字型”以外にも字形による入力方法はいろいろあります(学校教育で使われている“認知碼”など)が, 普及度の高さ・字音にまったく依存しない純粋さ, という点から考えて, まず“五筆字型”を試してみるのがいいでしょう。 オーストラリアの倪鴻波氏作のワープロNANJIStarなどは, 漢字を選ぶとその五筆碼を表示してくれるツールがついてきますし, 五筆碼のはいったコード辞書の類もいろいろあって便利です。

ほかに台湾では朱邦復氏による同様の“倉頡輸入法”というのが普及しています。 日本語用の文字分解入力方式には豊橋技術科学大学の戸水秀夫氏による 「NIK(にこにこ)」 というのがあるようですが, 他にはあまり見たことがありません。

2.五筆字型でのキーのグループ分けとキー番号

“五筆字型”の“五筆”というのは中国の漢字索引などでよく使われている, 漢字をその先頭の筆画によって 5種類に分類する方法です。 すなわち,横(一)竪(|)pie(丿)点(丶)折(乙)の5つです。 ちょっと注意すべき点を列挙します。

さて“五筆字型”ではアルファベット 26文字のうち, Z を除く 25文字を下のように 5文字ずつ筆画に割り当てます。

番号1 2 3 4 5
筆画横(一)竪(|)pie(丿)点(丶)折(乙)
キーGFDSA HJKLM TREWQ YUIOP NBVCX

各々のキーグループについて, さらに(QWERTY)キーボードの中央から端に向かって, 1番から5番までの番号を振ります。 つまり G はグループ1の第1番(以下 11 と略す), F は 12, D は 13, ... という具合です。 キーボードの配置順に記すと以下のようになります。

Q
35
W
34
E
33
R
32
T
31
Y
41
U
42
I
43
O
44
P
45
A
15
S
14
D
13
F
12
G
11
H
21
J
22
K
23
L
24
;
z X
55
C
54
V
53
B
52
N
51
M
25
,./

3.キーの名前

さて, 25のキーはそれぞれ漢字1文字の名前を持っています。 大変重要なので, 下の図を見て暗記してください。 たった 25 なのでたいして難しくないと思います。

Q金
35
W人
34
E月
33
R白
32
T禾
31
Y言
41
U立
42
I水
43
O火
44
P之
45
A工
15
S木
14
D大
13
F土
12
G王
11
H目
21
J日
22
K口
23
L田
24
;
z X糸
55
C又
54
V女
53
B子
52
N已
51
M山
25
, . /

注: 「糸」と書いたのは実際は簡体字の糸偏です。

必ず, キー番号(11,12,13,...)の順で覚えるようにしてください。 つまりキーボードの中央から外側へ向かって,
「1)王土大木工, 2)目日口田山, 3)禾白月人金, 4)言立水火之, 5)已子女又糸」
の順に覚えます。 各キー名の第一画がちゃんと先に述べた“五筆”に従っていることに注意。 たとえば「王土大木工」はすべて横画から始まっています。 最初が「王」なのは何か不穏に感じるかもしれませんが, 作った人が「王永民」さんだから, と考えれば自然でしょう。 「目日口田」が全部四角なのも覚えやすいですね。 なお「言」は JIS 規格票の印刷字形では横画で始まっていますが, この入力法ではいわゆる鍋蓋の類は一律「点」から始まるものとみなします。 「大」が D, 「口」が K, 「言」が Y というのは発音と関係しているのかもしれません。 「月」が E, 「水」が I, 「火」が O というのもピンインの最後の 1字と関連づければ覚えやすいかも。 入門書にはその他早覚えの類が記してあることもありますが, あまりそういうのに頼らずまる暗記した方がかえって楽だと思います。

さて, このキー名は同時に字根でもあります。 「之已」を除くキー名がみな部首字であることに注目。 部首字の多くは使用頻度が非常に高いので, 確実に覚えるようにしましょう。 たとえば JIS X 0208 の場合, 最初の「木水艸」の 3部首だけで 900字をこえ, それに「手口心人糸言金土虫肉SINNYO45女」を加えた都合 15部首に属する字は 2900字以上にも達します。 この 15部首中, 実に 13部首がキー名です。 GB2312 でもおおむね同様です。 いかにキー名が重要かわかるでしょう。

同じキーを 4回連続してたたけば, そのキーの名前が入力できます。 たとえば「人」は「WWWW」で入力できます。 「日月火水木金土」はこの方法ですべて入力できますね。

4.キー名以外の字根(1)

まず, きわめて覚えやすいものから。 キー番号から直接求められる字根があります。 たとえば「一」横(1)が 1本なので 11 のキー, 「彡」はpie(3)が 3本なので 33 のキーという具合です。 こういう字根は以下のように全部で 17個あります。 なお「シ」は片仮名じゃなくて「さんずい」を意味する漢字字根の代用です。
「水」と「シ」, 「火」と「REKKA」が同じキーに割り当てられているのは 漢字の原理から言っても理に適っていますね。

Q
35
W
34
E彡
33
RHIDARI2
32
T丿
31
Y丶
41
U冫
42
Iシ
43
OREKKA
44
P
45
A
15
S
14
D三
13
F二
12
G一
11
H|
21
J‖
22
KTATE3
23
LTATE4
24
;
z X
55
C
54
V巛
53
BORE2
52
N乙
51
M
25
, . /

漢数字の一二三が出てきたので, ついでに四から十までの 7字もやってしまいましょう。 これらも「ほぼ」ちゃんと第一画の筆法によって 5つのグループに配当されています。 (「ほぼ」というのは「九」の字が「折」にはいっているからです。 これは例外です。) これらの数字もすべて字根になっています。

Q
35
W八
34
E
33
R
32
T
31
Y
41
U六
42
I
43
O
44
P
45
A七
15
S
14
D
13
F十
12
G五
11
H
21
J
22
K
23
L四
24
;
z X
55
C
54
V九
53
B
52
N
51
M
25
, . /

キー名と比べてみると, なんとなく「人」と「八」が似ているし, 「立」と「六」, 「土」と「十」, 「王」と「五」は一画違い, 「四」と「TATE4」も関係ありそうだし, 覚えやすいようにいろいろ配慮されているのがわかります。

数字の一と五, 二と十が同じキーであるのをいぶかしく思う人もあるかもしれません。 しかしこれは何でもないことです。 字根が同じキーにキーに割り当てられていても, 文字そのものの入力は異なるからです。

一般に, 字根(キー名を除く)をそのまま文字として入力するときには, 次の方法によります。

  1. 1打めはその文字のキーをそのまま打つ。
  2. 2打め以降は, その文字を筆画にバラして, 3画以上ある時はその 1画め, 2画め, および最終画を入力する。 (例: 三 = 三(D)+一(G)+一(G)+一(G), 五 = 五(G)+一(G)+|(H)+一(G))
    ただし「五」の 2画めが「丿」じゃないことに注意。
  3. その文字の画数が2画しかないときは, 2打めに1画め, 3打めに 2画めを打つ。 4字めはスペースバーを打つ。 (例: 二 = 二(F)+一(G)+一(G), 七 = 七(A)+一(G)+乙(N))
  4. 1画しかない字根(一|丿丶乙の5字のみ)はちょっと特殊で, 2打めは 1打めと同じものを打ち, 3,4打めは L を打つ。
    すなわち 一 = GGLL, | = HHLL, 丿 = TTLL, 丶 = YYLL, 乙 = NNLL。

この方法にしたがって, 一から十までを入力すると,
一GGLL 二FGG 三DGGG 四LHNG 五GGHG 六UYGY 七AGN 八WTY 九VTN 十FGH
となり, みごとに区別がつくわけです。

ちょっと注意すべき点。 「川」は「TATE3」と ほぼ同形なのでやはり字根入力に従うのですが, 先頭の一画は竪でないので, キーストロークは「川+|+|+|」じゃなくて「川(K)+丿(T)+|(H)+|(H)」になります。 私にはこれはちょっと意外でした。

もうひとつ, 「曰」(いわく)の入力についても考えてみましょう。 「曰」は「日」(ひ)とほぼ同じ形なので, 字根入力と同じやり方で, 「曰」(いわく)=「日(J)+|(H)+乙(N)+一(G)」と入力できます。 「日」(ひ)の方は「JJJJ」とキー名入力の方法に従うので両者は区別できます。 なかなか巧妙です。

「已=NNNN」と「己=NNGN」も同様にキー名かそうでないかで区別がつきます。 でも「己」と「巳」は同じになってしまいます。 こういう場合は仮名漢字変換と同様に候補が出るようです。 実際には「己」は「自己」という単語で出てくることがほとんどなので, 双音入力(二字語の各字の先頭2打ずつを組み合わせ, 2字まとめて入力する。 「自(THD)己(NNGN)」ならば "THNN" ですむ)がサポートされているシステムなら, 多くの候補の問題を避けることができます。

効率化といえば, 「一」の使用頻度はたいへん高いので, 1打めの G のあとにスペースバーを打つことによっても入力できます。 こういう省略入力法を“簡碼”といいますが, べつに省略しなくても入力できなくなるわけではないので, この話は後回しにします。

5.字根の組み合わせ方(1) 偏と旁

まだすべての字根を説明し終えていませんが, そろそろ興味が持続しなくなってきたと思うので, このへんで字根を組み合わせる簡単な例を出します。 漢字の構造で一番よくあるのは, 左右つまり偏と旁に分かれた字です。 この節では偏と旁がいずれも字根である場合を説明します。

これは大変簡単で, いかなる場合でも 3打ですみます。 1打めは偏, 2打めは旁。 最後の 3打めはその字の最後の画(一|丿丶乙のいずれか)を入力します。

たとえば, 「好」ならば「女(V)+子(B)+一(G)」と入力します。 同様に「畑」なら「火(O)+田(L)+一(G)」です(もっとも「畑」は GB2312 にはありませんが)。

ここまで知れば, あなたはもうかなり多くの字を入力できるはずです。 たとえばさんずい(I)だけでも「汁汕汝江汢汨汪沐沺泗泣泪泊淦」といった字が打てます。 同様に人偏(W)の字なら「什仁仇从仔仙伍休佃位伯信」, 木偏(S)なら「杉杜杠杣枉林柆柏」といった字が入力できます。

最後の1打のことを「識別碼」と呼びます。 これがあるおかげで, 同じキーに複数の字根を割り当てても, 異なる字が同じコードを共有するのを避けることができます。 もし 2打だと, たとえば上の例では, 「仁」と「什」が同じコード(WF)になってしまうわけですが, 最終画が横か竪かで区別がつくわけです。

これでもう「汨羅」が辞書に登録されてなくて右往左往する必要はありません。 ...と思って実際にやってみたら GB2312 には「さんずいに曰(いわく)」を書いて 「コツ(gu3)」と読む別の字があるのだった(笑)。 もちろん候補選択は出るものの, 「汨」の方が先にでてくるので, そのまま次の字を入力すれば「汨」が確定するので, 実質的に候補を選ぶ必要はなくなっています。 逆に, JIS を対象にすると「沺」と「泗」が同じコードになってしまうのですが, GB2312 には「沺」がないのでこの問題は生じません。

6.キー名以外の字根(2)

全部の字根をグループごとに説明します。

横(一)グループ
キー番号 11 12 13 14 15
キー名 G王F土D大S木A工
準キー名 [士][犬]
筆画
数字
二画め=1 AO11 SAN11 干[KAKU12] HITUZI13 [HITUZI13B]
二画め=2 寸雨 KAMI13 丁西 廾[廿 TOMO15]
二画め=3 石厂 [ISI13 OO13 INU13]
二画め=4
二画め=5 匚戈[弋]

ずいぶんごちゃごちゃしています。 字根だけでは漢字として成り立たない変な形のものもけっこうあります。 複数の字に同じコードを振るのを避けるためにわざと変にしているのかもしれません。 さもなければ「HITUZI13」なんて 字根は作らなくても単純に「羊」でいいような気がします。

キー名・筆画・数字についてはすでに説明しましたが, 「準キー名」と書いたのはキー名に似た形の字です。 「土」と「士」はともかく, 「大」と「犬」が同じキーというのは少し意外です。

準キー名以外は, おおむね2画めの筆画によってまとめられています。 つまり 11 なら2画めは 1が多く, 12 なら2画めは 2が多く... という具合です。 さっきはいいませんでしたが数字の「十」や「七」も実はそうです。 したがって「この部分は字根だった」ということさえ覚えていれば, それがどのキーに配当されていたかは思い出しやすくなっています。 もっとも 2画めが 4 の字根はないので, 14 だけは例外になっています。

とはいってもあんまり規則と関係ないのも少なくありません。 「AO11」は「青」の字の冠ですが(「主」じゃない), この字の 2画めが横だか竪だかは個人差があるところでしょう。 「AO11」は「王」に, 「干」は「土・士」に, 「古」は「石」に字が似てるとか, そういう風にこじつけて覚えるしかないと思います。

HITUZI13 [HITUZI13B]」 のように「[, ]」でくくったのは左隣の字根からすぐに連想できる字根, という意味です。 五筆用の漢字キートップではこれらの字根は左隣の字の横に小さく書いてあります。 「干[KAKU12]」みたいに 「なんでだよー」ってなのもあります。 実は「KAMI13」も 「HITUZI13B」の隣に並んでたのですが, これだけはまるで理解できないので別にしました。 単にキートップの面積に合わせて字数を節約しただけなのかもしれません。 しかし, 「KAKU12(革の下半分です)」の 1画めが横でないのにここに配置されていることを理解するには, やはり「干に似た字根だから」という説明を受け入れるべきなのでしょう。

「廾」は草冠を兼ねます。 また「基」を「廾+三+八+土」のように分解するのにも使います。

字根自身を単独の文字として入力する場合には, 「戈」と「SAN11」の筆順に注意。 「戈」の字は「戈+一+丶+丿」のように「丿」が最後にきます。 「戊・我」は(字典での扱いと異なり)「戈」には従いませんが, やはり「丿」が最後にくるものと考えます。 すなわち「戊」ならば「厂(D)+乙(N)+丶(Y)+丿(T)」のように分解します。

竪(|)グループ
キー番号 21 22 23 24 25
キー名 H目J日K口L田M山
準キー名 [GU23] [曰YOKOHI22]
筆画 TATE3 [川] TATE4
数字 四 [YOKOME24SO24 ]
二画め=1 上[GU21卜] 止[ASI21] TORA21 KAWA21
二画め=2 RITTO22 [RITTO22B リ]
二画め=3
二画め=4
二画め=5 早虫 甲囗 貝冂HONE25
例外 力車

じっさいの表では「車貝」は簡体字になっています。

やはりある程度 2画めの筆法によって 5つのキーに配当されているようです。 とくに 21 には「卜」で始まる字根が大量に集まっています。 「KAWA21」 (「皮」の字に用いる)は竪画から始まっていませんが, 「TORA21」と類似の字根ということで ここにはいっているのでしょう。

2画めが「丿」「丶」の字根はありません。 逆に 2画めが折(乙)の字根は多いので, 3つのキーに分かれています。 「甲」は「田」, その逆の「由」は「山」を部分として含んでいるから, ある程度の連想は働きますが, 「虫」が 22 とかはまる暗記しかないですね。

23 のキーには新規に覚えなければならない字根はありません。

24 のキーに割り当てられた「囗」は「くにがまえ」です。 「口」(くち)は 23 なので注意しましょう。

「力」「車」の 2字根は竪画で始まっていませんが, 例外的にここに属しています。

実際になんの字のために存在するのか考え付きにくい字根もありますが, たとえば「SO24」は「曾」の中央部に, 「YOKOHI22」は「臨」の簡体字に使います。 「日」と「YOKOHI22」は同じキーなのに, 「目」「YOKOME24」 が違うキーに割り当てられているのは変な気がします。

pie(丿)グループ
キー番号 31 32 33 34 35
キー名 T禾 R白 E月 W人 Q金
準キー名 [AMARI31] [KATU33] [KANEHEN]
筆画 丿 HIDARI2
数字
二画め=1 NOITI31竹攵[夂] NOITI32手[ TEHEN32 KAN32]
二画め=2
二画め=3 KIN32 斤[HEI32]
二画め=4 TUME33 乂 [INU35]
二画め=5 用[FUNE33]乃 MATURI34 UO35 勹[UZI35] 儿[NAGARE35] ク[夕ZEN35]
例外 豕[ BUTA33 BUTA33B KOROMO33 NAGA33 ]

うーん。 あんまり規則的でないですね。 数も多いし。 でも手偏とか彳とか攵とか重要な字がそろっています。

部首の一部だけ抜き出したような字が多くなっています。 たとえば「けもの偏」は「INU35+丿」と打ちます。 字典で「けもの偏」は「犬」の部首にまとめていますが, 五筆字型では「犬」は D の所にあったことに注意。 「魚(の簡体字)」は「UO35+一」です。

字典の部首ではありませんが, NOITI31NOITI32 は実際には大変よく使われます。 ノを除いた横線が一本なら 31, 二本なら 32 ということで覚えやすいです。 31 のキーに割り当てられている「竹・攵」は, NOITI31 を部分として含んでいます。

TUME33」は 3つの点を, 「豕」は「彡」を含んでいるので 33 のキーだと覚えられます。 また「用」は「月」に似ています。
なお「爪」は「KIN32+|+丶」と分析し, 「TUME33」とは無関係です。

「癶・MATURI34」 は「八」に似た字, ということで覚えられます。 ただし「入」は字根ではありませんし, 歴史的に「人」と関連する「儿」は隣の 35(Q) のキーに割り当てられています。

食偏の簡体字(SHOKUHEN)は, 「ク+乙」として入力します。

点(丶)グループ
キー番号 41 42 43 44 45
キー名 Y言 U立 I水 O火 P之
準キー名 [GONBEN] [ MIZU43 MIZU43B MIZU43C ] [ SINNYO45 ENNYO45 ]
筆画 冫[ソ MAE42 SO42 ] REKKA
数字 六 [TATU42]
二画め=1 亠[MIYAKO41] 文方广 FURUTORI YAMAI42
二画め=2 小 [KO43]
二画め=3 GYO44 [AKA44]
二画め=4 ツ[ TU43 HIKARI43 ]
二画め=5 NE45

「門」は実際には簡体字です。 「NE45」は, 示偏(PY)と衣偏(PU)の両方を入力するために使われます。 「示」「衣」自身はそれぞれ FI, YE であって関係ないことに注意。

41 は確かに「亠」で始まる字根を集めていますし, 45 は二画めが折の字根を集めていますが, 42, 43, 44 のキーに関しては, 二画めの筆画はあまり関係なく, むしろ字根中の点の数で分けているようです。
たとえば 42 の「立」は中に二点を含んでいますし, 「辛 六 冫 ソ MAE42 TATU42 SO42 YAMAI42」も同様です。 例外は「門」だけです(これは二画めが竪だから, と考えられます)。
同様に考えれば 43 は「水」のような形の字根と 3点を含む字根であり, 44 はすべて 4点を含む字根です。 覚えるのはかなり簡単です。

折(乙)グループ
キー番号 51 52 53 54 55
キー名 N已B子V女C又X糸
準キー名 [己巳] [孑] [スマ] [ITO55幺]
筆画 ORE2
数字
二画め=1 コ尸[MAYU51] ヨ臼
二画め=2 凵也KOZATO52[耳卩SETU52]了
二画め=3
二画め=4
二画め=5 TAGAI55
例外 心[KOKORO51BKOKORO51B] 匕[ヒ]

実際には「糸」「馬」は簡体字です。

「刀」は 53(V) ですが, 「RITTO22B」は 22(J) なのでした。 また「刀」に似た「力」は 24(L) にありました。

「刀・力」については, 重要なルールがひとつあります。 識別碼を筆順によらず「乙」にする, ということです。

このグループはおおむね二画めの字画によって分かれていますが, 「心・匕」のような例外や「羽・巴・馬・弓」のようにあんまり字画と関係ない割り当てもやはりあります。

お疲れ様でした。 ずいぶん長文になってしまいましたが, 「HITUZI13」と「HITUZI13B」のような小さな字形の違いまで別に勘定しても 200字程度しかありませんので, 実際のところはそんなに覚えにくいものではありません。 とりあえず, どんな字根があるかだけでも覚えておけば, それが「どこに」あるかはうろ覚えでもなんとかなるものです。

7.字根の組み合わせ方(2) 上下型, その他

先に左右二つの字根からなる文字の入力法を説明しました。 五筆字型で扱う文字の構造には, 左右型のほかにあと二種類, 上下型(冠+足)と雑合型(それ以外全部, たとえば「門がまえ」「まだれ」「しんにょう」の類, および「夷(=大+弓)」のように分析不能なもの)があります。

左右型以外の構造を持つ漢字でも, 入力法自体は変わりません。 ただ, 識別碼のみが異なります。 記述の通り, 左右型の識別碼は最終画によって決定され, それは「一|丿丶乙」のいずれかでした。 上下型(冠+足)の場合も最終画によって識別碼は決定されるのですが, そのキーとして「一|丿丶乙」でなく隣の「二‖HIDARI2ORE2」を識別碼にします。 もう予測がつくと思いますが, 雑合型の識別碼はさらにその隣の「三TATE3彡シ巛」になります。 ただそれだけの違いです。 重要なので, もう一度表形式で書き直すと,

識別碼一覧
末筆 pie
左右型 丿
上下型 HIDARI2 ORE2
雑合型 TATE3

この工夫によって「只・叭」のように構造が違う字に違うコードを割り当てられるのみならず, 「禾」と「竹」に同じキーを割り振っても問題が起きないようになっています。

なお雑合型のうち, 「囗 SINNYO45 戈」などとそのその中身からなっている文字については, 本当の最終画でなく, 中身の最終画をとります。 (さもないと「くにがまえ」の字の最終画が全部同じになってしまう)

識別碼はこれくらいにしましょう。 実は上下型・雑合型には左右型にない問題がもう少しあります。

第一。 左右型の偏と旁が通常離れているのにたいして, 上下型ではくっついていることが多いので, 分析が難しい場合があります。 たとえば「兄=口+儿」これはまず誰も間違わないでしょうが, この上に「十」をつけた「克」は「十+兄」ではなく「古+儿」に分けなければなりません。 言い換えると, 左右型ではあまり気にしなくて構わなかった分析ルールを頭に入れて分析しなければなりません。 ここにルールを書きます。 (オリジナルではルールを 5種類に分けているのですが, 整理しなおしました。)

  1. “書写順序, 兼顧直観”: 実際の書き順にしたがって分割する。 ただし雑合型の「かまえ」の部分 (「国」の囗・「或」の戈・「可」の丁など) は書き順に反してもひとまとめにして考える。
  2. なるべく少ない数の字根ですむように分析する。
  3. “能散不連, 能連不交”: 同じ数の字根ですむ場合は, 2つの字根が交わらない方を優先する。 交わらない複数の分析方法がある場合は, 2つの字根が接しない方を優先する。
  4. “取大優先”: 以上で決着がつかない場合は, 先に来る字根の画数が多くなるように分析する。 一種の欲張りルール。 なんとなく「朝三暮四」の故事を思い出させます。

たとえば「牛」は 「NOITI32+|」 と 「NOITI31+十」 のふた通りの分析方法があるわけですが, “取大優先”によって前者をとります。 よく似た「午」もまったく同様に分析できますが, これは前者のやり方だと 「NOITI32」 と「|」が交わってしまうのに, 後者の方は接するだけですむので, “能散不連, 能連不交”の方が優先され, 後者の分析の方が正しいことになります。 (ちなみに「牛」は雑合型, 「午」は上下型です)
…となるはずなのですが, 実際は“取大優先”が“能連不交”より優先する場合もあるようです。 たとえば「平」は 「一+MAE16+|」 となり, “能連不交”な「一+ソ+十」は誤りなのだそうです。 ちなみに「干+ソ」とすれば字根数はもっと少なくなりますが, 書き順に反するからこういうことはやってはいけないようです。

第二。 上下型ではくっついていることが多いので, 雑合型と区別がつきにくいことがあります。 とくに「右・左・有・老・者・着」などが上下型であるのには注意しましょう。 「灰」も中国だと「右」のように書くことが多いので, 上下型になります。 システムによっては“容錯碼”といって, これらの字に雑合型の識別碼をつけてしまっても変換してくれるものもありますが, 中文之星で試したところ「灰」は DOU/DOI, 「右」は DKF/DKD のいずれでも OK なのに「左」は DAF のみ, という変な現象に出くわしました。 たぶんバグだと思いますが, 容錯碼はあまり信用できないということなんでしょう。

目安として, 上下ふたつの部分に分かれる字の上下と雑合を区別する基準。

  1. ふたつの部分が明白に上下に離れていれば上下, 交わっていれば雑合。
  2. ふたつの部分が接していたり, または上下といえるかどうかはっきりしない場合は, 片方の画数が 1画ならば雑合, 両方とも 2画以上なら上下。

たとえば「当」は上下ですが, 「主・丙」は上が 1画しかないので雑合になります。 「産(の簡体字)」や「気(の簡体字)」も下が 1画のみなので雑合です。 ただし「魚(の簡体字)」の下は 1画の「一」ですが, 明白に上下に分かれているので上下型になります。

ただ, このルールも万能ではないようで, 「少・系」などは 1画の字根を含むにもかかわらず上下型です。

8.字根の組み合わせ方(3) 3個以上の字根を組み合わせる

字根のなかで, それ自身が文字のものは GB2312 中に 102字, 2字根から成り立つ字は 700字程度あるそうです。 残り 6000字近くは 3つ以上の字根を組み合わせなければなりませんが, 字根の数が増えるだけで, やり方自体は 2字根の場合とほとんど変わりません。

字根の数が 4 以上の場合は識別碼は不要です。 さらに 5 以上の字根がある場合は, 4番めから最終字根のひとつ前までを無視します。 これを“一二三末”の規則と呼ぶそうです。

3字根以上の例
分解法 コード説明
白 + 勹 + 丶 (+ 丶) RQYY まず「白+勺」に分かれるので左右型の識別碼をつける。
人 + 二 + 厶 (+ 冫) WFCU これは「人+云」にまず分かれるので上下型の識別碼をつける。
MIYAKO41 + 小 + INU13 + 乙 YIDN 4字根なので識別碼不要
ク + 用 + 刀 + NOITI32 + | QEVH 5字根なのでNOITI32は入力しない

9.簡碼など

さて, 「一」を GGLL などと打っていたのでは面倒だというので, とくに使用頻度の多い文字には簡碼が用意されています。 たとえば, 「一」なら先頭の G だけ, 「人」なら WWWW でなく W の 1打だけで入力できます。 (実際はそのあとスペースバーを打たないといけないので 2打になる)

実際には 1打で打てる一級簡碼(数は当然 25字), 2打で打てる二級簡碼(約600字)があります。 三級簡碼というのもありますが, これは最後の一打をスペースで置き換えることができるだけで, 実際に打つキー数には影響しません。 もっとも識別碼を考えなくていいという利点はあります。 二級・三級簡碼については, 2..3字打ったところでその字が画面上に出るので, それを利用すれば自然に頭に入り, 努力して学習に時間を使う必要は特にありません。 よってここでは詳細は省略します。 ただ一級簡碼だけはよく使うし, 不規則なので, 下に書きます。

Q我
35
W人
34
E有
33
R的
32
T和
31
Y主
41
U産
42
I不
43
O為
44
P這
45
A工
15
S要
14
D在
13
F地
12
G一
11
H上
21
J是
22
K中
23
L国
24
;
z X経
55
C以
54
V発
53
B了
52
N民
51
M同
25
,./

だいたいはその字をフル入力した場合の第一打によって入力できるのですが, 「不(GII)・為(YLYI)・這(YPI)・有(DEF)・我(TRYT)・発(NTCY)」 のようにフル入力の場合と関係ないキーに割り当てられているものもあります。 「我」本来のTRYTというのは「丿+手+乙+丶+丿」 というものすごい分解の結果 (筆順については字根「戈」の説明を参照) なのですから, 簡碼のおかげで大助かりです。

注意: たとえば「主」は Y・YG・YGD のどれでも OK ですが, このように一級簡碼が二級簡碼としても使えるのは「民主産経中同」の 6字だけで, すべての字について成り立つわけではありません。 たとえば「工」はフル入力した場合 AAAA で, 最初の A だけに略せますが, AA だと「式(AAD)」の略になってしまいます。 同様に「人(WWWW)」は W だけで入力できますが, WW だと「从(WWY)」, WWW だと「衆(の簡体字, WWWI)」になります。

10.実例とコード表

とりあえず, 「王永民先生的五筆字型輸入法」と入力してみましょう。

  1. 「王」はキー名なので, 「GGGG」。 簡単です。
  2. 「永」ですが, 「丶乙MIZU43C」です。 最後に識別碼をつけて「YNII」。 ちょっと難しい。
    形の似た「承」は 「了三MIZU43C」(BDII)になります。
  3. 「民」これは知ってなきゃ無理。 「巳七」(NAV)で入力できます。 実際には一級簡碼なので N だけで行きます。
    「氏」も「UZI35七」(QAV)です。
  4. 「先」は「丿土儿」(TFQB)です。 「NOITI32」とかを使っては うまくいきません。
  5. 「生」は「丿AO11」(TGD)です。 識別碼は略せます。
  6. 「的」は「白勹丶」(RQYY)ですが R だけでいいのでした。
  7. 「五」は字根(GGHG)。 実際には GG だけでいきます。
  8. 「筆(の簡体字)」は「竹丿二乙」(TTFN)となります。 「毛」の入力は意外に手間がかかります。 これも二級簡碼で, TT だけに略せます。
  9. 「字」は「宀子」(PBF)。 これは簡単。 識別碼は省略可能。
  10. 「型」は「一廾RITTO22B土」(GAJF)です。 最初を「二」にしないのは“能連不交”ルールのためです。
  11. 「輸」は「車人一月RITTO22B」(LWGJ)です。 “一二三末”に従い「月」を略します。
  12. 「入」は「丿丶」(TYI)。 最後の識別碼は略せます。 これは簡単です。
  13. 「法」は「シ土厶」(IFCY)ですが IF だけでいけます。

以上, フルに打てば「GGGGYNIINAV TFQBTGD RQYYGGHGTTFNPBF GAJFLWGJTYI IFCY」, 二級までの簡碼を使えば「GGGGYNIIN TFQBTG R GG TT PB GAJFLWGJTY IF」となります。 この程度は楽に打てないとあまり実用になりません。

簡単な文字ほど, どうやって字根を組み合わせたらいいのかわからないものです。 最初のころ, 字根だけ覚えておいて, いろいろ入力して遊んでいたときには, 「来」がどうやったら出せるかわからなくて悩みました。 なにしろ中国語では常用字ですから, これが出ないと困ります。 「一+米」だったのは驚きでした。 王永民氏の本では, 「常用500字を紙の上で分解してみる」という練習法を薦めています。

(以下まだ執筆中です _o/|_)

11.ワイルドカード, 五筆画, 五筆橋

字根には分解できても, その字根がどのキーに属しているのかわからないことがあります。 また, 上下型なのかそれ以外の型なのかわからないなどの理由で識別碼がわからない, または考えるのがめんどくさいこともあります。 こういうときは, いままで使ってこなかった「Z」を使用します。 「Z」は一打ぶんのワイルドカードです。 ワイルドカードを使わなかったときに比べて, 当然画面には多くの候補が並びますが やむを得ません。 「Z」が最終画の場合はそれほど多くの候補が出てこないことが多いようです。

さらにワイルドカードを使ってもどう分解したらいいのかわからない字があった時のため, 効率は悪いが単純な方法も用意されています。 それが五筆画で, テンキーの 1 から 5 までで五筆を一画ずつ入力します。 たいていのシステムに用意されています。 メインの数字キーは候補選択に使うので, テンキーしか使えません。 5打で入力します。 5画未満の場合は後ろをゼロで埋め, 6画以上の場合は 5画め以降最終画のひとつ前までを省略します。 偏の画数が 4画以上だと(木偏・日偏・金偏など)候補数が猛烈に増えます。

五筆字型と五筆画を折衷した五筆橋という入力方法も用意されています。 この方式では最初の 1打のみ五筆字型の字根を使い, その字根を除いた残りを五筆画と同じ方法で入力していきます。 やはり 5打で入力します。 けっこう簡単で, かつ先に述べた五筆画の問題点をある程度克服しており, 候補数にうんざりすることは多くなりません。 あまり快速には入力できませんが, 補助手段だということを考えれば立派なものです。 この方式がどの程度一般的なものなのか私は知りませんが, 王永民さんの本の附録“一千常用漢字拆分編碼字典”には収録されていましたし, とりあえず「中文之星」でも利用できます。

参考文献

1.王永民, 五筆字型 -- 電脳技術電視講座教材. 中国科学技術出版社, 1993.
五筆字型の作者によるテレビ講座教科書。 イラストが楽しい。
2.劉洪強編著, 電脳中的漢字処理. 人民郵電出版社, 1996.
パソコン全般に関する入門書。 中国語DOSの種類とか, 各種入力方法について詳しい。
3.許国勝編著, 漢字電脳輸入碼典. 海南国際新聞出版中心, 1995.
ピンイン順の簡単な辞書。 区点・五筆・五十字元・倉頡のコードが記してある。 附録に各種ピンイン入力法の解説があり, 有益。 残念ながら誤記が多い。
なお, 五十字元についてはよく知らないが, 五筆字型で言う字根を声母によって分類, さらにその字の声母を最後に付け加えるものらしい。 たとえば「休」は人(Ren)+木(Mu)=休(Xiu)なので「RMX」と入力する, というのが典型的だが常にこんなに単純に行くわけではないようだ。

文字コードの話に戻る