分页: 2 / 3

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 6日 20:08
ejsoon
鶴飛四季 写了: 2022年 12月 6日 19:31 有一些含「麥」的字,左邊最後一筆會寫成長長的捺,托住右邊的字身,那麼字首取碼是否仍取十弓?
「麵」也有陸臺區別,我跟官方取上「十人人人」下「夕」的字型。如果要為最後一筆是長捺的字型,就不能是「十弓」了。

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 6日 20:11
ejsoon
鶴飛四季 写了: 2022年 12月 6日 19:31 有一些含「麥」的字,左邊最後一筆會寫成長長的捺,托住右邊的字身,那麼字首取碼是否仍取十弓?
「麵」也有陸臺區別,我跟官方取上「十人人人」下「夕」的字型。如果要為最後一筆是長捺的字型,就不能是「十弓」了。

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 6日 20:56
鶴飛四季
ejsoon 写了: 2022年 12月 6日 20:11
鶴飛四季 写了: 2022年 12月 6日 19:31 有一些含「麥」的字,左邊最後一筆會寫成長長的捺,托住右邊的字身,那麼字首取碼是否仍取十弓?
「麵」也有陸臺區別,我跟官方取上「十人人人」下「夕」的字型。如果要為最後一筆是長捺的字型,就不能是「十弓」了。
「亠厶」寫法也有區別的,臺標的話是三筆,陸標則四筆,取碼時選擇的是 卜戈

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 6日 21:23
ejsoon
鶴飛四季 写了: 2022年 12月 6日 20:56
ejsoon 写了: 2022年 12月 6日 20:11
鶴飛四季 写了: 2022年 12月 6日 19:31 有一些含「麥」的字,左邊最後一筆會寫成長長的捺,托住右邊的字身,那麼字首取碼是否仍取十弓?
「麵」也有陸臺區別,我跟官方取上「十人人人」下「夕」的字型。如果要為最後一筆是長捺的字型,就不能是「十弓」了。
「亠厶」寫法也有區別的,臺標的話是三筆,陸標則四筆,取碼時選擇的是 卜戈
育字頭,雅倉也編成「心戈」。

如果要專為臺標或陸標編碼也是可以的,看碼表作者的意願了。

我的看法是,如果要全面照顧,就分開編,比如臺標一個碼表,陸標一個碼表,舊體字一個碼表。

現在補完計劃的做法是,全部塞到一個碼表,致使其碼表十分臃腫。

尹倉一字一碼是比較合理的。

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 6日 22:04
鶴飛四季
ejsoon 写了: 2022年 12月 6日 21:23
鶴飛四季 写了: 2022年 12月 6日 20:56
ejsoon 写了: 2022年 12月 6日 20:11
鶴飛四季 写了: 2022年 12月 6日 19:31 有一些含「麥」的字,左邊最後一筆會寫成長長的捺,托住右邊的字身,那麼字首取碼是否仍取十弓?
「麵」也有陸臺區別,我跟官方取上「十人人人」下「夕」的字型。如果要為最後一筆是長捺的字型,就不能是「十弓」了。
「亠厶」寫法也有區別的,臺標的話是三筆,陸標則四筆,取碼時選擇的是 卜戈
育字頭,雅倉也編成「心戈」。

如果要專為臺標或陸標編碼也是可以的,看碼表作者的意願了。

我的看法是,如果要全面照顧,就分開編,比如臺標一個碼表,陸標一個碼表,舊體字一個碼表。

現在補完計劃的做法是,全部塞到一個碼表,致使其碼表十分臃腫。

尹倉一字一碼是比較合理的。
我主張先編Unicode,補全字形,設計一個新字體,然後編碼表,一字一碼

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 6日 22:36
ejsoon
鶴飛四季 写了: 2022年 12月 6日 22:04 我主張先編Unicode,補全字形,設計一個新字體,然後編碼表,一字一碼
尹倉在一字一碼的同時,也說明清楚哪些字用甚麼字型,這樣暫時就可以了。

目前其它的形碼也都沒有為編碼而做字體的,因為漢字是中華文化,它在民間流傳,不需要我們去做標準字體。

漢文庫典倒是有標準字體,但是你看騎沈四傑,以及TNTerik,都在講XX字不按字型取碼…

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 6日 22:43
鶴飛四季
ejsoon 写了: 2022年 12月 6日 22:36
鶴飛四季 写了: 2022年 12月 6日 22:04 我主張先編Unicode,補全字形,設計一個新字體,然後編碼表,一字一碼
尹倉在一字一碼的同時,也說明清楚哪些字用甚麼字型,這樣暫時就可以了。

目前其它的形碼也都沒有為編碼而做字體的,因為漢字是中華文化,它在民間流傳,不需要我們去做標準字體。

漢文庫典倒是有標準字體,但是你看騎沈四傑,以及TNTerik,都在講XX字不按字型取碼…
如果Unicode當初沒有亂搞收字原則,就沒有必要補全字形了。

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 7日 00:37
ejsoon
鶴飛四季 写了: 2022年 12月 6日 22:43 如果Unicode當初沒有亂搞收字原則,就沒有必要補全字形了。
那你認為應該把「黄黃」合並成一個,還是要把「廣鐄簧」等分成兩個?

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 7日 09:02
ejsoon
梁取水金木肯定是錯碼無疑。

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 7日 09:05
ejsoon
有一些字,如「残」、「径」、「惮」等,簡體跟日本漢字編在同一個Unicode上的字,臺標的「歹㦮」反而是日本那邊的寫法,港澳臺用繁體都不大可能用到日本漢字的寫法,如果追求「一字一碼」,則有些字以日本字形編倉頡碼有點不妥。
尹倉也考慮把「残径」編碼改掉,改成「残:一弓戈十」,「径:竹人弓戈一」。

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 7日 15:28
鶴飛四季
ejsoon 写了: 2022年 12月 7日 00:37
鶴飛四季 写了: 2022年 12月 6日 22:43 如果Unicode當初沒有亂搞收字原則,就沒有必要補全字形了。
那你認為應該把「黄黃」合並成一個,還是要把「廣鐄簧」等分成兩個?
我想把含「黃」的、能一眼看出是繁體字的如廣、鐄只編成一個Unicode,其他的編兩個Unicode

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 8日 16:49
ejsoon
鶴飛四季 写了: 2022年 12月 7日 15:28 我想把含「黃」的、能一眼看出是繁體字的如廣、鐄只編成一個Unicode,其他的編兩個Unicode
我也認為unicode本該做的更好。但是我的看法與你不同,我認為「黄黃」不應分成兩個,因為它們不是簡繁關係。所有異體都應合並,包括「曹曺」等。

這其實是前面講的source-code separation,「黄黃」分開收錄在unicode1.1之前是允許的,之後就不會再為同一個字的不同寫法編兩個碼了。(雖然好像一直沒怎麼遵守…)

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 16日 23:32
鶴飛四季
「雨」字編碼是否跟陸標?因為港標、臺標裡面的四筆不是相同的由左上至右下的點。
图片

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 17日 10:50
ejsoon
鶴飛四季 写了: 2022年 12月 16日 23:32 「雨」字編碼是否跟陸標?因為港標、臺標裡面的四筆不是相同的由左上至右下的點。
图片
臺標有很多字叛經離道,朱邦復沒有跟,我也就不跟。

不過雨字頭的第二碼要視為
横水
横水
才行,否則按現代標準,
蒙蔽
蒙蔽
是沒有包含作用的。

Re: unicode兩岸不同字型,如何取碼?

发表于 : 2022年 12月 17日 14:47
鶴飛四季

臺標有很多字叛經離道,朱邦復沒有跟,我也就不跟。

不過雨字頭的第二碼要視為
横水
横水
才行,否則按現代標準,
蒙蔽
蒙蔽
是沒有包含作用的。
豈不是所有含「⻗」結構的字的編碼都要改?