版面规则
公正客觀講理,杜絶廢話連篇
公正客觀講理,杜絶廢話連篇
解決同形分化字重碼的一個辦法
尹倉現在對unicode同形分化字採用把同屬一個輔助字形拆分的辦法來分開編碼以降低重碼,提升打字的準確性。但是這也産生了一個問題,被分化的字,很可能不能算作是對的編碼。
比如「肦」的編碼「bmcsh」一般就認為是錯碼。「內」編作「obh」會被認為是編錯碼,不符合倉頡規則。
今想到一個解決辦法,那就是:同形分化的編碼作為附帶補充的編碼加入。則打「ob2」也可以出「內」,打「obh」也可以。也不會再有編碼錯誤的嫌疑了。
不過「非筆劃字元」仍然是標準編碼,比如「入七曰釒士艹卄廾冃朩氵」等。
另「类」的「fdik」也應作為「補充編碼」。
作為「補充編碼」,其添加的自由度就高很多,可以不必受原始編碼和字形的約束。比如我想為「杀」添加「kid」這個編碼,那我可能就願意補充進去。
同時「瑶遥謡」日標也應作為「補充編碼」。
後面我需要整理一下哪些字的編碼要歸入「補充編碼」中。
「補充編碼」跟馬拉錘、jackchows的一字多碼是有本質區別的,補充編碼僅是為了去重,跟「尹末去重」一樣,它不作為碼表的主要部份。碼表的主體仍然在unicode cjk 20902字內一字一碼,尹倉仍然是一個一字一碼的碼表。
比如「肦」的編碼「bmcsh」一般就認為是錯碼。「內」編作「obh」會被認為是編錯碼,不符合倉頡規則。
今想到一個解決辦法,那就是:同形分化的編碼作為附帶補充的編碼加入。則打「ob2」也可以出「內」,打「obh」也可以。也不會再有編碼錯誤的嫌疑了。
不過「非筆劃字元」仍然是標準編碼,比如「入七曰釒士艹卄廾冃朩氵」等。
另「类」的「fdik」也應作為「補充編碼」。
作為「補充編碼」,其添加的自由度就高很多,可以不必受原始編碼和字形的約束。比如我想為「杀」添加「kid」這個編碼,那我可能就願意補充進去。
同時「瑶遥謡」日標也應作為「補充編碼」。
後面我需要整理一下哪些字的編碼要歸入「補充編碼」中。
「補充編碼」跟馬拉錘、jackchows的一字多碼是有本質區別的,補充編碼僅是為了去重,跟「尹末去重」一樣,它不作為碼表的主要部份。碼表的主體仍然在unicode cjk 20902字內一字一碼,尹倉仍然是一個一字一碼的碼表。
https://ejsoon.vip/
弈趣極光:享受思維樂趣
弈趣極光:享受思維樂趣
Re: 解決同形分化字重碼的一個辦法
在「淚」因跟「激」重碼而改碼後,我有時也會覺的,一些戶用臺標,一些用陸標,挺混亂的。
如果碼表主體統一用臺標,為了去重而改為陸標的字的編碼僅作為補充,則碼表主體的編碼字型就不會混亂,同時也實現了用不同字型編碼的方法去重的目標。
也就是說,「激淚」在主體仍然是重碼,但是也能通過打陸標「eisk淚」首字上屏。
如果碼表主體統一用臺標,為了去重而改為陸標的字的編碼僅作為補充,則碼表主體的編碼字型就不會混亂,同時也實現了用不同字型編碼的方法去重的目標。
也就是說,「激淚」在主體仍然是重碼,但是也能通過打陸標「eisk淚」首字上屏。
https://ejsoon.vip/
弈趣極光:享受思維樂趣
弈趣極光:享受思維樂趣
Re: 解決同形分化字重碼的一個辦法
「苟茍」卻不是同形分化,而是兩個不同的字。
同形分化只限於相同的字元構成的漢字。比如「汨汩」。
「墫墫」這組仍然不能入選,因為「土」跟「士」是不同的字元。
同形分化只限於相同的字元構成的漢字。比如「汨汩」。
「墫墫」這組仍然不能入選,因為「土」跟「士」是不同的字元。
https://ejsoon.vip/
弈趣極光:享受思維樂趣
弈趣極光:享受思維樂趣
Re: 解決同形分化字重碼的一個辦法
不能吧,三倉都作區分的
Re: 解決同形分化字重碼的一個辦法
這個也可以,但也有些人習慣純一字一碼,不妨弄兩種版本的碼表供用戶自行選擇。
Re: 解決同形分化字重碼的一個辦法
主體仍是20902字,一字一碼。「同形分化」的編碼會加在「尹末去重」的後面。碼表仍然是一字一碼。「同形分化」只是一種去重方法,「尹末去重」同理。
https://ejsoon.vip/
弈趣極光:享受思維樂趣
弈趣極光:享受思維樂趣
-
- 相似主题
- 回复总数
- 阅读次数
- 最新帖子
在线用户
正浏览此版面之用户: 没有注册用户 和 1 访客

