分页: 1 / 1

輸入unicode擴展區所有漢字

发表于 : 2022年 12月 9日 10:48
ejsoon
當前,unicode已經發展到了H區,真是人類資源的極大浪費!

unicode15說明:
https://www.unicode.org/charts/

H區說明:
https://www.unicode.org/charts/PDF/U31350.pdf


那麼,如何顯示這些漢字?

字體網站zhs.glyphwiki.org/提供了這個服務,你只需要把一個漢字的十六進制貼進以下網址:https://zhs.glyphwiki.org/glyph/u十六進制.svg,再囊括進img中即可。示例:

图片

注意要把十六進制中的英文轉成小寫。


如何查一個漢字的unicode十六進制?

很多網站提供unicode查詢:


如何更優雅的在本論壇使用glyph的字體服務?

如果壇主@圈宝有空且願意加上這個bbcode(已添加,感謝!),那麼我們就可以這樣:

[ gh ] 3142e [ /gh ]

顯示上面的漢字。還可以指定字體大小:

[ gh=120 ] 3142e [ /gh ]

就是120px的大小。

bbcode:

代码: 全选

[gh={NUMBER;defaultValue=36}]{TEXT}[/gh]
html:

代码: 全选

<img src="https://zhs.glyphwiki.org/glyph/u{TEXT}.svg" style="width: {NUMBER}px; display: inline;" alt="{TEXT}">
help line:

代码: 全选

glyph font, http://zhs.glyphwiki.org/

Re: 輸入unicode擴展區所有漢字

发表于 : 2022年 12月 9日 10:52
ejsoon
glyph字體確實很好看,比I.明體、hana明體都要好看,但是不知道有沒有提供.ttf格式下載到本地。

同時,本帖好像發重了?管理員可否幫忙刪掉重覆然後移到IT區?謝謝!

Re: 輸入unicode擴展區所有漢字

发表于 : 2022年 12月 9日 11:17
圈宝
已添加

bbcode使用的时候不要带空格

代码: 全选

#无效
[ gh=120 ] 3142e [ /gh ]
#有效
[gh=120]597d[/gh]
[gh]8b80[/gh]

Re: 輸入unicode擴展區所有漢字

发表于 : 2022年 12月 9日 12:14
ejsoon
圈宝 写了: 2022年 12月 9日 11:17 已添加

bbcode使用的时候不要带空格

代码: 全选

#无效
[ gh=120 ] 3142e [ /gh ]
#有效
[gh=120]597d[/gh]
[gh]8b80[/gh]


我上面帶空格是為了說明。 :mrgreen:

Re: 輸入unicode擴展區所有漢字

发表于 : 2023年 3月 6日 13:08
鶴飛四季
其實UNICODE本可以把日常用不到的字不編碼,而是弄成SVG供用戶複製,那該有多好,並且在外國文字方面,UNICODE也不應該收絕跡的古代文字,因為能參與文字考古的人很少。

Re: 輸入unicode擴展區所有漢字

发表于 : 2023年 3月 8日 07:24
ejsoon
鶴飛四季 写了: 2023年 3月 6日 13:08 其實UNICODE本可以把日常用不到的字不編碼,而是弄成SVG供用戶複製,那該有多好,並且在外國文字方面,UNICODE也不應該收絕跡的古代文字,因為能參與文字考古的人很少。
unicode 也只是一種參考標準,特別是越後面的版本就越是「參考」。

如你所述,假設我們確實缺字時,可以使用圖片,不管svg還是png。

現實情況也正是如此,當我們想表述一個奇怪的字形時,通常我們不會去查unicode擴展區是否收錄這個字,而是考慮使用圖片。

何況很少有人知道怎麼通過某種(想像中的)字形去找到它的unicode,去確認unicode是否收錄。

即使我們找到了那個unicode,如果它存在於unicode cjk extBCDEFGH這些區域,我更傾向於拿到該字的svg圖片,而不是直接輸入這個字。

因為直接輸入該字,會導致很多人的手機等設備看不到這個字,還有數據庫是否支持的問題。

我感覺我說話越來越像AI了。

Re: 輸入unicode擴展區所有漢字

发表于 : 2023年 3月 8日 23:17
鶴飛四季
ejsoon 写了: 2023年 3月 8日 07:24
鶴飛四季 写了: 2023年 3月 6日 13:08 其實UNICODE本可以把日常用不到的字不編碼,而是弄成SVG供用戶複製,那該有多好,並且在外國文字方面,UNICODE也不應該收絕跡的古代文字,因為能參與文字考古的人很少。
unicode 也只是一種參考標準,特別是越後面的版本就越是「參考」。

如你所述,假設我們確實缺字時,可以使用圖片,不管svg還是png。

現實情況也正是如此,當我們想表述一個奇怪的字形時,通常我們不會去查unicode擴展區是否收錄這個字,而是考慮使用圖片。

何況很少有人知道怎麼通過某種(想像中的)字形去找到它的unicode,去確認unicode是否收錄。

即使我們找到了那個unicode,如果它存在於unicode cjk extBCDEFGH這些區域,我更傾向於拿到該字的svg圖片,而不是直接輸入這個字。

因為直接輸入該字,會導致很多人的手機等設備看不到這個字,還有數據庫是否支持的問題。

我感覺我說話越來越像AI了。
我覺得如果搞倉頡反查Unicode就能解決這個問題,就是先輸入倉頡碼,找出對應的Unicode。

Re: 輸入unicode擴展區所有漢字

发表于 : 2023年 3月 9日 12:19
ejsoon
鶴飛四季 写了: 2023年 3月 8日 23:17
ejsoon 写了: 2023年 3月 8日 07:24
鶴飛四季 写了: 2023年 3月 6日 13:08 其實UNICODE本可以把日常用不到的字不編碼,而是弄成SVG供用戶複製,那該有多好,並且在外國文字方面,UNICODE也不應該收絕跡的古代文字,因為能參與文字考古的人很少。
unicode 也只是一種參考標準,特別是越後面的版本就越是「參考」。

如你所述,假設我們確實缺字時,可以使用圖片,不管svg還是png。

現實情況也正是如此,當我們想表述一個奇怪的字形時,通常我們不會去查unicode擴展區是否收錄這個字,而是考慮使用圖片。

何況很少有人知道怎麼通過某種(想像中的)字形去找到它的unicode,去確認unicode是否收錄。

即使我們找到了那個unicode,如果它存在於unicode cjk extBCDEFGH這些區域,我更傾向於拿到該字的svg圖片,而不是直接輸入這個字。

因為直接輸入該字,會導致很多人的手機等設備看不到這個字,還有數據庫是否支持的問題。

我感覺我說話越來越像AI了。
我覺得如果搞倉頡反查Unicode就能解決這個問題,就是先輸入倉頡碼,找出對應的Unicode。
倉頡反查只對懂倉頡輸入法的人有用,並且還需要有志人士花時間精力來製作。

同時,不少漢字字形因為過於奇怪,倉頡取碼並不唯一。倉頡對於連體分體有不同的取碼,而某些字形的結構判定並未能有絕對統一的意見(如垕的口土有沒有相接)。

倉頡本身也不是專為unicode定製的輸入法(當然因為unicode濫收也無法定製),倉頡乃至任何的形碼輸入法,對於字集的處理範圍也是有極限的。

對於倉頡而言,因為朱邦復當時統計的是康熙字典四萬字,則對應的unicode cjk 20902字處理起來是游刃有餘的。extA有五六千字,如有需要可以並入或需要時再切換碼表。

但是extB直接就有四萬多字,也就是說,從extB開始,unicode的收字已經超出了倉頡的處理能力範圍。如果連倉頡都不能,那其它輸入法就更加不能了。

當然,編碼是可以編的,想編多少都行,像馬拉錘和jackchow那樣按他們的理解編。但「能編碼」跟「能處理」是兩個完全不同的話題,以重碼及實用重碼為指標,當重碼超出某個閥值,我們認為它的準確度就很低了,而準確度一低,就不再能稱作形碼,失去了形碼的優勢。

現在99%的人都在用的拼音,根本不考慮這些生僻字。99%的人,連次生僻字都很難操作。那拼音輸入法為甚麼還沒有被淘汰?說明它並不涉及到實際生活及工業生産社會運作的任何關鍵層面。

因此輸入法群組的不少人,對unicode的每一個字都過於偏執了。

實際上unicode是有梯度的,unicode cjk佔了整個梯度的99%,剩餘的都是些渣渣。

我認為我們應該用「梯度」思維來理解unicode,而不是「平行」思維。unicode extB(含)往後的字,基本上我們都可以直接無視了。