輸入unicode擴展區所有漢字

分享讨论IT相关的内容
回复
头像
ejsoon
圈圈精英
圈圈精英
帖子: 2173
注册时间: 2022年 11月 18日 17:36
为圈友点赞: 96 次
被赞次数: 92 次
联系:

輸入unicode擴展區所有漢字

帖子 ejsoon »

當前,unicode已經發展到了H區,真是人類資源的極大浪費!

unicode15說明:
https://www.unicode.org/charts/

H區說明:
https://www.unicode.org/charts/PDF/U31350.pdf


那麼,如何顯示這些漢字?

字體網站zhs.glyphwiki.org/提供了這個服務,你只需要把一個漢字的十六進制貼進以下網址:https://zhs.glyphwiki.org/glyph/u十六進制.svg,再囊括進img中即可。示例:

图片

注意要把十六進制中的英文轉成小寫。


如何查一個漢字的unicode十六進制?

很多網站提供unicode查詢:


如何更優雅的在本論壇使用glyph的字體服務?

如果壇主@圈宝有空且願意加上這個bbcode(已添加,感謝!),那麼我們就可以這樣:

[ gh ] 3142e [ /gh ]

顯示上面的漢字。還可以指定字體大小:

[ gh=120 ] 3142e [ /gh ]

就是120px的大小。

bbcode:

代码: 全选

[gh={NUMBER;defaultValue=36}]{TEXT}[/gh]
html:

代码: 全选

<img src="https://zhs.glyphwiki.org/glyph/u{TEXT}.svg" style="width: {NUMBER}px; display: inline;" alt="{TEXT}">
help line:

代码: 全选

glyph font, http://zhs.glyphwiki.org/
上次由 ejsoon 在 2022年 12月 9日 12:16,总共编辑 2 次。
https://ejsoon.win/
天蒼人頡:發掘好玩事物
头像
ejsoon
圈圈精英
圈圈精英
帖子: 2173
注册时间: 2022年 11月 18日 17:36
为圈友点赞: 96 次
被赞次数: 92 次
联系:

Re: 輸入unicode擴展區所有漢字

帖子 ejsoon »

glyph字體確實很好看,比I.明體、hana明體都要好看,但是不知道有沒有提供.ttf格式下載到本地。

同時,本帖好像發重了?管理員可否幫忙刪掉重覆然後移到IT區?謝謝!
https://ejsoon.win/
天蒼人頡:發掘好玩事物
头像
圈宝
圈圈守护者
圈圈守护者
帖子: 75
注册时间: 2020年 12月 4日 20:46
我的状态: 🎯
为圈友点赞: 87 次
被赞次数: 17 次

Re: 輸入unicode擴展區所有漢字

帖子 圈宝 »

已添加

bbcode使用的时候不要带空格

代码: 全选

#无效
[ gh=120 ] 3142e [ /gh ]
#有效
[gh=120]597d[/gh]
[gh]8b80[/gh]
当时明月在,曾照彩云归
头像
ejsoon
圈圈精英
圈圈精英
帖子: 2173
注册时间: 2022年 11月 18日 17:36
为圈友点赞: 96 次
被赞次数: 92 次
联系:

Re: 輸入unicode擴展區所有漢字

帖子 ejsoon »

圈宝 写了: 2022年 12月 9日 11:17 已添加

bbcode使用的时候不要带空格

代码: 全选

#无效
[ gh=120 ] 3142e [ /gh ]
#有效
[gh=120]597d[/gh]
[gh]8b80[/gh]


我上面帶空格是為了說明。 :mrgreen:
https://ejsoon.win/
天蒼人頡:發掘好玩事物
鶴飛四季
锋芒初露
锋芒初露
帖子: 667
注册时间: 2022年 12月 1日 09:43
为圈友点赞: 3 次
被赞次数: 32 次

Re: 輸入unicode擴展區所有漢字

帖子 鶴飛四季 »

其實UNICODE本可以把日常用不到的字不編碼,而是弄成SVG供用戶複製,那該有多好,並且在外國文字方面,UNICODE也不應該收絕跡的古代文字,因為能參與文字考古的人很少。
头像
ejsoon
圈圈精英
圈圈精英
帖子: 2173
注册时间: 2022年 11月 18日 17:36
为圈友点赞: 96 次
被赞次数: 92 次
联系:

Re: 輸入unicode擴展區所有漢字

帖子 ejsoon »

鶴飛四季 写了: 2023年 3月 6日 13:08 其實UNICODE本可以把日常用不到的字不編碼,而是弄成SVG供用戶複製,那該有多好,並且在外國文字方面,UNICODE也不應該收絕跡的古代文字,因為能參與文字考古的人很少。
unicode 也只是一種參考標準,特別是越後面的版本就越是「參考」。

如你所述,假設我們確實缺字時,可以使用圖片,不管svg還是png。

現實情況也正是如此,當我們想表述一個奇怪的字形時,通常我們不會去查unicode擴展區是否收錄這個字,而是考慮使用圖片。

何況很少有人知道怎麼通過某種(想像中的)字形去找到它的unicode,去確認unicode是否收錄。

即使我們找到了那個unicode,如果它存在於unicode cjk extBCDEFGH這些區域,我更傾向於拿到該字的svg圖片,而不是直接輸入這個字。

因為直接輸入該字,會導致很多人的手機等設備看不到這個字,還有數據庫是否支持的問題。

我感覺我說話越來越像AI了。
https://ejsoon.win/
天蒼人頡:發掘好玩事物
鶴飛四季
锋芒初露
锋芒初露
帖子: 667
注册时间: 2022年 12月 1日 09:43
为圈友点赞: 3 次
被赞次数: 32 次

Re: 輸入unicode擴展區所有漢字

帖子 鶴飛四季 »

ejsoon 写了: 2023年 3月 8日 07:24
鶴飛四季 写了: 2023年 3月 6日 13:08 其實UNICODE本可以把日常用不到的字不編碼,而是弄成SVG供用戶複製,那該有多好,並且在外國文字方面,UNICODE也不應該收絕跡的古代文字,因為能參與文字考古的人很少。
unicode 也只是一種參考標準,特別是越後面的版本就越是「參考」。

如你所述,假設我們確實缺字時,可以使用圖片,不管svg還是png。

現實情況也正是如此,當我們想表述一個奇怪的字形時,通常我們不會去查unicode擴展區是否收錄這個字,而是考慮使用圖片。

何況很少有人知道怎麼通過某種(想像中的)字形去找到它的unicode,去確認unicode是否收錄。

即使我們找到了那個unicode,如果它存在於unicode cjk extBCDEFGH這些區域,我更傾向於拿到該字的svg圖片,而不是直接輸入這個字。

因為直接輸入該字,會導致很多人的手機等設備看不到這個字,還有數據庫是否支持的問題。

我感覺我說話越來越像AI了。
我覺得如果搞倉頡反查Unicode就能解決這個問題,就是先輸入倉頡碼,找出對應的Unicode。
头像
ejsoon
圈圈精英
圈圈精英
帖子: 2173
注册时间: 2022年 11月 18日 17:36
为圈友点赞: 96 次
被赞次数: 92 次
联系:

Re: 輸入unicode擴展區所有漢字

帖子 ejsoon »

鶴飛四季 写了: 2023年 3月 8日 23:17
ejsoon 写了: 2023年 3月 8日 07:24
鶴飛四季 写了: 2023年 3月 6日 13:08 其實UNICODE本可以把日常用不到的字不編碼,而是弄成SVG供用戶複製,那該有多好,並且在外國文字方面,UNICODE也不應該收絕跡的古代文字,因為能參與文字考古的人很少。
unicode 也只是一種參考標準,特別是越後面的版本就越是「參考」。

如你所述,假設我們確實缺字時,可以使用圖片,不管svg還是png。

現實情況也正是如此,當我們想表述一個奇怪的字形時,通常我們不會去查unicode擴展區是否收錄這個字,而是考慮使用圖片。

何況很少有人知道怎麼通過某種(想像中的)字形去找到它的unicode,去確認unicode是否收錄。

即使我們找到了那個unicode,如果它存在於unicode cjk extBCDEFGH這些區域,我更傾向於拿到該字的svg圖片,而不是直接輸入這個字。

因為直接輸入該字,會導致很多人的手機等設備看不到這個字,還有數據庫是否支持的問題。

我感覺我說話越來越像AI了。
我覺得如果搞倉頡反查Unicode就能解決這個問題,就是先輸入倉頡碼,找出對應的Unicode。
倉頡反查只對懂倉頡輸入法的人有用,並且還需要有志人士花時間精力來製作。

同時,不少漢字字形因為過於奇怪,倉頡取碼並不唯一。倉頡對於連體分體有不同的取碼,而某些字形的結構判定並未能有絕對統一的意見(如垕的口土有沒有相接)。

倉頡本身也不是專為unicode定製的輸入法(當然因為unicode濫收也無法定製),倉頡乃至任何的形碼輸入法,對於字集的處理範圍也是有極限的。

對於倉頡而言,因為朱邦復當時統計的是康熙字典四萬字,則對應的unicode cjk 20902字處理起來是游刃有餘的。extA有五六千字,如有需要可以並入或需要時再切換碼表。

但是extB直接就有四萬多字,也就是說,從extB開始,unicode的收字已經超出了倉頡的處理能力範圍。如果連倉頡都不能,那其它輸入法就更加不能了。

當然,編碼是可以編的,想編多少都行,像馬拉錘和jackchow那樣按他們的理解編。但「能編碼」跟「能處理」是兩個完全不同的話題,以重碼及實用重碼為指標,當重碼超出某個閥值,我們認為它的準確度就很低了,而準確度一低,就不再能稱作形碼,失去了形碼的優勢。

現在99%的人都在用的拼音,根本不考慮這些生僻字。99%的人,連次生僻字都很難操作。那拼音輸入法為甚麼還沒有被淘汰?說明它並不涉及到實際生活及工業生産社會運作的任何關鍵層面。

因此輸入法群組的不少人,對unicode的每一個字都過於偏執了。

實際上unicode是有梯度的,unicode cjk佔了整個梯度的99%,剩餘的都是些渣渣。

我認為我們應該用「梯度」思維來理解unicode,而不是「平行」思維。unicode extB(含)往後的字,基本上我們都可以直接無視了。
https://ejsoon.win/
天蒼人頡:發掘好玩事物
回复

在线用户

正浏览此版面之用户: 没有注册用户 和 2 访客