日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

用paddleocr识别汉字_汉字设计中的度量标准(三)

發布時間:2024/10/14 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 用paddleocr识别汉字_汉字设计中的度量标准(三) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

x 高度、大寫字母高度、

上升部高度、下降部高度、

字干粗細、字身傾斜角度……

這些參數是今天衡量、描述

一款西文字體最基本的度量標準,

并由此將西文字體帶向參數化與可變字體。

回顧漢字設計,我們是不是也可以厘清、歸納出

一系列漢字字體設計中的度量標準呢?

《漢字設計中的度量標準》為三篇系列文章。在第一篇中,我們比較式地回顧了中西文字體設計的發展過程,不論對于什么文種的字體設計而言,metrics 的底層邏輯是否清晰與豐富,對應著設計作品的多樣化與可能性。同時,我們枚舉了現有中文字體設計知識結構中有哪些 metrics 以及它們是怎么來的。

在第二篇中,我們從第二中心線的反思開始,追溯了豎向書寫與排版的漢字構造的歷史,以及金屬活字技術與橫排對近代漢字設計的重大影響。第二中心線似乎不太好用,而方塊鉛字與橫排的影響已經進入了幾乎所有中文字體設計師的默認設定,讓他們創新的步伐顯得越來越沉重。

在第三篇中,讓我們先繼續回到60年代,看看另外一個尚未被充分討論的發明——字面大小的視覺范圍框。

視覺識別范圍

基于第二中心線,徐學成重新設計了繪制漢字的稿紙,他在字身框與字面框之內,又加了一個框——他稱之為「字面大小的視覺范圍框」。根據筆者的理解,也就是指漢字可以被視覺識別的主要范圍。需要指出的是,在此徐學成使用了「字面」這一術語,其具有兩層意思:既指字面框,又指代了漢字的「視覺識別范圍」,前者可以被設定與測量,而后者是一個模糊的區域,雖然有一個視覺識別框線,但依舊需要根據不同的字作出判斷。一個術語的兩層意思導致了需要根據具體語境自行判斷,其沿用至今,某種程度上造成了中文字體設計領域對于概念的混淆。筆者在下文中將使用「視覺識別范圍」展開討論。

如果說第二中心線是從文字的結構出發,視覺識別范圍則顯然是從空間出發,兼顧了縱橫排版時的閱讀效果。徐學成一生撰寫過多篇字體設計方法論的文章,總結出了「穩、整、勻」的三字方針,從他的文章中可以看出,他是少數從排版角度思考字體設計的人。

徐學成提出的「視覺識別范圍」是否科學,是否僅僅適用于漢字?在展開討論之前,讓我們先看看其他文字的情況。首先從我們最熟悉的拉丁字母開始。

以英語為例,使用拉丁字母,其書寫與排印的方式為從左向右,以數量不等的字母組成單詞,單詞之間添加空格,組成句子。西文字體設計中最重要的部分,莫過于所謂的「x-字高」,它是以小寫字母 x 的高度為標準而確定的。以 x-字高為基準,在一行文字的肌理中,字母的上升與下降部分,分別向上與向下參差開去,而沿著閱讀方向保持穩定不變的,則是 x-字高所形成的「閱讀識別帶」。

不論是從左向右的拉丁字母,還是從右向左的阿拉伯字母,甚至是從左向右豎排的蒙古文字母,經歷了幾千年各自的發展,沿著閱讀的方向,都殊途同歸地形成了一條「閱讀識別帶」。

讓我們回到漢字,來找尋一下漢字排版中的「閱讀識別帶」到底在哪吧!我們把徐學成當年的發明,即視覺識別框到字面框之間的空間,拆解成縱橫兩個方向,分別進行遮擋實驗,看看會有什么結果。

漢字的左與右

我們先在豎排的情況下遮擋漢字的左與右。左右遮擋的原則是盡可能地往中間靠攏,直到觸及識讀的邊緣。如果再往內收,則「出」可能會與「土」混淆;「心」和「業」會變得陌生。

我們再反過來,把遮擋的區域疊加到原有文字上,可以被立即識讀出的字幾乎沒有了。由此得到的對于豎排漢字更為重要的縱向視覺識別范圍,我們稱之為「縱向核心區域」。

如前一篇所述,漢字在幾千年中一直處于豎向書寫與排印的狀態,這種方式又反過來影響了文字的造型。在楷書中把豎筆稱為「懸針豎」,其底部收筆尖銳,如針倒懸,而起筆則凝滯粗鈍。而撇捺的起筆與收筆也具有類似的特征。中國人為什么不把橫的收筆也寫成像針一樣尖銳呢?除了少數書法作品之外,這樣的寫法并不常見。豎畫的起筆頓挫而收筆尖銳,可以引導視線繼續下移閱讀;橫畫的起筆和收筆都有頓挫,其原因則是為了劃定文字的左右邊界,向眼睛暗示視線的停止。不論是我們熟悉的書法作品,還是印刷字體,大部分的字,都遵循著「橫細豎粗」的規律,可見豎比橫更為重要。

在豎排的語境中經歷千年的漢字,存在大量縱向的筆畫(豎、撇、捺、點),它們不斷引導著漢字閱讀者的視線上下移動。讓我們做一個簡單的實驗,摘取一段文本,分別將它們橫向與縱向的筆畫標記出來,看看我們是否依然能讀出些什么?

你能在哪邊的文本中,讀出更多的字?這背后的原理又是什么?

縱向書寫與排印的方式影響了文字的構成。根據筆者的粗略統計,在國標 GB2312 的 6763 個漢字中,左右或左中右結構的為 4307 個,占 64%,上下或上中下結構的占 22.5%,包圍結構的占 8%,剩下 5.5%為獨體字。為什么常用漢字中,左右或左中右結構的字占大多數呢?與傳統的書寫 / 閱讀的方式有關。

漢字的上與下

當漢字被橫排之后,原本并不成問題的閱讀識別一下子變得十分突出,嚴峻地擺在了中國第一代字體設計師們的面前。他們不得不借用了書法中的種種概念,包括——重心,將其高低一致作為評判漢字設計的標準之一。為豎寫、豎排而生的漢字,其結構原本并沒有考慮到橫向排版的識別問題,如「甲、申、由」,其中的「田」分別位于上、中、下的 位置,在豎寫或豎排時,只需保持三個字上下對齊,閱讀起來就十分順暢;而一旦切換到橫排的語境中,則無論如何調整,也無法避免視線的上下跳躍。因此,「重心」這一概念也面臨著與「第二中心線」同樣的窘境——理解因人而異,無法準確定位與測量。

再多的「重心調整」,也難以改變在橫向閱讀「甲申由」時視線的跳躍

水平閱讀時讓視線忽高忽低的漢字,是一種錯誤嗎?它們嚴重影響到了我們的閱讀嗎?我們是否應該對那些不符合「標準」的漢字采取革命行動,加以改造,讓它們「重新做字」呢?是也不是。也許再過幾百年,漢字的形態會在持續的使用過程中,被打磨出更適應于橫排吧。

事實上,我們現在閱讀橫排漢字時,并沒有感覺到什么不適。視覺的習慣起到了很大的作用,而一代代字體設計師們悄悄的努力才是背后的原因。

漢字從豎排進入橫排的時代,如果說豎排時代豎向的筆畫起到了引導視線的作用,對于橫排的漢字來說,橫筆則起到了同樣的引導作用,其高低位置最為關鍵。

不同字的橫筆數量差異巨大,橫筆越多的字往往越高

筆者曾經選取五款不同廠家的黑體,對橫筆從少到多的64個漢字進行了比對試驗與統計。結果顯示,在字面框頂部與底部的橫筆,都有一個上下浮動的區間。把這個區間遮擋起來,我們依舊能識別出幾乎所有的漢字。「鼎、骨、冒」是幾款黑體中都有較高橫筆的字,「亮、九、過」則是橫向筆畫較低的字。通過遮擋試驗,我們可以得到極限的縱向可識別區域。而當我們用這個區域去遮擋橫筆較少的字,如「口、二、田、三、彐、國」等字的時候,則具有完全的可識別性。

由此我們得到了對于橫排漢字更為重要的橫向視覺識別范圍,我們稱之為「橫向核心區域」。

修剪樹枝

根據遮擋試驗,我們可以測量出一套字體中,對于幾乎所有漢字都適用的縱向與橫向核心區域(除去筆畫數量極多的非常用漢字)。同時,我們也必須清醒地意識到,縱向與橫向的核心區域,也是因字而異的。

造成這一現象的原因是漢字的橫排與被人為設計的歷史實在太過短暫,而為數不多代的字體設計師們雖然有模糊的對齊意識,卻又無法完全擺脫幾千年來豎寫漢字形成的審美觀。而漢字的美學觀,又與跨越時空的文化心理、身份認同有關。我們常常能聽到似乎相互矛盾的口號:「中國人、方正字」vs「漢字不是方的」。

相比于漢字,異常年輕的現代中文字體設計與排印歷史

讓我們回到在遮擋實驗中被忽略的部分——那些被遮擋住的筆畫。為什么擋住了它們,我們依舊能識別出是什么字?我們可以把被擋住的部分想象成需要修剪的樹枝,而核心區域內則是主干樹枝。當漢字豎向書寫與排列時,猶如自然生長的樹木,在離開地面不斷指向天空的同時,也在向四周的空間伸出自己的枝椏。修剪枝椏并不會影響主干的生長,枝椏的長短、造型卻可以塑造樹冠的造型。當漢字變成橫排時,橫向筆畫轉換成了主干,而縱向發展的筆畫則變成了枝椏。

我們可以參照西文字母的設計,在它們的橫向核心區域——x高度的上下,不同的字母伸展出各自的枝葉。把枝椏變長或者變短,看起來沒太大區別(a)。作為對照,當我們把x高度變大的時候,在總高度(上伸部基準線到下降部基準線的距離)不變的情況下,字母看起來卻明顯變大了很多(b)。

我們同樣可以把漢字做類似的變化,在橫向核心區域上下的筆畫,可以隨意的拉伸或裁剪,對文字本身的影響有限的(a)。而當我們保持枝椏部分不變,增大橫向核心區域的高度時,字則明顯變長(b)。

在核心識別區域之外的筆畫,可以在上下與左右兩個方向拉伸與變形,而絲毫不影響原本文字的識別性。老一代的字體設計師、美術字高手們,早就領悟到了這個原理,在徐學成的幾本關于美術字的著作中,都例舉了類似的文字變形方式。

《美術字薈萃》,徐學成,2000

從術語到初始設定

作為三篇文章的結尾,我們建議采用以下新舊術語來思考與描述漢字的設計,并在我們開始設計一套包含漢字的字體之前,作為預先需要確定下來的基本條件:

1. 字身框的寬窄與高低

正方形字身框的漢字字體已經夠多了,是時候考慮或寬或窄的字體了,對于現代化的超大字體家族而言,寬窄的變化也是必須的。另一個可以探索的方向,則是不等寬、不等高、不等寬也不等高的字身框。希望在不久的將來,我們能看到專為橫排或豎排優化設計的比例寬度(proportional)的中文字體。

2. 漢字的左右與上下邊距

字面框到字身框的距離的兩倍,等于默認的漢字間距。我們可以把這段距離理解成西文中的字母邊距(side bearing)。漢字可以縱橫排列,所以不僅有左右的字邊距,還有上下的字邊距,它們都應該可以被分別設定。現有的字身框不是一個固定的百分比,就是一個固定的數值,但是漢字在橫排與豎排時的情況并不一樣,設置成一樣的數值,最后的視覺效果卻未必是看起來一樣的。如果我們將字面框轉化成左右與上下的字邊距,則對排版的控制力一下子就增強了很多——既可以根據設計需求,設置成橫排與豎排時視覺間距接近,也可以設置成視覺上不同。

3. 橫向與縱向軸線的位置

4. 橫向核心區域的厚度

一套字體中最高與最低橫筆之間空間的最大公約數。

5. 縱向核心區域的寬度

一套字體中最左與最右豎筆之間空間的最大公約數。

6. 與字母、數字的匹配

中國國家標準規定的中文字體,不僅僅只包含漢字,還必須包含拉丁字母以及阿拉伯數字,甚至是西里爾字母、希臘字母等。一套字體中的字母、數字與漢字的大小比例關系是今天的中文字體設計師無法回避的課題,與漢字相對應的字母基線、x高度基準線、上伸部與下降部的基準線、大寫字母高度線,也就必不可少了。對于西方的字體設計師來說,他們可以設計一套只包含拉丁字母的西文字體;但對于中文字體設計師而言,我們必須在設計漢字的同時,至少還要設計出匹配的拉丁字母。

除了上述6點以外,筆畫的粗細與對比度、筆型的設計、骨架的風格,甚至是字身框傾斜的角度、豎排時拉丁字母和數字的上下邊距與字偶間距等等,也都是在開發一款中文字體時,必須考慮的內容。

參數化漢字設計之路

可變字體的變量軸,隨著軸的數量增加,其拓撲結構也變得復雜

參數化設計作為一種設計方法與工具,在今天已經進入了設計的各個領域,不論是較早開始的多媒體設計、工業設計,還是建筑設計、服裝設計。使用量化可控的變量參數,可以在數學邏輯的層面對所有的結果進行篩選,并快速優化迭代。這種方式讓設計作為一門手藝,更多依靠長期經驗積累的歷史,發生了改變。

數字技術的出現,讓曾經為印刷工業服務的字體設計,徹底變樣。赫拉爾德·因赫爾(Gerard Unger, 1942–2018)在他的 Theory of Type Design 一書中認為,在數字化時代下的字體設計,從多工種協作的復雜工作,變回了一門可以僅僅依靠單人就能完成的工作,字體設計終于變成了一門手工藝。

誠然,在掌握新的數字化工具時,我們當然需要學習、練習,甚至改造自己的工具,這些行為都可以被歸于手工藝的范疇。赫拉爾德在書中的判斷,前提當然指的是西方的字體設計。然而對于漢字設計來說,不論是中國,還是我們的近鄰日本與韓國,至今為止的設計方法論,還停留在早期工業時代,而我們的工具則已經進入了數字化時代。這種大腦與身體相隔十萬八千里的情況,讓今天的漢字設計圈在面對新技術新工具的時候,只能以沉默應對。

漢字的 metrics 是參數化設計的底層邏輯,希望這一系列的三篇文章,能拋磚引玉,給相關從業者以新的啟發,促進技術與設計方法論的融合并進。

使用40個母版制作,包含5個變量軸的可變「永」字


關于作者

厲致謙(colourphilosophy/cp)|豆瓣||Instagram

以設計為原點的多領域的研究和實踐者,然并卵;「上海活字」項目發起人,3type聯合創始人,The Type 撰稿人。

總結

以上是生活随笔為你收集整理的用paddleocr识别汉字_汉字设计中的度量标准(三)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。