網路城邦
回本城市首頁 家國主義 家主政治 中華家國
市長:梅峰健保免費公投  副市長: 早早安(顏俊家)子鳴Abr尉左
加入本城市推薦本城市加入我的最愛訂閱最新文章
udn城市政治社會政治時事【家國主義 家主政治 中華家國】城市/討論區/
討論區歷史文字 字體:
看回應文章  上一個討論主題 回文章列表 下一個討論主題
【漢字部件資料】(轉貼)談華文教學中漢語的「部件教學」
 瀏覽14,000|回應6推薦0

梅峰健保免費公投
等級:8
留言加入好友
談華文教學中漢語的“部件教學”
放大字體】【縮小字體】【列印稿件】 2008年03月05日 16:45 來源:中國華文教育網

    所謂“漢字部件”,即“現代漢字字形中,具有獨立組字能力的構字單位,它大於或等於筆畫,小于或等於整字。”(費錦昌《現代漢字部件探究》,《語言文字應用》1996.2)部件教學在華文教學中具有重要的意義,主要體現在漢字教學、詞彙教學和學習者自學等方面。但從現有的教學狀況來看,部件教學雖意義重大,卻未受到充分的重視,相反地存在著諸如:部件介紹零散、不成系統;部件教學過於隨意、缺少計劃性;忽視部件教授,由筆畫直接過度到整字或僅採取整字教學等問題。這樣的教學方式,給初級階段的、母語是拼音文字的學生識記漢字帶來了較大困難。

  本文首先對部件教學在華文教學中的意義作概括性分析,然後就如何進行部件教學提出一些看法和建議,旨在拋磚引玉,引起從教人員對漢字部件教學及其研究的重視。

    一、“部件教學”在華文漢字教學中的意義

  “部件教學”是華文漢字教學的基礎和重要內容,是一種最為有效的漢字教學法。

  首先,從漢字的形體來看,漢字是由不同數量、不同功能的部件依照不同的結構方式組合而成的。“漢字部件的數量、功能和組合方式(位置、置向、交接法),是每個漢字區別於其他漢字最重要的屬性,漢字的資訊量主要是由部件來體現的。”(王寧《漢字構形理據與現代漢字部件拆分》,《語文建設》1997.3)部件以有限的形式組合成大量的漢字,並依靠自身所負載的“構意功能”(表形、表義、示音、標示)來實現對漢字字義或字音的指示。可以說,部件教學是華文漢字教學的基礎內容,不通過部件,就無法對漢字進行講解。

  其次,從漢字教學的內容來看,漢字教學主要包括“字音、字形、字義”三個方面,其中字形分析是漢字教學的核心內容,我們可以通過分析字形,來指明字形與字義、字音的關係。字形分析即“結構分析”,漢字結構分為整字、部件、筆畫三個層級,部件是整字和筆畫的仲介,是結構的核心,因為“無論造字還是考字,都是從部件出發的。” (石定果《語言教學與研究》,《漢字研究與對外漢語教學》1997. 1)通過部件教學,可以讓學習者明白構成一個漢字的每個部件,對該字的字義和字音,或指示或曲折暗示,都有它特定的意義,從而促進學生對漢字特徵的了解,激發學生學習漢字的興趣,加速學生對漢字的識記和掌握。可見,部件教學在華文漢字教學中是十分重要的。

  此外,從華文漢字教學法的有效性對比情況來看,“部件教學”是其中之最。需要明確的是,這裡所謂的“有效性”指的是能夠提高學生識記漢字的速度。對於“部件教學”在華文漢字教學中的這一重要意義,我們可以從以下幾個方面來加以理解:

  第一,從漢語構形系統來看,“部件教學”是提高漢字教學效率的最可行方式。“組成漢字的構形元素不是無限的,而是可以歸納為一定數量的單位。”(梁彥民《漢字部件區別特徵與對外漢字教學》,《語言教學與研究》2004、6)有統計數字:7000個通用字中總共有246個意符,5631個形聲結構中包含了1325個不同的聲符,部件數量遠遠少於漢字總量。另外,246個意符中的54個構字能力很強的意符,構成了4898個形聲結構,約佔形聲結構總數的87%(陳原《現代漢語用字資訊分析》,上海教育出版社1993)。可見,部件教學可以化簡學生識記漢字的過程,減輕學生的記憶負擔,有效提高學生的認讀與書寫漢字的能力,是提高漢字教學效率的最可行方式。

  第二,漢字教學的三種常規模式的對比結果顯示:“部件教學”是最實用的漢字教學法。由現代漢字的三個構形層級(筆畫-部件-整字)決定,漢字教學的常規模式也有三種,即筆畫教學法、部件教學法和整字教學法。筆畫法較為傳統,在漢語母語教學中始終受到高度的重視,但在華文教學中卻遭到部分學習者的質疑,其原因:基本筆畫雖量少、簡單易記,但運用於加工筆畫較多的漢字時,卻不免過多過繁,而且還要時刻注意筆順。所以,筆畫法僅適用於筆畫簡約的獨體字,對於大部分合體字的加工,不僅沒有發揮出任何優勢,反而增加了學生的記憶負擔,不實用。整字法同筆畫法一樣,比較有效地作用於獨體字,若僅用整字法來進行漢字教學,難免出現難度過大的弊端。另外,漢字系統中合體字佔有相當比重。綜合各方面因素,介於筆畫法和整字法之間的部件法,既避免了筆畫法的繁瑣,又擺脫了整字法的高難度,可以說是對外漢字教學中最為實用的一種。

  第三,漢字系統中絕大部分字符的組合方式決定,“部件識記”法是一種快捷的漢字識記方式。有統計表明:7000個現代漢語通用字中,屬形聲結構的有5631個,約佔通用字總數的80.5%,這一偌大群體在整字的組合上,往往採用的是1+1的方式,即一個音符加一個意符。這樣的組合關係既簡單明瞭,又有音義關係的提示。基於這一語言事實,我們可以借助部件教學,充分發揮該組合關係對於漢字識記所產生的積極效應,創設一個利於識記的良好認知環境,這樣,學習者識記漢字顯然就容易、快捷得多了。

  二、“部件教學”在華文詞彙教學中的意義

  在華文詞彙教學中,“部件教學”最突出的意義在於有助於詞彙釋義。部件教學這一意義的呈現,主要是由漢語詞彙系統的構詞特點所決定的。

  漢語語素以單音節為基本形式,這些單音節基本上都是語義的承擔者,可以作為語素構成大量單音節詞。漢語的每個音節都與一個漢字相對應,也就是每個單音節詞在漢字系統中都存在著一個與之對應的漢字,由於漢字的表意功能,這個漢字在成為記錄該詞的符號的同時,也成為了該詞詞義的承載體。因此,漢字教學中的部件教學法可以直接作用於單音節詞的釋義教學。

  單音節如此,雙音節亦然。古、近代漢語的詞彙系統以單音節詞為主體,而現代漢語的詞彙系統則發生了雙音節化,雙音節逐漸佔據了優勢。雙音節詞的構成主要是通過廣泛運用詞根複合法來實現的,部件對單音節的釋義功能也就勢必會作用於雙音節詞。即使雙音節化的過程中,兩個單音節詞的詞義可能要經過雙音節詞義的選擇,但大部分部件所負載的意義資訊對詞義的指示作用仍然有不同程度的保留。

  總之,一方面漢字部件所承載的意義資訊能夠直接,並較充分地作用於漢字字義,另一方面根據漢語詞彙系統的構詞理據,漢字字義又可以影響詞彙意義的形成和表達,所以漢字部件教學是有助於詞彙意義的解釋和理解的。

三、“部件教學”是學生自學和閱讀的需要

  “部件教學”除了有益於漢字和詞彙的課堂教學外,對學生的課外自學和閱讀也是十分有益的。首先,部件的掌握是大部分學習者自學生字的需要。下面是兩組對初級上學習者所進行的自學生詞情況的調查統計:

  第一個問題是:碰到不知道讀音的漢字時,怎麼辦?

  查字典的17

  先問別人,後查字典的11

  算了(含有時候)的3

  調查人數30

  第二個問題是:碰到不知道讀音漢字,怎麼查字典?

  部首查字法的18

  電子詞典直接書寫法的6

  猜字義(音),母語反查字音(義)的 4

  調查人數30

  在第一組數據中,採取“算了”的態度的三個調查對象中,有一人是先問別人,再查字典,有時候算了;兩人不去查字典,只是問別人,或者算了。這一調查結果說明:在遇到不知讀音的漢字時,大部分學習者都要查字典。

  在第二組數據中,有兩名調查對象未對查字典的方式作選擇,不排除兩者在沒有可以直接書寫漢字的電子字典的情況下,對不知讀音的漢字無可奈何。從調查結果的數據來看,大部分學生是採用部首查字法來認識一個不知讀音的漢字的。

  從以上兩組調查統計數據,我們可以得出這樣的結論:由於漢字不是拼音文字,在只知字形不知讀音的情況下去認識一個漢字,絕大部分學習者要運用部首查字法來實現自己的自學目的。所以,從學習者自學生字的角度來看,進行部件教學是十分必要的。

  其次,漢字部件的理解和掌握也是學生提高閱讀能力的需要。制約漢語學習者閱讀能力提高的因素有很多,詞彙量少是其中之一。一篇文章中,如果出現一些不認識的字(詞)時,勢必要影響閱讀者對文章內容的理解和閱讀速度。對於這一難題,加強詞彙識記、訓練,提高詞彙量雖是根本,但即便是漢語功底很好的操漢語的中國人,在廣泛的閱讀當中遇到不認識的字詞也是在所難免的,何況我們討論的漢語初學者。當然遇到不認識的字詞查字典是一個很好的習慣,但是培養通過漢字字形的分析,結合上下文來猜測其語義的能力也是十分必要的,因為我們學生的閱讀很有可能是在不能查字典或不可以查字典的情況下進行的。那麼要培養這一閱讀能力,基本問題是指導學生對漢字的字形進行分析,這就對部件教學提出了需要。

  四、“部件教學”的原則和方法

  “部件教學”在華文教學中的重要意義,決定從事華文教學的教師在教學過程,不僅要對部件教學予以重視,而且要留意其教學法方面的研究。對此,我們曾有過一些思考和體會,在此提出,意在與同人交流共進。

  “部件教學”的總體設計應體現這樣幾條總的原則:

  第一,對部件的介紹要注意由簡到繁。漢字筆畫的繁簡影響漢語學習者對漢字識記的正確率,常用、簡單的漢字錯誤率最低。所以,對於漢字初學者來說,入門階段的部件介紹宜簡不宜繁。此外,由簡至繁還能夠有效避免學生對漢字學習的畏難情緒,有利於日後的深入學習。所以,無論從識記規律上,還是從學習者心理的角度,遵循部件介紹由簡至繁的原則都是十分必要的。

  第二,杜絕隨意介紹,體現階段性和系統性。部件教學的重視決非是遇字就拆分,見新部件就講,應該在由簡到繁的原則基礎上,把部件有計劃地、分階段地介紹給學生。部件教學還要有系統性,所謂系統,一指部件本身的系統性,如“亻”,為“人”字旁,在構字上常常表示與人或人的身體有關的意義,比如漢字:“你、他、體、倆、住”等;二是指部件在構字上的組合方式,也就是首先要讓學習者明確漢字部件的組合併非無序的堆砌,而是有規律的,而後再對一些部件常出現的位置作介紹,如“亻、彳、纟”用於漢字的左側,“辶、廴”用於左下半包圍結構等,加深學習者對漢字構形規律的認識和理解。

  第三,安排部件介紹的時序,應遵循常用優先、兼顧構字能力的原則。要實現這一原則,在部件和所用例字的選取上一是要參照相關的詞頻統計,二是要結合漢語教學。只有這樣,才可能設計出既合乎教學規律,又滿足學生需要的部件教學計劃。

  在遵循上述總原則的基礎上,具體教學法上還應該重視如下一些方面:

  第一,重視獨體字的教學。重視部件教學不等於可以忽視獨體字教學。漢字總體可以分成兩大類,即獨體字和合體字。雖然從漢字系統來看,合體字佔絕大部分,但是獨體字除了自身帶有讀音並表達一定的意義外,往往還可以作為部件,成為漢字的一個組合部分。教學中,應注意這一類獨體字意義的解釋,及其作為構字部件時在字形或發音上的變異情況。字形變異,如:心→忄(情)、小、(恭);火→灬(熟、煮);金→钅(鍛、銀);言→讠(語、說)等。發音變異,如:射→謝、榭;者→箸 、著、都(dū)等。

  第二,漢字部件在構字上有角色上的分工,教學中應同等重視意符和聲符。漢字是表意體系文字,漢字意符的構字能力遠遠超過聲符,所以人們自然十分注重表意部件的教學和研究。但是從文字學角度來看,大量形聲字的構成是通過在假借字上附加意符來實現的,我們可以借助構詞能較強的常用聲符部件,運用歸納排列法自然輸入一些難寫難記、使用頻率不高的字詞,方便學生認知,如:解(jiě/xi岢)→懈、邂、蟹、獬等。此外,對於母語是拼音文字的學習者來說,能在表意的方塊字中捕捉到與字音相關的部件,他們是很感興趣的。那麼部件教學中應如何權衡意符和聲符?我們認為,以介紹意符為主,兼顧簡約而常用的、構字能力較高的聲符的引進,真正實現部件教學在華文漢字教學中的積極效應。

  第三,應留意學生對漢字加工時,在構字的部件上常出現的錯誤類型,並進行總結分析。一些漢字部件在形體上十分接近,如:礻、衤;入、人、八;予、子;士、土;亻、彳;日、曰;貝、見等,學生很容易混淆,經常會出現“視”寫成“衤”旁;“預”寫成“子”旁;“賽”寫成“見”底;“覽”寫成“貝”底;“冒”寫成“日”頭之類的錯誤。教師有必要對此做總結分析,並在教學中對相似部件的表意情況進行區別性講解,減少或避免此類錯誤的出現。當然,學生對漢字的識記和書寫還有其他一些錯誤類型,都值得總結。

  第四,意符的表意特徵不可忽視。部件教學的主體--“意符”,在形聲字的構字過程中往往起著區別同音異詞,對該詞所屬意類或所屬意類的共性做模糊性指示的作用,其表達的意義往往是寬泛的,與所構成的漢字字義有一定的距離,部分部件的意義甚至還存在著變異的特徵。這些問題在教學中不可忽視,應適時對學生加以說明。

  關於漢字部件問題,文字學領域已有頗為豐碩的研究成果,其中也不乏一些運用認知心理學理論來研究識字過程中部件效應的佳作,這些成果對於華文教學中的“部件教學”都有著積極的指導意義。近年來相關研究的拓展與深入,也進一步證實了“部件教學”是華文教學的重要部分和方法,值得重視和研究。(北京華文學院 盛繼艷)


【家國主義 家主政治 中華家國】健保免費連線《梅峰》


本文於 修改第 1 次
回應 回應給此人 推薦文章 列印 加入我的文摘

引用
引用網址:https://city.udn.com/forum/trackback.jsp?no=50415&aid=2980266
 回應文章
(轉貼)漢字解密地圖
推薦0


梅峰健保免費公投
等級:8
留言加入好友

 

漢字解密地圖

編輯室

臺大電機系專題演講

時  間:102年5月22日下午3:30-5:20

地  點:博理館101演講廳

主持人:李學智教授

主講人:廖文豪副教授 / 國立台北商業技術學院資管系

‧前言
漢字解密地圖又可稱為漢字衍生關係圖或漢字樹,它以系統化的方式呈現文字的衍生脈絡,是解密漢字符號的有力工具。透過它,使用者不僅可以認識每一個漢字符號所代表的意義,也可以更進一步理解每個漢字背後所隱藏的古代文明。自從漢朝以隸書體代替古體字以後,許多甲骨文、金文所代表的圖像意義大幅消失,以至於無緣見識到甲骨文及金文的文字學權威東漢許慎,在編寫說文解字時產生不少錯謬。兩千多年來,華人天天讀漢字,卻多半不知它的構字意義,而漢字解密地圖有系統地解開華人長久以來的文字疑惑。為了解開兩千年來的文字之謎,廖教授憑藉資訊科技專長以及十餘年來研究古字體之熱忱,廣泛蒐集所有古字符號以進行比對分析,最後確認出每一個古字符號所代表的意義,進而建構出漢字解密地圖,於是出版了廣受矚目的漢字樹叢書。

主持人李學智教授特別介紹今日的演講者廖文豪副教授,目前任教於國立台北商業技術學院資管系,他同時也身兼該校的圖書館館長,並曾擔任過該校的計算機中心主任,其專長為資料庫的管理系統、資料模型的建構與分析、計算機結構。而對於漢字這麼獨特的研究,其實一般認為應該是中文系相關學者的專利,不過廖教授其實是我們台大電機系的學長,他依據他對漢字的興趣以及他在電腦方面的專業知識,對許多的漢字做了一些不同的解構,並加以整理得到了它們發展的脈絡與衍生地圖,整理成所謂的漢字樹。今天他要依據自己在資料庫方面的專業知識所整理出來的漢字地圖,來向各位娓娓道來漢字是如何創造與衍生的。

 

‧漢字樹的由來

廖教授一開始表示很榮幸能跟各位學弟妹們分享他研究漢字的一點點心得。在他所任教的北商有位外籍老師曾經提到他有十幾位朋友,跑到中國大陸去學中文,只學三個月左右就全跑回來了,他們覺得學中文太無聊,一筆一畫都不知道意思,卻要把它們硬背起來,這樣對一個成年人來說,實在是太痛苦,一輩子都很難學會。很多外國人會講流利的中文,但大都不會寫。如果能突破這點,勢必有助於漢字在國際間的推廣。

使用資訊工具來研究及整理古漢字是非常有利的,除了可以將漢字進行統整分析,還可以藉著它來建構出極為系統化的架構,而這在過去是不易達成的。漢字樹就是藉著資訊工具將漢字有系統架構起來的成果。漢字樹原本叫做漢字解密地圖,不過遠流出版社擔心有些讀者會看不懂,由於漢字衍生地圖看起來像是樹狀結構,所以就改做漢字樹。

‧從闖關遊戲中了解漢字衍生

為了增加趣味性,教授藉著漢字猜謎的闖關遊戲讓大家來體會一下漢字的衍生,請大家猜一猜每個象形字所代表的現代漢字。第一關是有關房子的衍生,它的衍生過程好像是孩童畫圖。先畫一個房子的輪廓 (宀),再畫一個門,就成了一棟最簡單的房子 (向),商周的人蓋房子都是坐北朝南,大門一打開來便是南方,於是這個字便引申出方向的意涵。接著,為了讓房子看起來更宏偉,於是在原有屋頂上頭再添加一層華麗屋頂 (尚),在古代,屋頂的等級限制十分嚴格。天子居住的殿堂,其屋頂構形採用從最高等級的重簷廡殿,紫禁城太和殿、故宮博物院也是採用這種屋頂構形。接下來,再以夯土台當地基墊高房子,就成了 (堂)。在周朝,殿堂台基的高度是有嚴格規定的,地位高的人才能居住在台基較高的房子。《禮記》記載:「天子之堂九尺,諸侯七尺,大夫五尺,士三尺。」以前我們講的寶蓋頭「宀」,許多人都不知道它代表房子,以為跟頭或蓋子有關,其實所有的「宀」都跟房子有關,如宅、室、寮、宇等上百個字都是,從投影片中「宀」的衍生圖來看,「宀®向®尚®堂」只是眾多衍生路徑當中的一條而已。

過去我們學漢字,卻連基本符號的意義都不甚了解。在他小學時,以為雙人旁「彳」跟人有關係,但那時候問老師時並沒有得到一個清楚的答案,一直到他自己研究漢字以後才發現雙人旁其實是指一條馬路。比如說「行」的古字「╬」代表四通八達的馬路,若把右半邊省略掉,就變成了「彳」,就是後人所稱的雙人旁。由此可知,我們一定要認識基本的漢字符號,才不會被誤導,才能真正認識漢字的精髓。

第二關的衍生關係也很有趣。如何描寫一個人的舌頭呢?舌頭自口而出,可以上下左右擺動,擺動的時候還會有口水噴濺,於是古人造了「舌」。「舌」的甲骨文 描寫從口裡吐出一條會擺動之物(Y字形舌頭),周圍之小點表示口水。舌是可幫助說話、分辨味道的器官。「舌」的衍生主幹為 → →  。首先, 伸出一條會擺動之物,於是就衍生出 (舌);接著,舌頭一擺動,就能產生言語,言( )表示在「舌」( )之「上」( );古人進一步發現,當人口中含著樹葉或管子等物,便能發出美妙樂音,於是他又在 (言)內再添加一筆畫,音( )表示口含一物所發出之美妙「言」語。接著,廖教授展示「口」的衍生圖並解釋其中一些有趣的漢字。

第三關漢字猜謎是有關人的衍生。漢字的造字很有系統,由簡至繁,由具象到抽象,例如「繁」是由  → →  → ,先有一個不分性別的 (人)。這個人跪坐下來,「雙手交垂」便衍生出「女」(),一個端莊賢淑的女子。如果在「女」字的胸前添加「兩點」之後,就又衍生出具有「哺乳」能力的「母」( )親;若在母親的頭上再添加「一根根頭髮」,就衍生出「每」( ),藉此引申出每一根、每一滴等意涵。如果在「每」的旁邊添加一隻持梳子的「手」,就衍生出「敏」( ),意表一隻快速打理滿頭亂髮的手。最後在「敏」底下加上一條「髮辮」( ),就衍生出「繁」( ),因此由編織髮辮引申出「繁複、繁瑣」等意涵。

從以上的衍生關係可以看出古人造字有一些衍生規則:由簡單筆劃逐步添加構件而衍生成繁複筆劃的字;其次,是從具象的文字,如人、女、母,逐步進入愈來愈抽象的文字,如每、敏(敏捷)、繁(繁複)。許多字看似雜亂無章,但若是能抽絲剝繭找出字與字之間的衍生關係及演化關係,便能解開漢字構字的奧秘。所謂的「衍生關係」是由一個字衍生出另一個字,而「演化關係」是指同一個字,由甲骨文、金文、篆體,一直演變到現代字體的過程。若是能掌握漢字的衍生路徑以及漢字的演化順序,就能建構出完整的漢字系統。

經由上述幾關漢字衍生猜謎遊戲,廖教授主要是想讓大家了解,我們能夠根據一套有系統的架構,透過電腦把許多有關聯的漢字符號都找出來,如此便能破解每個漢字符號背後的意義。在他剛開始做研究時便遭遇一些困境,每個學者對於每一個符號的解釋都不太一樣,非常地不一致。所幸,像是大海撈針的幾十萬個符號裏,藉著資訊工具的彙整分析,還是能有系統找出古漢字彼此之間的關聯性。

 

‧漢字解密樂無窮

而在讓同學們透過闖關的方式了解漢字的衍生關係後,廖教授接下來準備另一份投影片,讓大家體會漢字解密就像破解命案一樣,充滿著懸疑與趣味性。破解漢字必須設定相關的檢驗原則,否則會流於自說自話,缺乏公信力。廖教授自訂五項檢驗原則,例如,必須符合甲骨文、金文構型,必須有先秦典籍為依據,其次,對每一個漢字符號的詮釋必須能套用在所有含有此符號的漢字上,除此之外,還必須能據此合理詮釋所有引申意義。

例如「方」是一個很常用的字,但構字起源眾說紛紜,東漢許慎的《說文解字》認為「方」是兩艘併攏的船,但從甲骨文、金文等構形卻是怎麼看都不像;近代有學者認為「方」是挖土的耒插(圓鍬),但也無法自圓其說;也有學者認為是一個人在挑扁擔;還有人認為方是畫方型的工具,卻無法解釋如何操作。自許慎以來,「方」困擾了不知多少的古今學者。什麼是「方」?翻閱先秦史書,再對照甲骨文、金文及篆體,可以清楚發現,「方」指的就是「國境外的人民」,這樣的詮釋使得各種包含「方」的漢字及史書記載都變得合理。周朝典籍中記載著,商周人稱邊境外的民族為方,例如,當時北方民族有鬼方、土方,西方有羌方、東方有人方。所以,「方」就是指鄰國人,方的甲骨文 、 在「人」之上添加「一橫畫」,表示邊境上的人民。

為了進一步驗證,廖教授將所有含有方的古字彙整起來,主要有「旁、邊、防、放、敖」等,赫然發現這些字都與鄰國有關,「旁」代表四圍邊境的鄰國人,「邊」代表鄰國人從邊境進入本國,「防」代表阻擋鄰國人的城牆,「放」代表流放到鄰國,「敖」代表到鄰國出遊。

另外,就引申意義的驗證來看,商周時代,各國的國土講究「四方」,唯有四四方方的領土才算是完整的國土。《周禮》記載:「方千里曰王畿」,國土的中央是君王所居住的王城,是一塊占地一千平方公里的方正土地,而再往外一層層擴展的土地也都是四方形。方的本義為國境外的一群人民,以此來檢視它以下幾個引申義也都是吻合的。

1 方向或方位:所謂的「東方」就是指位於「東邊的方國」,「西方」就是指位於「西邊的方國」,因此後人以東方、西方等代表方向或方位;

2 某一邊:由於方國相當多,而且國名常有更變,當描述國與國之間所發生的事件時,為了簡化敘述,就簡化以代號來稱呼了,如敵方、友方、甲方、乙方等;

3 四邊對稱的形狀:殷商人稱「四境鄰國所圍之地」為「四方」,相關用詞如正方、長方等。

除了用於破解漢字以外,廖教授說漢字衍生圖也簡化了六書,使人更易理解構字意義。大家都知道,自古以來,大家都以六書來講解漢字,但其中的轉注、假借就連中文系畢業生都難以說清楚,可見六書教學法其實是非常複雜難懂的。事實上,每個漢字符號不外就是形、音、義而已,像「方」這個符號到底代表聲音還是意義,我們可以清楚地從衍生圖上看到,圖中的實線代表跟意義有關,虛線代表跟聲音有關。例如,「旁、邊、防」等裏頭的方是代表意義,屬於義符;而「芳、肪」等裏頭的方是代表聲音,屬於聲符。透過義符與聲符的辨別,大量簡化學習上的困擾。

接下來廖教授繼續為大家說明解密地圖在歷史考證的應用。頭一個歷史謎題是,大禹到底存不存在?「禹」代表什麼意義呢?《說文解字》說「禹」是一條蛇,因為它中間有個「虫」,而虫就是蛇。知名史學家顧頡剛據此提出「禹」的構字本義既然是一條蛇龍,所以大禹是個虛構人物,根本不存在。此外,史學家楊寬說,大禹是由「虫」、「九」兩符號組合而成,代表一條勾龍。他進一步說,古籍記載勾龍的父親是共工,既然勾龍就是大禹,而大禹的父親又是鯀,因此他的結論是「共工就是鯀」。雖然這項推論很有意思,但其實充滿矛盾的。首先,《孟子》說大禹是「驅蛇龍,治水患」的人,如果他自己是蛇龍,那怎麼會去趕蛇龍呢?此外,史書記載「大禹伐共工」,如果共工是禹的父親,那大禹攻打父親不就成了大逆不道的不孝子嗎?所以這樣的推論顯然沒有考證清楚。另外,故宮博物院的研究員楚戈在《龍史》一書中說,金文「禹」像是兩條蛇龍交纏在一起,所以他推論「禹」代表兩條蛇在交配,因此引申出「禹」有淫亂的意思。無獨有偶,大陸名嘴更在電視上宣稱大禹有外遇,否則他三過家門而不入是很不正常的。

「禹」這個字到底代表甚麼?從金文及篆體來看,的確是由「虫、九」所構成,虫代表蛇,但九代表什麼呢?從九的衍生圖來看,九其實代表一條伸長的手臂,所有包含九的漢字都與伸長的手臂有關。例如「仇」代表伸長手臂去抓的仇人,意味著無論仇人逃到天涯海角都要把他擒拿,又如「究」代表伸長手臂去洞穴中摸索,探究也,而「萬」則是伸長手臂除去蠍子。既然九代表伸長的手臂,那麼,禹就代表抓蛇龍的人,這樣的禹與史書上所說驅蛇龍治洪水就完全吻合了。為了進一步舉證,廖教授將虫及九的衍生圖作了一番解釋,如「強」代表拉大弓射大蛇,引證了古籍中劉裕、后羿射大蛇的典故,「閩」代表「蛇門」境內,意指古代越國境內,同時也引證了《吳越春秋》的「蛇門」典故。

再來看看「龍」的演化歷史,甲骨文的「龍」 像是一條張開大嘴的蛇,不少專家考證,古代的原始龍就是大蟒蛇之類的生物,但為何在金文、篆體裡卻在大蛇之上添加一個「辛」的符號呢?由辛的衍生圖來看,含有此符號的漢字都與罪犯有關,因為「辛」就代表逆天之人。既然如此,龍不就意味著是一條逆天的大蛇嗎?原來,古代發生大水患,被認為是逆天之龍所造成的,一直到大禹驅走蛇龍,水患才平息。《孟子》說:「當堯之時,水逆行,氾濫於中國。蛇龍居之,民無所定。」《論衡》也說:「洪水滔天,蛇龍為害,堯使禹治水,驅蛇龍,水治東流。」黃河龍門是大禹驅趕蛇龍的遺跡,長江三峽的龍脊石是大禹斬蛇龍的遺跡。古字也可證實相關記載,如甲骨文 表示龍在吐水, 、 代表雙手抓龍。廖教授也同時以虹、寵、龐、龔等字及有趣典故加以引證。龍為何後來被認為是好的呢?廖教授認為轉捩點在劉邦,劉邦是歷史上第一個平民皇帝,他利用人民對龍的迷信與恐懼,捏造自己是一條紅龍的許多事蹟,包含母親遭蛟龍性侵生下自己,將自己斬白蛇事蹟說成紅龍斬殺白龍,妻子呂后也編造有紅龍盤旋在劉邦頭頂等等,劉邦當上皇帝後開始身穿龍袍,凡此種種,於是,惡龍從此翻身為好龍。

最後,廖教授讓大家玩一場漢字解密遊戲,「冉」這個古字到底是描寫甚麼呢?有學者說是魚,也有說是臉上的毛髮,有人說是龜、蛙等,但答案是什麼呢?我們先從眾多包含此符號的甲骨文來找線索,甲骨文顯示,冉會在陸地上走路,有人在追冉,有人抓冉來火烤,有人坐船去抓冉,冉還可以在市場上秤重販售,到底冉是什麼樣的生物呢?透過實物圖像、字形辯證、古籍引證、字義引申及衍生關係等檢驗後,廖教授提出鱉甲說,相當有趣!

‧整理漢字,引經據典

在講述完兩個主題後,同學們的發問也十分熱烈,廖教授也耐心的一一解說。像是有同學便好奇,甲骨文的字這麼少,那後來的漢字是怎樣整理出來的?廖教授答道:「甲骨文雖然字不多(約4000字),但所有的部首或基本符號都已經出現了,以後出現的許許多多漢字都是由這些基本符號所拚出來的。」另外也有同學提出質疑,這些漢字有些解釋聽起來很有道理,但有些卻好像是自圓其說,是不是研究這個領域的人都是在自圓其說呢?廖教授解釋道,的確在很多人研究漢字,有時候並沒有考慮得很清楚,但是他所解的漢字都會遵守五大項檢驗原則,如符合考古證據(如甲骨文字形或古文物)、符號詮釋及衍生關係的完整一致性、先秦典籍引證、字義引申的合理性等。除了邏輯上的正確性外,一定要在古文物或古籍中有證據,而這種理性辯證的態度應該也是身為理工人的一個特質吧!

回應 回應給此人 推薦文章 列印 加入我的文摘
引用網址:https://city.udn.com/forum/trackback.jsp?no=50415&aid=5034548
(轉貼)漢字樹
推薦0


梅峰健保免費公投
等級:8
留言加入好友

 

自序

  自古以來,人類用簡單的圖像符號來溝通,這是象形文的基礎,然後再由這些獨立符號的象形字再合成會意字及形聲字等。漢字保留了全世界最完善的圖像文字,我期望藉著《漢字樹》能讓讀者重新從圖像表達的角度來看待漢字。

  我原本以為《漢字樹》要經過幾年的工夫,才能被讀者群所理解與接受,沒想到一推出就得到相當熱烈的迴響。這除了感謝上天的恩賜,感謝祖先所留下的文化瑰寶,也要感謝過去在文字學領域貢獻的先輩們所提供的研究文獻。在本書寫作過程中,初蒙作家暨古文學專家高大鵬教授的指導,復經台師大易經學大師暨文字學專家賴貴三教授的指導與慷慨校閱,我在此致上十二萬分的謝忱。

  《漢字樹》出版之後,我接到了許多人的回應,有驚喜與欣賞,也有提問或疑慮。對於各方的批評與指教,我甚為珍惜感謝,在此謹以問答的方式來敘明我的想法。

  一、什麼是漢字樹?為什麼要建構漢字樹呢?

  英文字母只有二十六個,拼寫容易,但是漢字部首將近兩百個(康熙字典有一七六個部首),行政院全字庫系統所公告的漢字基礎構件更超過五百個,要熟悉這麼多的漢字基礎構件談何容易?更何況這些構件之間似乎並無可依循的規律,無怪乎能學好漢字的外國人實在少之又少。但是,我找出古字中具有獨立構形及意義的漢字符號,以圖像方式建構出具有衍生關係的漢字樹。

  而且,漢字樹的衍生路徑隱藏著漢字的發展脈絡,由簡入繁,由具象到抽象,因此,漢字樹其實就是一部漢字衍生史,有助於我們有系統地理解古人造字的發展脈絡。同時,漢字樹使得每個符號的意義明確化且合於邏輯,其衍生路徑可以幫助學習者(包括以中文為母語的學童或是中文讀寫不得要領的外國人)直覺地產生線性聯想,學習漢字是一串一串地學,會更有效率。

  二、什麼是圖像字?

  古字的字型結構相當不一致,常常同一個漢字在甲骨文或金文就出現各種不同樣貌,如「方」的甲骨文就有大約三百種寫法,以致於許多文字學者難以破解其構字本義,即使破解了這個字,也難以挑選出具有代表性的古字與現代漢字對應。我為了解決這個問題,自行開發了一套「示意圖像」字體,也就是圖像字。圖像字除了要符合甲骨文及金文所表達的構字本義之外,還要與現代字體的筆劃相接近,使它發揮實用價值。

  三、《漢字樹》寫作動機是什麼?為什麼一個學資訊的理工人願意花十幾年的工夫研究漢字呢?

  其實一開始,我並沒有想要寫書。我從小學漢字,卻不知道一筆一畫代表什麼意義。這種疑惑隱藏在心裡,日積月累,最後我實在受不了,於是我開始探究漢字背後的世界。我彷彿是一個好奇的小孩,推開了一扇門,然後掉進一座漢字的迷宮花園。我被這座花園裡的甲骨文與金文迷住,對於古人的造字智慧,充滿驚奇與讚嘆。走著走著,發現自己其實已經迷路了。我不斷摸索著出路,先按著前人的蹤跡,以為能找到出路,但卻沒想到引發更多的迷惑。

  我經過一番坐定沉思之後,決定學福爾摩斯,先廣泛蒐集資訊,再尋求破案之道。《漢字樹》的系列書籍,就是我把破案經過公諸於世的結果。簡單地說,我寫作《漢字樹》的遠因是在學生時代就對漢字的來源產生好奇,而東漢許慎的《說文解字》又無法完全令我信服。近因則是甲骨文、金文逐漸普及,使我有機會較全面地進入古文字的世界。但是我廣泛閱讀知名甲骨文學者的著作,如徐中舒的甲骨文字典以及王國維、郭沫若、董作賓、陳夢家、唐蘭等知名甲骨文學者的論著,覺得各家的說法相當分歧,同一個符號往往出現許多不同版本的詮釋意義。

  有些文字學者往往只看見局部的甲骨文及金字,未能看見全貌,故難免產生以偏概全的弊病。唯有全面彙整分析,才能找出更加一致可靠的答案,而這種工作就必須藉助於完整的資料庫及資訊技術。

  甲骨文有三千多個字,而每一種字又有許多不同構型,數量龐大。一般人聽到要彙整分析幾萬個古字,往往就打退堂鼓。而我,憑著一股傻勁,鑽研了十年,才大致弄通每一個甲骨文及金文符號的意義。

  四、漢字樹的詮釋,根據在哪裡?

  《漢字樹》出版之後,我請教過幾位中文系教授,得到許多指教,受益良多,但同時我也覺得有必要在此加以解釋。

  書中使用的獨立符號(又稱獨體字),學者之間大部分沒有什麼異議,例如「又」代表手,「止」代表腳掌,「」代表跪坐的人等等。但是兩個以上的符號所組合成的字(又稱合體字),在學術界向來就是意見分歧,例如「居」是由尸與古所組成,但對於居的詮釋,就有不下十種說法。現代人僅能從後來的《說文解字》及先秦典籍裡找線索,有時不可能確知當初造字真正的想法。我是將「尸」與「古」的構字符號與意義彰顯出來,提出我認為較有根據且合理的說法。

  五、漢字樹是否有過度詮釋的疑慮?

  文字學界當中向來有保守派與較前衛的實用派。保守派認為,若是古文獻中沒有解釋的字或沒有具體證據的字,就不要強加解釋,甚至他們認為將漢字圖像化都是不允許的。我個人是支持較前衛的實用派的。因為古文獻所解釋的也是後人依據有限的證據加以揣測的,不見得是真正的構字本義。

  而且古體字當中,有許多有不同的造字來源,非常一致性,也難以系統化,以致於產生學習的障礙。為了使漢字更有系統化,本書主要是選取最能與現代漢字相呼應的甲骨文、金文或篆體。我認為唯有如此才有助於有系統地學習現代漢字。

  如果要推廣漢字,就必須以易學易懂的方式來解說漢字的構字意義。在這方面,我開發了圖像字,並將相關聯的基本符號組合成有意義的敘事,例如「聊」代表兩個人面對面(卯)互聽(耳)對方談話。

  漢字的構字,本身就有理路可循,因此,漢字樹是試圖重新有系統、大規模地勾勒漢字的邏輯,有些個別的詮釋或許因為個人才學經歷有限,還有疏漏之處,但是大的架構與方向,應該是正確的,在此也感謝讀者的賜教,盼望與讀者的交流。(liao@mail.ntcb.edu.tw)

§內文1

人體器官 

在漢字中,「身」是指人的軀體。就構字而言,「身」就是「人」的「肉」體。金文及篆體都是意表「人」腳盤以上的所有「器官」。 

許多具有器官意義的漢字都包含肉(月)的古字。「身」的另一個篆體則是調整筆順並加以美化之後的結果。人的軀體所衍生的字,可以分成三大類。第一類是實體器官(肉)及抽象器官(心)所衍生的字;第二類為頭部器官所衍生的字;第三類為肢體器官所衍生的字。 

第五章 肉與心 

古人造字,將人體的器官分成「實體」與「抽象」兩種。含有「月(肉)」的字多表示看得見、摸得著的器官;而含有「心」的字則大多賦予看不見、摸不著的抽象意義。實體器官幾乎都是由筋肉所組成,所以與「實體器官」有關的字大多被賦予「月」(肉)的構件。古人認為「心」是掌管「思想、情感及生命氣息」的內在器官,所以便賦予與這些活動有關的字「心」的構件。這一章就從「月」(肉)和「心」這兩個觀點來詮釋相關的漢字。 

肩 ㄐㄧㄢ jiān 
像門「戶」轉軸的「身體器官」。 
肩膀是「身體」與「手」的連接處,可以像門軸一般靈活地轉動。 

愛 ㄞˋ ài 
心中愛慕,頻頻回頭,不忍離去。 
當人看見愛不釋手的寶物,或當年輕人看見所暗戀的對象,心頭就碰碰跳,頻頻回頭,捨不得離去, 生動地刻畫出此戀慕之情。篆體表示一個因心中渴慕而頻頻回頭的人;另一個篆體添加了夂,意表緩步前行,不忍離去。愛的相關用詞如喜愛、愛慕、愛情等。「愛」的簡體字為「爱」,「心」消失了。 

肢 ㄓ zhī 分「支」出去的身體「器官」, 
人的手腳也,「支」也是聲符。 

胃 ㄨㄟˋ wéi身體的「器官」,會將吃進去的「米」 「包圍」 起來處理。 
篆體表示吃進去的「米」被某一器官「包圍」起來; 金文及篆體加了「肉」,表示身體的「器官」,會將吃進去的「米」「包圍」 起來處理。《說文》:「胃,穀府也。」 

脊 ㄐㄧˊ jí支撐許多支肋骨的「器官」。 
篆體,上構件是連著肋骨的「胸椎」,下構件是「肉」, 表示身體的「器官」。《說文》:「脊,背呂也。」 

肥胖 
肥 ㄈㄟˊ féi「肉」多的「巴」人(請參見「卩」,第二章)。 

第六章 頭 

漢字基礎構件中,與頭有關者主要為 「囟」、「甶」,而與頭部器官有關者主要為「目」、「自」、「耳」、「牙」、「口」。 
「目」衍生出許多與視覺有關的字,「自」衍生出許多與嗅覺有關的字,「耳」衍生出許多與聽覺有關的字,「口」衍生出許多與嘴巴有關的字,「牙」則衍生出與牙齒有關的字。 

低頭審視的人 
古代的大臣負有監督的責任,以確保全國百姓能夠平安度日,因此,不僅城門口及重要道路口設置檢查哨,官兵還要不定期對百姓進行臨檢,便以一隻專注的眼睛加上一個彎腰的人來描寫低頭檢查的人。 

臥 ㄨㄛˋ wò 低頭「注視」 的人。 
以「臥」為構件的字都具有這個意涵,如臨、監、鹽等。「臥」的本義是低頭俯視的人,引申為俯臥的人,相關用詞如臥房、臥倒、臥病等。 

監 ㄐㄧㄢ jiān 
一個人低頭注視臉盆裡的水所反射的面容。 
「監」的本義為檢查自己的面容,引申為仔細檢查,相關用詞如監察、監管、監工、監牢等。由監為聲符所衍生的字相當多,音發監(jian)的字有鑑、鑒、艦;音發ㄌㄢ(lan)的字有覽、襤、藍、籃、濫、攬、欖等。 

聊 ㄌㄧㄠˊ liáo 
「兩人面對面」彼此互「聽」對方的談話。 
「 聊」傳神地描寫出用耳朵專心傾聽對方談話的意境。「 聊」引申為閒 
談、樂趣,相關用詞如閒聊、聊天、無聊(沒有樂趣)等。 

緊 ㄐㄧㄣˇ jǐn 「善於做事者」(臤)製作「繩索」,牢固且密合。 
「糸」是一條以兩、三股的植物纖維交纏而成的繩子。善於製繩者,總能將繩子做得牢固且密合,相關用詞如緊密、緊繃等。「緊」的簡體字是 「紧」。 

§內文1

第一章 人 

胎兒期 

巳 ㄙˋ 

胎兒或新生嬰兒。 

從甲骨文到篆體都描繪一個只有頭而沒有四肢的生物, 則是調整筆順的結果。在襁褓中的嬰兒,手腳用布包裹著,因此以一個頭和沒有手腳的身體來表示。 

以巳為形(義)符衍生出包、妃、祀及起。這四個字都與嬰兒有關。巳單獨成字時,表示時辰名,如巳時,指的是上午九點到十一點。 

妃(ㄈㄟ)──一個能生育嬰孩的女人。 

甲骨文、金文都是在描繪一個能生育嬰孩的女人。《史記》記載堯有一后三妃,舜升為天子後,立娥皇為后,女英為妃,而先祖黃帝更是四妃十嬪,生了二十四個王子,派駐各地管理人民,因而使得黃帝的王權非常穩固而強盛。古代君王納妃或許是為了生養眾多,使族群壯大,因為君王無後,可能會引發爭權危機,甚至滅國。像是西漢成帝因為多年無子,於是立定陶王劉欣為太子,劉欣繼位之後,歷史上稱為漢哀帝。哀帝縱情聲色,好男寵而無子,二十六歲就告去世,於是給了外戚王莽篡奪皇位的機會,西漢滅亡。有鑑於此,古代帝王除了元配以外,都廣納嬪妃,妃子若是生下男嬰,身價倍增,但如果無法生育,有的甚至淪落為帝王的殉葬品。 

到了秦始皇統一文字後的小篆,文字產生變革, 改成 ,在這裡,巳變成了己,似乎藉此來宣告妃就是君王自「己」的「女」人。為什麼有這個變更呢?因為商周以後,帝王都是嬪妃成群。秦始皇滅六國之後,也接收了六國的後宮美女,到了唐朝,更是三千佳麗在後宮,納妃的目的已經不再是為留後,而是為了滿足君王的色慾。 

包(ㄅㄠ)──母親彎著身體,包覆著一個小嬰兒。 

「包」的引申義是將東西裹住,相關詞有包裹、包圍、包裝等。以包為聲符所衍生之形聲字有苞、胞、飽、抱、袍、跑、刨、泡、砲、炮等。篆體的 則是調整筆順之後的結果,與現代漢字已經相差無幾。 


祀(ㄙˋ)──將新生嬰孩獻給至高神並請求庇祐。 

《史記》與《孔子家語》記載一段孔子誕生的故事,孔子的父親孔紇老年無子,因為擔憂無人能繼承事業,於是娶了第二個太太,生下一個跛腳的孟皮,還是覺得遺憾,就在七十二歲時又娶了當時只有十八歲的顏徵在,兩人為了得子,便前往「尼丘山」向上天祈求,後來,顏徵在果然生下一個健壯的兒子,為了感謝上天於尼丘山上應允夫妻倆的禱告,所以把這個兒子取名丘,字仲尼。 

甲骨文的「祀」是父母將嬰孩獻給至高神的象形文;另一個甲骨文及篆體表示兩手抱著嬰兒獻給神。(兩手抱子的構字意象與呆、保相近,請參見「呆」)金文及篆體則將抱嬰兒的兩手省略。 

祀的意思就是「向神獻祭以求庇祐」,也被廣泛引申為一切祭拜的禮儀,如祭祀。台灣民間的「三朝」禮,是在母親產後的第三日,由祖母抱著嬰兒去向神獻祭以求庇祐的一種習俗。另外,布農族於每年七、八月份會舉辦一項傳統祭典,就是在月圓時候,族人將嬰孩帶到會場舉行嬰兒祭,求神使嬰孩能長大成為強壯勇士。 

起(ㄑㄧˇ)──一個嬰兒開始學走路,會意字。 

嬰兒會爬之後,下一個階段就是學走路,而學走路的第一步要先能站起來,所以「起」的引申義為站立、開始、情況漸漸好轉,相關用詞如起立、起來、起始、起色等。 

孩童時期 

黃帝娶了十四個妃嬪,一共生了二十五個兒子,其中十四個較有才幹的被分封於各地管理政事,因此鞏固了黃帝的政權,其後的君王如堯、舜、禹及各朝代的開創者如夏、商、周都是黃帝的子孫,因此,太史公司馬遷說:「自黃帝至舜、禹,皆同姓而異其國號,以章明德」。到了今天,許多華人也都以黃帝子孫自居,然而,「子」與「孫」這兩個字的造字本意又是什麼呢? 

子ㄗˇ 

甲骨文、金文及篆體是象形文,大頭、有兩隻手及無腳的身體,不描繪雙腳似乎象徵這個人還不能獨立自主。 

在漢字構形中,「子」多半代表孩童或子嗣,在此把衍生字分為五大類,其中與孩童教育有關的有「字」、「教」、「學」;與生育有關的有「疏」、「流」、「育」、「棄」等;與孩童乳養有關的有「孔」與「乳」;與孩童照顧保護有關的有「呆」、「保」、「仔」、「存」;而與子嗣有關的有「孫」、「孟」、「季」。 
第七章 口 

在字典裡,「口」是佔字比例最高的部首。「口」主要用以表示與嘴巴或聲音有關的意涵,但也有一些是用以表示與口構形相近的東西,例如房屋的窗口、圍繞的地域、方形器物、圓形器物等。所以「口」的衍生圖可分成兩大類,第一類是與嘴巴或聲音有關的字,第二類則是與嘴巴或聲音無關的字。 

以 ㄧˇ yǐ 
人藉著所發出的「聲息」來顯露心意。 
大臣擅於察言觀色,由君王身上所發出的氣息,大臣就可以知道君王 
對某件事情的看法,要是君王發出短促的「 哼!」,就表示他心懷不 
滿;如果青筋暴露,表示他在發怒;若是口吐大氣,表示如釋負重;倘若君王不自覺地哼起小曲,則表示心情愉快。「以」的引申義相當多,常用的有三項,一個是「認為」,相關用詞如以為。第二個是「因此」,相關用詞如所以、以致於;第三個是「用」,相關用詞如以牙還牙等。 

可 ㄎㄜˇ kě 
用「拐杖」擊石「歌唱」。 
每逢祭天,古代君王就會率領眾臣民藉著歌聲向上天表達感謝與稱頌,一旁的樂師就會以杖擊石來應和。《尚書》及《史記》都記載,舜命令樂官擊磬作樂,結果演奏之後,群獸隨樂起舞,鳳凰來儀,神人和諧。這個祭祀音樂,史稱「韶樂」。「可」的本義是向上帝擊石詠唱,引申為合宜、值得稱許、應允。因為古人認為對上天獻唱是「合宜的」,如此上天就會「應允」百姓所求。相關用詞如可以、許可等。《禮記.檀弓》記載一段原壤即興而歌的故事。原壤是個極為隨興的人,凡事不拘禮儀。有一天,他母親死了。孔子體恤他家庭貧困,於是親自送來一付棺材。沒想到,原壤竟然敲打著棺材唱起歌來,他說:「我好久沒有用歌聲來抒發內心的感情了呀!」接著就隨興唱起:「初看這棺材的紋路,好像狸貓頭上的斑紋。細看之下,又好像是母親你柔弱雙手因勞碌而生的皺痕啊。」孔子的弟子都覺原壤如此行徑太失禮,但孔子雖然講究禮儀,這時候竟視而不見,僅淡然地表示老朋友終究不失為老朋友啊! 

第八章 手 

甲骨文以三根手指的手來代表「手」,由此「又」可衍生出許多與手有關的重要基礎構件如「又、爪、攴、殳、寸、力、九、聿、丑、叉、手」等。 

禹 ㄩˇ yǔ 
「伸長手臂」去抓「大蛇龍」的人。 
「禹」的金文代表持「叉」對抗大「蛇」的人。先秦典籍將大禹描寫成對抗蛇龍的英雄,而漢畫像磚上所繪之大禹像也是手持一支雙齒大叉。另一個金文及篆體則是描寫伸長手臂去抓大蛇的人。由此可見,大禹的意思就是擒龍人(或抓大蛇的人)。 

四川三星堆文化保留了夏朝的文明,其中的青銅立人像,雙手各圈成一個大圓圈,表示伸手抓大蛇龍。此人的耳朵各有一個大耳洞,這是大禹的獨有特徵。古書提到大禹有耳漏(耳洞)、身體枯瘦、出生於四川石紐,這些都符合青銅立人的形象與背景。中國十大民間收藏家朱文燦所收藏的大禹手抓大蛇龍的三星堆玉器,更說明了大禹就是擒龍人。青銅立人雙手所抓的大蛇,直徑二十公分,就比例而言,應該是一條長度四到五米的巨蟒。我國雲南、四川一帶的巨蟒與緬甸蟒應屬相近類別,一條緬甸蟒飼養一年半就可長到三米長。四千年前的大禹時代,巨蟒應是極為普遍的。 

第九章 腳與道路 

漢字中與行走有關的主要構件為「止」與「行」。止是一隻腳掌,行是一條四通的道路。「止」衍生出許多與「腳」有關的基礎構件及常用字;「行」則衍生出與「道路」有關的基礎構件及常用字。」等。 

正 ㄓㄥˋ zhèng 
「腳掌」準確地觸及「目的地」。 
甲骨文及金文都是在「止」的上端添加一「矩形」,表示腳掌準確地觸及「目的地」。篆體則將「目的地」簡化為「一」。正引申為不偏不倚、不多不少、剛剛好,相關用詞如正方形、正三角形、端正、正巧、午正、訂正等。以正為聲符所衍生的字有証、政、症、征、怔、眐、整等。 

夏 ㄒㄧㄚˋ xià 
一個「人」在「烈日」下「緩步行走」。 
「 夏」的金文描寫一個有頭、手及腳的人,在左上角有一個太陽。這是描寫一個在太陽底下行走的人,又像是一個人在迎接太陽。中國人一向以「 在太陽下生活的人民」自居,因此自稱為華夏民族。篆體僅剩頭及緩步行走的腳。夏,本義為在烈日下緩步行走的人,引申義為酷熱的季節,相關用詞如夏天、仲夏之夜等。大禹所建立的夏朝,是中國第一個王朝。大禹為什麼將國名稱為「夏」呢?因為堯舜時期歷經洪水,雨水從天而降,長期遮蔽了太陽。大禹為了消除水患,耗盡了一生歲月,犧牲了健康與家庭,因此,當上國王後,第一個願望就是希望不再有大洪水。充分顯露了大禹的心聲,然而,遺憾的是,夏朝的最後一個君主夏桀暴虐無道,苦難的百姓各個哀嘆:「這個太陽何時殞滅呢?」(《尚書》:「時日曷喪?」


本文於 修改第 1 次
回應 回應給此人 推薦文章 列印 加入我的文摘
引用網址:https://city.udn.com/forum/trackback.jsp?no=50415&aid=4944444
(轉貼)漢字樹
推薦0


梅峰健保免費公投
等級:8
留言加入好友

 

漢字樹:從圖像解開「人」的奧妙


【好設計】編排廖文豪教授《漢字樹》的幕後

作者:吳家恆 / 2013-01-23

《漢字樹》-1
裝幀設計/吉松薛爾(攝影/但以理)

漢字樹:從圖像解開「人」的奧妙
漢字樹
文╱吳家恆(遠流出版三部副總編輯)

初次看到廖文豪教授《漢字樹》的Word檔,直覺這個稿子要編排起來並不容易,內文中散佈大量的甲骨文、篆體、隸書,這些古文字雖然是文字,但並不是電腦的字體,所以必須當作圖形來看待。但是這個圖文高度混雜的文本,編排起來的難度遠比想像來得高。

《漢字樹》妃
比方說,把左圖這個符號放在讀者面前,大概很難猜出這是「妃」字,左邊是「女」,右邊是「子」,表示有生育能力的女子。電視劇《後宮甄嬛傳》裡頭,雍正宣稱甄嬛是四阿哥弘曆的生母,把她迎回宮中,封爲熹妃。不就表示了能生育是成為「妃」的條件嗎?

所以在《漢字樹》的編排上,必須要古今文字並列,但這還不夠。很多漢字的構件,本身也是字,像是「熙」去掉底下的「火」,成了「巸」,大部分讀者是唸不出來的,所以得加上注音ㄧˊ。但是不能有的字加注音,有的不加,全書必須有一致性。

接下來又想到,如果讀者沒學過注音,那其他地區的華文讀者,或是學中文的外國人怎麼辦?所以勢必要加上其他的表音記號,而適用性最廣的是羅馬拼音。

《漢字樹》-9
《漢字樹》-2
內文編排細膩有系統,除了古今文字並列,並標示注音、羅馬拼音(攝影/但以理)

到這裡,在呈現一個字的時候,要並陳古今字體,要附上拼音符號,還有簡單的解釋。這已經很接近字典的概念了。但是,《漢字樹》不應該是一本字典,也不可能是。很少人讀字典,但《漢字樹》是要讓讀者閱讀的。因此,版面設計除了必須以清晰、規律的視覺呈現「裝載」剛才提到的要件之外,讓人一目了然,還不能過於呆板,在這方面,琢磨出最後呈現出來的版型是一個漫長的過程,尤其要感謝美術設計吉松薛爾。

《漢字樹》-3
目錄頁(攝影/但以理)

《漢字樹》-10
章名頁(攝影/但以理)

《漢字樹》-4
文字樹狀圖利用線條、顏色,帶出字與字的關聯(攝影/但以理)

漢字樹2:人體器官所衍生的漢字地圖
漢字樹2:人體器官所衍生的漢字地圖
吉松薛爾在封面設計的巧思,大概每一個翻開《漢字樹》、看到封面書衣的讀者都會「哇」的一聲讚嘆不已,因為整個書衣展開之後,可以看到一幅大的漢字樹狀圖,同時,透過不同的折法,還可以折出三種封面。做書衣的想法,其實很單純,因為作者把漢字之間的邏輯關係組織在一個一個樹狀圖中,而有些「漢字樹」枝葉繁茂,空間有限,實在裝不下,需要更大的空間,書衣是個很自然的選擇。

所以最後呈現出來的,是經過邏輯推演之後的自然結果,就如同作者用歸納演繹的原則撐起漢字樹,道理是一樣的。

《漢字樹》-7
漢字樹狀圖書衣海報,利用不同折法,可以折出三種書封(攝影/但以理)

《漢字樹》-6
書衣海報一面印金,一面印黑(攝影/但以理)

《漢字樹》-8
內封以牛皮紙印製,乾淨質樸(攝影/但以理)

十年生一樹,漢字將成林——廖文豪《漢字樹》

作者:陳琡分 / 2013-01-18

廖文豪-1
廖文豪老師與《漢字樹》的「人」字樹狀圖書衣海報(攝影/但以理)

漢字樹:從圖像解開「人」的奧妙
漢字樹:從圖像解開「人」的奧妙
每逢需要報出姓氏的時刻,我們總是自然而然地拆解起來:姓張便說「弓長張」,姓陳便說「耳東陳」,或者「口天吳」、「木子李」,我們很習慣將一個字分化成更容易理解的符碼,好讓問者能夠無誤地接收、拼湊出那個正確的字。

又或者,多數人可能都還記得那個從小就朗朗上口的字謎:「一點一橫長,一撇到南洋,十字對十字,太陽對月亮」。也不知道為什麼,某一段懵懂的習字時期,每每寫到這個「廟」,嘴裡心裡總得喃喃地念上這麼一首二十字訣,才能好生把字寫出來。但那點那橫,那撇那十字,其實對「廟」字本身,一點意義也沒有。

在數以萬計的漢字裡,常用漢字約莫五千多個。這五千多個方塊小磚的構成,到底有沒有一點邏輯可循?難道那些直橫勾拐,點挑撇捺,都只是古人留下的、無意義的信手塗鴉?

捧著這個問題翻遍經史子集,問遍古今學者,得到的答案可能莫衷一是,甚至各說各話。但問及台北商業技術學院副教授兼圖書館館長廖文豪,他將引領你去看他一手種下、逐日茁壯的《漢字樹》,樹上連生的一枝一椏、一葉一芽,串起的圖像,解答的正是漢字使用者千百年來最大的疑惑。

廖文豪-3
(攝影/但以理)
「我從學生時代對文字學就非常有興趣,一直想要知道漢字中的一筆一畫到底代表些什麼,看了很多古書或歷代學者的相關著作,始終找不到合理又清楚的解釋;不少論述相互牴觸,自然也無法說服我。」十多年來,一向鍾情於古漢字研究的廖文豪也同樣時時捧著這個問題。上窮碧落下黃泉的結果,卻只是滾出愈來愈大的謎團。但他始終相信,漢字既為人類史上流傳最久的圖像文字,那些勾勒出漢字筆劃的結構符碼,一定有其初始意義。於是他決定結合自己的專擅,將資料庫導入漢字的解析中,企圖為漢字建置出一個有別於現今的部首分類法、且更可凸顯原始字義的系統。

原本想得簡單,以為只要替漢字組成符碼建個「全面搜尋」資料庫,就能解決這個問題。沒想到光是如何拆出漢字中具有意義的符碼、哪些符碼又帶出更多符碼,就令他頭痛不已;而身為事事講求證據的理科人,對於不同字裡的同一符碼,是否都能從典籍與考古文物中找到合理的字解來相互佐證,更是格外嚴苛。凡此種種,在在說明了現有的漢字研究是如何散亂矛盾,也讓廖文豪發現,試圖解構再建構的自己,其實不是走進一座文字花園,而是掉入一片文字迷宮,這一掉,就是十年。

「當你身在迷宮中走不出來時,你會怎麼做?」有的人可能選定一條路就直闖冒竄,有的人可能ABCD各路沿途做記號,但廖文豪並不。「我就爬到迷宮最上面,從高牆上俯瞰整個迷宮,把每一條路徑都看得清清楚楚。」爬到高處的他,找出三個能夠相互辨證漢字符碼的鐵三角:1. 留有文字最初樣貌的甲骨文與金文;2. 考古證據;3. 先秦典籍。每拆出一個可能的符碼文字,先利用電腦鋪天蓋地的搜尋功能,在建置好的先秦典籍資料庫中翻箱倒篋,找出最早的起源字義;同時再往甲骨文金文與考古資料鑽去,務求得到最全面的解釋。

例如「方」字,東漢許慎《說文解字》解為「併船也。」但這與形容範圍方正、指稱東西南北,都連不上關係;或稱畫方的工具,也令人一頭霧水。廖文豪從先秦典籍與甲骨文、金文中,確認「方」是「『邊境』(橫劃)之『人』」,自此衍生出方向(東南西北皆有鄰國)與形狀(象古代領土形狀)等意義。確定這個字符之後,其他含有這個字符的字,是否都能與字符吻合?「可以的。不管是旁、邊,都有方的字符;或防,築高牆(阜)來防止鄰國人(方)進入……這些都是可以從典籍裡找到解釋的。」

廖文豪-2
廖文豪老師為我們解析「方」字(攝影/但以理)

就這樣一路自問自答,拆拆組組,人腦與科技共同孕育灌溉,成就一棵乾淨清爽、言簡意賅的漢字樹,字字互有連動,意義一目了然。「這當然是人工與電腦的合作,畢竟沒有人能夠通曉所有典籍、顧及各家說法。」文字學是推理,是統計,是分類,是考古,必須兜攏最大值的資料,再從中比對篩選。「許慎寫《說文解字》時,不管花費再大的心力,都不可能面面俱到。」縱使集時代之大成,終究只是一時一地的專家之言,偏失、錯誤,在所難免。「但我們現在能看到甲骨文金文,還有先進的電腦資訊工具來協助彙整,這是我們的幸運。」

漢字樹2:人體器官所衍生的漢字地圖
漢字樹2:人體器官所衍生的漢字地圖
當種籽終於從千頭萬緒中篩出種下,五千多個常用漢字,透過三者交叉比對,剝去世世代代各憑喜好習慣長出的層層血肉,餘下最核心、最原本的骨幹,連廖文豪自己也對這棵漢字樹的樣貌驚訝不已。「你知道光是一個『人』的符碼,就衍生出兩千多個常用漢字嗎?」不論是人從出生到老死的各個階段,及至人的姿態變化、人與人或與環境之間的行為、狀態、關係,幾乎都由此輻散而出。這也是廖文豪選擇以「人」這個符碼作為貫串第一本《漢字樹》的原因,「從這一棵漢字樹,你會發現中國人是多麼以人為本,完全以人為出發點去思考事情。」

「事實上,漢字樹要能長出來,也非到現時現地不可。」廖文豪說,這絕對不是他一人的功勞,只是他抓到放大思索的要領,並懂得如何將不同的工具結合應用,那不只是讀遍古書經典,或在google隨意打上關鍵字就能了事的。十年生得一棵漢字樹,而當這樹開始萌芽茁壯,會在漢字研究與華語教學帶來何等的革新,或在文化創意產業如何開枝散葉、結出果實,進而長成一片漢字森林,都十分令人期待。化繁為簡,再自簡生繁,正是廖文豪投入茫茫文字之海的最大目的。

500個與「人」有關的漢字+超過5,000個甲骨文、金文、篆文
收納在2張漢字樹狀圖!

  一個台大電機系畢業、專精於電腦的「理工人」,在偶然的機會接觸了被認為許多從事文學創作研究的作家、專家也視為畏途的「文字學」,產生了濃厚的興趣;順著歷來各家的研究,進入了漢字構型的世界,流連忘返。隨著心得漸增,心頭的不解疑團也越來越多。

  於是,他引入電腦強大的彙編整理能力,有系統地梳理漢字的構件,試圖找出解釋力更強的說法,在這個過程中,也越加感受到部首的限制與誤導。

  部首是一個字組成的構件之一,因為有許多字都有,因而成為漢字分類的標記。但是,屬於同一個部首的字,彼此之間卻未必有關連。反之,有些看似不同的字,從漢字的演化發展來看,卻是關係密切。

  作者長年浸淫在文字學的天地,尋索字與字之間的邏輯關連,濃縮在書中的「漢字樹狀圖」中。再透過作者清晰簡要的說明,即使對於在文字學毫無根基的讀者,也可以憑著自身對中文母語的使用經驗,得到許多新奇的發現與樂趣。

作者簡介

廖文豪

  現任台北商業技術學院副教授兼圖書館館長。鍾情於古漢字研究,鑽研甲骨文十餘年,發表過《漢字龍原來是一條逆天之龍》、《紋身習俗對漢字的影響》、《在漢字裡遇見上帝》、《品茗漢字裡的酒香》等文章。

漢字樹2:人體器官所衍生的漢字地圖



  英文字母只有26個,但是漢字部首卻將近200個,行政院全字庫系統所公告的漢字基礎構件更超過500個,要認識這麼多的漢字,談何容易?就算認識了,不知道漢字背後的有趣故事,何其可惜?

  甲骨文有三千多個字符,而每個字符又有許多不同構型,與時發展之後,又有金文、篆體、隸書的分別。廖文豪教授在過去的十多年間,彙整分析了幾萬個古漢字,從中找出具有獨立構形及意義的符號,融會歷來各家說法,重新建構字與字之間的關連,所獨創的「漢字樹」既是圖像的、也是邏輯的。

  而且,漢字樹的衍生路徑也隱藏著漢字的發展脈絡,由簡入繁,由具象到抽象,因此,漢字樹其實就是一部漢字衍生史!

  不管是以中文為母語的學童或是中文讀寫不得要領的外國人,都可以從漢字樹的衍生路徑產生直覺的線性聯想,望圖生義,因而學習起來事半功倍。

  《漢字樹》是一扇門,一般讀者從中可窺見漢字構思之精、造字之巧。今天高談「文創」,漢字絕對是最高明的「文創」!

  第一本《漢字樹》以「抽象的人」(小孩、成人、老人、女人)作為構字組件,第二本要帶你一起來看漢字如何表現具象的人體器官!

作者簡介

廖文豪

  現任台北商業技術學院副教授兼圖書館館長。鍾情於古漢字研究,鑽研甲骨文十餘年,發表過《漢字龍原來是一條逆天之龍》、《紋身習俗對漢字的影響》、《在漢字裡遇見上帝》、《品茗漢字裡的酒香》等文章,著有《漢字樹:從圖像解開「人」的奧妙》。



第五章  心與肉
第六章  頭
第七章  口
第八章  手
第九章  腳與道路

第一章 人
人的生命週期分成四個階段
胎兒時期
孩童時期
長成期
衰老期

第二章 人的姿態變化
雙腳站立的人
跪坐的人
躺臥的人
與他人互動的人
消失不見的人
張口吐氣的人
離不開土地的凡人
鄰國人民
支撐家族的民族英雄
人的軀體
彎著身體的人
其他由人所衍生的字

第三章 大
「立」的衍生字
「天」與「辛」的衍生字
「」的衍生字
「夭」的衍生字
「文」的衍生字
「黃」的衍生字
其他由「大」所衍生的字

第四章 女
「母」的衍生字
萬民皆由女而生
女人的婚姻與生活處境

編輯手記

  「我的語言的限制意味著我的世界的限制。」--維根斯坦

  維根斯坦被稱為當代語言哲學的奠基者,他這句話言簡意賅,放諸四海皆準,道出了語言對於人的重要性:語言是經驗的總和,語言有多寬,世界就有多寬。

  但是,反過來也可以說,世界有多豐富,語言就有多豐富。不管是通用各地的國際語言,還是某個瀕臨絕跡的少數族群語言,也不管是形諸文字或是口耳相傳。只要是發展為一群人共通的聲音溝通系統,都有其豐富的內涵。

  至於如何以書寫符號來記錄語言,不同的文化各有不同的取徑,有些語言走的是拼音的路,以一組符號來表達該語言所使用的聲音元件,像是英文、西班牙文、法文、德文、俄文等幾種國際強勢語言都是拼音文字。拼音的優勢顯而易見,只需要以數量極少的符號就可以表示無窮的聲音組合。

  印刷術的問世,更是有利於拼音文字。我們只要想一想,十六世紀歐洲的印坊只要備有三十種左右的活字鉛字,就可以開始印書,而同時期明代的印坊卻是少說得做出上千個活字才能運作,兩者之間投注的資源和產出的效率,有多麼大的差別啊!

  歐洲的知識傳播在使用活字印刷術之後突飛猛進,與歐洲文字採用拼音系統有很大的關係。這層優勢看在二十世紀的蔡元培、瞿秋白眼中,當然會覺得以象形為根基的漢字是落伍的,應該予以「羅馬化」、「拉丁化」,改成拼音文字,才是正途。蔡元培是中央研究院第一任院長,他在南京政府時期推出的「國語羅馬字」遭到冷落。而做過中共總書記的瞿秋白死於國民政府槍下,中文拉丁化雖然有些成效,但也難以為繼。不過,中共建政之後,「中國文字改革」的工作繼續進行,最後出現了今天在中國大陸通用的簡體字。

  或許是中國的積弱使得蔡、瞿等人(還包括趙元任)無視於中文的優勢:歷經了數千年發展,形成出一套完備的符號系統,許多先民的生活方式、地理環境,乃至世界觀與宇宙觀,至今還留存其中。這是其他拼音文字所無法企及的。

  只是中文歷經甲骨文、金文、篆書、隸書、楷書,乃至簡體字的發展,筆畫由彎而直,形體也越趨方正,慢慢失去了古代漢字的具象,以致於今天提到漢字的造型,就想到艱澀的文字之學,那是屬於專家的學術角落,一般讀者恐怕難以親近。

  初次翻看廖文豪老師的書稿時,浮上心頭的大致是這麼個看法。但是,這個印象隨即被推翻。讀者只要稍加翻個幾頁就可知道,作者重新勾勒了漢字演變的路徑,方便讀者以更直觀的方式來理解「一個字為什麼長這樣而非長那樣」,同時也打破了部首的限制。

  所謂的部首,就是許多字所共有的一個零件,被挑出來作為分類的依據。部首往往也代表了意義上的關連,但不見得能描述字與字之間的邏輯關連。比方說,「泳」和「流」都有「水」的偏旁,被歸為「水」部。但其實光是「永」就已經有了水的意涵,而「流」則是描繪嬰兒頭下腳上,順著羊水呱呱墜地。這兩個字都與「水」有關,但是彼此沒有意義的關連。

  「流」、「呆」和「教」分屬不同部首,看起來也全無關係,但其實都與「子」有關。嬰兒頭下腳上出世,四肢不發達,意識不明,需要大人用雙手抱持,就是「呆」(所以呆不是上「口」下「木」)。等到過了幾年,大人用手拿筆(),帶小孩(子),學畫叉,那就是「教」了。

  《漢字樹》從構字的邏輯重建了字與字之間的關連,把原本是象形文字的漢字放回圖像的脈絡來理解,整理出一張又一張的漢字樹狀圖。讀者只要拎起「肉粽頭」,馬上就可以撈起一串字。讓我們這些以中文為母語、時刻接觸而再也不起疑的使用者重新去感受造字的掙扎與想像,也重新建立我們與漢字的關係。

  尤其在今天,電腦普及的結果之一便是拿筆寫字的機會越來越少,許多漢字的形音只是個概念,拿起筆寫不出來,或是出現別字的情形屢見不鮮,這都說明了我們跟漢字的緣分日漸淡薄。廖文豪老師的《漢字樹》,無疑以清晰簡明而又趣味盎然的方式,為讀者介紹了漢字之美、漢字之妙,而且閱讀門檻不高,大概是小學高年級以上的程度就可以輕易進入。

  文化傳承不需侈言,也無須高言,在我們日常使用的漢字中,就有無窮的寶藏與樂趣可以發掘!




本文於 修改第 5 次
回應 回應給此人 推薦文章 列印 加入我的文摘
引用網址:https://city.udn.com/forum/trackback.jsp?no=50415&aid=4944443
(轉貼)《字族》簡介
推薦0


梅峰健保免費公投
等級:8
留言加入好友

 

海峽兩岸聯手


創意編排全新編撰寫嶄新詞條


  300年來第一創意百分百全新編輯概念百分百全新革命性字詞典


字 族  


---- 完全巔覆康熙字典的編輯方式


                                   字族---- 是將 形似音近 的字, 編串在一起的新發明、 新式編排的字


有利於查閱時, 舉一反三、 觸類旁通, 馬上認識三至五個, 甚至於十個生字而且因 形似音近 的字併排在一起, 很容意易立即分辨字形、 字音、字義的不同, 而快速提高識字效率; 利於正確造詞、 造句、 作文, 學生漢字使用能力無形中快速倍增


 傳統字詞典的內容編排, 不外乎: 一、按部首, 二、按音順, 三、按筆劃排列不論是按那一種方式編排, 其左右字與字間之 形或音 均無相似或相近可供聯繫或比較之用字族編排正好補足這個缺失, 字與字之間均有 形似或音近 之易淆字可立即辨正 檢索方法完全按照傳統方式, 不需另外學習


《康熙字典》創立以部首方式編排字典已歷時近三百年, 為市面所有各大小版本字詞典所遵尋沿用, 而《字族》首次澈底巔覆此一傳統編輯方式 這是一本不僅方便查索, 更是一本既可供閱讀, 又可快速識字的字詞典‧ 


本書預計收羅13,000個單字字頭(不含異體字俗體字及或體字),  30,000詞條(剃除日常語詞、冷辟詞條、不合時宜之過氣詞條)  詞條除釋義外, 併列近義詞、反義詞 另酌附例句


 全書預計1, 500頁, 大 32開,  軟面精裝


2010年 10月 出版‧ 它的新名字叫《字族》!             本《字族》的內容是以字形結構 為網的方式架構, 再輔以字根 串聯 這是一個全新觀念編成的權威著作 每個字頭併附篆字及簡体字可供讀者全方位使用, 為方便讀者與大陸資訊接軌, 附有標準之正確漢語拼音每一個字頭均精解字源結構, 準確釋義無疑這是百年來, 完全以讀者考量而編寫的嶄新工具書


全書引用先聖先賢的經典古籍名著例句,包括經、史、子、集、詩、詞、曲、賦、小說等,耳熟能詳的典籍遠超過百本擷取例句精彩詮釋字與詞條的正確意義,超過萬條,每一例句均附有典籍出處,方便讀者檢索原文深入瞭解,亦可謂是中國名句的大百科引得


總編輯魏成光, 早年主持台灣地球出版社及台灣古籍出版社, 并親執編務工作 發行對臺灣文教界具有深遠影響的: 細說錦繡中華彩色珍本  二、世界文明史16冊 三、世界風物志23冊  四、中國文明史24冊  及五、中國經典名著譯叢近百冊


編者自習精研 小篆字形結構 逾廿年,其間屢受 王寧 (北京師範大學博士生導師) 賴明德 (前國立臺灣師範大學文學院院長 許錟輝 (國立臺灣師範大學國文系教授) 謝清俊 (中央研究院研究員),  等諸位先生的鼓勵、 指導、 獎掖導引作者在學習的摸索過程中, 宛若盞盞明燈,不時鞭策作者孜孜矻矻不懈前進並迭次受邀臺灣師範大學中文研究所博士班, 專題演講 小篆字形結構 且曾受邀至中央研究院資訊研究所, 為時三個月的 小篆字形結構 切磋研究教學‧ 


編者全面深入有系統的解剖說文篆字字形結構,發現篆字是由二百餘個字根所組成, 每個字有其 形、音、義 造字口絕例一,予以還原製作衍生表例二後, 赫然發現篆字確實是或頗省改創造於大篆的嶄新的字體, 更明確的說,篆字是中國第一個由製造而非約定俗成的文字, 而說文解字是一本非常有組織的篆字造字祕笈,包羅萬象,天文、地理、五行、飛禽、走獸、蟲魚、艹木, 卻決非是某個個人、或小團體所能完成, 簡單說, 說文的母稿是由當年李斯奏請秦始皇後「書同文取大篆或頗省改 所謂小篆者也」的版本




屏棄以聲韻繫聯, 而自創以形源為主之字族體系,本書字根與字串之選取是嚴格遵守小篆字形結構其規律的


 終成此一開創字詞典嶄新編輯概念之濫觴一一《字族》!


字族編纂委員會 


總編纂 魏成光 謹識  






開發網路字族


小學生字族


簡體字族


網路開放檢索


                             

「題」字錯了嗎? 是古字啦!
圖/吳佩玲

「桃園縣展演中心」今年底要舉辦金馬獎,不少縣民對書卷般的建築物都會行注目禮,尤其是前縣長朱立倫紅色的落款。

縣議員邱素芬質詢問文化局長張壯謀,那個「ㄊㄧˊ」字是別字嗎?不少小朋友指著「ㄊ一ˊ」告訴媽媽「那個字寫錯了」。文化局長張壯謀表示,落款是請縣內知名書法家黃群英代筆,「ㄊㄧˊ」下方不是「走」字邊,寫成「正」是古字。

邱素芬說,她翻閱歷代145個字體,終於在明朝才子文徵明所寫的「跋萬歲通天進帖」中找到,其實公共建築中藝術字體,如能加點告示就不會有誤解了。

要進修!就上 udn 進修線上

【2010/04/29 聯合報】

回應 回應給此人 推薦文章 列印 加入我的文摘
引用網址:https://city.udn.com/forum/trackback.jsp?no=50415&aid=3956434
1
推薦0


梅峰健保免費公投
等級:8
留言加入好友

 

試論部件拆分的相對性 (初稿)

----漢字拆分的相對論----

 1.0 引言

  2.0 拆分在理論上的相對性

   1. 部件的客觀獨立性vs.主觀規定性 2. 交重結構應否拆分

 3. 單筆應否拆出 4. 多筆部件的拆分問題

 5. 分割溝問題 6. 相似部件的認同問題

 7. 筆畫能否切割問題    8. 部件與理據

3.0 拆分實踐中的相對性

 4.0 從歸納統計中擬定部件

 5.0  基元表的擬定與本文小結

 

1.0 引言

漢字的拆分,由於如下因素,有其相對性,因而拆分後各家所得的部件表便有相當的差異:

(1) 字集的大小,(2)拆分的目的,(3)拆分的理念及方式。

字集的大小不僅影響拆分後的部件數量,也影響拆分的方式。例如,是個部首,有完整的字義,含的字,除豆的部首屬字外,還包括登、()、豊、()、壹 等字屬,對於5萬字以上的字集言,估計當在100字以上,直接以豆為部件,可算是合理的設計。但就七千多個的通用字言,豆拆分為二,則是較佳的設計,因為成字部件太多,不便於編碼輸入。

漢字拆分的目的一般是作為形碼輸入,另一個目的是筆者所強調的是將漢字解構,以求基本結構(基元)。再以豆為例,把豆分為[一口][立底] 2部件;還是把它分為一、口、[立底] 3部件,作為編碼輸入,都是可行的方式。但為求基元,豆一分為三是必須的,因為分後的餘件都是組字頻率高的基元。

就拆分的理念言,主要與拆分的目的相關,如果只為編碼輸入,一些難以拆分的字,當然可以不拆分,也可以去頭摘尾,甚至以萬用符號代替,都可達到目的。但若為教學著想,為了在拆分過程中學習漢字的筆序,認識漢字的基本結構,就不能這樣做。以”()字為例,這是較難寫的繁體字,一般以整字編碼輸入,不必分解。但在書寫時它還得依筆序分為3個單元:中間的骨幹[] (),左方部件E,右方部件?,這些也是黽字的基元。

另一種拆分理念不同的是部件或基元應否含義。漢字由獨體的組成合體的,拆分是它的逆反過程,照理說求得含義的基元,應是拆分的理想目標。但隸變之後的漢字,在合體字中說明字理(形聲或會意)比較容易;而拆分後的部件大都是獨體,很難自現有字形中去說明字理(象形或指事),必須借助於古字體來作解釋。如果堅持每一部件都要含義,勢必增加拆分的難度而無法拆分到末級。

在另一方面,尋求含義的基元,發現同義異形的部件,不僅有利於簡化編碼的設計,(例如把?/?編為同碼),更可認知字形的古今演變,對於探討漢字的基本結構,是一項富於啟發性、前瞻性的工作。因為漢字拆分的最高目標不在於編碼輸入,而在求取基本結構,在於從漢字解構過程中,去發現優化漢字的途徑。例如,如何統合同義異形的基元,簡化漢字壘床架屋式的複雜結構等等。

2.0 拆分在理論上的相對性

 以下各節摘述一些專家關於拆分的理論,並補充筆者個人的一些看法。

因部件構形不易在屏幕上表達,下文以英文字母表示部件的相對位置:頭=t,底=d,旁=p,邊=b,框=k,心=x,角= j,省=s…。例如 [d] 表鼠字的底部,[t] 表惠字的頭部(?)[p]字的左旁(廿口夫的組合)[j]表黎字右上角(?+?)

 

1部件的客觀獨立性vs.主觀規定性   

費錦昌先生在總結多家部件理論的基礎上,針對拆分問題作了分析研究,得出了部件的定義。他認為部件是 ”現代漢字字形中具有獨立組字能力的構字單位,它大於或等於筆畫、小於或等於整字。而筆畫在滿足一定條件下參與構字時,就是所謂的單筆部件。與單筆部件相對應的多筆部件即是一般意義上的部件。另外,他還提出了復合部件的概念,那是由多筆部件進一步組合而成的,可用於識字教學。例如鼻、()、鼓、麻…,既是部首,又可算是復合部件。

部件本身雖具有組字能力的客觀獨立性,卻帶有相當程度的主觀的人為規定性,這幾乎是公認的事實。費氏認為解決好部件的科學定義後,就可找到拆分原則和方法,確定部件的範圍和數量。但由於眾多的實踐證明,筆者認為即使解決好部件的科學定義,也不易獲得統一的拆分原則和方法,在本質上部件的客觀獨立性只是相對的,這是筆者與費氏看法不同之處。

吳錚在<從識字教學看部件拆分原則>,認為若以識字教學為目的,不應籠統將某一原則視為首要的衡量標準,原則間存在著相互制約的關係,必須具體的確定各原則的適用範圍。

曉東先生則認為:相對獨立性是部件的基本特徵,具體表現在通用性、不可分割性和部件間有分割溝這些特點上。依筆者的解釋:所謂通用性,即具有組字的能力,可與他字匹配。所謂不可分割性,即認為它是基礎部件,不宜再行拆分。而所謂部件間分割溝,指的可能是在漢字構形上顯示的自然界限。然而這三個所謂部件特徵,都是人為規定的部件性質也可能因設計者而異,並不是絕對的。換言之,下了部件的定義之後,仍難有一致的拆分方式及成果。以下的討論就可證明此點。

 

2. 交重結構應否拆分

專家們大多認為交重結構不應拆分,例如潘德孚先生認為:交叉結構、包圍結構都是漢

字的基本結構,基本結構若加以拆分,會有多種拆法,不符合漢字的結構規律GF 3001規範5.1也是如此規定。筆者以為對這問題不妨作反向思考:如果不拆分,會導致什麼結果?以GF規範所列部件為例,筆者認為可拆分的部件就有如下47 個:旡、禸、冘、夬、毋、內、丹、妻t、冉、央、史、冊、斥、庚d、曳、弗、母、夷、單d、舟、聿、兼dd、更、裏、束、、朿、事、果、垂、秉、臾、庸d、惠t、革、柬、禺、重、鬼、禹、p、象、黑、熏、s。如果單筆相交也不拆分的話,更增加了如下13個成字部件:孓、中、巿、尹、弔、未、末、本、世、申、甲、電、吏。 這就說明了GF-3001規範的設想雖好,卻無實用價值,因為清單內共有560個部件,實在是太多了。

當然 可不可 拆分與 要不要 拆分是兩回事,有的字雖可拆分,但為著別方面的考量,也可以不予拆分,拆分與否也是相對的。

筆者認為在一定條件下,交重結構可以拆分其一,可依照部件順序分解的,則下列部件

就可拆開:、毋、內、冉、央、史、冊、斥、庚d、母、單d、舟、聿、兼dd、更、裏、事、臾、庸d、惠t、革、禺、禹、p、象、黑、熏、s其二,有字理可依的,則交夾結構的部件如:夷、束、、朿、秉、柬,亦可拆開。

成字部件由於只構成本字,實際上失去了部件作為構字單位的意義。多筆畫的成字部件太多,不便於記憶,也不利於編碼輸入。

 

3單筆應否拆出

基本筆畫 橫、豎、撇、點、折應可作為部件之一,幾乎已成為定論。但專家們的意見,也

並非完全一致。如的拆分。蘇培成和曉東先生以成字優先原則拆分為[二、小][一、丁]拆分為[二、?]。傅永和先生則以有明顯的分割溝,而拆成為[] [?]

由於不考慮分割溝,費氏對含的字,有的視為作了拆分,如字;有的視為相接的筆畫不作拆分,如字。據統計,橫筆在 <辭海的正體字中出現頻度最高,約為30%。筆者認為在拆分作業上,單筆畫  不宜有兩屬性,原則上均可拆分。至於能否拆分,得視分後餘件能否成字或可否與他字匹配。盡可能將從字中拆分出來,這樣可以增加多筆部件的統字率。

在通常情況下,人們認為點畫在字中的作用和地位都不能算做部件。但是仍然有相當一部分字中的點畫,看起來與其它部件的作用相當,如勺、玉、主、太、犬、戶 等字。在費氏的

拆分理論中不排除點畫的拆分。而容許拆分也造成了新的問題,即拆分後所得的部件構形完全相同,如太/犬拆分後同為[?]/主拆分後同為[?]//巳拆分後同為[t?]從而使不少字的區別在部件這一層次很難體現。筆者認為要不要拆分,其重點不在於此,只要它們的區別性可體現在這一層次就可以了。

另外,與蘇培成先生一樣,曉東先生也沒有對二字作拆分。這可能是因為他們都把兩字的下半部作為點畫來看待。筆者認為,乒乓二字的下半部應可視為撇筆及捺筆的變形,他們在結構模式上與兵、岳二字具有明顯的相似性,對他們作拆分符合字形結構和人們的心理習慣。

倘若單筆畫不能作為部件,則下列各字(舉例):亂、虯、紮、禮、氕、舊、軋、幻、已、幣、

衛、個、乳、乒、乓、再,都變成了成字部件。這個例子說明在一定條件下,把單筆畫當作部件拆分,對於編碼輸入有利。重要的是單筆部件應給予某些限制。例如,費氏在他的拆分理論中規定每次拆分只能有一個單筆部件,並且每次拆分後都應包含多筆部件,這些原則值得大家借鑒。

再如有些限制的規定也是可以參考的:對離接單筆部件作拆分,應保證拆分後的多筆部件成

字或具有較強的通用性,如字,拆分後的多筆部件是。又如字,拆分後的幾個部件都是整字。而如字,其中的筆畫塊不成字也不具有通用性,故不作拆分。

又如在一分為二拆出的兩個部件中,務必至少有一個是部首或成字的前提下,才能進行,如:良[? ],亞[-業]。否則不拆分,如:為、甫 等字。

要之,筆者認為基本筆畫 橫、豎、撇、點()、折 都可作為部件之一,在一定條件及限制下,都可拆分。而所謂有條件的拆分,各家的具體規定不同,也顯示了拆分規則的相對性。

 

4多筆部件的拆分問題

多筆部件有些筆畫過多。如 鼠、熏、曾、黑、惠 等字,筆畫都在十畫以上。造成如此拆分結

果的原因是部件內部的組成具有唯一性。將他們拆分出來與不作拆分,並不減少部件總數。但

人的短時記憶一般以七個單位為限。因此從識字教學的角度看,如果拆出部件本身筆畫繁多,

識記較為困難,並不是一件好事。

這涉及對於拆分的寬嚴態度,蘇培成和曉東先生的理論主張用寬式拆分,即只要該字的其中一個部件具有較強的通用性,可以替換其它部件,就應對它作拆分。這樣難免增加了一些通用性較弱且不成字的部件。費錦昌先生在其理論中強調了漢字部件的通用性,主張採用嚴式拆分,從而增加了像上例所舉的一些成字部件。筆者傾向於前者,即寬式拆分,認為除了分出的部件只能與本字組字,如非、之類外,其它應盡可能予以拆分。

有些成字部件如果本身的識記有一定困難,就很難作為構成其它漢字的基礎單位。成字部件身兼成字及部件兩任,如何限制成字部件數量,採用科學而簡易的方法使它確定在一定數量範圍之內,就顯得相當重要。以章為例,章為象形字,可分為[立早],但分為 [立日十] 可能更佳。

有人採用首尾碼來定義並輸入,對比較特別的漢字作了大部件處理,他們認為這樣既可減少基本部件數目,又不會為拆分漢字而煩惱。例如:那、制、敖、帶、敢、眉、農、發等等,便可如此處理。筆者並不反對這樣的輸入方式,但總認為這是一種權宜之計,不足為法。何況筆者追求的是漢字的基本結構,大部件不是拆分的最後成果。

 

分割溝問題

有明顯間隙的部件,可以一目了然的看出來。對那些沒有明顯間隙的、連接在一起構字的部件,潘氏提出隱性間隙 修改第 1 次

回應 回應給此人 推薦文章 列印 加入我的文摘
引用網址:https://city.udn.com/forum/trackback.jsp?no=50415&aid=2980309
(轉貼)漢字構形資料庫的建置與缺字處理
推薦0


梅峰健保免費公投
等級:8
留言加入好友

 

漢字構形資料庫的建置與缺字處理 

莊德明 derming@gate.sinica.edu.tw

中研院資訊科學研究所 

第三屆兩岸三院信息技術與應用交流研討會 2005.06.20-23

 
 
 
 

 

「員」的字形演變及解形 

節錄自《漢語大字典》

 
 
 
 

 

計算機中貧乏的漢字信息 

 

 

ㄩㄢˊ 

注音 

口月山中 

戈月山金 

口月人 

口月山金 

田口月金 

倉頡碼 

 

2A505 

8C9F 

5458 

54E1 

5713 

Unicode 

ADFB 

B6EA 

Big5 

 

? 

回應 回應給此人 推薦文章 列印 加入我的文摘
引用網址:https://city.udn.com/forum/trackback.jsp?no=50415&aid=2980296
(轉貼)漢字構形資料庫的建置與缺字處理
推薦0


梅峰健保免費公投
等級:8
留言加入好友

 
這是 http://2a3y.sdb.ac.cn/upload%5Cno03_15.ppt 的 HTML 檔。
G o o g l e 在網路漫遊時會自動將檔案轉換成 HTML 網頁。
 
 
 

漢字構形資料庫的建置與缺字處理 

莊德明 derming@gate.sinica.edu.tw

中研院資訊科學研究所 

第三屆兩岸三院信息技術與應用交流研討會 2005.06.20-23

 
 
 
 

 

「員」的字形演變及解形 

節錄自《漢語大字典》

 
 
 
 

 

計算機中貧乏的漢字信息 

 

 

ㄩㄢˊ 

注音 

口月山中 

戈月山金 

口月人 

口月山金 

田口月金 

倉頡碼 

 

2A505 

8C9F 

5458 

54E1 

5713 

Unicode 

ADFB 

B6EA 

Big5 

 

? 

回應 回應給此人 推薦文章 列印 加入我的文摘
引用網址:https://city.udn.com/forum/trackback.jsp?no=50415&aid=2980292
(轉貼)香港電腦漢字楷體字形參考指引
推薦0


梅峰健保免費公投
等級:8
留言加入好友

 


May 4, 2001  Document No.: DN43R27

 

香港電腦漢字楷體字形參考指引

(Version 0306R4)

200153849)

please fax your comment by May 8, 2001 to Dr. Lu Qin at 2774 0842

or email to csluqin@comp.polyu.edu.hk 

  1. 主題內容

    1.1  本指引原則上根據漢字的構形規律及香港常用字形制定,以定義漢字部件形狀的方式來描述漢字字形,主要目的是為廠商提供適合香港使用的使用的電腦用楷體漢字字形作為參考進行規定,規定根據漢字的構形規律及香港常用字字形原則制定

    1.2  本指引適用於ISO/IEC 10646國際標準中的多語種基本多文種平面(BMPA擴充集(Extension A、及《香港增補字符集》(Hong Kong Supplementary Character Set)內的漢字本指引不適用於ISO/IEC 10646國際標準所包括的所包括的內地規範簡化字及只為日本、韓國、越南新加坡單一地區使用的漢字1

    1. 本指引以國家語言文字工作委員會於一九九七年十二月一日發布的GF 3001-1997  《信息處理用GB13000.1字符集漢字部件規範》(文件號:GF 3001-1997  為基礎,根據本指引提供的部件拆分原則,羅列本指引所適用漢字之所有部件,並在本指引的《香港電腦漢字字形基礎部件表》內例舉適用於香港字形的漢字。
    2. 本指引只描述漢字部件的筆結構,並不對漢字或其部件的大小和比例構成限制。
    3. 1.4  本指引只描述漢字部件的筆畫結構,並不對漢字及其部件的大小和比例構成限制。 本指引只規定適用於電腦使用的楷體字形。
 
  1. 參考標準與文獻

標準

    1. ISO/IEC 10646-1:2000(E), International Standard: Information Technology-Universal Multiple-Octet Coded Character Set(UCS) - Part1: Architecture and Basic Multilingual Plane, ISO/IEC, 2000
    2. GB 13000.1-93 信息技術  通用多八位編碼字符集(UCS第一部分  體系結構與基本多文種平面》,國家技術監督局,中國標準出版社,199312 24
    3. GB/T 13443-92 信息交換用漢字128X128點陣楷體字模集及數據集國家技術監督局,中國標準出版社,199221
    4. GB 12200.1-90 漢語信息處理詞匯  01部分:基本術語》,國家技術監督局,中國標準出版社,19901
    5. GB/T 12200.2-94 漢語信息處理詞匯  02部分:漢語和漢字國家技術監督局,中國標準出版社,199412 7
 

文獻

    2.6 GF3001-1997《國家語言文字工作委員會 語言文字規範  信息處理用GB13000.1字符集漢字部件規範》,國家語言文字工作委員會, 1997121

    2.7 李學銘主編,《常用字字形表(二零零零年修訂本)》, 香港教育學院,2000

    1. The Unicode Consortium, The Unicode Standard Version 3.0, The Unicode Inc. , 2000
    2. 中國文字改革委員會,《簡化字總表(新版)》,中國文字改革委員會,1986
    3. 臺灣教育部,《國字標準字體宋體母稿 - 教育部字序》臺灣教育部, 19982
    4. 臺灣教育部,《常用國字標準字體筆順手冊》臺灣教育部, 199911
    5. 國家語言文字工作委員會,《現代漢語通用字  筆順規範》,國家語言文字工作委員會,語文出版社,19878
    6. 蘇培成,《6現代漢字學綱要》,北京大學出版社出版199410
    7. 馬顯彬,《漢字筆畫定量研究》﹐《語文建設通訊(香港》第63期﹐20004 
    8. 《康熙字典》,中華書局,19581月第一版,19972月第9次印刷
    9. 漢語大字典編輯委員會,《漢語大字典》,湖北辭書出版社和四川辭書出版社,198610
    10. 《電腦用中文字型與字碼對照表》2,《技術通報C-26》,財團法人工業策進會,19845
    11. 《香港增補字符集》,香港特別行政區政府,199928
 
  1. 術語

    3.1 漢字 Chinese character / Hanzi (GB 12200.190)

     書寫漢語的符號系統。其他一些國家或民族也用漢字作為書寫符號。

3.2 簡化字 simplified Chinese character(GB 12200.190)

    特指內地於1986年公布的《簡化字總表(新版)(見上文第2.9)所收納的2 235字。在內地,這些字取代了筆劃較多的漢字作為正體。

    1. UCS-2編碼 UCS-2 code

    ISO/IEC 10646 國際標準中的以二字節定義的編碼系統。UCS-2 編碼以十六進制表示。UCS-2 編碼與Unicdoe 編碼一致。

    1. 特指4.5內地於1986年公布的《簡化字總表》,共2,235字。統一的中日韓文字Unified CJK Ideographs( ISO/IEC 10646  信息技術  通用多八位編碼字符集)

    ISO/IEC 10646 國際國際標準包括的中國、日本、韓國及其他國家和地區經認同規則整合後所採納的漢字的統稱。

    3.5 中日韓文字之字集標準CJK Ideograph Sources( ISO/IEC 10646 Annex S 信息技術  通用多八位編碼字符集附件 S附件S)

          ISO/IEC 10646 國際國際標準中基本多文種平面內的中日韓文字是在整合只包括國、本、及其他國家和地區原有的電腦文字標準後得出的中已定義之漢字這些原有的電腦文字標準或規範稱為原字集。原字集的頒標準國家和地區均有代號,其中G, H, J, K, S, T, V 分別代表中國內地香港日本韓國新加坡台灣越南。

    3.6 5.5 The Source Separation Rule( ISO/IEC 10646  信息技術  認同規則Unification Procedure( ISO/IEC 10646  Annex S信息技術  通用多八位編碼字符集附件 S)

    ISO/IEC 10646 國際標準使用的一套漢字統一整合規則3。根據認同規則被認同的漢字不會分別編碼,而在不違反認同規則的原則下,ISO/IEC 10646標準不限制某一碼位的異體漢漢字的具體字形。

    3.7 原字集分別編碼原則 Source Separation Rule( ISO/IEC 10646  Annex S信息技術  通用多八位編碼字符集附件 S)

    凡在原字集中具有各自的單獨代碼的異體字,不受認同規則限制,在 ISO/IEC 10646 國際標準中予以保留且分別編碼仍保持單獨代碼,以保 ISO/IEC 10646 與原字集之間的映射關係不受影響。

    1. 非同源漢字 non-cognate characters ( ISO/IEC 10646  Annex S信息技術  通用多八位編碼字符集附件 S)

         ISO/IEC 10646 國際標準中之術語。指字形近似但無字源關係或意義、用法不同的漢字,因此分別編碼,例如:“士”和“土”。在有些國家和地區認為是異體的漢字,在其他國家和地區會當作非同源漢字,例如:""(UCS-2 編碼為 "6723")  ""(UCS-2編碼為 "81A7")。因此,ISO/IEC 10646 國際標準中將一些容易混淆的非同源漢字在附件 S中列出。

    3.9 楷體 Kai Ti(GB/T 12200.294)

        漢字主要印刷體之一。由手寫的正規楷書發展而來。

    3.10  筆劃 stroke (GB/T 12200.294)

    構成楷書漢字字形的最小連筆單位。

    3.11  筆形  stroke featureGF 3001-1997

             筆畫的具體形狀。楷書漢字的筆形依據筆勢和走向可以分為數十種,其基本的類別為“一”(橫)、“”(豎)、“”(撇)、“、”(點)、“”(捺)和“ ”(折)。

    3.12  筆順stroke order (GF 3001-1997)

                書寫每個漢字時筆畫的次序和方向。

    3.13  筆數 stroke count (GB/T 12200.294)

             構成一個漢字或漢字部件的筆畫數目。

    3.14   漢字部件  Chinese character component (GB/T 12200.294)

             由筆畫組成的具有組配漢字功能的構字單位。簡稱“部件”。

    例如:“木、心、口、也”。 漢字的偏旁部首是部件的一種。

    3.15 基礎部件  basic component (GF 3001-1997)

             最小的不再拆分的部件叫基礎部件,也稱單純部件。基礎部件處於漢字結構的最低層,又稱末級部件。例如“男”中的“田”、“力”

    3.16  主形部件 main-glyphprincipal component

             來源相同的一組部件中,具有代表性形狀的部件,例如:“又”(見於“設”字)與“”(見於“燦”字)兩者之中,“又”為主形部件。“設”中的“又”和“燦” 、“”中的主形“又”。主形部件具有代表和稱說本組部件的作用。

    3.17  變體部件variant componentcomponent varian

                來源相同的一組部件中,形狀受到位置影響而變化的部件。例如:“又”(見於“設”字)與“”(見於“燦”字)兩者之中,“”為變體部件。燦” 中“”為“又”的變體部件。、“”中的“”。

    3.18  形似部件 non-cognatesimilar components

                形狀相似,但無字源關係的兩個或多個部件,例如:“士”和“土”。

    3.19 部件拆分(GF 3001-1997) component decomposition

    將漢字拆分為部件稱部件拆分。

    3.20 有理據拆分無理據拆分 structural-based decomposition and compromised decomposition

          根據漢字構成的結構理據所進行的部件拆分,稱有理據拆分;當無法分析理據或理據與原始形成的字形不一致時,依照已定義之部件所進行的部件拆分,稱無理據拆分。

5.15 包含字形               一個作為成字部件的漢字,其亦包含於其它漢字中。“賁”是“墳憤僨”等字的包含字形。

  1. 部件拆分原則

    本指引對上文適用範圍內的漢字進行部件拆分,目的是以定義漢字部件形狀的方式來描述漢字字形本指引只描述漢字部件的筆劃結構,並不對漢字或其部件的大小和比例構成限制。

    拆分原則本指引根據《信息處理用GB13000.1字符集漢字部件規範》第5段的《漢字基礎部件表》使用規則所載的部件拆分原則為基礎4,對本指引適用範圍內的漢字進行拆分。具體的拆分原則如下:

    4.1 盡量延用《信息處理用GB13000.1字符集漢字部件規範》已有部件,除非部形狀有異,例如:《信息處理用GB13000.1字符集漢字部件規範》只有“土"字部件,而本指引另有“"

    4.2 不違背形體的原則:

    1. 交重不拆,例如:“或中的“戈不會再拆分;
    2. 相離相接可拆,例如:“計拆分成“言和“十",“頁"拆分成“和“貝"
    3. 少數不影響結構和筆數的筆搭掛,按相接處理,例如:“頁"中的“和“貝"當作相接。
    4. 遵照結構規律的原則:

    部件組成合乎漢字構件原理,進行有理據拆分,例如:計拆分成“言和“十"。無法分析理據或與字形原始形成出現矛盾時,依形進行無理據拆分,例如:“丟"字原為“ " 由“”(撇)和“去"組成,而香港習慣已將撇變成橫,且“王與“已在《信息處理用GB13000.1字符集漢字部件規範》給出,因此“丟"以無理據拆分成“王與“

    1. 合理控制下限的原則:
    2. 兩個以上的相離或相接部分,若其中一個無構成其他字的能力,則不再拆分,例如:“"不會再拆成“ " 和“" 因“"不獨立構字。
    3. 兩個相離的對稱部分,不獨立構字,不再拆分,例如:“"
    4. 依筆形區分部件的原則:
    5. 屬於同一部件但筆形不同的,按照主形部件和變體部件分別列出。
    6. 屬於不同源的部件,筆形完全相同的,歸為當作同一部件。
    7. 部件的大小和筆畫的絕對長短粗細不作為區分部件的標準,例如:“部件作獨體漢字“"用和作部件時( “匹"),“一(橫)的長短習慣會不同。
    8. 綜合衡量的原則:以上原則無法兼顧時,權衡利弊,綜合處理。

7 漢字的結構類型(是否已窮列?是否列明參考標準?)                本參考指引規定的漢字基本結構類型有13分別用括號中的結構符號表示:左右結構(a);上下結構(b);右上包圍結構(c);左上包圍結構(d);左下包圍結構(e);左上右三包圍結構(f);左下右三包圍結構(g);上左下三包圍結構(h);全包圍結構(i);獨體結構(j);左中右結構(k);上中下結構(l);交叉結構(m)。

5. 關於《香港電腦漢字楷體字形基礎部件表》

                 本表列載的基礎部件合共614個,是對本指引適用漢字集進行拆分的結果。

    5.1   部件排列方

    1. 部件按筆數從少到多順序排列。
    2. 數相同的部件,則按起筆“橫豎撇點折”順序排列。

87.3  欄目說明87.3.1  序號:部件的排列順序號。87.3.2   部件:列出部件的基本形狀和出處。關於出處,每個部件之下均出現一個四位數目 -ABCD”, 若數字為“0 代表找到,若數字為“1 代表找不到。A表示《康熙字典》的出處B表示《漢語大字典》的出處C表示 “大五碼”的出處D表示 “香港增補字符集”的出處87.3.3   筆劃數:列出部件的基本筆劃數目。例字:列出包含該部件的漢字楷體字形作為示例。若例字後面有“……”者,表示沒有窮舉,還有其他例字。若例字後面沒有“……”者,表示已經窮舉。每個例字之下方均列出所代表的Unicode碼。87.3.5   位置:對部分變體部件所在的典型位置加以描述。主要包括“上、中、下、左、右、內、外、左上、左下、右上、右下、獨體等”。(是否仍會說明位置?)8.3.5  附註:與部件相關的補充說明。87.3.66   GB組號和GB序號:如部件同時載列於 《信息處理用GB13000.1字符集漢字部件規範》,該規範編予該部件的組號和序號也一併列出,以便檢索。

89.《香港電腦漢字字形基礎部件表》5.2 欄目說明

5.2.1  序號:列出部件的排列順序號。

5.2.2 部件:列出部件的基本形狀和出處代碼。

    7.3.2.1狀僅表明筆畫結構,並不對該漢字或其部件的大小和比例構成限制出處表示該部件是否出現在如下四個參考文獻中的文字。出處表示由該部件組成的漢字是否出現在以下四種參考文獻中。出處代碼以四個數字(ABCD)組成出現以數字表示,“0 為出現,“1 為未出現。參考文獻由四位數目-AB

      A:《康熙字典》

      B:《漢語大字典》

      :“大五碼”(2.17)

      :《香港增補字符集 》

      "0"表示有關的參考文獻所收的漢字有使用該部件,“1”表示沒有。由於本指引適用範圍內的漢字不一定是中文傳統中文漢字,出處代碼可就該部件是否用於中文漢字所用提供附加的參考信息。

    5.2.3   數:列出部件的基本實際書寫筆數目。

5.2.4    例字:列出包含該部件的漢字楷體字形作為示例。

    1. 例字後面有“……”者,表示沒有窮舉,還有其他例字。
    2. 例字後面沒有“……”者,表示已經窮舉。
    3. 每個例字之下方均列出所代表的UCS-2 碼。有"*"者表示該字收錄於 4.2 《常用字字形表(二零零零年修訂本)出處中出現的漢字
    4. UCS-2 編碼下方標明該例字的出處,出處及標示與5.2.2相同。

    5.2.5 附註:與部件相關的補充說明,例如標示由原字集分別編碼原則而分別編碼的漢字,及非同源漢字。

    5.2.6  GB組號和GB序號:如部件同時原來載列於 《信息處理用GB13000.1字符集漢字部件規範》,該規範編予該部件的組號和序號也一併列出,以便檢索。由於《信息處理用GB13000.1字符集漢字部件規範》不是字形規範,而且內地的書寫習慣與香港不盡相同,因此其所該規範所列的部件形狀可能與本指引所列的對等部件形狀之字形有略有不同

1 本指引建議廠商參照ISO/IEC 10646標準中 G 列字形製造此類漢字

2台灣工業標準“大五碼"之正式文獻

3 認同規則原文見 ISO/IEC 10646 Annex S (Informative) Procedure for the Unification and Arrangement of CJK Ideographs

4 拆分原則只適用於本指引適用範圍內的漢字。因由於本指引的適用範圍不包括ISO/IEC 10646國際標準中的內地規範簡化字及僅在日本、韓國、越南、新加坡等一地使用的漢字,因此拆分出來的部件不包括這批漢字獨有的部件,如簡化字部件




本文於 修改第 1 次
回應 回應給此人 推薦文章 列印 加入我的文摘
引用網址:https://city.udn.com/forum/trackback.jsp?no=50415&aid=2980279
(轉貼)漢字印刷字形的整理
推薦0


梅峰健保免費公投
等級:8
留言加入好友

 

漢字印刷字形的整理

Page 1 of 6

莊德明

壹、字形整理的回顧

目前電腦處理漢字的種種問題,最主要的原因是電腦中的漢字信息嚴重不足,其中又以字形的問題最需迫切解決。從19939月起,本實驗室即著手於漢字字形的整理工作,並陸續發表多篇論文【1,2,3,4,5,6】。由這些論文的發表順序中,可以發現早期的字形整理工作,主要在建立字形資料庫,其中重要的參考文件為《中文電腦基本用字研究》【7】、〈中國文字之結構模式及其分析〉【8】及《漢字綜合索引字典》【9】。

《中文電腦基本用字研究》一書,共蒐集8532個字,另有參考字形597個,統計共2022604字次,此即〈中文電腦基本用字表〉,以下簡稱林樹字集。由於往後在台灣並沒有更好的文字統計,所以我們仍以此字集為藍本。另外,〈中國文字之結構模式及其分析〉一文測試了十幾種常用的構字方式,並統計使用的頻度,發現只用橫連(?)、直連(?)及包含(?)三種組合方式,可以大幅簡化漢字的結構。採用這三種組合方式,將林樹字集逐字拆分後,得出496個字根,簡稱〈交大字根集〉。至於《漢字綜合索引字典》一書,則記錄著林樹字集8532個字的字根式,如『堰=土?(匚?(日?女))』。這496個字根,也曾經針對《中文大辭典》【10】的49905個字形逐一核試,共可組合48713個字,其餘的1192個字不是非常罕用,就是隸定前的文字。值得注意的是,在作這些研究的時候,中文個人電腦尚未出現,更不用說字集及輸入法,字根在某一個意義上,就是輸入法,尤其當時的印刷打字,一字一鍵,相形之下,496鍵的字根鍵盤要合適多了。

字形資料庫的初期工作,是要在電腦中還原林樹字集及字根式。由於每個字形的字根數不一,如「」的字根數為4,「」為2;再加上部件的共用機會也不小,如部件「」為「」及「」共用,所以在字形資料庫中,我們以一系列的構字式代替字根式,如『堰=土?匽』、『匽=匚??』、『?=日?女』。構字式雖然大幅簡化了登錄工作,但是額外的代價為多造了629Big5沒有的部件,如「?(鎖)」、「?(嵕)」等。林樹字集登錄完成之後,我們發現每個字的構字式都是唯一的,所以構字式可用來識別字形。

以往電腦在面對漢字時,都採用數位編碼,首定定義一個字集,然後再針對字集裡的每一個字,給予一個數位碼。事實上漢字並不是一個封閉集合,而是開放集合,因為漢字在發展的過程中,同一個字在不同的時空下,常有不同的字形,如「藥」和「葯」等;再加上漢字在不同的應用範疇,常有創新字的需求,如化學元素及新發現的動植物。漢字既然是開放集合,所以無論字集如何擴充,缺字問題依然存在。相對於數位編碼,以構字式為主的構形編碼可能更適於漢字,因為構字式可透過有限的部件及拆分符號,來組出無限的字形。在面對電子古籍層出不窮的缺字時,對照目前的電腦內碼,如Big5UnicodeCNSCCCII等,構字式應該是一個更好的交換碼。構字式由於是從漢字的構形出發,所以只要有適量的部件,不管是台灣、大陸、日本、韓國及越南的漢字應該都可以處理。而且在應用上,構字式仍可和目前的電腦內碼共存,只要增加適量的部件及拆分符號,各種內碼即可相互轉碼,如CCCII轉到Big5Big5的缺字則可用構字式表達。

由於林樹字集只有8532個字,為了進一步驗證構字式的實用性,我們繼續分析了Big5字集的13053個字、〈簡化字總表〉【11】的2235個字、《中文大辭典》的49905個字、《漢語大字典》【12】的54727個字、喃文的2999個字。在構字式驗證的過程中,構字式本身並沒什麼問題,有問題的是部件的數量,例如以林樹的部件集來表達《中文大辭典》用字,只能組合出42374個,若要再表達其餘的字形,至少還要再造4019個部件。為了減少部件的數量,我們在構字式外,另增部件序,部件序不需要拆分符號,只需在部件前後加上標示符號即可,如『牖=?片戶甫?』。部件序提出後,字形表達的問題仍舊回到字根的層次,這在《中文大辭典》和《漢語大字典》中最為明顯,因為要把這兩個字集所剩的16201500個字形完全拆分,分別還要再加上1006844個字根。由於這些字形有不少是隸定以前的文字,所以還需進一步的過濾。

除了字形的表達外,字形資料庫的另一個重點是異體字的標示,如「塼」和「磚」為異體字。林樹字集登錄完畢後,我們隨即進行異體字標示,初期以林樹字集內附的597個參考字形為主,接著加上2235個簡化字。然而異體字間的關係,比我們當初所認為的還要複雜。在《漢語大字典》的異體字表中,蒐集了29233個異體字,這些異體字的關係不只是全同及簡繁、還包括古今、訛字、不全同等,很遺憾的是這些關係在異體字表裡並沒有表達出來。由於釐清這些字形間的關係,需要相當多的人力,目前我們只輸入了整個異體字表。

貳、漢字部件的探討

部件即是漢字的構形單位,當一個形體用來構造其它的字,成為所構字的一部分時,稱之為所構字的部件,如「」、「」是「」的部件。在早期賴以建置字形資料庫的《漢字綜合索引字典》一書中,曾提出字根索引的概念。其實字根只是部件中的一種,在〈漢字部件規範〉【15】中,將字根稱為基礎部件,指的是在對漢字進行拆分時,那些最小的不再拆分的部件,如「」中的「心」。至於那些可由兩個以上的基礎部件組成的部件則稱合成部件,如「」中的「」。另外,部件中可以獨立成字的稱成字部件,如「」中的「」;不能獨立成字的稱非成字部件,如「」中的「?」。

〈漢字部件規範〉內附一個560個基礎部件的〈漢字基礎部件表〉,這些部件是根據GB 13000.1字集中的20902個漢字,逐字拆分而得,其中字形的拆分原則如下:

  1. 用本部件表進行部件拆分時,相離、相接可拆,交重不拆。如「」拆分成「」、「」(相離),「」拆分成「」、「」(相接),「」不可拆分成「」、「」(交重)。
  2. 字形符合理據的,進行有理據拆分;無法分析理據或形與源矛盾的,依形進行無理據拆分。如「」拆分成「」、「」(有理據拆分),「」拆分成「?」及「?」(無理據拆分)。
  3. 因在字中所處的部位不同而產生了筆畫變形或比例變化的部件,可與本部件表的相應部件認同使用。如「」的左半部與「」認同使用、「」的左半部與「」認同使用。
  4. 本部件表中的部件均為基礎部件,不得再行拆分。如「?」不得再拆分為「?」及「」兩個小部件,「」不得再拆分為「」及「」兩個小部件。
  5. 本部件表中的部件,可組合合成成字部件,但不得組合出非成字部件使用。如可用「」、「」、「」組合成「」,作為部件用;但不得用「」、「」,組合出「自?田」作為部件使用。

和〈漢字基礎部件表〉相比,〈交大字根集〉的字形拆分原則在1,3,4點是相同的,但是仍有兩個獨特的拆分原則:

  1. 首先將林樹字集的8532個漢字先橫拆,再將所得結果直拆,然後再拆解包含的字形得到了約三百五十餘字根。
  2. 其次基於實用的考量,希望儘量減少每個字平均的字根數和字根總數,最後得到一組496個字根的集合,在此集合下,平均每個漢字僅2.14字根即可組成。

實際比對這兩個字根集後,更能看出它們的異同:

  1. 既是林樹字根,也是漢字基礎部件者有315個。
  2. 為了減少每個字平均的字根數,林樹字根集有個「高頻字不拆」的原則,如「」、「」、「」。林樹字根集的40個高頻字根中,只有13個是漢字基礎部件,如「」。
  3. 由於林樹字根集只採橫連、直連、包含的方式拆分,所以有些字雖非漢字基礎部件,但卻是林樹字根,如「」、「」、「」。
  4. 字根雖然定義成「最小的不再拆分的部件」,但是所謂的「最小」,各字根集的考量不同。如「」是漢字基礎部件,「」卻不是,而兩者都是林樹字根;又如「」是林樹字根,「」卻不是,而兩者都是漢字基礎部件。
  5. 除此之外,漢字基礎部件表多出來的字根主要是因為GB 13000.1字集的字數比林樹字集多,而且還包含簡化字。

字根的認定,是字形資料庫中令人困擾的問題之一。對林樹字根而言,它是在減少每個字平均的字根數和字根總數下求得平衡;對漢字基礎部件而言,它是在有理據拆分和無理據拆分中取得妥協。但是在將字形資料庫導入缺字解決方案後,我們必須向使用者說明字根的特性,有鑑於這兩個字根集的字根有不少是康熙部首,再加上大多數人對於康熙部首並不陌生,於是在1998年初我們重新定義林樹字根集的拆分原則:

  1. 不管字源或頻度上的考量,所有的康熙部首皆視為字根,不論是原形、變形或是簡化字根,如「人(?)」、「心(?、?)」、「」、「言(?)」。
  2. 以康熙部首為最基本的字根集,並且不管字源,將漢字直接視為圖形,然後再採用橫連、直連及包含的方式拆分,那些無法拆分的字形或部件即視為字根,如「平」、「」。
  3. 林樹字集的前40個高頻字形仍視為字根。

從構形上來看,字根代表最小而不再拆分的部件,但在《漢字綜合索引字典》中,它還扮演著「索引」的角色。林樹字集的8532個字,不管拆分符號,然後按照字根的書寫順序(字根序)排列,只有9組相同,如「只(叭)」、「員(唄)」;即使不管書寫順序,相同的也只有43組,如「部(陪)」、「保(咻)」。由於重複的機率非常低,所以可把字根序當作索引。

除了字根外,字形資料庫另一個困擾的問題是合成部件。〈漢字基礎部件表〉的部件使用規則中指出,該部件表中的部件,可組合合成成字部件,但不得組合出非成字部件使用。但是在我們的字形拆分規則中,並不考慮字源,而只是將漢字以橫連、直連及包含的方式拆分,這在字根式中固然簡單明瞭,但在改以構字式表達後,就會產生不少非成字的合成部件,如『修=???』中的「?」,因為在字源上「」拆分成「」及「?」。林樹字集在改用構字式表達後,額外多造了629Big5沒有的合成部件,情況更糟糕的是,一旦字集擴大後,雖然字根增加得很有限,但是非成字的合成部件卻會大量增加,而形成系統嚴重的負擔,如要拆完《中文大辭典》的49905個字,這類部件可能增加到5000個。

合成部件雖然有字源上的意義,但是在我們將漢字視為圖形拆分,並將字形資料庫用來解決缺字時,這類部件的作用已蛻變成簡化字形的表達,如字根式『堰=土?(匚?(日?女))』可改寫成構字式『堰=土?匽』,字根序「土匚日女」可改寫成部件序「土匽」。由簡化字形表達的觀點來看,合成部件的取捨應考量部件的使用頻度,保留常用的,去除罕用的,如此不但可大量減低系統的負荷,而且不會妨礙到字形表達的簡易性。另外,有些重疊的部件,可改用方便符號表達而捨棄,如『瞿=?目?隹』、『俎=?人?且』、『桑=?又?木』、『綴=???又』。

1997年底,當時林樹字集的部件數共2150個,其中有1452個在Big5裡,另外的698個為造字。從使用頻度來看,假使希望99.9%的字都可由構字式組成(即留下0.1%的字用其他的方法解決,以增進系統效益),只須保留464個造字,然而捨棄的的207個造字中有27個是字根,再加上保留的464個造字中有22個是重疊部件,所以實際上保留的造字為464+27-22=469個,精簡後的林樹部件集共1921個。接著以林樹部件集為基礎,將字集擴大到Big5及簡化字總表,並且加上康熙部首214個、《中文字根孳乳表稿》【16】裡的聲母869個、形母265個,說文說首540個、漢字基礎部件560個,最後的部件集總數為2600個,包括801個字根及1799個合成部件,其中在Big5內的有1817個,造字783個。

2600個部件的適用性如何?《中文大辭典》49905個字,可完全拆分的有48285個;《漢語大字典》54727個字,可完全拆分的有53227個。至於這兩個字集所剩的16201500個字形若要完全拆分,分別還要再加上1006844個字根,然而目前的字根數也只不過是801個。由於這些字形有不少是隸定以前的文字,還需進一步的過濾。另外在喃文2999個字中,目前扣除手寫字跡模糊以致無法判定的109個字形外,其他可完全分解的有2709個字形,另外還有181個字形必須再補字根才可完全分解。

參、表達缺字的方法

以構形來表達缺字,其中最重要的是部件,其次才是部件的放置位置,即部件的組合順序和組合方式。部件包含字根與合成部件,而部件的組合方式則有橫連、直連及包含三種方式。缺字的表達式中,部件、組合順序及組合方式全部具足的,稱作部件式。部件式是把漢字視為一個二度空間圖案,然後再將部件依橫連、直連及包含的方式拼出,並以括號表示運算之優先,其中橫連指的是由左至右,直連是由上至下,包含是由外至內,如『堰=土?匽』、『匽=匚??』、『?=日?女』。由於部件還可再拆分成較小的部件或字根,所以一個字可能有好幾個部件式,如『』的部件式除了『土?匽』之外,還有『土?(匚??)』。

假使把部件式中的每一個部件再輾轉以字根依橫連、直連及包含的方式拼出,這便是字根式,如『堰=土?(匚?(日?女))』。雖然一個字可能有好個部件式,但是這些部件式所對應的字根式都是一樣的。從使用的頻度來看,部件式中使用最頻繁的,是像『堰=土?匽』這種只用到一種拆分符號和兩個部件的部件式。只用到一種拆分符號的部件式,我們稱作構字式。構字式雖然只能有一種拆分符號,但是可以重複使用,如峚=山?大?土』、『粥=弓?米?弓』。相對於部件式和字根式,構字式不但簡潔,而且所含的資訊並沒有減少,構形依然一樣的嚴謹,所以構字式仍可轉成部件式和字根式。然而在兼顧嚴謹及簡潔之下,構字式要付出的代價就是大量的非成字部件,這也使得它所需的部件集遠比部件式和字根式來得大。

部件式雖然包含部件、組合順序及組合方式,但是在字形的識別上,最重要的仍然是部件,假使把部件式中的拆分符號和括號抽離,所剩下的部件,我們稱為部件序,如土?(匚??)』是「」的部件式,而『土匚?』是部件序。除了少數字形外,部件序幾乎就是漢字部件的書寫順序,書寫漢字時筆畫順序或許因人而異,但是部件的順序卻極為一致。部件序和部件書寫順序不一致的例子,如「」的部件序為『凵?』,而部件書寫順序為『?凵』。由於一個字可能有好幾個部件式,所以也會存在好幾個部件序。同樣的,把字根式中的拆分符號和括號抽離,所剩下的字根,我們稱為字根序,如土?(匚?(日?女))』是「」的字根式,而『土匚日女』是字根序。雖然一個字可能有好個部件序,但是這些部件序所對應的字根序都是一樣的。

假使將部件序的部件按照某種任意假定的次序排序,我們稱為部件組,部件組實質上就是忽略部件的組合或書寫順序。同樣的,字根序的字根按照某種任意假定的次序排序,我們稱為字根組,如「」的字根序『土匚日女』按照字根使用頻度排序後為『日土女匚』。

在上述各種缺字的表達法中,若由構形的嚴謹和表達的簡潔來考量,構字式無異是最佳的選擇。然而構字式在實際應用上,由於非成字部件太多而造成實施上的困擾。為了減低部件數量,必須在構形的嚴謹和表達的簡潔上有所犧牲,最後我們保留了表達的簡潔,因為構形的嚴謹在字形的識別上並不是那麼重要,如『土?匽』、『土匚日女』或『日土女?』在林樹字集中都是唯一的,皆可識別「」。部件的取捨標準,是由使用頻度決定,在保留99.9%的字都可採用構字式表達的條件下,其他比較罕用的合成部件可以捨棄。至於那些因部件捨棄而無法再以構字式表達的字形,可改採部件序,因為部件序無需拆分符號及括號,因此也比部件式及字根式來得簡潔。

構字式由於包含拆分符號,所以和其他字形混合時,並沒有辨識上的困難,如《金剛經》:「爾時世尊食時,著衣持金?本,入舍衛大城乞食,於其城中,次第乞已,還至本處。」中的『金?本』。但是部件序和其他字形混合時,前後必須再加上標示符號「?」及「?」,才能區分,如『穎=?匕禾頁?』。另外,可用構字式表達者,當然也可用部件序,然而構字式比部件序嚴謹,仍應儘可能用構字式。

為了表達上的簡潔,我們依漢字構形特色加了八個方便符號,分別是「?」(二個相同部件橫連)、「?」(二個相同部件直連)、「?」(三個相同部件橫連)、「?」(三個相同部件直連)、「?」(三個相同部件三角排列)、「?」(四個相同部件橫連)、「?」(四個相同部件直連)、「?」(四個相同部件四角排列)。方便符號的例子如『=?克』、『=?戈』、『=?車』、『=?火』等。方便符號可用於構字式,以擴大構字式的適用範圍,部分原先只能用部件序表達的字,加上方便符號後,即可改用構字式,如『=?目?隹』、『=?人?且』、『=?又?木』、『=口??又』等。方便符號也可用於部件序中,讓字形的表達更為方便及精確,例如『=??又酉欠?』中的「?又」不但比「又又又又」來得方便,也更精確。方便符號也讓一些字的表達式既不需組合符號,也不需起始及終結標示,如『=?車』。

肆、異體字形的處理

異體字的問題相當複雜,本篇論文題文設限在印刷字形,多少也是想簡化這方面的討論。這些年來,雖然我們絕大部分的時間都在確認字形的表達,而無法挪出較多的時間來處理異體字,但是在驗證Big5、《中文大辭典》、《漢語大字典》等字集,拆分過十萬個以上的字形後,對於異體字的問題,多少有點瞭解,希望藉著這篇論文提出一些初步的看法。

目前對於異體字的蒐集,比較完整的算是《漢語大字典》的異體字表。此表的編排是採用主體字統領異體字的方式,將同一主體字統領的簡化字(限於1986年新版的《簡化字總表》所收的簡化字)、古今字、全同異體字(指音義全同而形體不同的字)、非全同異體字(指音義部分相同的異體字),集中在該主體字下編為一組,共有主體字12207個,異體字29233個。另外,這些異體字也有一些本為民間俗字,而舊字書定為訛字,該表仍作異體字處理。異體字的例子如「」是「」的簡化字,而「」的另一個異體字「」,同時也是「」的異體字,所以「」和「」、「」只是部分相同。很遺憾的是,除了簡化字以外,主體字和異體字的關聯,到底是全同、古今、或訛字,該表並未說明,必需重新查閱字典。由於釐清這些字形間的關係,需要相當多的人力,目前我們只輸入了整個異體字表。

異體字表裡的異體字,在《漢字漢語基礎》一書中稱為異構字,和異構字相對的,是所謂的異寫字。異寫字是音、義、用完全相同的字,彼此間的差異主要是部件的異寫,如「」與「」皆由部件「」及「?」構成,只不過「」在「」中異寫成「?」。異寫字由於數量龐大,而且有規則可循,所以異體字表中收錄得很少。異構字的整理,重點在於釐清字形間全同、不全同等的關係;而異寫字由於音、義、用完全相同,所以它的整理重點,則在於列出部件間異寫的現象。對字形資料庫而言,異構字除了逐字登錄外,還要標示字形間的關係;至於異寫字,只需找一個參考字形登錄,另外再標示部件的異寫現象即可。

參考字形的選定,我們一直以楷體為拆分的依據,因為楷體比較接近書寫習慣,福=???』。由於各印刷廠及電腦字型的楷體字形都不太相同,最後我們以1993年教育部公布的標準楷體母稿為主,這也就是Microsoft Windows 95(或98)繁體中文版內附的標楷體。標楷體的最大特色在於儘可能的由部件來反應字源,並由部件的規範達到字形的規範,只是也因此和傳統的書寫方式有所出入,造成處理上的困擾。如「?」()與「」()、「」()與「?」()在標楷體分得很清楚,但是在將這些部件延伸到《中文大辭典》和《漢語大字典》時,部分以「」、「?」為部件的字形由於意義不詳,根本無法正確判斷。

值得一提的是,《漢語大字典》在字形的處理上,是採用新舊部件並列的方式,如部件「」()、「」()交互出現。至於新舊部件的取捨,純粹取決於參考書目的字形。《漢語大字典》的參考書目有2965種,包括《周易》等古文獻,也包括1980年代的出版品,所以越是常用字,新舊字形交互出現的機會越高,此時即採用新形;反之,越是罕用字,在只有舊形的情況下,也只好採用舊形。相形之下,標楷體和《中文大辭典》採用的部件,大多是《漢語大字典》裡的舊部件。由此可知,異寫部件是可以規範的,而且是有必要規範的,否則同一個部件,在不同的字集裡,一旦寫法不同時,都會造成分析及檢索上的困擾。

另外,有些部件雖不是異寫,但因外形相似而難以辨識,也可視同異寫部件處理,如部件「?」()、「?」()是兩個不同的部首,雖在標楷體和《中文大辭典》都有明確區分,但在《漢語大字典》裡,「?」有時也會作「?」(夏)。至於異寫部件的整理,除了《漢語大字典》在〈新舊字形對照舉例表〉中列出72組外,其他的我們還在整理中,如部件「?」與「」,標楷體採用「?」(),《中文大辭典》大多用「」,《漢語大字典》則並列。

伍、缺字的檢索機制

古籍電子化的一個重要動機就是檢索,而檢索的機制又和字形的表達息息相關。目前電腦在面對漢字時,都採用數位編碼,首定定義一個標準字集,然後再針對字集裡的每一個字,給予一個數位碼,編入標準字區。至於那些字集沒有收錄的缺字,則放在使用者造字區。由於造字區和標準字區都採用數位編碼,所以標準字的檢索機制仍可適用。相較於數位編碼,改用構字式或部件序來表達缺字的方式,我們稱為構形編碼。由於構形編碼和數位編碼不同,現有的檢索機制必須作適度的調整,才能夠同時檢索缺字。如字串「著衣持金?本」的『金?本』只是一個字,無法用「」或「」來檢索。

數位編碼有一個特色,即一形一碼;構形編碼在理論上,是一形多碼,因為每一個缺字都可用構字式或部件序表達。實用上,構字式仍是最常用的缺字表達法,由於受限於現有的部件,大多數字形都只有一個構字式,如『礎=石?楚』,但是也有例外,如「」有『雨?異』、『雷?共』、『雨?田?共』、『雨?田???八』四個構字式。相對於構字式,部件序的變化就多了。由於部件的可拆分性,一個字常有好個部件序,如『出米翟』、『出米羽隹』都是「」的部件序。對於部件的熟悉程度不同,構字式和部件序也可能混合使用,如『屆=尸??』、『屆=?尸凵土?』。少數部件的書寫順序,有時也會因人而異,如『屆=?尸凵土?』或『屆=?尸土凵?』。另外,方便符號也會讓缺字的表達更多樣化,如『遻=???口??』或『遻=??口口??』。

同一個缺字儘管有各種不同的表達法,但是這些表達法所對應的字根序或字根組是相同的,如『雨?異』、『雷?共』、『雨?田?共』、『雨?田???八』的字根序皆為『雨田?八』,『尸凵土』、『尸土凵』的字根組皆為『土尸凵』。從檢索的觀點來看,為了能讓使用者享有最大彈性,對於缺字的各種表達方法,都要接受,因此缺字在計算機中的表達,除了構字式和部件序外,還要再加上字根序及字根組。構字式和部件序其實可共享同樣的結構,因為構字式等於拆分符號加上部件序,而部件序可視為沒有拆分符號的構字式。至於字根序可由部件序轉換而得,而字根組則可由字根序轉換而得。

另外,異寫部件也會再增加檢索的複雜性,如『???』及『示??』皆可檢索「」。綜合上述,缺字的檢索機制可以描述如下:

  1. 異寫部件的取代。
  2. 構字式(或部件序)比對,若不成功,則將構字式或部件序轉成字根序,繼續下一個步驟的字根序比對。
  3. 字根序比對,若不成功,則將字根序轉成字根組,繼續下一個步驟的字根組比對。
  4. 字根組比對,若不成功,表示這個缺字尚未收錄在字形資料庫中。

構形編碼除了一形多碼的問題外,也有一碼多形的情形,以下是三個主要字集的分析情形:

  1. Big513053個字形中,除了2個重複的字形外,可用構字式表達者有12746個,部件序305個。其中表達相同的,構字式1個,字根序29個,字根組123個。
  2. 《中文大辭典》已完全拆分的48285個字形中,除了79個重複的字形外,以構字式表達者40796個,部件序7489個。其中表達相同的,構字式2個,部件序8個,字根序448個,字根組1938個。
  3. 《漢語大字典》已完全拆分的53227個字形中,除了76個重複的字形外,以構字式表達者44366個,部件序8861個。其中表達相同的,構字式1個,部件序17個,字根序563個,字根組2161個。

這三個字集中,構字式相同的字形,有「」、「」及「」、「 」兩組,然而「」及「」兩字本身就難以分辨,而「」、「 」的差異在於「虎」有兩種包含方式。部件序相同的字形,事實上都是同一個字,只不過是部件位置不同而造成字形的差異,這些字形由於缺乏適當的部件,以致無法用構字式區分,如「」和「」、「」和「」等。部件序相同的字形,由於字數很少,可利用標示「?」加上編號來區分,如『嵇=?禾尤山?1?』、『=?禾尤山?2?』。由此也可看出,為了減少部件數量而提出的部件序,對字形識別的影響相當小。

陸、結語

本實驗室從事漢字印刷字形的整理,至今已快滿六年。這些年來,我們將漢字逐字柝分成部件及字根,其中包括Big513053個字、《中文大辭典》的49905個字及《漢語大字典》的54727個字,最後找出2600個漢字部件(包含801個字根),並建置成字形資料庫。另外,葉健欣還為《漢語大字典》製作了12TrueType字型。

建置字形資料庫的主要目的,是為了增加電腦中的漢字信息,當然也有助於缺字的解決。以往各個單位為了解決缺字而不斷的重複造字,有了字形資料庫後,即可透過構字式或部件序取得字型、異體字等相關資訊,以節省缺字的處理成本。各個單位如果在造字的同時,也建立缺字的字形資料庫,必可有效的降低造字檔的轉碼成本。

這六年來,深深覺得漢字字形的整理工作,相當繁複,決非一蹴可幾,祈盼能有更多的人一起加入!

誌 謝

這些年來,每次遇到字形整理的問題,而難以取捨時,感謝謝清俊教授從旁指導,適時將問題解決,讓工作能夠順利進行。另外,更感謝本實驗室的同仁張翠玲、許婉蓉、高孝玖、許永成、邱台鳳,沒有他們這些年來的努力,就沒有現在的字形資料庫。

光碟索取

本實驗室已將這些年來的工作成果,收錄於光碟中,內容包括字形資料庫、異體字表及相關字頻資料,有興趣者歡迎來函索取,來函請寄derming@gate.sinica.edu.tw

參考文獻

  1. 〈中文字形資料庫的設計與運用〉,謝清俊、莊德明、張翠玲、許婉蓉,19954月。
  2. 〈電子古籍中的缺字問題〉,謝清俊,19968月。
  3. 〈漢字的字形與編碼〉,謝清俊,199610月。
  4. A Descriptive Method for Re-engineering Hanzi Information Interchange Codes〉,謝清俊,199610月。
  5. 〈談古籍檢索的字形問題〉,謝清俊,19974月。
  6. 〈中央研究院古籍全文資料庫解決缺字問題的方法〉,莊德明、謝清俊,、林晰,19985月。
  7. 《中文電腦基本用字研究》,林樹編著,交通大學計算與控制學系印行,19723月。
  8. 〈中國文字之結構模式及其分析〉,倪耿,1972年。
  9. 《漢字綜合索引字典》,劉達人、杜敏文、謝清俊、張仲陶、蔡中川、林樹合編,華英出版社,197910月。
  10. 《中文大辭典》,林尹、高明主編,中國文化大學出版部,197310月。
  11. 《漢字簡繁體字對照字典》,蘇培成編,台灣珠海出版有限公司,199410月。
  12. 《漢語大字典》,徐中舒主編,遠東圖書公司,19919月。
  13. 《漢字漢語基礎》,王寧主編,北京科學出版社,19967月。
  14. 〈常用次常用國字標準字體楷書母稿〉,教育部國語推行委員會研訂,19932月。
  15. 〈信息處理用GB 13000.1字符集漢字部件規範〉,大陸國家語言文字工作委員會,19985月。
  16. 《中文字根孳乳表稿》,周何,國字整理小組編輯出版。

回應 回應給此人 推薦文章 列印 加入我的文摘
引用網址:https://city.udn.com/forum/trackback.jsp?no=50415&aid=2980275
(轉貼)華裔留學生漢字部件構型意識的實驗研究
推薦0


梅峰健保免費公投
等級:8
留言加入好友

 

現代漢字的整字,可以根據部件的數量,分為單部件字和多部件字兩類。由一個部件構成的字是單部件字,如上、下、水、日。由兩個或兩個以上部件組成的字是多部件字,如件、想、寬、毀、贏、贛等。統計結果表明,現代漢字由三個部件組成的最多,大約佔40.32%,其次是由兩個部件組成的字,約佔34.04%;然後是由四個部件組成的字,大約佔16.39%。這些數據對我們進行識字教學和電腦處理漢字,有重要的參考價值。
  既然多部件的漢字最多,自然帶來部件組合方式的問題,也即是常說的間架結構問題。如何把若干個部件容納在一個方框之內,而又能達致閱讀的明晰、書寫的順當、字形整體結構的美觀等要求呢?掌握漢字的基本間架結構,往往是一個字寫得好壞成敗的關鍵,這就如建立好房屋中的樑柱,骨架自然穩當堅實,美觀得體。

華裔留學生漢字部件構型意識的實驗研究
 
2008年02月03日
 

  北京華文學院 劉兆靜


  1. 引言

  1.1 漢字正字法意識。西方學者認為,『正字法是一種將語言中的聲音和一套書寫符號對應起來的方法。』 心理學家又根據詞的形態結構和音位結構之間的一致程度或透明程度(所謂正字法深度)將各種書面語言的正字法分為兩種,一是淺層正字法,指詞的形態和音位具有嚴格的一一對應關系,可以完全由形知音;二是深層正字法,指詞的形態和音位沒有嚴格的一一對應關系,而是多對多的關系,不能完全由形知音。彭聃齡先生在接受西方關于正字法定義的基礎上,認為漢字正字法有其特殊性。他認為『漢字由筆畫和部件組成,但組合並不是任意的。不同的筆畫或部件只有按一定規則結合起來,才能構成人們熟悉的漢字,這些規則就被稱為「正字法」。正字法規則是人們識別字詞時必須依靠的一種內隱知識,字詞識別不僅要依靠對筆畫、部件或字母的檢測,而且要檢測這些成分的結合規則。』

  根據上述分析,並綜合兩種意見,我們認為漢字正字法所包含的內容有兩個部分:一是表音規則,即漢字(主要針對形聲字)的字下單元(形旁和聲旁)和整字讀音關系的對應程度;二是構型規則,即有關漢字筆畫和部件的層級結構、框架結構和空間位置結構的規則。

  1.2 漢字部件構型規則在漢字認知加工中的作用。許多研究都顯示漢字的筆畫和部件會影響漢字的認知加工。彭聃齡等採用命名作業和真假字判斷作業考察了筆畫數和部件數對漢字加工的影響,結果發現,當部件數保持恆定時,筆畫數少的漢字較筆畫數多的漢字加工快;而當筆畫數被控制時, 部件數也會影響低頻漢字的加工,表現為低頻少部件漢字的加工要快于低頻多部件漢字的加工。多項研究考察了漢字部件位置對漢字認知加工的影響。結果一致表明,在漢字的合體字中,左右結構字的右部件比左部件容易提取;上下結構字的下部件比上部件容易提取。另外,劉偉等和章睿健等的研究顯示,成字部件對中文合體字的認知存在顯著作用。

  1.3 漢語母語者漢字部件構型意識的發展。漢字部件和筆畫的構型規則對于漢語母語者漢字的認知加工確實存在顯著的作用。那麼這些漢字構型規則又是如何萌芽並進一步逐漸發展起來的呢?多項研究均採用真假字判斷作業分別考查了小學階段學生在漢字識別中對漢字部件位置及位置頻率線索的意識。實驗結果表明,小學低年級學生已能夠利用漢字部件的位置和位置頻率資訊幫助其識別漢字。李虹等以幼稚園中、大班和小學一到三年級學生為研究物件,通過對線條圖、位置錯誤非字、部件錯誤非字、假字和真字進行字典判斷,探討了漢語兒童正字法意識的發展,結果發現漢語兒童正字法意識的發展分為多個層次,學前階段只能發展區分漢字和線條圖的基本能力,筆畫和部件意識及部件位置意識等漢字構型規則意識要在入學後才能逐步發展,並且前者的獲得比後者容易。

  1.4 留學生漢字部件構型意識的發展。漢字對于外國留學生來說,是學習中文過程中最困難的環節之一。因此,很多研究者都非常關心留學生是否能夠形成對漢字部件構型規則的認識。馮麗萍和馬燕華分別利用漢字注音組詞和聽寫作業考察了中級漢語水平外國學生漢字正字法的情況,結果表明:筆畫數、部件數對學生漢字作業有影響。馮麗萍等利用真假字判斷作業考察了部件位置資訊對漢字和非漢字背景留學生漢字加工的影響。結果表明,對非漢字背景的歐美留學生來說,右部件和下部件的作用較強;對漢字背景的日韓留學生來說,對左右結構的漢字因熟悉度較高而傾向于整字加工,上下兩個部件共同參與漢字識別過程,也就是說日韓留學生對漢字部件位置規則並不敏感。

  不過另外兩項研究的結果與上述研究存在不一致。這兩項研究的作者利用真假字判斷作業,分別考察了不同漢語水平,母語為漢字圈和非漢字圈的留學生漢字部件位置意識的狀況。這兩項研究的結果基本一致,即中高級漢語水平的留學生已基本形成部件位置意識,並且歐美學生對左右結構字的部件意識好于上下結構。

  由于外國留學生的母語背景、漢語水平參差不齊,教學和學習以及個人因素各種情況比較複雜,差異也很大,因此不同研究者在留學生漢字部件構型規則意識的發展方面還很難達成一致結論,許多問題尚待進一步研究。

  1.5 華裔留學生的漢字部件構型意識的發展。華裔留學生因其身份比較特殊,近年來,有關華裔學生漢字習得的問題受到了研究者們的關注。許多教師針對華裔留學生的漢字教學問題提出了很多好的建議,不過有關漢字習得方面的研究尚不多見。李俊紅等在一項研究中利用部首識別作業和調查法考察了美國華裔和非華裔學生的漢字部件意識,被試被測試時,學習部首一周。結果表明華裔和非華裔學生都具有了一定的漢字部件意識,但華裔學生的部件意識更強,並具有層級的特點。該項研究雖採用實驗測試的方法,但由于被試數量較少,學習漢字時間較短,因此其研究結果尚需進一步的實驗証實。

附件:
 
【來源:中國華文教育網】






本文於 修改第 2 次
回應 回應給此人 推薦文章 列印 加入我的文摘
引用網址:https://city.udn.com/forum/trackback.jsp?no=50415&aid=2980273