为论文《用实例谈汉字的特点》

汉字的特征

汉字有六个特点,有些是优点,有些是缺点。

(1)汉字和汉语基本适应。

汉字之所以适应汉语,主要是因为汉字的单音节形式与汉语语素的单音节形式一致,记录汉语语素与汉字之间往往存在对应关系。汉字基本兼容中文,可以从以下几个方面来理解:

第一,一个汉字代表一个音节,一个语素基本上就是一个音节,所以汉字和语素是对应的,所以用汉字记录汉语语素是非常合适的。但是,汉字和语素的对应并不意味着汉字和语素是对等的。仔细分析,汉字和语素的关系其实更复杂。毕竟汉字是书写单位,语素是语言单位。汉字与语素的复杂关系是,一个汉字可能代表几个不同的语素,如“米”代表米,米代表长度单位,“站”代表“站”或“站”的意思。也有可能是几个汉字代表一个语素,比如“沙发、吉他、马来西亚”这些外来词是在外来词发音的影响下,用汉字音译过来的,汉字没有独立的意义,这样的词可以忽略。在中国传统中,有一些连词,都是在几个汉字中记录一个语素,比如“苗条、摇摆、琵琶、蜘蛛、犹豫”当然,大多数汉字都是用一个汉字来表示一个语素,比如“山、河、灯、人、看”等等。

第二,汉语是没有形态变化的语言。语法意义和语法关系主要通过语序和虚词来表达,而不是像印欧语系那样通过音位来表达。所以汉语的特点决定了用汉字记录比较合适。比如英语动词do (da)有do、did、done等词形变化。一个词(尤其是动词)的词形在不同的句子中是不一样的,它的音位需要变化。用音位来记录这样一种语言比较合适,而动词的类似意义则用汉语中的“正、曾、己”等独立语素(词)来表达。再比如,英语中,复数要用名词后的后缀S来表示,这个语素也是通过在单词内部加音素(即内部屈折)来表示的,而汉语中,复数是通过加一个语素“们”来表示的,非表意名词主要用前面的量词来表示,而不是在单词内部变化。这种情况用一个独立的汉字来表达是非常方便的,用汉字来表达像英语一样的形态变化会很困难。

汉字适合汉语,借用汉字可以反证韩语和日语的情况。日本和韩国曾经借用汉字来记录自己的语言,但是由于两种语言和汉语的语法规则差异很大,汉字只能记录固定的部分,而对于有形态变化的部分,有固定书写方式的汉字是无法分解的。因此,用汉字记录日语和韩语并不完全合适,需要用字母来表示有形态变化的部分。正因为如此,朝鲜在汉字的基础上创造了谚语,日本也创造了。而且历史上汉字也有被周边少数民族借用的,但没有直接借用来记录自己的民族语言。而是在它们的基础上进行了改造,以适应自己民族语言的需要,如契丹、西夏、女真等。

再次,用汉字记录汉语,可以非常有效的区分同音字。汉语音节结构简单,辅音和元音只有400个音节左右,元音和声调只有1,200多个音节。另外,词形短小,以双音词为主,单音词还是很活跃的,可以说是汉语词汇的基础,所以同音字、同音字很多,容易混淆,而且不同形态的汉字起到了区分同音字的作用,所以汉语同音字很多。在书写中,同音字有微妙的区分,这是拼音文字做不到的,如“公式-商业-进攻-宫廷-防御工事”、“形式-形势-行动”、“国家-国家-国情”、“中期-末期”。口语中,同音字读音完全相同,容易混淆,但我们看看几组读音完全相同但字形不同的汉字,就一目了然了,汉字在区分同音字中的作用:

居(平调):栖、弓、捕、被剪、坏疽、驹、毛、蹲、蹲、蹲。

石(无声):是,市,式,事,示范,远景,世界,形势,适,考,室,蚀,誓,死,柿。

李(去声):李,李,李,周,例,李,李,李,李,李,李,李,李,李,李,李,李,李,李,李,李。

伊(去声):伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊,伊。

以上四组汉字,每一组都有完全相同的音韵声调,但是字体却有很大的不同,这使得区分不同的语素非常方便。我国著名语言学家先生曾利用汉字的这一鲜明功能,用声韵完全一致的汉字写了一个史吃狮史的故事,抄在这里供大家欣赏:

狮子爱好者石狮石狮发誓要吃掉十只狮子。石总是在市场上看到狮子。十点钟,十头狮子适合赶集。在正确的时间,石狮在正确的市场。石视其为十狮,靠矢势使其十狮不死。石拾得十狮之尸,正适合石室。石室湿了,石室等着擦石室。石室擦拭,初尝十狮尸。吃饭的时候,我首先知道的是十狮之尸,其实是十头狮子的尸体。审判口译是一个问题。

如果这些语素用拼音记录,按照拼音的规则,发音相同的语素也应该有相同的字形,那么这些语素根本无法从字形上区分。汉字是从古代的表意文字发展到形声字的。为什么他们没有步入注音字的行列?这与汉字有效区分同音字的功能有关,也是很多人反对汉字改革和汉字拼音化的重要原因。的确,目前拼音文字解决不了汉语同音字的问题。

第四,现代汉语方言很多,发音差异很大。但由于各方言语法体系和词汇体系的一致性突出,用汉字记录汉语在文字上起到了沟通方言的作用。虽然同一个字的读音因地而异,但大部分都是用同一个汉字记录的,大家看得一清二楚。所以汉字在沟通方言方面有很好的作用,拼音文字很难适应汉语方言差异的特点。汉字为维护汉语的统一,避免汉语分裂成不同的语言做出了巨大的贡献。在欧洲,许多不同的语言彼此之间的差异远不如中国方言,但它们是不同的语言。虽然差异很大,但中国不同地区的方言并没有进一步划分,而且由于汉字的维护,没有人会认为中国的方言是不同的语言,尽管一些西方语言学家把中国的一些方言视为不同的语言(见哈特曼和斯托克的《语言学和语言学词典》)

(2)汉字是形、音、义的统一。

因为汉字记录的是语素,语素是音义的统一,每个语素既有音义,再加上汉字的形体,所以汉字是形、音、义的统一。一个汉字可以代表几个语素和音节,但每个汉字必须独立地代表一个音节、一个语素,并且是有形的。所以汉字是形、音、义三位一体,不可分割。这与音位字符和音节字符非常不同,例如英语字母a、b、c、d、e和日语字母ぁ、ぁ、ぅ、ぇ、ぉ等。他们有形式和自己的发音,但他们是没有意义的,所以他们不是形式,声音和意义的统一,因为他们

正是因为汉字的这个特点,我们一开始学汉字很难,但是学了一定数量的汉字之后,学单词就不难了。比如我们学了“电”这个字,就可以和其他有意义的汉字组成“电话、电灯、电线、电视、电影、电流、电机、电表、电”,基本不用再去学习和记忆这些生词了。因为我们把汉字一个一个的学了,实际上就相当于把构词法的语素一个一个的学了,掌握了这些构词法成分的形、音、义,那么学习理解这些词自然就很容易了。另一方面,音素对于人们学习单词来说是非常容易的,比如英语只有26个字母,几节课就能学会,日语有50个表音符号,对于初学者来说很容易,但是在学习单词的时候就比较难了,因为每个单词的拼写形式都不一样,不容易记住。

(3)汉字具有很强的永恒性。

汉字的超越性可以从两个方面来理解:一是古今一致性强,二是沟通方言的特殊功能。汉字的超越性在于从古代到现代都是可以通达的。今天,我们仍然知道几千年前文献中的汉字。我们不能理解的不是汉字本身,而是古今语素义的变化。汉字虽然有几千年的历史,但古今汉字的结构模式和体系本质上是一样的,与语言中基本单位的对应关系也是一样的,即都是记录的语素(和古代同时的词),没有本质的变化,所以有着贯穿古今的特殊作用。比如中国历史上的宋元明清小说,今天读起来难度不大,而用拼音记录的当代文献,今天一般人很难看懂,只有专家才能看懂,因为拼音要随着单词读音的变化而调整拼写(当然也不是绝对一致,比如英语单词know中的k今天不发音,但拼写没有调整)。

汉字的超空间特征是它有一种特殊的沟通方言的功能。汉语方言比较复杂,有七种方言。再细分的话,方言就更多了,方言之间的差异特别大。口头上,不同方言区的人根本不会说话。如果他们说话,就像和外国人说话一样,彼此听不懂。除非他们使用双方沟通的中介语言(比如普通话),否则无法沟通。但是,用汉字书写是一种非常奇妙的情况:无论你是上海人、广东人、湖南人还是福建人,你们之间都没有障碍。如果没有汉字,很难想象不同方言之间如何交流!当然,汉字在沟通方言方面的根本作用是汉字记录汉语。汉语方言虽多,但每种方言的语法结构特征(词和句子的特征)是相同的,语素义的差异很小。否则,也是无法理解的。用汉字记录的日语,虽然你每个字都认识,但无法理解其内容。有人夸大说学日语的人经常“进去笑,出来哭”,就是这个道理,但是学汉语方言就不会这样了。

从上面的分析可以看出,汉字的研究需要我们了解汉字的永恒功能。我们还应该注意到,汉字这一特征的根源是中国古今语法、词汇系统与方圆的* * *连通性。汉字沟通古今、方言的功能,其实还是汉字基本适应汉语的反映。

(4)汉字数量众多,结构复杂,缺乏完整的语音系统。

汉字系统的字数是惊人的。从古至今,汉字总数已达八万多。据统计,现代汉语使用的汉字数量约为1000。《国家现代汉语通用字表》收录了7000个汉字,《现代汉语通用字表》收录了3500个汉字。

汉字数量庞大的根源在于汉语的特点。因为汉语的音节结构比较简单,音节数量比较少,与语言中的语素数量不成比例。比如现代汉语由辅音和元音组成的基本音节只有400个左右,有四声的只有1,200个左右,而现代汉语的词汇系统中有上千个语素。这种情况下,读音相同的语素很多,词形较短,主要是两个音节,但正因为如此,也有很多而且往往是常用词。如果在书写中不使用形态各异的汉字来区分这些同音字和词,就会造成混淆,使用混乱,影响交流和人际交往,甚至导致误解和损失。从一些汉字的分化过程可以看出汉字字形在区分词义方面的作用。比如“云”的本义就是云朵之云。后来加上了“说”的意思。为了区分它,又造了一个“云”来区分它。“箕”本来是簸箕的意思,后来有表示第三人称的意思,于是人们在院子里加了一个竹字头,形成“簸箕”;“莫”是指太阳从配置上淹没在草中,表示傍晚的黄昏。后来引申出否定的意思,表示没有人。为了区分,在原字形上加了一个“日”来区分。这就是“黄昏”这个词。类似的例子还有很多,比如“昏婚”、“自然烧”、“截趾”、“挑挑”、“利益溢出”等等。可见,汉字的数量是复杂的,不容易学习和掌握,也有自己容易分辨的一面。

汉字结构复杂,可以从几个方面看出来。一方面,汉字笔画多。以7000个常用汉字为例,笔画从7到15不等,笔画超过5000个,最多的一个汉字笔画多达36个。另一方面,汉字结构单元的笔画和部件是否按统一的方向排列组合,而是上下左右四面八方散开,向多个方向行进,具有平面的特点,结构单元的组合方式也是多种多样的。笔画之间有分离、连接、交叉,构件之间有左右结构、上下结构、围合结构、框架结构的组合,而且很多往往是几种方式的总和,所以结构比较复杂。汉字与拼音字符的行进方向不同。所以,学习汉字,只知道笔画成分,不知道结构,还是写不出一个字。

而且汉字的结构中没有语音成分。虽然汉字系统中有大量的形声字,但是形声字的音符并不是特殊的音标,很多还是独立的文字。更重要的是,现代汉字中的形声字的音符大多已经失去了语音功能。有些音符可以用一个词表达声音,但不能用另一个词。这些情况混在一起很难判断,比如“台湾”根据现代形声字笔记的语音情况,如果用笔记来推断一个不认识的字的读音,多半可能会出错。人们在使用汉字时,往往会产生一种错觉,认为既然汉字是并列的,就可以用自己的笔记来推断读音,这往往会导致错误和笑话。比如下面这个汉字的读音错误,就是人们盲目用笔记来推断的结果:“易、郁、坎、龋、牙、酵母、干、叶、瘾”。人们常说汉字难读,和汉字不能从结构上表达声音有关系。

(5)难以用汉字进行机械加工和信息处理。

汉字难以用于机械化和信息处理,可以从以下几个方面来理解。首先,汉字数量庞大,现代汉语共有7000个常用字。如果专业领域用字多了,那么机械处理这么多汉字当然更困难。其次,汉字结构复杂,大部分笔画在10左右,有几十种。而且汉字的笔画和部件组合的模式也很复杂。我们可以把这些汉字的组合模式与人进行分类,但是通过逐字的观察比较,可以说是一字一句的结构模式,有些词,比如“东、麝香、气”比较而言,由于拼音中音位字的数量有限,机械处理没有障碍。比如引文只有26个拉丁字母,只有52个大写字母,其他字符(如标点符号等。),所以总数不超过65,438+000。所以,英文字符都可以放在键盘上,在键盘上抄写7000个汉字简直不可想象。所以在我国,打字已经成为一门技术,需要专门学习。

我们可以做一个英文和汉字的对比,这个差异就可见一斑。目前计算机一般用点阵来表示文字信息,也就是用一个电子方阵来表示一个字符。每一个方阵都有若干个网格,网格中的笔画被点亮,每一个笔画被变暗,从而实现单词的显示。要显示英文,最少要用7×9点来表示一个字符(一般是9×12点),最少要用16×16点来表示一个字符(一般是24×24点)。英文字符100,中文字符只有7000。所以重点是:

英语:7×9×100=6300分。

汉字:16×16×7000 = 1792000点。

汉字在计算机中的存储空间是英语的284倍。差距大得惊人。汉字的机械化处理以前落后于其他文字,因为7000个汉字需要存储1750k比特,而英文不到10k比特。计算机发展之初,根本没有这么大的内存。资料显示,美国IBM公司在60年代末生产的最先进型号的电子计算机,内存为4096-131072,可以加载汉字,但价格太高,无法投放市场,而其他型号的计算机无法加载汉字。这还是一个普通的汉字点阵。如果是精确的汉字点阵,比如32×32点,或者100×100点,处理10000个字符,占用的空间就更惊人了。当然,在计算机存储迅速膨胀的今天,这个问题已经成功解决,但相对于拉丁字母,汉字的局限性还是很明显的,所以有学者认为,从长远来看,只有拼音才能方便信息处理。

(6)在国际文化交流中难以使用汉字。

汉字难以在国际交流中使用,一是因为其结构复杂,二是汉字不表音,难以学习和使用,而拉丁字母在国际上被广泛使用,可以说是国际化的文字。相比较而言,汉字很孤独。虽然随着中国经济文化的发展,随着中国在世界上地位的提高,会有越来越多的人学习和使用汉字,甚至研究汉字,那是不同于汉字国际化的。所以有人说汉字是国际文字,21世纪是汉字的时代。从热爱汉字和中国文化的角度来看,无可厚非,但从科学求实的态度来看,汉字作为国际交流的工具有其局限性。

汉字有几千年的历史。它们之所以能使用这么长时间,根本原因就是适应了汉语的特点。所以我们在学习和研究汉字的时候,既要看到汉字的优点,也要看到汉字的缺点。对待汉字,我们不骄不躁。