Back to my papers
Back to my main page

                        计算机的汉语句子分析

                                 胡明亮

      一、绪言
     计算机处理资料的速度越来越快,记忆容量也越来越大。显
然,我们生活的各个方面将会更多地依赖计算机。费时费力的语
言教学,更应该充分利用现代科学技术,提高教学效率。
     本文只是从语言学的角度提出一些计算机处理汉语句子时可
能遇到的问题。这些问题不解决,计算机在语言教学方面的运用
就会受到极大的阻碍。
     二、用途
     计算机分析语言结构的技术,对语言教学有很多用途。例如,
可以考虑让计算机代替老师改正学生的病句,或者让计算机帮助
学生翻译。
     2.1 改错
     学生写出来的错句,如果计算机可以认出来,甚至加以改正,
那该多好!比如,下面这两个错句(《实用汉语课本》第二十四
课练习):
     (1) 帕兰卡去古波宿舍在星期五。
     (2) 九月四号一九七九年他去中国。
这两句都涉及到词序问题。例(1),表示时间的介词短语“在
星期五”应该放在“去”或者“帕兰卡”的前边。例(2)的两
个时间短语“九月四号”和“一九七九年”应该换一下位置。
     2.2 翻译
     如果计算机不仅可以翻译词汇,而且也可以正确地翻译句子,
就能省去老师的很多时间。但是,这方面的进展似乎不大。美国
博敦大学(Bowdoin College)计算机系的Allen Tucker教授承认,
即使将文章的内容限制在一个很小的范围,不同语言之间的句子
翻译,也很难达到百分之九十的正确率。
     市场上销售的“能翻译英汉句子”的电子字典,翻译的效果
也不理想。有些错误的翻译,还被同行业的竞争对手当作反面教
材,放在自己的广告里。比如今年(一九九五年)三月十九日的
《世界日报》的一个广告,就有(3)、(4)、(5)这样的例
子:
     (3)I want a break. 我想要一个裂缝。
     (4)The moon rose. 这枝月亮玫瑰。
     (5)The sky is clearing up.  这天空正消失。
     据那个广告说,香港消费委员会召集专家,对十五种电子字
典进行了测试,得出结论说:那些可以进行“人工智能全句翻
译”的电子字典,“效果差劲,不值得推荐”。可见,句子翻译
的问题,目前还处在起步阶段。
     三、问题
     计算机在改错和翻译等方面还难以大显身手,主要是因为人
类对自己的语言了解得不够。现在我从句法、语义和语用三个方
面提出一些问题,供大家参考。
     3.1 句法
     研究动词、名词短语和介词短语之间的相对位置,研究动词
后边可以跟几个名词短语,几个介词短语。比如“去”这个动词
后边只能跟一个名词短语。计算机学到这样一条规则,就可以把
例(1)“帕兰卡去古波宿舍在星期五”判断为错句,甚至可以
把“星期五”移到前边,该成正确的句子。
     又比如,除了特殊情况以外,句子应该有动词。计算机有了
这条规则,就不至于产生出例(4)“这枝月亮玫瑰”这种没有
动词的句子了。
     3.2 语义
     光教计算机句法还不够。比如例(2)“九月四号一九七九
年他去中国”那一句,光用“动词短语”、“名词短语”等形式
范畴,就难以判定为错句。所以,我们还应该教计算机一些语义
规则。语义是指句子表示的“谁什么时候做什么”等等意思,以
及各成分之间在意义上的关系。比如,汉语把表示大时间的词语
放在表示小时间的词语的前边。例(2)不对,就是因为小时间
“九月四号”放在了大时间“一九七九年”的前边了。
     3.3 语用
     但是,句法和语义的规则,都难以排除例(3)“我想要一
个裂缝”和例(5)“这天空正消失”那样的错误。从句法上看,
“我想要一个裂缝”和“这天空正消失”都没有错误。从语义上
看,“裂缝”可以被“要”,“天空”也可以“消失”。这里,
就涉及到句子的上下文,甚至更大的非语言环境。我们只有把人
们一般不会要“裂缝”、天空一般不会“消失”这类语用方面的
因素教给计算机以后,才可以避免“我要一个裂缝”和“天空正
消失”之类的错句。
     下面例(6)这段话,摘自海外某中文报纸:
     (6)但,热心、辛苦、耗时的记者,出乎意料地、不可思
        议地,竟被“暴发户”在冲冲怒气下挥拳,并向正欲给
        “暴发户”拍幸运照的记者踢了一脚。
      这段话读起来不太通顺。细看一下,发现问题出在“踢一
脚”的施事上。前边一句,用“被”字句,是说记者如何如何。
可是,到了下一句“踢一脚”时,却是说“暴发户”如何如何。
各部分的主题,从记者变成暴发户,显得太突然,给我们理解
这段话造成一定困难。告诉计算机什么时候可以换主题,怎么
换,也是值得我们研究的语用问题。
     四、思考
     计算机技术在语音识别与合成、文字的识别与合成、孤立
词汇对译等方面,都取得了很大进展。但是由于人们对句子结
构的认识还很不够,所以计算机在句子或者更大语言单位的运
用,受到很大限制。
     从句法形式上、语义关系上、语用因素上,进一步发现和
总结出正确而又简单的规则,以便教给计算机,将面临的一项
既艰苦、又充满乐趣的工作。

(原文曾在1995年新英格兰地区文理学院中文教师年会宣读)

Back to my papers
Back to my main page