谈谈机器翻译
第5版()专栏:
谈谈机器翻译
姚兆炜
机器翻译也叫自动化翻译。具体地说,它是利用电子计算机来进行翻译工作的。这门新兴学科虽然只有十几年的历史,但它的发展却非常迅速,并且在实际生活中已逐渐显示出它的重要性来了。
翻译工作是一项相当繁重的脑力劳动,而需要进行翻译介绍到我国来的各种书刊又这样多,如果翻译工作仍保持着像一千三百多年前玄奘[zàng]法师翻译佛经时所采用的那种“手工业式”方法,尽管翻译人员不断增加,也总是赶不上实际需要。尤其像科学技术情报等方面的翻译,不仅要求准确,而且必须及时报道,否则就会失去意义。
现代快速电子计算机的发明,在技术上提供了翻译自动化的有力保证。电子计算机每秒钟可以做一万次的加减法运算(有的甚至超过一万次)。如果像计算一个数学题目一样,把翻译工作也化为一套有序的思维过程,叫计算机去完成翻译任务,当然十分理想。那末,计算机怎样去做文字翻译工作呢?
人进行翻译工作,要记熟很多外语单词的意义(当然还要靠词典的帮助),同时必须事先学会外语的语法知识。在计算机进行翻译之前,人们需要为它准备好一本词典和一套语法规则。而这本词典和这套语法规则,必须先用一定方式把它们代换成数字,然后预先放在计算机里,叫机器把它们“记忆”好。为了使计算机“认”得文字,尤其像由字母组成词的俄语或英语,可以先给每个字母规定好一个数。例如对俄语字母,可以这样规定:
俄语字母 对应的数(注)
А 01
Б 02……
Я 33于是,每个俄语单词就可以用一个数来表示。ДА在计算机中表示为0501。同样,语法规则也可以用一定的数来逐条代替。
“Я ЧИТАЮ КНИГУ.”这句俄语句子需要翻译为汉语时,可以把它们先代换成下面的数:
Я—33;
ЧИТАЮ—2510200132;
КНИГУ—1215100421。然后,把这些数送到计算机里去。计算机“看”到这个句子后,就开始在预先“记”好的词典里一个个的去寻找有没有和它所“看”到的词(其实是数)同样的数在词典里出现。这可以利用计算机的减法来完成。因为只有当两个数相等时,它们相减的结果才会等于零。如果计算机所“看”到的数和词典中的某个数通过计算机的减法运算结果等于零,那末,所要找的词便查到了。词查到后,在找到的词那里会出现另一个数字,它表示和这个俄语词有相同意义的汉语译文。此外,还指出:这个词是名词还是动词或其他词类(也都由一定的数表示)。“Я”这个词,词典中除指出它的汉语译文所表示的数外,还直接指出它是“代名词、单数、第一格”(也由规定的数来表示)的语法特征。
但是,俄语动词由于不同人称有不同的词尾变化形式,如果词典中的每个词都采用词的原形来存放,那末,像“ЧИТАЮ”这个词表示的数在词典里就找不到和它相等的数来,这就要按照语法里的词尾变化规则把词进行改变,即把ЧИТАЮ的词尾-Ю(32)去掉,并添上词尾-ТЬ(2030),然后再去查词典。按照这种方法查到的词,在语法规则中就相应的会给这个词定出它是“动词、现在时、单数、第一人称”的语法特征。同样,КНИГУ的词尾-У(21)也必须改变为-А
(01)后才能查到,这时所用到的语法规则会对它作出“名词、单数、第四格”的特征来。当全句中的每个词在词典里都找到后,计算机就进一步根据所“记”好的语法规则再来进行“思索”和“判断”,分析每个词在句中所起的语法作用。如根据“Я”是“代名词、单数、第一格”的特征,而在句中又没有其他第一格的名词,按语法规则就确定它是句中的“主语”(当然这也是用一定的数来表示的)。又如
“ЧИТАЮ”是“动词、现在时、单数、第一人称”的特征,且又和主语“Я”的人称一致,因此,它应该是句中的“谓语”。同样由“КНИГУ”的语法特征“名词、单数、第四格”,根据语法规则可以确定它是“宾语”等等。语法成分的确定是供下一步“译文组成”颠倒词的次序时需要,使得译文符合我们汉语的习惯形式(因为俄语中有好多是倒装句,它和我们汉语句子不完全一样)。在这个例子中不必进行词序的颠倒,因此,可以直接把在词典中所得到的每个汉语译文数字,通过特制的打字机把这些数转换成“我读书”三个字打印在纸上,并从机器里传送出来,翻译也就完成了。这些事先规定好的步骤,在计算机里是由所谓“程序”来控制进行的。
根据苏联1956年所进行的法俄机器翻译试验,把由八至十个法语单词组成的句子翻译为俄语,约需时二十秒钟左右。而那架计算机的运算速度平均每秒只能做二千次的加减法运算。如果计算速度更快些,所需要的翻译时间也就会更少。
那末,能否利用计算机来代替翻译工作者呢?不能。机器翻译的实现只是减轻了人类部分的脑力劳动,以便使人们能够腾出更多的时间来从事更高级的创造性活动。计算机不可能而且也没有必要去翻译各种文学著作,更不要说叫计算机去做诗了!
当然,真正在计算机上实现翻译决不像上面所说的那样简单。首先,一词多义现象就很难解决,在好多译文里究竟挑选哪一个为我们需要的意义,是随着不同的场合而各有不同。此外,词序问题也非常麻烦。还有其他一系列的难题。因此,更需要我们对语言进行精密的研究,建立一套适用于在机器上实现对语言进行加工的语法规则。
目前,机器翻译还处于试验研究阶段,离彻底实现是有一定距离的。但是,随着科学技术的迅速发展,和对语言研究的提高,不要多久机器翻译将会在实际工作中获得应用(如翻译科学技术文献)。将来,我们除要求计算机能进行书面的“一对一”的翻译外,还要求能进行多种文字间的彼此互译,而且更进一步要求实现语音翻译。一架语音翻译机,当它“听”到某一国的话后,经过语音分析、语音代码的变换(即翻译过程)、语音组合后,最后它会“讲”出另一国的话来。
(注)在计算机中一般是采用二进制数来表示。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】