字体:大 中 小
护眼
关灯
上一页
目录
下一页
二四、生活 (第3/4页)
他俩同在一个很小的房间,这导致山丰自觉有点尴尬,水准不如人家,年纪也不如人家,人家都一心扑在工作中。实验室那时候有电话,b宿舍接电话方便多了,但是接到电话,不好意思说太多,一是不太想别人知道,二是讲话打扰别人工作。 有一天,实验室来了一位锺妍nV士,介绍了一种图语言模型理解人类语言,号称任何句子理解之後,都能变成一副图,而这幅图可以用她设计的图语言来描述,然後基於这幅图,能够完成所有的任务。这个设想已经申报项目成功,获得资助,锺妍想到北大寻找合作。锺妍的思路代表了当时绝大多数研究者的思路,大家都在思索如何在计算机里表示语言的语义,要回答这个问题,首先要回答什麽是语义。 山丰问吴湛,「你觉得图语言可行吗?锺妍画在黑板上的那十几个小图案,施加简单的组合,就能表达出世界上所有句子、文章的语义?」 「我觉得她在瞎扯。」吴湛直接了当地说,他继续补充,「自然语言处理,可以不去管语义的表示,b如,我说,请帮我开门,你走过去把门打开,我就认为你理解了语义。对计算机也如此,它只要完成了人类语言下达的任务,就可以了,至於这个语义如何表示,不重要。」 柳凛cHa话道,「不是不重要吧,也许是因为非常难。做个类b,听到指令,难度为1,完成指令,难度为3,理解指令,难度为5,而讲这个理解的结果表示出来,难度可能是100。这几乎是一个哲学上的终极问题。」 「对对,」山丰也悟道一些,说道,「就像人为什麽要活着,这是一个哲学上的终极问题,但是人可以不用Ga0明白这个问题,而活着。自然语言处理也如此,我们不必Ga0懂什麽是语义,如何表示语义,而直接完成语义的要求。」 三人稍微停顿了一会,吴湛说,「这应该不是哲学问题,这应该是语言学的终极问题,也是现在语言学的困境之一,连一些最基本的概念都没有Ga0清楚。我们这个学科叫计算语言学,就是让计算机掌握语言学中的理论和知识,可是,语言学中那些最基本的概念,现在用人类语言都还没有说清楚,其中的理论,用人类语言都还没有建构起来。所以,计算语言学要想发展,也许得绕过语言学。这也是现在学术界,更倾向使用自然语言处理,这种更笼统、实用的说法。」 「我读到一本书,讲人类认识划分三个部分,信仰、哲学、科学,就是说最初人类对某种观念只能无条件地崇拜和相信,这是信仰,也是宗教的基础。然後,人类开始质疑一些说法,试图找到相信它的根据,这就是哲学。再进一步,如果人类用严谨的语言,在某个知识领域,建立起一套经严格证明,且实践检验正确的系统,则是科学。吴湛,你认为,计算语言学现在处於哪个阶段?」 「哲学阶段?」吴湛似答似闻,然後陷入思考。 「不,山丰,你这个问题其实很复杂,有好多层面。」柳凛接着讲,「首先,不是任何观念都能从信仰发展成科学,b如神的崇拜、X善论、X恶论等等,它们可能永远停留在信仰阶段。另外,哲学和语言学的关系也很复杂,也学语言学b哲学还基础,也就是说,从信仰到哲学,可能还需要过语言学这一关,哲学的思考和论述,都必须借助人类语言,因此,如果语言学中有些概念不清,哲学的很多概念也说不清,也就无法进入科学阶段。这有点类似哲学和逻辑学的关系,虽然通常将逻辑学归於哲学,但实际上,它是哲学的基础。首先有了基本的逻辑,哲学的论述才能开展。语言学也如此,首先有了基本的语言单元,哲学的大厦才能搭建。」柳凛滔滔不绝,讲了很多,自己也意识到,有点跑题了,就停了下来。 吴湛说,「计算语言学现在属於计算机科学的分支,当然希望进入科学的阶段,像今天听到的图语言模型,就是一个尝试,不过这些年,国内外太多这些理论出来了,柳凛最近迷上的LFG,也是其中之一,其实都走的是sky的路子,用在计算机语言的设计和处理上,大获成功,用在人类语言,就漏洞百出,sky自己也修改不停,目前还是看不到曙光,像今天这麽大口气的,还很少听到,像古代练丹师给皇帝推荐的长生不老丹。」 「那你们说,我们该怎麽对待这个专业?」山丰问。 「先别那麽大口气,具T问题具T分析,一个问题一个算法,尝试通过实验的方法不断改进算法,一点点提高。这是目前可以实实在在做的。」吴湛给出了建议。 「这属於头疼医头、脚痛医脚,只见树木,不见森林,还是要看你自己的兴趣和长处。一个一个小问题的慢慢改进,什麽时候是头?其实是在逃离问题,等别人突破,跟在後面做点小改进。而且,这些方法,大部分,其实稍微分析,几乎都到了无法再提高的瓶颈。数学上,不是有很多函数吗?看起来在不断增长,其实,理论上早就发现一个无法突破的上限。最近兴起了语料库方法,思路和sky完全不同,也许提供了通用方法的另一种途径?」柳凛说。 「国外已经兴起很久了,中国关注的人还不多,清华的h昌宁最近出了一本书,做了一些介绍。不过,看起来,需要相当多人工标注的数据,这不是一年两年的事,也许要一代人两代人,我们现在也只能浅尝辄止。你如果想长期在这个领域做,先别想太宏大目标,关键还是争取到项目,就像今天的锺妍那样,有资金支持,先活着,打零工呗,有一个机会就抓一个机会。其实,这就是所谓的坚持,尤其看不到希望的坚持,你可以说是得过且过,也可以说是持之以恒。」吴湛总结道。 山丰沈默不语,觉得自己真的陷入了「炼金术」的困境,你说这东西有用嘛,它远远达不到吹嘘的那样,你说它没用嘛,它也确实对一些特定的小问题的处理有所帮助,更重要的是,它提供了一个令人向往的想像空间。山丰从吴湛的总结中,似乎觉察到一种「人心分离」的生存之道,一边做一些小小的研究,因为大的研究做不下去;一边做大大的宣传,因为小的宣传申请不到经费。简单说,就是要有点「自欺欺人」的JiNg神和勇气,看起来与科学中的诚信JiNg神严重违背,但是,这个领域的特殊X,或者说这个领域当前发展阶段的特殊X需要这样的JiNg神。不过,山丰觉得与自己的X格严重冲突,自己不适合。 到了三年级,特别是三年级下期,因为要完成毕业论文,又几乎天天去,
上一页
目录
下一页