文学与人工智能: 熟悉的陌生人

文学与人工智能: 熟悉的陌生人 


瓦西里·格罗斯曼的《生活与命运》这部描绘人类苦难的伟大小说中,先知一般地描绘出了未来的命运图景——

电脑进行数学运算,记住历史事件,下棋,把著作从一种语言翻译成另一种语言。它在迅速解答数学题的能力上优于人,它的记忆力是无可比拟的。

按人的模样制造机器人所创造的进步有无极限?似乎没有这种极限。

可以设想未来许多世纪和几千年后的机器。它将听音乐,鉴定绘画作品,亲自作画、作曲、写诗。

回忆童年……幸福的泪水……别离的痛苦……对自由的热爱……对病狗崽的怜悯……多疑……母亲的温柔……死的念头……悲伤……友谊……对弱者的爱怜……意外的希望……幸福的猜想……忧郁……无缘无故的喜悦……骤然的慌乱……

一切的一切,机器都将再现!

这段话穿插在作者对纳粹集中营的描述和反思中间,如有千钧之重,似乎暗含了这样的类比——纳粹带来的苦难,印刻在二十世纪人类痛苦的脊梁上;而未来人工智能与机器世界带来的苦难,是否会是纳粹世界的新版本呢?

我们不难发现,这是很多叙事作品曾描绘过的图景,从《弗兰肯斯坦》到王晋康的《类人》,从好莱坞电影到中国网络小说,类似“脑机接口”“人造人”“机器人统治人类”“人类植入体内程序”等说法,已经成为一种现代性叙事母题。从形式上讲,这是一种古老的叙事类别,可称之为“危机叙事”或“恐惧叙事”,叙事中的主人公是人类自己,叙事中的敌人则不断演变,由野兽演变为犯罪分子,由犯罪分子演变为阶级异己分子,由阶级异己分子演变为非我族类,由非我族类变成机器人和人造人。在故事中,总是有华夏就要有蛮夷,有“超级英雄”就要有“灭霸”,它们难以分割,成为叙事快感的天然来源。从人类学角度讲,这也是古老恐惧的技术赋形。

这样的叙述、怀疑和忧虑,弥漫在通俗文化之中,成为货币一样的中介,大家彼此交换,便意味着处于同一文化共同体中,分享着同样的情感结构。去小学边遛弯散步时,会常见到一些活在拉康所谓“想象界”里的小朋友,手舞足蹈,念念有词:“受死吧,机器人!”“你们无法毁灭地球的!”“其实我也是个机器人。”“哦,原来你也是机器人。”……从童书和动画片开始,能指世界中的二元对立与危机叙事就已经出现,而作为对立一方的机器人,在童年幻象里替代了白骨精和哥斯拉的位置,大众媒介替代教育机构,完成了“人工智能教育”的从娃娃抓起。

电影《人工智能》海报

自人工智能问题引发关注以来,我们似乎已经习惯把它与危机联系在一起。而人工智能与文学“杂交”后,这样的恐惧、警惕和反对,也在文学语境中出现。比如微软小冰的诗歌作品,引起媒体和大众的广泛关注,也引来了众多文学从业者的批评。一位著名诗人便曾说过:“这部诗集提供了一本不好的诗的范例。冷酷、无心,修辞的空转,东一句西一句随意组合,意象缺乏内在逻辑,软语浮词,令人生厌的油腔滑调,原材料来自平庸之句。”而在类似的声音中,这样的话语尤其响亮——“坏的诗都有某种机器人诗的风格,没有灵性。”这似乎是相关批评的总纲,人有灵性,机器无灵性,灵性是分界线,由于没有灵性,机器永远创作不出优秀的文学作品。“灵性”因此成了一个用来批评人工智能写作的关键词。

不过,有哪位计算机科学家或程序员曾宣称过,在当前阶段,人工智能可以完全替代人类创作,计算机可以取代莎士比亚和鲁迅吗?当人们发现,这个被口诛笔伐的技术乌托邦论者并不存在,会有种擂台上突然失去了对手的窘迫和尴尬。许多文学从业者批判的对象,只是一个假想敌,幻觉中的反派。因此,这样的讨论本身也变得如科幻小说一般。

当然,这种批判并非没有价值。构建幻影并与幻影搏斗,本就是文学的任务,也是文学的魅力所在——奥威尔写的是一个幻影,赫胥黎写的也是一个幻影,历经岁月洗礼,他们的作品仍给人无穷启迪。但是,遵循认识真理的基本逻辑,需要问:在批判人工智能之前,我们搞清楚它在做什么了吗?认清它给文学研究和文学创作带来的种种可能性了吗?在很多人心目中,阿多诺对爵士乐的批判,乃是某种典范,姑且不讨论他对爵士乐的褒贬,阿多诺对其历史、乐理、调性及与古典乐关系的了解,足以显示这位批判理论代表人物的认真与真诚。

出于对人文学术和自然科学相同的热爱,笔者选择人工智能与文学作为博士论文课题,头昏脑涨地埋在一堆有关机器学习、概率统计、自然语言处理、脑科学的中英文资料里。作为潜入计算机界的文学卧底,读了半吊子数学的哲学发烧友,现在可以向组织汇报如下一些观察——

观点A:目前的计算机写作程序还在草创初期,尚有局限,并不完美,仍在东奔西窜、四处探索,却没安营扎寨、量化生产,暂时创作不出艺术水准冠绝古今的小说和诗歌,也无法保证创作的标准化。(此处我同意文学研究者的观点,不过计算机从业者也持同样的观点,双方并不矛盾。)而在其他文本生成领域,人工智能已经开始展现出卓越的潜力,例如新闻生成,足以假乱真,写出不错的报道,而且已被广泛采用。

具体到人工智能的分支,自然语言处理(NLP)到底在做什么呢?简而言之,第一,它是将人类语言数字化,从字符变为数字,接着进行统计,通过“词向量”的形式,使文字得以表达呈现;第二,人工神经网络通过不断训练缩小处理的误差,完善算法,提高输出结果的准确率。然而具体到某一类型的文学作品,目前往往总量丰富,卓越之作却并不多,影响到数据采集的完备性。

观点B:“机器写作能还是不能?”是个充满诱惑的问题,但是,它的提问方法本身就是个问题。因为,这不是“能与不能”的二分问题,而是卡尔纳普所说的“确证度”问题。不妨假想一条函数线,横轴上1代表能创作出类似莎士比亚戏剧的名著,0则代表不能,那么科学家和工程师们的艰辛努力,是让机器写作从0走向1的过程。目前机器写作正越来越趋近于那个1,虽道路艰辛,但未来可期。若无三体人、比克大魔王等外力影响,趋势几乎不会停止,必将继续向前。例如,人工神经网络层数更深、上下文处理也更优秀的“BERT模型”,便被认为具有突破性。

观点C:计算机技术对文学研究的帮助之大,甚至可能超过结构主义、精神分析等各类二十世纪流行过的研究范式。今天再翻开钱锺书先生的《管锥编》,惊叹于他的博闻强记、妙语连珠之外,也会发现,钱先生采用的似乎是某种“大数据”式的研究方法。这种认识模型与数理统计异曲同工,也就是说,当材料和证据积土成山之后,真理已不言自明,无需拿起喇叭大喊。《谈艺录》中品评李贺诗,言及“长吉爱用泣涕字”,而在袁行霈、罗宗强主编的《中国文学史》唐代部分,介绍李白诗歌风格时,特地谈及李白爱用蓝和白两种颜色,这些研究都已经是在进行一种词频统计工作。当然,对于人工智能,词频统计还只是基础性工作。目前,NLTK程序已可以计算作家的词汇复杂度,构建句法依存关系,更加数字化地观察作家的语言风格;TenlorFlow可以利用词向量训练来进行文本情感分析与文本相似度分析,挖掘作家的意见与倾向;基于人工神经网络模型的翻译程序,也早已应用到了各色文学文本的翻译中。

目前文学与人工智能的结合,除了上述应用于文学研究领域的词频统计、句法依存分析、情感分析等数据收集和建模分析之外,在创作领域,则出现了提供自动起名、人设生成、剧情灵感提示、描写参考等服务的网络小说创作辅助平台“玄派网”,可以进行相关文本糅合与生成的“大作家”写作软件等,能对创作特别是类型文学和网络小说创作提供技术性帮助。

在我看来,计算主义与文学宇宙之间进行的是一场有关语言本质和文学本性的深刻对话,而非肤浅对抗,在未来,它们势必会进行更深刻的融合。在一切都处于加速进程的当代文明中,这不只是一个争论谁对谁错的问题,而是怎样的研究更有助于发现真理,从而服务于人类未来的问题。对抗可能有意思,对话可能无聊,但当前阶段,对话无疑是首要的,在对话之前,搞明白“对手”在做什么是重要的。否则,文学界和相关学术界的所有辩难,都可能变成一种类似科幻小说的假想,或者不自觉地用反对的声音,增添“人工智能”这一话题的媒体热度,乃至搜索引擎中的网页数量。

上世纪六十年代,美国科学家赫伯特·西蒙预测,人工智能将在二十年内替代一切人类工作,事实证明他错了,人工智能的发展前景远没有那么乐观;八十年代,著名哲学家休伯特·德雷福斯认为,在弈棋领域,机器无法击败人类,事实证明他错了;二十一世纪,又有论者认为,人工智能不可能在即时战略游戏领域击败人类,如今在《星际争霸2》这款即时战略游戏中,计算机已达成统治级别的胜出,人类又错了。预测未来是辛苦的事,噱头大于内容,同理,恐惧未来也是辛苦的事,情绪大于推理。当然,若我们不关心对错,而是关心价值,关心能否保留文学作为人类心智独特维度的美学与伦理价值,那么,这场争论便又回到曾经的“诗与科学之争”中了,那场数个世纪的争论留下弥足珍贵的资源,值得每位关心人工智能与人文社科之关系的朋友温习。

十七、十八世纪,思想界群星璀璨,诸多震撼人心的观念应运而生。在众神喧哗的背景下,有两种观念超前于时代,当时却没有得到足够的重视,渐渐隐藏到历史地表之下。多年以后,人工智能的技术进步日新月异,人工智能给人文知识界带来的影响日渐增强,人们追溯式地指认思想祖先,才想起这段历史残片,于是开始钩沉。拉美特里提出“人是机器”,而莱布尼茨则说“一切皆可计算”,一定程度上,这两个说法也是今天诸多争鸣和讨论的总命题。你有过自己变成机器的体验吗,你有过觉得自己被编制在一张数字和计算的大网中的体验吗?如果有过,那么莱布尼茨和拉美特里的很多思考,都会再次绽放思想的光芒。

二十世纪,两位著名德国哲人,海德格尔和阿多诺,都非常警惕技术,《世界图像的时代》和《文化工业述要》两篇雄文,至今回声嘹亮。不过同时代,本雅明对电影技术解放性的认识却提供了另一种声音。二十世纪法国思想家西蒙栋对机器的思考仍有启发,心理学家雅各布·莫雷诺的社会原子理论也值得重温。不过,我认为更值得重视的,是美国心灵哲学积攒下来的成果。之所以说文学与人工智能是“熟悉的陌生人”,也与此有关。

人工智能已经开始文学创作与语言处理的实践,文学界也很早就开始了对人工智能的评论和警惕,彼此交集不少,不过,它们真的熟悉对方吗?事实上,这两套宏大的话语体系仍处于一种彼此隔绝的状态中,这也是诸多议论显得有些自说自话的原因所在。人工智能哲学家丹内特不仅精通哲学,也精通生物学和进化心理学,另一位代表人物博登有计算心理学的专业知识,分析哲学领域大名鼎鼎的普特南,则是数学专业出身。在他们的思想体系中,充满着人文哲学与自然科学的交往理性和对话精神。我认为,我们的起步,也要从这样的交往和对话开始。

对话能带来什么呢?某些自然科学从业者对人文学科常有一种“无意义幻觉”,倾向于认为:人文学科的逻辑性欠缺,无非是知识储备和记忆,再加点风花雪月的抒情,可以轻易掌握。某些人文学科从业者对自然科学则常有一种“魔鬼幻觉”,倾向于认为:自然科学构建了抽象的体系大厦,让技术理性弥漫现代社会,造成了曾经的道德共同体和价值的崩溃,造成了虚无主义和娱乐至死的恶果。有鉴于此,对话应能帮助我们避免很多徒劳的工作,更靠近真相,确信人文学科与自然科学对于现代社会会有相辅相成的效果,正如那个曾经的伟大预言所说:自然科学与人文科学终将是一门学科。

具体到文学领域,通过人工智能,可以引入一个他者视域,让计算机替代部分机械劳作,而在利用现代技术提高效率的同时,更清晰地发现在一次次融合之后,计算机所真正无法替代的部分,从而了悟文学的本质与其最珍贵的价值到底是什么。

常想起茅盾《子夜》里描述高老太爷进城的情景,借用精神分析的观念,不妨认为,他的恐惧并不在于眼前世界的真实存在,并不在于有什么跳出来勾他的魂或要他老命,而在于,他与眼前的世界,彼此都一无所知。