书城艺术分析传统下的电影研究:叙事、虚构与认知
9667300000008

第8章 机器叙述者的黎明:走向自动化故事生成(2)

现在我们看到,要实现机器叙述有两个显而易见的困难:第一个困难是对故事的下一步可能发展的空间搜索需要巨量运算,如果要计算n步则可能超过极限。第二个困难是如何让系统具有分辨“好情节”和“坏情节”的能力,即如何让它生成满足特定标准的故事。要克服第一个困难,需要一种回避指数爆炸的方法。这不是不可解决的。例如,可以像巴利的系统那样,通过访问用户知识库或调用专家系统等方式来解决。要克服第二个困难,则需要有一种机器能够接受的“审美理论”(aesthetic theory)或者“评价理论”(evaluation theory),从而为系统识别和选择情节提供标准或依据。显然,评价一个情节的好坏,比评价一步棋的好坏更难以形式化,毕竟审美评价涉及的因素要复杂、微妙得多。

二、规划手段在交互式叙事中的应用

哲学家诺埃尔·卡罗尔提出了一个富于启发性的思路,他要求我们思考一个问题:什么样的叙事是“最容易理解的叙事”?卡罗尔关注的是一个故事的“叙事性联系”,而不是它的各种静态成分。他提出的问题是:对于最普通的、非专家型的观众来说,前面的情节和后面的情节之间的何种联系最容易被理解?在对最“大众化、全球化”的经典好莱坞电影叙事进行研究之后,卡罗尔得出了结论:构成“问答结构”的叙事最容易被理解。这就是他所称的“问答叙事”:前面的情节对于观众提出一个问题,而后面的情节将回答这个问题。

这并不是说,通俗的好莱坞电影总会明确地“提出一个问题”并进行回答,而是说,影片会通过各种“提示”(cues),竭力使观众在心理上“表征”(represent)一个结构完整的问题。这种“叙述性问题”并不需要用具有完整语法结构的疑问句来表述,而是在观众心目中自然形成的一个“默会的疑问”(tacit question)。这个疑问重新组织、结构了当下的故事情境,并限定了可能的答案的范围。这些问题可以是模糊的,也可以是明确的,可以有多个可能回答,也可以只有两个非此即彼的答案。例如“凶手是谁”(Who did it)是侦探片必须促使观众形成的基本疑问,这个疑问的可能答案数量至少与犯罪嫌疑人数量一样多。相反,“他的行动能不能成功”或者“她能不能逃离那个危险”这样的问题,则是悬念片必须引起的疑问,并且只有两个非此即彼的可能回答。按问题—回答结构组织叙事,是理解起来“最不费力”的叙事的一般构成方式,也恰恰是最容易被形式化、最容易编写到计算机知识库中的叙事。

事实上,卡罗尔是把“叙事理解”作为一个类似于问题求解的过程来分析的,尽管同时他也正确地指出,二者并不完全等同。他的思路在AI研究中得到了证实:机器确实特别容易实现对这类叙事的形式化,因为情节本身通过故事中的角色获取其目标而产生了被明确构造出来的“规划”(planning),而故事情节正是基于这些规划而展开的。在计算机和认知心理学领域,“规划”正是问题求解的一种途径。

事实上,对作为规划的故事的描述,早已在服务于故事理解(而不是故事生成)的计算机语言学中被提出。但借助规划手段生成叙事,却是近年来才开始的工作,这方面的工作与叙事学研究、心理学研究紧密结合,卡罗尔和齐尔曼等人的思想在这一领域产生了较大影响。但反过来,这一思路的灵感就是,可以求助于对问题求解的渲染来生成故事,至少是局部生成故事片断,即把对单一目标的追求作为主要叙事机制。这正是目前的数字叙事的首要技术基础:把“规划”作为首要技术手段,它通过“行动选择”(根据角色目标和情境选择角色行动)来描述角色的高层行为,这样构成的一个故事可以被描述为一个因果上关联的行动串。

研发“长弓规划者”(longbow planner)的杨格及其同事,在2004年提出了一种理论。它是根据传统的叙事理论改造的,它的设想中包含了经典叙事学的核心概念:“本事”(fabula)、“故事”(syuzhet)以及“话语”(discourse)“本事”(fabula)、“故事”(syuzhet)和“话语”(discourse)这几个词语,最初源于俄国形式主义者什克洛夫斯基等人区分的fabula和syuzhet,法国叙事学家热奈特则区分了discourse层次。在叙事学中,它们大致分别与“被讲述的对象(素材)”、“被(读者)建构的对象”和“被讲述出来的话”相对应,但自动化叙事研究中对这些术语的用法与叙事学的用法并不完全一致。但是,这些元素在自动化叙事研究中的用法不同于传统的用法。在杨格的构想中,fabula被表征为一个规划结构,它是由“石弩(crossbow)”程序——一个基于长弓规划系统的多层、偏序的因果联结规划系统——所产生的,涉及编写一个规划问题、一个行动算子库、一组前提条件和一组限制,这些共同构成了一个“规划空间”(故事世界)。一个syuzhet是一系列从fabula中被选择出来的事件,并且这些事件的顺序标示出它们被呈现给观众的顺序。最后一层,即一个discourse,被定义为那个再现故事的媒介本身(语言性文本或者电影)。在此基础上,杨格及其同事构造了一个能产生悬念效应的叙事的系统——“悬念机”。这是一个从“素材世界”中建构出叙事结构的框架,这个叙事结构意在引起用户特定水平(可高可低)的悬念。“悬念机”首先抽取一个关于那个输入故事的融贯的纲要作为一个故事结构的内容,然后通过添加各种故事元素(这些元素使用启发函数来控制悬念水平)来完成这个结构。对“悬念机”的实用性进行测试的结果令人振奋,“这个模型在挑选提高读者悬念水平的故事元素方面是有效的”。

但是,“悬念”是特殊的叙事效应,历来的叙事研究者都强调悬念效应与故事中行动者的目标之间的关系。也就是说,与其他叙事效应相比,它最容易接受规划技术的形式化。其他效应的情况也许会复杂得多,它们也许很难服从某种目标—指向的过程的形式化,因而也难以利用规划技术来模拟。这有些像五子棋与象棋的关系,也许它们在服从计算机化方面,并不只有量的差别,可能还会导致质的差别。并且,“悬念机”是一个需要用户作为参与者的交互系统,因而并非完全意义上的机器叙述者。规划技术能不能生成其他效应的叙事呢?并且,由计算机独自实现的(而非与用户交互实现的)自动化叙事生成是可能的吗?

三、喜剧情境的自动生成

可能通过规划求解过程来模拟喜剧情境吗?显然,我们关于喜剧的传统定义与“规划”风马牛不相及,喜剧情境似乎和人物行动的“目标”毫无关系。喜剧的领域非常宽泛:从让人幸灾乐祸的踩香蕉皮、落水沟、扔奶油蛋糕到尖酸刻薄的讽刺揶揄,从漫画到电影中的噱头,等等。传统的喜剧理论(也称“笑的理论”)往往试图全面覆盖这些领域,但可以想象,这样产生的理论往往要么失之偏颇,要么过于含糊。柏格森认为,笑是来自于机械或僵硬;霍布士相信,笑是由于看到他人比自己低劣而引发了自己的自豪感;而康德则相信,笑是紧张的期待突然落空时出现的情感……这些观点都是富于启发性的评述,但它们各自适用的也许是不同的喜剧类型。就利用规划技术对喜剧性叙事进行形式化来说,确定计算机接受的“机械”、“丑”之类的审美标准也是困难的。