我,创作,AI,与网文小说
上周,我发布了一部网文小说作品。它的特别之处在于,这是一部我尝试的第一部长篇文字类作品,一部企图可以面向大众市场的作品,一部 AI 高度参与创作过程的作品。
今天,我想来聊一聊,创作,AI,和网文小说。
首先在小说达到五万字左右数量的节点,先来概览一下这部作品。《决战!核废水引爆的亚特兰蒂斯》,这个故事包括一开始创作的动机其实都是我和朋友一时兴起想尝试下社会热点,AI 创作工具,以及曾经一个阅文无数,一腔热血想书写自己的小说的少年之前,和另一个对网文知之甚少,惜字如金的软件工程师之间,到底能碰撞出什么样的火花。于是我利用调休和周末的几天时间,构建出了这样一部作品并正式上架了番茄小说的平台。
TLDR:当前的 AI 工具尚且不足以完成整部中文网文小说作品,但是对于短篇偏纪实和科幻类已经能有比较不错的效果了。主要的挑战在于:
- 上下文。网文每章节动辄几千上万字,现有的大模型根本无法完整记录好超长的上下文信息,容易出现前后驴唇不对马嘴的情况。
- 中文优质语料的缺失。
- 大模型预训练时期人为添加的诸多限制
但是 GPT 的出现,已经让我们看到了这种可能。相信不出十年,AI 在超长上下文的文学创作能力就能有质的飞跃。
谈一谈使用的 AI 工具
在创作这部小说的过程中,主要用到了以下几个工具,在各自的领域都是代表性的存在,这里拿出来单独说一下。
文生图模型:稿定设计-AI 绘图
这次的封面图的底图就是采用 AI 绘制的,坦白说一开始我个人不是特别满意,不是我预期想象中的样子。但是对于这整个过程使用的时间来说,我觉得这个效率反而是最惊人的。一分钟不到,符合基本设定要求的底图生成好了。我再画三分钟添加个文字,摆一摆位置,一个基本元素完备,风格色彩合格的网文小说封面图就制作好了。相比较之下,听闻之前的类似出图都是以天级别计算的,费用甚至几百上千,这其中的效率差简直恐怖。
我之前也尝试过手动搭建 stable diffusion 在自己的 GPU 服务器上运行,用的 gradio 那个 web ui,自我感觉良好,出图的效果也挺不错。但是拿给非工科的朋友用,上来就是吐槽界面怎么全是英文,怎么那么多按钮,该怎么启动,该怎么写提示词,怎么不会画中国风。有一说一,那个时候的 AI 工具更像是一个工程原型机,而现在被稿定设计这样的 toC 平台引进做好本土化适配和产品化设计之后,使用上手出乎意料的简单。
图片超分模型:Upscayl
图片超分这是一个起步较早的方向,门槛低,效果好,我是用它来对上述生成的封面图进行超分后降采样得到一个更加可用的画面,毕竟上面没交钱开会员只能用截图工具获取画稿 hhh
可以预先选择好图片的风格以获取更好的超分效果,比如原图是偏动漫插画类的,还是偏写诗类的。
LLM 大语言模型:Claude-2-100k
GPT 早已经火出圈了,但是之前由于上下文长度限制,其实并不能很好的作用于网文小说写作这种场景。尝试了一众 AI 模型,LLama, Palm 这些因为对中文支持不友好所以排除名单。Claude-2-100k 综合使用下来是最合适的。可以在一开始给他说明好他的任务,是作家,然后再把故事背景和设定给他,后面就可以根据情节安排写出一段段故事了。
这类大模型是需要使用者通过不断调整 Prompt 才能发挥好的,比如让他写一段餐馆里的闲谈的场景,一开始会写的比较干,几句话描述下什么人,进到里面,坐下来,点了餐,吃了饭,干了什么事,走了。这种就很没意思。需要手动调教他,添加更多的环境描写,设定是在秋天,傍晚时分,温馨的环境,餐厅里面有什么,路人的神态是放松的,背景是本世纪初,对白偏生活化一点,诸如此类。很惊喜的是,它完成的很好,语言流畅自然,中文里一些高级的词汇和中文里一些口语化的描述,都能写出来。但是作为网文小说这种,就太死板了,目前看来写写严肃文学倒是很合适。
LLM 大语言模型:彩云小梦
Claude 和 GPT 说到底还是外国人训练的,对于网文小说这种题材,还是国内的公司做的更有那味。
产品从一开始就是为小说的场景而设计的。进来就会指引你填写世界观设定,风格选择等,续写风格可以选言情,玄幻,脑洞大开等等,看起来很有趣。实际体验下来,写出来的东西也确实很有网文那味,比如霸道总裁,玄幻武功,炼丹修仙,这个『中国特色文学体裁』那是信手拈来。甚至还会写擦边球。可以看得出来这个模型的确是用各种五发八门的国内网文小说训练出来的。
不过缺点也很明显,其底层技术应该是类似于 GPT3.5 的技术,主要问题是上下文太短,生成的故事没有连贯性,而且风格差异化太明显,经常跑偏。经常写着写着上一句还是霸道总裁的现代都市言情,下一段就斗气三段直接来到玄幻世界。还出现过前面一段是两人往事的叙事,转成霸道总裁风,然后两人调情没几句就直接变成讥讽和争吵,变成了一场战斗戏,再一转又是欲情故纵的调情擦边球戏。
不过总体来说,用来添加一些言情类的对白细节和玄幻类的战斗戏细节还是非常合适的。
当前 AI 创作工具的局限性
在使用 AI 创作这部小说的几天时间里,我最大的瓶颈,不是奇葩又烧脑的设定,不是新书上线缺乏积极反馈的一丢丢沮丧,也不是因为各个 AI 输出结果千疮百孔需要我人工救场时的懊恼,最大的问题,是白嫖额度到期。
没错,上面使用的平台,全部都是我白嫖的。即便他们都拥有可以加钱获得力量的会员方案,但在这个时间点,我还不想为了一本读者都没几个,收益遥遥无期的这么一个作品,甚至连完本都不能保证的作品去投入。毕竟这目前还只是一时兴起的一个玩具,还是想用一个更大众化的视角去看看当前 AI 技术在国内的发展和普及。
不过好在这些平台都很大方,每天都有免费额度,第二天就可以继续用了。这配额也一定程度上避免了我熬夜爆肝 hhh
这里就不得不提到当前 AI 普及和发展的一个大难题:算力要求。
这里不仅仅是这些大模型对运行的硬件规格要求高,目前在手机那样的平台上运行还是非常吃力。更重要的一点是,这些质量高效果好的模型需要更多参数,更多材料,更高规格的 GPU 去训练,更多个人和企业推送整个生态发展。而现在这些高端 GPU 而设计和制造技术都是掌握在美国科技企业手里,目前还有相关法案禁止出口先进制程的 GPU 到中国,国内高质量的材料也是少的可怜,生态更是无从谈起,各家都想自己搞自己的。国内本就不强的 AI 技术将雪上加霜。
国内前几年吹得牛逼哄哄的各种超算,各种国产芯片,在 AI 的浪潮前,似乎都没声了。国内外的 AI 技术和生态差距将被进一步拉大。不出意外的是,不久之后国内的 AI 就会落后于欧美一到两个世代。
下面再来探讨下这些国际领先的 AI 模型才需要考虑的,在这种内容创作场景下的一些局限性。
第一:上下文
这里并不单纯指的是上下文长度的问题,还有上下文形式的问题。
首先显而易见的,对于网文这种篇幅超长,水货超过的类型,现有的大模型的上下文长度还是不太够。短期来看,提高上下文长度可以很大程度上改善续写跑偏的问题。但是有些问题不是单纯增加这个长度就可以解决的。一个很明显的例子,就是伏笔。
挖坑,或者说埋伏笔,是文学写作过程中非常常见的一种手法。悬念的制造,气氛的推动,离不开伏笔。而且对于长篇幅的作品来说,伏笔的呼应可以强化作品的连贯性,让读者能够清晰地认识到,这些文字是一个整体,他们共同构建了这个作品。这对于网文小说更是尤其重要。
但是从目前我使用 AI 创作的体验来看,目前的 AI 完全无法掌控好伏笔。几乎全部都是需要我人工来盯着,并思考什么时候适合去挖坑和填坑,一个坑挖了又需要以什么样的方式把他填上。
另外一个问题是,这些伏笔,人物关系,概念设定等,很多时候他都并不是一个线性的结构,所以通过文字的形式作为输入放到上下文里其实都不是很合适。我个人感觉他们更像是网状的结构,但是这种模式似乎又与当前这些模型的原理和运行模式格格不入,就期待后续有没有使用网状结构信息训练和推理的模型出现了。
第二:预训练时期人为添加的限制
这一限制在国外这些大厂的 AI 模型上尤为明显,『政治正确』对他们来说太重要了。非常明显的体现就是,我要求 AI 构思一个反派角色,并输出人物的基本设定,以及往事的一些碎片特写。
但是 AI 返回的结果让我总是苦笑不得,说我们要保持正确的积极的价值观,同时不能对性别,种族,外貌等方面有任何的歧视。而且对环保还有 happy ending 有着莫名的执念。举例来说的话就是一个反派,有这黑暗的过往,后来成为了故事中的反派,烧杀抢掠,破坏环境,最后迷途知返,众人谅解,the end.
这些限制不仅仅使得 AI 在构思故事时,尤其是反派或者一些消极的事物时缺乏真实性和张力,此外也是的故事中的很多人物缺乏性格。男主就是男主,女主就是女主。关键情节上戏份谁多一点谁少一点罢了。
相较之下,国内的 AI 在处理人物性格这个问题上就太过极端。以彩云小梦为例,写出来的男性任务,要么就是霸道总裁,要么就是童年悲惨,后来灵力爆棚;女生呢要么是冷淡的御姐,要么就是看起来古灵精怪故作娇羞其实前言不搭后语的神经病。从体验的结果来看,倒是非常符合我对国内网文的刻板印象呢。
作为对比,就几个我认为人物塑造上很有特色的几个例子。
- 一个就是最近看的《阿基拉》,铁雄在一个孤儿院长大,处处被大哥一般的金田保护着,使唤着,在他面前,铁雄似乎永远是个长不大的弟弟。他向往着金田那酷炫的红色摩托座驾,几次试图驾驭他却失败闹了笑话。后来机缘巧合下被改造获得了超乎常人的力量,也成为了乱世里麻木,愤慨的民众敬仰和追随的救世主,神明。铁雄获得力量,在一次慌乱恐惧的半梦半醒的战斗中,意识到自己的强大后,进行了一番发泄,暴击了追赶而来的武装部队。对追赶而来的金田等人,他的第一反应是再也不是小弟了,现在换成铁雄保护他了。后来他的反应不是对所有欺负过自己的人复仇,也不是什么圣母拯救世界。不知道是出于害怕还是好奇,他继续追寻着终极的力量,阿基拉。后来追寻阿基拉成为一场空,在一片废墟上,双方战斗有来有回,这段给我的感觉,甚至不像是少年打败怪兽,更像是两个童年玩伴之间,想象自己化身超人后的嬉戏。后面铁雄身体里的力量不受控制,他变成一个肌肉组织疯狂增生甚至吞噬女友的巨型肉瘤怪兽后,又一次向金田发起了救助『救救我』。
- 科幻巨著《三体》,动画作品《我的三体》里,对于章北海这个人物的刻画也很有意思。一个从海军时代走到太空军时代,意志坚定,正义凛然的军人,为了保卫人类文明,为了应对无处不在,封锁人类科技的质子,章北海对整个世界封锁了自己的内心,坚定他的信念。跨越了几个世纪,在他冬眠几百年后醒来,三体的探测器水滴第一次到达太阳系与人类文明接触前夕,章北海利用他代理星际舰长的身份,带着保卫人类文明的使命,带着整艘星舰以最大速度脱离了太阳系,向着无尽星辰大海远去。他深知人类文明在三体世界的技术面前毫无还手之力,他拼尽全力,为人类文明留下一个火种。后面假装追击叛逃者章北海,实则心有灵犀,志同道合的褚岩舰长等也与其汇合。但是在资源储备不同的情况下,四只舰队不得不自相残杀争夺所剩无几的资源以支撑长途的星际航行。这场战斗中章北海以释然的心态交出了这个接力棒,由之前与他素未谋面不曾相识的褚岩舰长,作为他的精神延续来完成这个延续人类文明火种的使命。
这两个人物塑造都很有意思,风格迥异,不落俗套,却又富有戏剧张力,而且透露出作者对生活和人性的观察,有独特的人文温度。
而这样的人物塑造,不仅现阶段的 AI 无法直接达到,甚至作为创作者给定故事大纲和发展脉络,AI 都很难写出对应的契合特定作品风格和人物个性的文字。
当然上面拿文学上获得高度评价的作品来欺负现阶段不够成熟的 AI 有点不够意思。但即便对于网文,要写出让人印象深刻的角色和情节,只有这么几个脸谱化高度同质化的画像,我觉得是几乎不可能的。如果要写流水账形式,刻板印象的,没有太多要求的工业流水线作品,我觉得目前还是有这个可能的,不过需要足够好的模型能力和预训练作为基石,再加上创作者对 AI 模型和提示词的了解才行。这个想必在未来两到三年应该就会有突破,到时候市面上这些高度同质化的小说只会更加泛滥。
浅谈字节与番茄小说
番茄小说的产品的月活,营收之类的我在此就不再过多赘述,大家有兴趣的可以去找些商业分析报告看看。这里主要探讨的是,他作为字节旗下的产品,身上有这哪些字节的影子,又有这什么独特的优势和产品策略?
首先,和头牌产品抖音一样,番茄小说是一个 UGC 的,重流量,数据,反馈和推荐算法驱动的这样一个产品。
说起推荐算法,很多人都会觉得 AI 这一块国外技术这个牛批,为什么抖音这种模式首先在国内流行起来,后来又席卷国外互联网。
这里有几个抖音发家致富很重要的因素,推荐算法需要大量数据做训练,相较于奈飞这样的长视频流媒体平台,抖音的短视频在相同时间内能够采集到的用户的反馈数据是前者的几十上百倍。数据量有了,训练算法的模型也就更精准了,用户得到的反馈越来越积极,在内容制造者层面和内容消费者层面都开始扩张开来,越来越多的流量,越来越多的用户反馈数据,越来越好的算法,越来越好的用户积极反馈,越来越多的内容创作者涌入,这个商业飞轮就运转起来了,而且转的越来越快。
在这一点上,番茄小说师承抖音,在这条正反馈链路上也是做的很好,小说免费,叠加头条的引流,大家都跑过来看,用的人多了,反馈数据有了,推进更精准了,反响更好了,更多的写作者入驻,内容多了,整个盘子越来越大,越来越好。
除此以外,小说作为当代国内文娱领域一个重要组成部分,IP 也是一个非常重要的资产。每本小说都会在两万字的时候有一个跟番茄签约的流程,签了,就能获得被搜索推荐的资格,获得平台分成,不签,对不起啥也没有。签约之后 IP 相关的内容肯定是要被平台买去了的,具体作者能分到几个点吗。。。那就是另外一个故事了。
这一点跟腾讯阅文集团的布局是一样的,流量,IP,影视和周边。这些大体都是同一套商业逻辑。不知道其他平台怎么样,番茄应该是非常注重反馈数据的那一个了,更新频率,完读率,互动活跃度等等各种指标来考核作者,整的比上班还累。
不过总体来说,番茄和字节整个的这个商业逻辑和发家致富历史还是很值得我们去学习的。尤其是这个恐怖的飞轮,一旦转动起来,就是能以势不可挡的架势冲击大半个互联网。
创作历程分享
平心而论,我认为自己一直都不是,也无法成为一个优秀的文字工作者。也许我可以写出中学时期那些所谓的辞藻华丽,立意高深的『好』作文,也许可以写出一篇简洁,严谨的工作文档。但是我知道,这里面缺乏温度,缺少灵魂。见过真正有人文关怀,突破天际的想象力,性格迥异却又充满戏剧性张力的人物故事,见过那些有天赋的作者和同学,我觉得有些东西就是需要天赋,没天赋就是没天赋,可能终其一生都赶不上。
如果我要写一个故事,可能最多也只是一篇平平无奇,逻辑上通顺,偶尔有那么几个脑洞,大部分时间都只能在前辈的影子下拙劣地模仿的一个故事。
在创作这部甚至不能称为作品的作品中,我的大部分时间也都是在构思一个试图有些新鲜东西的『合理』的情节,补充各种细节和设定,挖坑,填坑,水字数,调整 AI 生成文本中的 bug。
不过也不是完全没有收获,在尝试使用 AI 创作整个小说的时候,我大概掌握了一些技巧。比如设定要预先给 GPT 定好,情节的节奏和衔接还是要亲自把控,但是一些细节可以让 GPT 代劳,这个真的很有用,(尤其是对于需要大量水字数的网文小说)
比如让 GPT 写一段餐馆里众人围着小电视机的日常对白。
街道上行人并不多,都是些步履匆匆的上班族,或悠哉散步的老人。秋阳从树隙间洒落下来,洋洋洒洒铺满了整条街道。路边的建筑不是传统的日式木质结构,而是夹杂着些西式的红砖或水泥房屋,显得格调混杂却又和谐统一。
这是一条看似平凡却让人感到亲切温馨的小街道,没有太多喧嚣与烦扰,却处处透着人情味。林凡和明石正要开始一段充满未知冒险的旅程,这家小餐馆像一个温暖的港湾,让疲惫的身心得以喘息。
两人兴许不知道前方有怎样的险阻在等待,但是此刻,享受这份静谧与温情,已经足够。
小餐馆的电视上,又在播放着新闻。
“天呐,蔬菜价格又要涨价了!”一个头发花白的老奶奶放下碗筷,双手扶额无奈地说。
“是呀,最近物价飞涨,生活费用压力太大了。”旁边一位白胡子老头也叹了口气。
“就是有证据显示这起事件有阴谋!”那名中年男子神秘兮兮地小声说。
“天哪!这也太可怕了。”老奶奶捂住嘴巴,一副震惊的表情。
“唉,真不知道这社会要到什么地步。”老头叹道。
电视上又切换到了其他新闻,几名上班族模样的青年男女也加入了讨论。
“诶,你们看,股市又跌了!”一个男生着急地说。
“最近经济形势越来越不景气啊。”一个女生也愁眉苦脸地说。
“工作这么辛苦,钱还是省不下来,年轻人现在日子没指望了。”另一个男生一脸失望。
三名年轻人叹息连连,满脸忧虑之色。这时,电视画面跳转到了娱乐新闻,几名艺人的花边新闻占据了荧屏。
“来来来,看这个,明星的绯闻啦!”一个女生眼前一亮,话锋一转。
“嗨,这些娱乐新闻才叫有意思。”另一个女生也来了精神。
“工作那么辛苦,看点这些解压解压嘛。”一个男生笑着说。
三人又投入到了对明星私生活的讨论中,烦恼的表情一扫而空,兴奋地指点着电视画面。
林凡和明石面面相觑,感慨百态人心,千头万绪,便也没去打扰他们继续闲聊。
还有一些人物对白类的,写起来很麻烦的,也可以让 GPT 代劳水字数。
他们一边在海上漂流,一边在研究这片海域的变异生物,寻找着这个世界的根源。他们的进展很顺利,在几天之后,他们终于查到了一些蛛丝马迹。一处人迹罕至的海岛上,有一座奇怪的建筑。
在研究中心的顶楼,一个房间的窗户被打开,里面站立着数十名科学家。这些科学家都身着白大褂,戴着墨镜,一副严肃冷漠的表情。他们正在进行一项实验。
在林凡和明石的监视之下,他们在实验台上摆弄着一块金属板。这块金属板通体呈现黄铜颜色,表面光滑如镜。
一位穿着白大褂的科学家拿着一把匕首,匕首微微泛着幽蓝的光芒。
不知为什么,林凡看到这个光芒第一个想起的是明石。
匕首插进了那块金属板。金属板的表面顿时出现了一阵阵波纹,波纹越来越大,最后化作一张人脸出现。
林凡看着这张诡异的人脸,心脏不由自主地加速跳动,呼吸急促,额头渗出细汗,双腿忍不住微微发抖。
“你在害怕什么?你是不是害怕这块金属板上有一张狰狞的人脸?”
科学家的声音响起,让林凡清醒了过来。他看着林凡,露出一丝嘲讽的微笑:“害怕什么?你在害怕这块金属板上的人脸是假的?哈哈!你真幼稚啊!” “你在胡说八道些什么!“林凡怒声反驳,“你们的实验已经失败了,现在我们就能证明它不是真的!”
“证明?怎么证明?“科学家冷哼一声,“如果这块金属板上没有人类的话,你认为你有资格跟我们谈条件吗?”
林凡愣了愣,一时语塞。这个时候,明石走了过来,“我们已经找到了这个实验的关键,我想我们应该跟他们谈判一下。”
他们跟着科学家走到了那个办公室里。那里坐着四个人,分别是两男三女,男人的年纪约摸四十岁左右,看上去有些阴郁,眼睛里透露着一抹狡黠的寒光。女人的年龄比较大,约有七十多岁,头发花白,脸上的皱纹深邃。男人看上去三十多岁,皮肤黝黑,眼眸深邃。三女中有两个看上去年龄稍微小一点的女孩,大约只有十六七岁,但是却穿着一套白大褂,一看就像是医院里的护士装。
“你们是谁?想干什么?“其中一个男人开口问道。
上面这两段文字,前面一段是 Claude 生成的,后面这段时彩云小梦生成的。可以看出有这非常明显的风格差异。
Claude 生成的很『正确』,前后通顺合理,但是总感觉没那味,像是先生成的英文再翻译过来一样,而且感觉很平淡,里面的每个人物,换成男人女人,大人小孩,感觉都没有什么不会有什么违和感。
彩云小梦生成的相较而言就很『疯癫』,写的一长剧情上就容易出 bug,而且动不动就『冷哼』『嘲讽』,情绪波动倒是有了,不过总感觉全是国内网文的套路化,应该是国内网文看多了吧也怪不得人家的模型 hhh
关于创作欲
最后的最后,来聊一聊『创作欲』这个东西。
马斯洛需求层次理论模型
人的需求分成生理需求、安全需求、归属与爱、尊重需求和自我实现五个层次。需求是由低到高逐级形成并得到满足的。
创作这件事正是最高的那一层,自我实现的层次。
创作这件事,其实并不是单纯指的是创作小说,音乐,电影等。我个人理解,他应该是一种更广义的,自身能力参与建设最终使得一样事物变得独一无二。至此,个人的价值得到了体现,收获了『心流』状态的正向反馈,『归属感』的反馈,以及这一件事物变得独一无二带来的价值的提升。
举例来说,写代码是一种创作,摄影是一种创作,唱歌是一种创作,某时某刻你在朋友圈留下一段自己的文字,也是一种创作。
『我』的参与,让这个事物变得独一无二。『我』的沉浸,给我带来积极的反馈,『我』创作的作品,属于我,有一种归属感。
我在给自己的年度目标中,也把中大型创作作为我的指标之一。我觉得首先无论结果时好时坏,我很享受创作的过程。就比如本文开头提到的这本小说,以及前段时间制作的『铃芽之旅』中日粤三语 MV,花了很多时间和精力,但是并不会觉得累,反而会觉得很有成就感,甚至是反向充电。也许这就是『为爱发电』的魅力吧。
畅想
时代的发展,技术的更迭,让我们有机会去尝试和实现我们的祖辈做梦也想不到的东西。当前,AI 作为创作的辅助工具,尚且处在初级阶段,AI 绘图,AI 写小说,AI 写代码,都还只是高度场景化,模板化的一些应用。也许未来的某一天,让我们可以真正地,从脑机接口将我们的想法输入到 AI,通过 AI 进行解读和艺术加工。到那个时候,创作的权利,属于我们每个人。人类世界会变得更好吗,我不知道。但是我期待未来的某一天,我能够通过这种方式,记录下脑海中的旋律,梦境中的画面,以及记忆中的故事。