人工智能在美国出版业中的应用问题与启示

摘要:人工智能正在不断改变着美国出版业的前景和结构。美国出版业应用人工智能进行内容分析与出版决策,尝试以人工智能进行内容创作,利用人工智能优化学术出版的评审与编辑过程,基于人工智能助力图书推荐与营销。同时,美国出版业致力于探索人工智能在非人化出版过程与情感元素两个维度的局限与突破。中国出版业应积极发展与构建人工智能的生态结构。

关键词:人工智能美国出版业应用

中图分类号:G

本文刊于《出版发行研究》年10月刊

近几年,人工智能是全球出版界的爆炸性话题。在一些发达国家,将人工智能应用于出版业已经有了一些突破性进展,出版大国美国更是如此。美国出版业对人工智能的应用已不止于查找错误,而是已经进入自动模仿人类思维能力的机器学习阶段,并在此基础上致力于挖掘互联网环境中的海量数据,使人工智能成为连接读者和作者的桥梁,拉近出版业和读者距离的工具。无论是企鹅兰登书屋、哈珀柯林斯、西蒙-舒斯特、麦克米伦、阿歇特等美国五大出版商,还是美国众多中小出版商和技术运营商,都在积极拥抱新时代的变革,充分开发和利用人工智能,丝毫不放过任何一个利用新技术提升图书出版决策和营销潜能的机会。这些都为中国出版业发展和应用人工智能带来一些启示。

一、人工智能在美国出版业中的应用

出版活动总是由出版决策、优秀的内容、正确的编辑与伟大的营销等四部分组成,基于此,通过智能化应用数据,人工智能正在对美国出版业的内容发现、内容创作、编辑过程、图书营销等四个领域产生深刻影响,进而不断改变着美国出版业的前景和结构。

1.助力内容分析与出版决策

对于出版业来说,确定读者需求总是一项艰巨的任务。在过去的四百年里,图书出版过程一直建立在编辑和出版经纪人的知识、经验和直觉认识之上,因为不可能大规模地追踪读者偏好。美国传统出版商和出版经纪人从数百万份书稿中筛选出一小部分有价值的书稿,选择他们认为会与读者产生共鸣的小说,并最终确定哪些书稿有可能成为世界上最畅销的图书。然而,经验与直觉并非绝对可靠的,因其无法避免审稿过程中的偏见与误解,《哈利·波特》的第一本书就被拒绝了12次,《暮光之城》被拒绝了14次,斯蒂芬·金的《魔女嘉丽》在出版之前遭到了30次拒绝。由于行业专家的决定,有一些伟大的小说从未上过书架,也有许多作者在多次遭拒后放弃了写作追求。另一方面,因为图书选题的选定仅靠编辑和出版商来把关,具有明显的主观倾向,许多被编辑和出版商看好的图书,并不被读者和市场认可和接受,无法实现其市场价值,甚至最终沦为尘封的库存。出版商之所以一直在使用他们的直觉进行图书选择,只因为没有什么工具能做得更好。多年来,美国图书俱乐部的普及以及焦点小组的调查提供了洞察力和方向,但这些数据并不足以确定广泛的读者偏好。随着电子阅读器和在线阅读论坛的发展,一切都发生了变化。通过连接设备,最终可以大规模地跟踪读者行为并进行数据分析,这就允许出版业中的各方做出更明智的出版决策。现在的人工智能技术已能让那些潜在的畅销书不被忽视,数据充当了均衡器,通过精准的数据和技术算法,为每个作者提供公平和平等的出版机会,同时也能及时做出市场推广。作者也有更好的机会知道他们的作品是否具有传统出版的潜力,避免了将书稿发送给出版社和经纪人的艰难过程。

一本名为《畅销书密码》的图书于年在美国出版。该书作者朱迪·阿彻和马修·L.乔克斯利用计算机分析了过去30年间出版的本小说文本,最后得出了畅销小说的个通行元素。这些元素包括小说的主题、情节、人物以及有关小说风格和设置的各种变量。当把这所有的数据汇集在一起,朱迪·阿彻和马修·L.乔克斯宣称他们的算法可以预测一本书是否能登上《纽约时报》畅销书排行榜,并称其预测的准确率可以达到80%。它将提供一个畅销小说的准则。[1]基于数据驱动的出版商Inkitt于年宣布与TorBooks公司合作出版由出版算法选出的第一部小说,试图证明出版业是一个基于数据驱动的过程,并尝试通过授权读者推动选择哪种类型的文献并以前所未有的方式向市场推出来改变行业。

实际上,美国出版商们并不认为算法本身能决定哪一本书成为畅销书,基于数据驱动的人工智能只是将传统的图书选择过程转变为科学的开始。脸书、推特等社交媒体创造了读者社区,并通过数据分析和统计发现现实生活中隐藏着的、有相似阅读倾向的读者群。这些数据再经过出版商的智能化整理与分析就变成了个性化的阅读倾向报告,图书编辑据此勾勒出读者心中理想的图书样本,进行前期策划。美国麦克米伦出版公司旗下的圣马丁出版社就由此逻辑发现摄影师布兰登·斯坦顿拍摄了很多纽约市井生活的照片并发布在多个社交媒体上,且粉丝众多,之后迅速与该摄影师达成了出版协议,将那些照片集结成册为《人在纽约》和《小大人》两本图书,两本书的销量都在出版一年时间内突破了42万册。[2]麦克米伦出版公司旗下的另外一家出版社法拉、斯特劳斯和吉鲁(BYR)出版社通过数据分析注意到杰西卡·希巴把她两岁儿子与宠物狗一同睡觉的一系列合照发布于个人博客,并嗅到其中商机,迅速与杰西卡签订了三本图书的版权协议,出版了系列畅销儿童图书《西奥与博的午睡时间》。人工智能的出现和应用使困扰美国出版商的选题策划有了明显改观,使出版业的内容生产走向精准化。这不仅保证了大众图书的市场契合度,降低了出版风险,而且最大限度地保障了市场效益。

人工智能对出版业的影响是无穷无尽的,其主要技能是利用机器去定义书中的元素,然后更好地理解并解读读者的需求,发现藏在数据中的消费市场,以帮助确定市场营销的重点。美国出版商充分利用人工智能技术,通过数据分析和读者反应识别和判断图书类型、风格和主题偏好,并及时跟踪读者的参与和响应,保证出版商可以打造出畅销图书。

2.尝试以人工智能进行内容创作

美国出版业已经开始尝试以机器学习知识帮助作者写作。他们开发了一个人工智能机器人尝试编写下一个《权力的游戏》,还开发了一个代码可以用来复制J.K.罗琳等著名作者的写作风格。[3]在基于内容分析的帮助下,人工智能帮助编辑获得比较成熟的作品,然后编辑再充分利用他们自己的才能进行超越计算机能力的创作过程。

作者工具是英特罗格(Intellogo)公司开发的一套网页基础上的人工智能工具。英特罗格公司专门聘请了一个文学专家团队来帮助作者工具理解什么是词汇和情感,以及内容和情感如何融合在一起。人工智能能够模仿出人的思想意识,也能够了解作者在写作时候的心思和意图。经过机器学习和训练之后,作者工具能够帮助作者更加深入地把握作品结构和逻辑关系,也能帮助作者在主配角关系、情节推进和情感变化中保持作者的一贯写作风格,由此达到帮助作者进行内容创作的目的。

另一家技术公司StoryFit为图书出版提供人工智能见解和解决方案,其独特之处在于他们的数据和人工智能可以为图书创意、收购、开发和营销等各个出版环节的决策制定提供信息。该公司利用人工智能测量文本中的多个关键故事特征,并将其与数千本图书进行比较,产生可操作的见解和智能。传统的作者或故事讲述者可用的数据量很少,而由于人工智能的最新创新,机器现在可以量化情绪、语调、人格和个性等指标,也能够衡量和比较,为故事讲述者提供前所未有的丰富数据。[4]

人工智能还在塑造着美国学术出版的未来。由于充满大量的新发现和数据,科学家们越来越难以及时跟踪他们的研究领域,而人工智能算法是有效管理信息过载问题的一种解决方案。借助人工智能,美国学术出版商可以根据已发表内容和数据集创建新的作品,生成新的文本叙述或图书,并将现有文献建立实质性联系,进而得出新的结论。机器生成的书籍是由计算机算法自动生成的,该计算机算法从给定的数据库检索相关内容,并自动对其进行聚类,然后生成章节结构,并总结和解释最相关的文档。通过提供来自大量论文的聚类分析和结构化摘要,人工智能生成的图书对于任何有需要撰写文献综述或寻找研究主题的人来说都是一个很大的帮助。即使这种文本叙述有点笨拙并且可以轻易识别出是机器生成,它仍然加速了文献的消化过程。同时,如果需要进一步研究,读者还能从这种文本叙述中识别并点击潜在的原始来源,以便深入挖掘并进一步探索该主题。

3.优化评审与编辑过程

人工智能可以用于优化复杂的编辑过程。美国的人工智能技术已经能够达到在短时间内将一本书或期刊编辑完成,并改正其中的错误。IBM旗下一款名为“沃森”的人工智能就曾编写了一期杂志。该期杂志内容多样,不同的内容体现了沃森不同的分析功能,让人越来越相信技术能够改变世界。

在学术出版过程中,人工智能已经可以执行从寻找同行评审到数据制作的一系列功能。一是确定新的同行评审专家。大量学术研究没有足够的同行评审员来应对,人工智能可以从编辑可能没有考虑过的网络来源识别新的潜在评审专家,或创建自动评论,以减轻期刊的负担。二是打击剽窃。许多当前的抄袭算法都是逐字匹配的,使用同义词或释义可以挫败这些服务。然而,新的人工智能软件很像人类的思想,可以识别整个句子或段落的组成部分,更好地打击剽窃。三是报告错误。如果作者未能报告关键信息(例如样本大小),编辑需要就是否接受或拒绝论文做出明智的决定,那么编辑和审阅者应该了解这一点。新技术可以扫描文本以确保正确报告所有必要的信息。四是不良统计。如果科学家对他们的数据进行不适当的统计检验,这可能会导致错误的结论。人工智能可以确定最合适的测试,以获得可靠的结果。五是数据制作。人工智能通常可以检测数据是否已被修改,或者是否已生成新数据以达到预期结果。[5]六是内容编辑。人工智能已经可以从事对文章基本内容的编辑工作。

在未来,人工智能甚至可能会注意到新的研究项目和新的知识,并提出实验来扩展研究,实现完全自动化的出版决策和出版过程。统计评论家(StatReviewer)的创始人兼总裁查德威克·德沃斯一直在密切


转载请注明:http://www.beicanshijie.com/sxgs/17498.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了