文心大模型为内容创作装上AI大脑 加速AIGC发展趋势

2022-07-22

人工智能加持,许多不可能成为可能。《富春山居图》是中国古代水墨山水画的巅峰佳作,在7月21日召开的2022百度世界大会现场,百度首席技术官王海峰展示了基于文心大模型“补全”后的《富春山居图》。

预训练大模型,这是全球人工智能发展的热门方向,它可以让AI技术更快落地到各行各业,实现从“量变”到“质变”。此前,百度文心家族发布了20 多个大模型。“补全”《富春山居图》残卷背后的关键就是文心视觉大模型支撑的AIGC技术能力。

文心大模型助力下,AIGC(人工智能自主生成内容)时代加速向前,背后更深远的意义是可以以更低的成本、更快的生产速度,生成AI原创内容。“未来十年,AIGC将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。”百度创始人、董事长兼首席执行官李彦宏在2022百度世界大会上说。

AI助力“补全”残缺画作

预训练大模型是当前人工智能发展的重要方向,它增强了人工智能的通用性。百度、微软、英伟达等国内外科技巨头,纷纷在AI大模型领域展开相应探索。

文心是百度自主研发的产业级知识增强大模型,能从大规模知识和海量数据中融合学习,效率更高、效果更好。本次画作“补全”,使用了“视觉生成大模型+单样本微调”的大模型落地策略。

用AI复原老照片,让古画中的人物“活”起来……利用AI助力文物修复已屡见不鲜。但应用文心大模型“补全”《富春山居图》与以往有所不同。其最大亮点在于,每个人都可以根据自己的想法“补全”缺失的部分,从而赋予画作更具个性化的意义。

然而,要实时生成一幅高清晰度、高还原度,并且支持全民参与的画作,对AI算法提出了诸多挑战。据百度技术人员介绍,这幅传世名画“补全”的背后有三个难点:难点一:高清晰度。将AI应用于历史画作的修复并不罕见,但往往清晰度不高。此次百度实现了高清尺寸的“补全”,生成的画作更加逼真,具备了更高的艺术观赏性;难点二:高还原度。在只有一幅样本的条件下,仍然要高度还原大师作品,对模型的迁移学习能力要求极高;难点三:全民参与。由于不同用户输入的笔触千变万化、形态各异,需要同时满足所有人多样化的创作期望和创意想法,并且近乎实时生成画作。

知难行易,为了更好呈现艺术效果,百度使用文心视觉大模型实现了对画作的“补全”。文心大模型先是学习了大量的中国山水画,当具备了“大师”水平的文心大模型再去学习《富春山居图》时,就能够更快速掌握这幅传世名作的精髓,从而让“补全”出来的画作与现存真迹保持风格一致。

据王海峰介绍,在百度APP搜索“富春山居图”,每个人都可以参与“虚拟补全”,简单勾勒几笔,只需不到1秒钟,文心大模型就能自动“补全”画卷。另据了解,此次参与“补全”的视觉生成大模型因为参数量大,建模能力强,能够让用户在勾勒线条的当下,既能实时生成清晰度较高的画作,又能将大众不同的“补全”创意实时转化生成。

人工智能虽然不能百分之百还原残画,但能提供更加多样的修复方案。

从应用角度看,文心大模型可以持续在书画文物的修复中发挥作用,做出基于中国文化艺术的数字内容创新。同时,也能帮助更多非专业人士以多元的方式参与书画艺术创作,拉近艺术与生活之间的距离。

事实上,人工智能在书画文物修复中已广泛应用,AI可以帮助还原历史“真相”。巴黎圣母院借助AI推动精准修复,三星堆探索AI识别文物修复,影片《决胜时刻》重映版也使用了AI修复技术。未来,书画文物修复可能是人机协同完成,数字创意艺术的发展将涌现新的创作局面,此举也利于更进一步还原遗失的传统文化。

AI数字人开启AIGC智能创作潮流

“补全”《富春山居图》只是AI赋能的众多应用之一,本次大会上的另一大看点“火出圈、成顶流的数字人”,也是百度文心大模型支撑的重要应用。

数字人形象,最早可追溯至上世纪80年代,不同于传统PC互联网时期的数字人,在AI赋能下,数字人实现智能化交互,打开了内容创作的新空间。

以AI数字人度晓晓为例,它是具备AIGC能力的数字人,不仅具备了对话能力,它还能40秒写40篇高考作文,它创作的AI绘画数字藏品卖出了高价,它的画作在大学毕业展上展出,它与龚俊数字人联合演唱的歌曲MV是国内首个虚拟偶像AIGC歌曲……这些都展现出AIGC能够高效率实现内容生产的价值。

基于大模型技术,AI数字人拥有超强的创造力,颠覆现有的内容生产模式。据了解,拥有文心大模型能力的AI数字人全面进驻百度APP,一方面意味着对话交互式搜索新时代的到来,另一方面也是大模型支持下AIGC能力逐渐成熟的体现。

AIGC,是指人工智能自主生成内容,这是AI领域目前的热门概念之一。我们先后经历了PGC、UGC时代,AIGC作为全新的内容生产方式,有几个显著特点:

产出高效。度晓晓在挑战写作时,可以做到40秒写40篇作文,画一幅画则只需要几十秒。与人类生产效率相比,这是指数级的提升。正如李彦宏所说,未来可以实现以“十分之一的成本”,以百倍千倍的速度,去生成AI原创内容。

创意多元。不断降低的AI应用门槛,为创意插上腾飞羽翼。比如,在今年4月举行的2021百度认知AI创意赛“AI创意派”决赛上,就涌现了像传记生成、高考志愿推荐、心理树洞等诸多创意应用。基于大模型能力生成的T恤、马克杯、帆布袋、画册、明信片等创意周边,证明大模型能够在创意领域落地应用。

人格化更高。在文心大模型的支撑下,AI已经具备了很强的理解和生成能力,不仅能写出立意明确、引经据典的高分中文作文,还能够快速生成超过100多种语言的优质内容。在文心大模型的支持下,AI产出的内容不仅“智商”更高,“情商”也更高了。

“AIGC是PGC、UGC之后,全新的内容生产方式。它不仅会提升内容生产的效率,也会创造出有独特价值和独立视角的内容。”李彦宏认为,AIGC将走过三个发展阶段:首先是“助手阶段”,AIGC用来辅助人类进行内容生产。第二是“协作阶段”,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面。第三是“原创阶段”,AIGC将独立完成内容创作,大模型技术的突破,正在加速这种发展趋势。

从业界应用看,大模型技术正助推AIGC迈向AI主播、AI创意、AI智能新闻播报等更多应用场景,进一步释放内容创作的无限潜力。

从宏观层面看,当前中国正阔步迈入数字经济时代,以人工智能、虚拟现实等为代表的新技术蓬勃发展,数字文化消费升级展现出前所未有的潜力。“十四五”时期,文化产业数字化战略加快实施,数字创意、数字娱乐等产业将不断壮大。相信未来基于文心大模型的AIGC将会带来更多新的创新性探索,并开放赋能到更多领域。

AIGC背后的核心支撑文心大模型

不管是AI数字人,还是AI“补全”《富春山居图》残卷,百度AIGC背后的技术是百度飞桨及文心大模型领先的技术优势,这些底层技术支撑智能创作,推动AIGC时代到来。

作为一种新型的内容生产方式,基于大模型的AIGC生产效果和效率不断提升,叠加政策利好,将为实现创意内容生产提供更多可能。正如百度研究院预测,2022年AIGC技术将借助大模型的跨模态综合技术能力,激发更多创意,提升内容多样性,降低制作成本,实现大规模应用。

“百度文心大模型学习效率更高、学习能力更强,还能跨语言、跨模态学习。一旦跨过某个奇点,就能产生真正意义上的AI原创内容。”李彦宏说。

百度飞桨是中国自主研发、功能丰富、开源开放的产业级深度学习平台,相当于“智能时代的操作系统”。基于飞桨,百度进一步打造具备产业级知识增强文心大模型,通过大模型与国产深度学习框架融合发展,百度为中国产业智能化转型打造了AI大底座。

文心大模型不仅在赋能AIGC加速到来,从落地应用来看,文心大模型已通过飞桨开源开放平台、百度智能云等赋能到工业、能源、金融、通信、媒体、教育等各行各业。

飞桨文心大模型在媒体、医疗、金融等行业都产生了巨大价值。例如在媒体行业,文心大模型的理解和生成创作能力激发创意,提升内容多样性,降低了制作成本;在保险领域应用中,文心大模型的智能解析能力,能使文本处理效率提升30倍;在人力资源领域应用中,文心大模型能实现候选人信息智能分类,模型识别准确率达到99%;在医疗领域应用中,文心大模型将每份病历的检查时间,从30分钟缩短到了秒级别。

据了解,目前文心大模型已支持数百家企业与机构,开发者数量超过6万,已在数百个场景中落地应用,产业应用数量居业界前列。

为促进大模型惠及更广泛的行业与人群,百度已于近期全新推出文心大模型创意社区——文心·旸谷社区,用户可以零距离感受文心大模型的魅力和应用创新潜力。

时至今日,中国的产业数字化水平仍有待提升,文心大模型的这种创新机制提供了解决之道。促进数字经济发展得到国家和各地政府部门高度重视,作为智能科技底层技术,大模型在推动数字经济发展中大有作为。

李彦宏表示,百度飞桨作为人工智能时代操作系统的核心价值。深度学习框架,是数字经济发展中的核心技术,是中国必须抢占的关键点和制高点。基于飞桨深度学习平台,百度在预训练大模型领域又取得了重大进展。大模型是当前人工智能发展的重要方向,正在成为人工智能技术和应用的新基座。

作为深耕产业级的大模型,文心定位于产业级知识增强大模型,它来源于产业实践,服务于产业实践,期待文心以技术创新、落地应用上的领先性为契机,持续降低应用门槛,让AI技术普惠到更多人、更多行业。(文/凌纪伟)

【纠错】
【责任编辑:郑伟】
声明:转载此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请在30日内与本网联系,我们将第一时间更正、删除,谢谢。
来源:新华网
媒体矩阵
app
app
app
app
app
app
app
app
战略合作