赵广立

从修复老电影到研发新药,它如何发光发热?
2022-12-01 18:29

 

文|《中国科学报》记者 赵广立

在老电影《横空出世》中,中国第一颗原子弹成功爆炸的一幕被搬上荧幕,成为影史经典。二十多年后的今天,人们不但可以重温这一幕,甚至可以在高清设备上获得更佳观看体验。这背后,少不了“胶片医生”的贡献。

上图右侧为电影频道-百度•文心大模型修复画面。截图自电影《横空出世》

新“胶片医生”

在以前,“胶片医生”是电影修复工作者的别称。在电影频道节目制作中心(简称“电影频道”)拥有的约2万部中外电影资源中,超半数以上是用胶片拍摄的。

为让影视经典色彩更丰富、画面更高清,“胶片医生”们往往要在老电影“分辨率低、噪点高、色彩饱和度低”等问题上“动刀”。

影片主要靠人工手动逐帧修复,费时耗力。随着人工智能(AI)技术的进步,AI一度成为“胶片医生”的得力助手。然而,面对有诸多细分环节的电影修复工作,传统的模型研发所需数据和时间成本都很高,AI修片的效率和效果难孚众望。

转机发生在AI超大规模预训练技术的突破之后。

近日,百度联合电影频道,发布业内首个影视行业“智感超清大模型”——电影频道-百度•文心。智感超清大模型深度结合百度AI技术能力和电影频道长期积累的视频修复数据,通过对超分辨率、去噪、去模糊、去压缩等多任务的联合预训练、亿级参数量的学习,可实现对多种损坏情况的修复,并通过画质提升、边缘锐化等方式增强视频的清晰度,达到全方位提升视频修复效率和观感体验的效果。

另外,智感超清大模型可以用一个模型同时处理影片修复的多个任务,全方位助力电影频道提升视频修复效率。

测试数据显示,使用电影频道-百度•文心大模型每天可修复视频28.5万帧,解决了绝大部分画面的修复问题。即便是需要人工进一步精修,修复速度也能提升3~4倍。并且,在老片“超清化”中,大模型可针对影片进行自适应色彩增强、清晰度增强、时序插帧、SDR转HDR等,全面提升老电影的画质,使其焕发新生机。

11月30日,Wave Summit+ 2022深度学习开发者峰会线上举行,“电影频道-百度•文心”也与一众行业大模型一起亮相。在“电影频道-百度•文心”的加持之下,AI成了新的“胶片医生”。

这一案例也深刻地表明,AI正随着深度学习平台与大模型技术的成熟而逐渐变得更稳健和有效率,而这也为AI普惠的加速到来铺平道路。

AI普惠,脚步加快

在Wave Summit+ 2022深度学习开发者峰会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰道出AI普惠加速背后的关键:“深度学习平台+大模型”能够贯通AI全产业链,夯实了产业智能化的基座。

“深度学习平台+大模型,贯通了从硬件适配、模型训练、推理部署,到场景应用的AI全产业链,夯实产业智能化基座,进一步加速产业智能化升级。”王海峰解释说,作为基础共性平台,开源开放的深度学习开发平台下接芯片、上承应用,堪比智能时代的操作系统;而大模型具有效果好、泛化能力强、研发过程标准化程度高等特点,对深度学习模型的开发、训练和推理部署都提出了更高的要求,牵引着深度学习平台的发展方向。

王海峰表示,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。“大数据、大算力、大模型能力仅需少数企业操心,千行百业直接应用即可。”

这样的产业化路径已经在文心大模型的产业实践中得到验证,联合行业头部企业研制行业大模型就是其中的重要实践之一。

“冰城”哈尔滨,拿出城市跨业务、跨结构、跨部门的数据知识和多种任务算法,基于文心基础大模型ERNIE 3.0打造面向城市领域的行业大模型——冰城-百度•文心。通过构建统一预训练模型,冰城-百度•文心具备超强的语言理解、语义分析等能力,可望支撑城市各领域AI规模化应用的开发效率和效果的提升。

人民网,引入人民网舆情数据中心积淀的行业知识与任务样本数据,联合百度共建媒体行业大模型——人民网-百度•文心,目前已在“新闻摘编报告生成”等应用场景取得明显的效果。未来,该模型还将用于新闻事件抽取分析、新闻评论聚合分析、新闻信息个性化推荐等更多场景。

吉利汽车的汽车专家携手百度AI专家,向文心大模型“投喂”吉利汽车行业数据进行预训练,得到性能更强、稳定性更高的汽车领域大模型吉利-百度•文心,目前已应用于吉利的智能客服系统、车载语音系统和汽车领域知识库构建等业务场景中。

泰康保险集团则向百度分享其在保险行业特有知识,共同基于文心CV大模型VIMER-StrucTexT打造保险行业大模型——泰康-百度•文心。该大模型在泰康典型应用任务中表现亮眼,平均字段识别错误率相对下降,有望为AI技术更大范围内落地保险铺路。

此外,还有共同研发面向燃气行业大模型“深燃-百度•文心”的深燃集团、联合发布面向电子制造行业大模型“TCL-百度•文心”的TCL、共同打造知识增强的社科行业大模型“辞海-百度•文心”的上海辞书出版社……他们通过行业数据学习、知识挖掘、模型训练,让AI的触角深入到安全质检、电子制造、知识产权保护等各个领域。

加之此前已与百度共创行业大模型的国网电力、浦发银行、中国航天,百度已与合作伙伴在十多个行业共创共建行业大模型,推动大模型“下场”,加快了AI普惠的脚步。

大模型生态初现峥嵘

峰会上,王海峰披露,飞桨生态持续繁荣,截至2022 年11月,平台已凝聚535万开发者、服务20万家企事业单位、基于飞桨创建67万个模型。

在深度学习平台和预训练大模型的加持下,越来越多领域的行业关键业务实现了AI“替补”人类“出场”,大模型生态初现峥嵘。

农业应用——农作物生长,防虫害是关键。要防虫害,及时、准确的虫情监测是前提。以往,虫情监测要耗费大量的人力、物力,即便如此也难以做到及时、准确。

宁波“微能物联”通过与百度合作,借助飞桨EasyDL平台产品及背后的文心CV大模型VIMER-CAE,研发了“微能虫情测报系统”。这套系统通过“预训练+微调”范式,实现资源复用和知识积累,提升模型的复用性,目前它已能够根据引诱抓拍的图像分析识别对应虫害,并定制防治方案。

工业应用——韦士肯(厦门)机器人系统有限公司专注于汽车零部件的无损检测。此前该公司针对公司在汽车零部件轴承、电池等上的质检工作,采用的智能化方案准确率仅有 70%多一点,无法满足需求;后来借助飞桨EasyDL(背后预置了百度大规模预训练模型)图像任务中的图像分割应用,韦士肯降低了数据标注量,得到了优于原方案的模型效果。

保险业应用——某大型保险公司日常需要处理大量保险合同,复杂的合同条款和快速迭代的业务内容会给保险合同管理带来巨大的人力成本。基于文心大模型,该保险公司实现了保险合同条款文本的自动解析识别,并智能提取39个维度的关键信息以便于业务系统管理。

在智能技术辅助下,该保险公司单份合同的处理时间降低到分钟级,显著提升了工作效率及准确度,大幅降低了人力成本。

银行业应用——光大银行过去各业务环节比较依赖线下人工流程处理各类文档,经营成本高、运营效率低。为降本增效,光大银行积极向智能化靠拢。然而,业务对AI需求多而复杂,模型生产成本、周期和效果有待改善。

后来,光大银行以文心大模型为底座,统一规划建设企业级AI平台,不断整合和升级AI应用能力、响应各类业务需求,目前已在手写签名OCR识别引擎、终端登记智能识别、私行代销产品审核、合格投资者审核等场景实现应用,成果显著。

科研应用(生物医药领域)——化合物的药物代谢动力学(简称ADMET)预测问题对于制药行业来说是一个极为重要的场景,若能在药物研发早期就排除ADMET性质不佳的分子,针对ADMET性质对候选化合物进行优化,可大幅节省药物研发大量的时间和资金投入。

在大规模的无标注化合物数据库上训练化合物表征大模型HELIX-GEM,使大模型学习到化合物中蕴含的物理化学规律和知识,进而将其应用在众多的ADMET成药性预测任务上,可一举提升ADMET任务的效果。

与传统实验方法对比,该模型高效、准确,计算1000个分子的ADMET相关指标只需不到1分钟的时间,且有更高的准确率。同时,计算的指标也更多,可以一次性预测50+种ADMET相关的指标,综合效果超过其他机器学习方法4%以上。

谈到大模型应用进展,在百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜看来,当下的大模型机制,封装了复杂的模型生产过程和过程中各种各样的消耗;如此,行业应用面对的是一个清晰、简单、低门槛的界面,因此,大模型与深度学习平台结合“给上层的应用带来了更大的想像空间”。

 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。

分享到:

0
一周排行