Kara0807的个人博客分享 http://blog.sciencenet.cn/u/Kara0807

博文

虚实系统互驱的混合增强智能开放创新平台的架构与方案

已有 704 次阅读 2020-4-9 11:26 |个人分类:智能科学与技术学报|系统分类:论文交流

虚实系统互驱的混合增强智能开放创新平台的架构与方案

张俊, 李灵犀, 林懿伦, 张天韵, 张科, 许沛东, 阮克羽, 沈聃



【摘要】首先提出了混合增强智能开放创新平台建设的总体目标以及面临的问题,提出了一种虚实系统互驱的平台架构方案。然后阐述了平台的基本形态,并详述了平台各层的模块机理和作用,以及涉及的关键技术,如人机交互技术、数据处理技术和数字虚拟工业技术。最后设计了开放创新的保障和激励机制,并探讨了区块链技术在混合增强智能开放创新平台数据安全方面的应用。        

【关键词】混合增强智能 ; 开放创新平台 ; 虚实系统 ; 人机交互 ; 数字虚拟工业技术 

引用格式  张俊, 李灵犀, 林懿伦, 张天韵, 张科, 许沛东, 阮克羽, 沈聃.虚实系统互驱的混合增强智能开放创新平台的架构与方案. 智能科学与技术学报[J], 2019, 1(4):  379-391 doi:10.11959/j.issn.2096-6652.201942


The architecture and scheme of the hybrid-augmented intelligence open innovation platform based on the virtual and real systems

ZHANG Jun, LI Lingxi, LIN Yilun, ZHANG Tianyun, ZHANG Ke, XU Peidong, RUAN Keyu, SHEN Dan


Abstract  The overall goal and problems of the construction of the hybrid-augmented intelligent open innovation platform were first put forward,and a virtual and real systems driven platform architecture scheme was proposed.Then the basic form of the platform was described,and the mechanism and function of modules at all levels in the platform were elaborated,the key technologies were also involved,including human-computer interaction technology,data processing technology and digital virtual industry technology.Finally,the guarantee and incentive mechanism of open innovation was designed,and the application of block chain technology in data security of open innovation platform was discussed.       

Keywords: hybrid-augmented intelligence ; open innovation platform ; virtual and real systems ; human-computer interaction ; digital virtual industry technology 

Citation ZHANG Jun.The architecture and scheme of the hybrid-augmented intelligence open innovation platform based on the virtual and real systems. Chinese Journal of Intelligent Science and Technology[J], 2019, 1(4):  379-391 doi:10.11959/j.issn.2096-6652.201942     


1 混合增强智能开放创新平台建设的背景和意义

人工智能(AI)技术的快速发展对经济社会和国际竞争格局产生着深刻影响[4,5]。文献[6]讨论了新一代人工智能开放创新平台发展的一系列问题,基于开放创新平台实现从“想法到算法、算法到技术、技术到产品、产品到服务、服务到安全、安全到可持续性”的快速转化,这是培养和提高智能产业创新人才能力的核心支撑工具和系统。

混合增强智能是指将人的作为或人的认知模型引入人工智能系统,即在系统中引入人的认知能力或类人的认知模型[1,7]。人在回路的混合增强智能可以有效地实现人机交流和通信,增强智能系统的决策能力,提高系统对复杂情况的适应性以及处理复杂任务的能力,从而使得混合增强智能系统能够生成比单一人工智能系统更为精确可信的结果[8]。混合增强智能作为新一代人工智能的重要发展方向,对人工智能与实体经济的深度融合与应用有着十分重要的意义。现阶段,混合增强智能已经在人在回路的视点估计[9]、疾病识别[10]、基于人机混合计算平台的复杂任务处理[11]等领域进行了先导性研究。

作为新兴的研究领域,混合增强智能在基础理论、关键技术和应用模式等方面尚存在很多科学问题需要进行探索,并且依赖社会各界研究团队的广泛和深入参与。混合增强智能的研究对软硬件设施、数据资源、技术力量等层面具有较高的要求,因此,有必要遵循《国家新一代人工智能开放创新平台建设工作指引》,整合、共享相关资源,建设混合增强智能开放创新平台,增强该领域的研究力量,提高混合增强智能的理论技术水平,促进混合增强智能在电力调控、自动驾驶、医疗诊断等复杂关键问题中的应用求解,驱动相关领域的变革与发展。

本文旨在提出一种虚实系统互驱的混合增强智能开放创新平台建设方案,并对其基本模块、关键技术及运行机制进行阐述。

2 混合增强智能开放创新平台的形态架构及核心内容

2.1 混合增强智能开放创新平台建设的整体目标及面临的问题

结合上述分析,可总结出混合增强智能开放创新平台建设的整体目标:面向我国新一代人工智能发展规划的重大战略,以混合增强智能为重点关注对象,构建混合增强智能的基础研发环境、产业运作链条、开源共享模式,营造开放友好的研究氛围,激发创业热情,最终提高我国在混合增强智能领域的理论研究及产业应用水平,促进人工智能技术与电力、交通、医疗等核心领域的深度融合,创造新的经济增长点。

然而,由于混合增强智能中人机智能深度耦合的特点,以及需求导向市场环境对相关技术的约束和限制,混合增强智能开放创新平台的建设需要应对以下几个主要问题。

问题 1 如何支撑混合增强智能中人类与 AI的交互协作

混合增强智能涵盖人类与AI两种形态的智能,两者在共同的整体目标下进行深度合作。这种合作的基础在于人机之间意图传达的准确性和自然性,需要由充分的外部条件进行基本的保证,以支持对混合增强智能关键问题的深入研究。然而,由于资产实力的限制,广大中小企业往往在相关技术和配套设施方面有所欠缺。因此,如何通过软硬件和机制设计等方式,提供充分的人机沟通渠道,降低中小企业在混合增强智能领域研究的准入门槛,是混合增强智能开放创新平台建设中需要首先考虑的问题。

问题 2 如何在保证实际应用稳定性的基础上实现从数据到解决方案链条的完整与良性发展

在混合增强智能开放创新平台的资源支持下,企业基于具体需求场景提出了对应的解决方案,以应用于实际业务。然而,现实中存在的一些关键业务(如电力系统调度控制、汽车自动驾驶)对解决方案的可行性有严格的要求。若解决方案与实际场景存在较大偏差,将造成严重的人员和财产损失。此外,受安全和成本限制,企业也难以在实际业务环境中部署、测试与改进解决方案。因此,如何通过混合增强智能开放创新平台的各环节协调建设,支持从数据采集到方案反馈的整体流程,保证解决方案与实际应用环境的适配性,对于平台建设来说也是至关重要的问题。

问题3 如何激励开放以开放驱动创新

混合增强智能领域的开放创新主要取决于良好的开源环境,研究人员贡献自己的成果,促进相关技术的传播与更新。然而,在市场环境下,出于竞争力和经济效益的考量,相关核心技术均被企业视为商业机密,企业和相关研发人员并不具有开源的主动性。因此,如何通过合理的保障和激励策略,推动企业乃至产学研各环节之间健康的技术传播交流,并强化企业创新的动力,是开放创新平台在提高我国混合增强智能领域研究水平的过程中面临的关键问题。

2.2 混合增强智能开放创新平台的基本形态架构

针对混合增强智能开放创新平台建设的整体目标及核心问题,本文提出虚实互驱的混合增强智能开放创新平台建设方案,其基本架构如图1所示。

在需求推动下,实际领域系统(如电力系统)向混合增强智能开放创新平台提供相关数据,期望得到解决方案。混合增强智能开放创新平台由依托单位构建,涵盖基础保障层、数据处理层、算法支持层、模型方案层、应用验证层及虚拟领域系统。依托单位提供混合增强智能研究所需的基础软硬件设施、数据算法资源,并构建初始虚拟领域系统。研究单位、企业基于相关资源,针对应用场景,依托虚拟系统,进行对应的研发、测试。成功案例一方面与需求匹配,应用于实际领域,实现从数据到方案的产业链条闭环;另一方面在保障激励措施下,反哺资源池,增广数据,丰富算法,优化模型,参与平台后续建设,启发新的技术理念,促进平台良性发展。在整个过程中,实际领域系统对平台进行数据驱动,辅助建立目标领域的虚拟系统,虚拟领域系统则为企业的解决方案提供拟真测试环境,提高方案在实际系统中的适用性,实现虚实系统的相互驱动。

2.3 混合增强智能开放创新平台基础模块

通过第2.2节的描述可以发现,该平台的正常运行主要依托各层以及其中的基础模块。各个模块依据其所处的层和执行的任务,功能会有所不同。本节主要对混合增强智能开放创新平台中的这些层以及基础模块进行介绍。

2.3.1 基础保障层

基础保障层是整个系统的基础,主要是为上层提供数据基础和软硬件支撑,该层主要包含3个模块:多源数据采集模块、人机交互接口模块和高性能计算模块。基础保障层的数据主要来源于该平台所服务的各个领域和行业,如电力、金融、交通和医疗领域等。

• 多源数据采集模块主要负责实际领域中可获取数据的采集与输入。在数据采集和输入过程中,需要引入人机交互接口和界面;此外,还需要对所输入的数据进行标准化操作,以保证输入数据的一致性。数据输入后,按照类别的不同,对数据进行分布式存储,节省存储空间的同时,也方便后续调用。

• 人机交互接口模块主要负责平台中的各类人机交互任务。在混合增强智能开放创新平台中,数据的输入过程需要引入人机接口技术,以实现对人工携带的数据的输入,并利用人机界面实现数据的初步可视化,使研究人员明确采集到的数据的类型和特征,以便对后续研究以及系统或者模型的结构进行基本的预测。数据脱敏方法的选择、算法框架的选择以及解决方案的优选等过程,均需要研究人员的参与,结合人机交互接口,即可基于平台推荐与主观意见,获得阶段性的最优结果。在测试结果和评价反馈结果的输出过程中,通过接口向研究人员展示结果,为模型方案的可行性分析提供直观参考。在借助该混合增强智能开放创新平台对初学者和研究人员进行培训的过程中,也需要配备和使用相应的人机接口及界面,展示典型算法和模型的计算和运行过程,使他们能更为直观地理解和掌握各个算法模型的机理及效用。人机交互接口模块主要采用以人为中心的交互模式,通过研究人员的操作,对所要执行的任务进行初步的定义、判断和选择,以便后续算法的选择和模型的构建。该模式可充分利用研究人员的专业知识和分析决策能力,并提供充足的人机沟通渠道,提高研究人员的参与度,保障人机协作的效果。通过对人机交互接口模块调用权利的开放,可确保大中小各式企业均能基于混合增强智能开放创新平台完成相应场景下的研究。人机交互接口模块在混合增强智能开放创新平台中的基本功能如图2所示。


图1

图1   虚实互驱的混合增强智能开放平台基本架构


图2

图2   人机交互接口模块在混合增强智能开放创新平台中的基本功能


• 高性能计算模块主要用于支持平台中所要运行的各式算法;高性能计算是一种计算环境,可为各式算法提供计算空间与计算核心,属于硬件设施,一般可以利用标准计算机的大型集群或者专用硬件进行构建[12]。高性能计算可以保障混合增强智能开放创新平台运行/运算的能力和性能,提升计算速度。

2.3.2 数据处理层

数据处理层主要负责对来自基础层的数据进行初步处理,提取数据特征,隐藏敏感数据。这一层主要包含3个模块:数据标注模块、数据脱敏模块和标准算例模块。

• 数据标注是一种数据加工行为,所要标注的一般是数据的特征[13]。数据标注模块主要用于数据特征的提取,或其内在含义的简要解释。该模块有助于数据分类,并且可以使得后续的计算和分析更为简便。此外,通过数据标注,智能算法能够更高效地识别数据,有助于计算速度和精度的提升。

• 数据脱敏是指通过一定的策略、规则或者编码措施,对敏感数据进行变换、变形或加密操作,从而实现敏感数据在非可信环境下的使用[14]。在面向电力、金融和医疗等敏感企业的技术研发中,因为原始数据往往在一定程度上涉及国家机密和个人隐私,故需要相应的变换来隐藏数据中的敏感信息。在数据脱敏模块中,除了借助平台自带的智能脱敏机制和数据筛选机制外,还可通过人机界面,基于人对敏感数据的定义和辨识,借由人工和智能系统的协作实现对需要加密、脱敏的数据的定义,并对加密或脱敏方法进行选择,完成对敏感数据的脱敏操作。

• 标准算例模块实际上是一个算例库,其中包含可以作为基准的各种算例的集合,该模块主要用于算例的存储和调用。该模块中的算例可以在对数据进行标注和脱敏后,验证其可用性,并对其标准化程度进行判断。标准算例也可以用于对平台中所收录的算法进行基本的验证和评估,为在后续研究中选择合适的算法提供帮助。此外,该模块中的算例可以作为参照,为初学者和处在培训阶段的研究人员提供相应的算法流程、算法作用及效用的直观体验,缩短学习和培训周期。算例库可以为系统或模型的优化提供帮助,为系统模型的测试提供支撑[15];也可以在未提供基础数据或基础数据欠缺时,作为补充数据,用于模型的测试和验证。

2.3.3 算法支持层

算法支持层主要负责算法的搜集和深度学习框架的选取,以此为后续的系统建模和模型测试提供支撑,该层主要包含3个模块:通用算法库模块、深度学习训练框架模块和强化学习训练框架模块。

• 通用算法库模块中收录了各式算法,该模块可以依据所要执行的任务和研究人员的选择对所需算法进行调用。在混合增强智能开放创新平台中,算法库中的通用算法是不断更新的,平台会定期根据算法的使用频率和范围,将优秀的新算法采集并收录到通用算法库中,以保证算法库中算法的前沿性和普适性。

• 深度学习训练框架的主要任务是提供一个基本的架构,之后的层会基于这个框架实现对系统模型的建立、训练和计算。该模块中的各式框架均属于常用的主流训练框架,具有极好的兼容性和适配性。对这些框架进行适当的代码和算法填充、修改以及调试,即可完成一个深度学习代码的编写与神经网络的构建,实现系统模型的搭建,从而解决某一特定的机器学习问题。

• 强化学习训练框架同样为技术方案的建模、训练和计算提供基本架构。仅依靠深度学习无法满足系统或任务的需求(如对电力系统调度控制策略的制定),而利用强化学习框架,通过对其进行代码的填充、修改和调试,可以实现神经网络的构建和系统模型的搭建,解决相应的机器学习问题。

从通用算法库中选取并调用的算法,将会被载入深度学习训练框架或强化学习训练框架之中,从而完成相应神经网络的构建。在系统建模过程中,具体训练框架的选取主要由从数据处理层传来的数据形式以及需求场景决定。这3个模块共同为系统建模和模型测试提供算法依据。算法支持层中各模块之间的相互关系如图3所示。


图3

图3   算法支持层中各模块间的相互关系


在算法支持层面,还可以借助模块化技术和人机交互界面,实现研究人员对所使用的算法和框架的选择;同时,平台也会推荐适用于任务的算法和框架。根据人工选择和平台推荐,选择出最合适的算法以及框架,以实现技术方案的制定,提升任务的完成效率,保证结果的可靠性。

2.3.4 模型方案层

模型方案层基于输入的数据和相应的通用算法,辅助制定任务或者问题的解决方案,并完成模型的构建。该层主要包含3个模块:配套解决方案模块、方案制定模块和模型组件模块。

• 配套解决方案模块主要用于生成各需求场景对应的解决方案,制定建模方案和系统架构,为后续模型的搭建提供相应的基础和框架。解决方案一般是基于前面几个层中所获得的数据和通用算法,通过直接调用、适当微调或者整体调整而生成的。该模块需要对所提出的数个方案进行优选,以获得最好的实验效果或仿真结果。

• 方案制定模块主要用于配套方案的制定。在配套解决方案模块生成相应的解决方案后,借助方案制定模块,将所提出的方案进行进一步的细化,制定具体方案和解决步骤。该方案将作为后续系统建模和运行测试的参考以及依据。

• 模型组件模块主要用于系统建模,这一过程可以简要概括为:基于前述模块提出的最优方案,制定所需的模型组件或引擎,随后选择、抽取、调用模块中相应的组件,构建系统模型,以便于企业直接调用。

模型方案层的系统建模过程可以简要概括为 3步:首先,结合配套解决方案模块和方案制定模块获得所需的任务解决方案,并选取其中的最优方案作为建模时使用的方案;随后,依据所选择的方案,在模型组件模块中选取所需的模型组件或引擎,若所需组件并未包含在该模块中,则依据需求制定相应的组件;最后,借助相应的模型组件和所选取的最优方案,完成对系统模型的构建,生成相应的系统模型,用于后续层的系统仿真和测试。模型方案层的系统建模过程如图4所示。

2.3.5 应用验证层

应用验证层主要负责对所构建的模型和所提出的方案进行仿真实验验证,该层包含3个模块:实验测试环境模块、需求场景生成模块和评价反馈机制模块。

• 实验测试环境模块主要用于基本实验环境的构建。该模块一般会按照前述几个层所获得的数据、算法、模型和解决方案,结合应用目标,依托虚拟领域系统,搭建合适的仿真或实验环境,为仿真实验或测试奠定基本环境。

• 需求场景生成模块主要用于系统测试场景的生成。该模块会根据实际场景需求,生成测试所需的场景集,以贴合实际领域系统运行中可能出现的场景,方便测试时取用。借助该模块,可以在解决方案部署后,实现对实际领域系统在不同场景下运行情况和运行状态的观察和比较,以此对本文所提方案的性能和效用进行全面的检验。


图4

图4   模型方案层的系统建模过程


• 评价反馈机制模块主要是对在实验环境和对应场景中得出的测试结果和结论进行量化评价,以验证所选择的方案和模型效果,并决定对模型方案的处理方式。若判定已达测试标准,则输出测试结果和相应的方案与模型,认可其在实际系统和领域中的应用可行性;若判定达不到测试标准,则根据评价结果,为模型方案的迭代修改提供参考和调整意见。

对测试结果的评价不仅可以由系统平台自行完成,还可以通过与评价反馈机制模块相连的人机接口将测试/实验结果反馈给研究人员,由他们来判断测试的有效性以及所建立模型的实用性,并在下一次的迭代过程中,将相应的修改意见输入基础层。将系统评价和人工评价的结果相结合,可实现对本文所提算法和模型的优化。

应用验证层中各模块的基本运行和协作模式可以简要概括为以下两步:首先,通过实验测试环境模块和需求场景生成模块实现系统测试所需环境和场景的构建;随后,在这些环境中,基于不同的测试场景对系统进行仿真测试,将所得的结果和结论传输到评价反馈机制模块,用于判断方案和模型的可行性,为后续的反馈升级提供依据与支撑。这3个模块之间的协作关系如图5所示。

2.3.6 虚拟领域系统

虚拟领域系统是对实际系统在核心业务层面的高度拟真系统。在产学研的过程中,可以借助该系统对实际的运行情况进行模拟,以使解决方案在混合增强智能开放创新平台中获得更贴近实际情况的结果,增强产品的实用性。上述的5个层次与虚拟领域系统及实际系统构成一个循环迭代的过程,这就是混合增强智能开放创新平台的基本运行模式。

虚拟领域系统的数据基础主要来源于基础保障层,并和数据处理层交互地对输入数据进行处理。随后,该系统会从算法支持层和模型方案层中获取所要使用的算法和模型。虚拟领域系统可将基本的实验环境反馈给应用验证层,支撑对算法技术进行仿真测试或模拟运行。

同时,虚拟领域系统也是一个开放系统,该系统会根据成功案例进行更新。虚拟领域系统作为企业和研究单位的方法测试平台,将测试结果反馈给需求单位作为参考,以便需求单位进行相应的试点和改进。此外,虚拟领域系统还可作为培训与半实际领域系统平台,若需求单位赋予该虚拟领域系统培训功能,则可提高研究人员对需求的理解能力,有资质的研究人员甚至可以直接与虚拟领域系统的 AI 进行需求任务下的演练,并将演练结果作为更新混合增强智能相关算法的依据。演练数据也将被反馈到数据资源池中,丰富了可用数据。


图5

图5   应用验证层中各模块之间的关系


2.4 混合增强智能开放创新平台关键技术

混合增强智能开放创新平台各层模块的构建与平台整体的正常运行需要多种关键技术的支撑,本节将对混合增强智能开放创新平台涉及的关键技术进行介绍。

2.4.1 人机交互技术

在混合增强智能开放创新平台中,使用最为广泛的就是人机交互技术。人机交互技术是一种将人和机器联系起来的技术,它能够精确地采集人的输入,直观而形象地向人展示其运算结果,以此达成人和机器的广泛互联和实时交互,实现人和机器智能的深度合作和高度结合。借助人机交互接口,可以实现对系统和平台的有效控制和精确操作,并将研究人员所表达的意思、所做出的选择和所提出的意见精准地传输到相应的模块和运行过程之中,使人机之间可以准确、自然地传达意图。

该平台可供选择的人机交互技术主要包括:自适应人机接口[19,20]、基于传统硬件设备的交互技术、以人为中心的多模态交互技术[21]等。其中,自适应人机接口主要负责完成的任务有3个:一是帮助用户使用系统功能,二是参与用户问题的求解过程,三是为用户提供训练[16]。混合增强智能开放创新平台主要使用的人机交互技术有两种:多模态人机交互技术和基于触屏的交互技术。多模态人机交互技术是一种适用于命令不明确且具有多个用户情况下的人机交互技术[21],基于触屏的交互技术则借助触摸屏来实现人对机器的直接控制和操作[18]

2.4.2 数据处理技术

数据处理技术能够对所输入的数据进行适当的变换,以实现对数据计算的简化和数据隐私的保护。混合增强智能开放创新平台上所使用的数据处理技术主要包括数据标准化技术、数据脱敏技术和数据标注技术。数据标准化技术实现了对数据格式和相关协议的统一,确保了系统中或平台中数据的一致性,满足了人机交互输入输出的一致性原则,简化了系统的计算过程,加快了各模块间的数据传输速度,缩短了计算用时。数据脱敏技术通过对数据进行适当的变换和处理,隐藏了其中的敏感信息,消除了敏感数据,从而保证了关键信息和数据的隐秘性,保障了数据的隐私和相关企业的信息安全。数据标注技术通过对数据的特征进行标注,并对其内涵做出适当的解释,实现了对数据类别的区分与存储,从而达到了节省存储空间、简化数据调用和数据分析过程的目的。

对于输入平台的普通数据来说,数据标准化技术主要分为3类:多源数据融合、裁剪设计和传统数据标准化方法。多源数据融合和传统数据标准化方法实现了对数据的标准化或融合处理,可以使用的相关技术包括 DataPipeline 所提供的数据融合方案、最大最小值法、平均数方差法、总和标准化、标准差标准化和极大值标准化等[22]。而裁剪设计一般应用于数据输入和人机交互的接口处,通过直接对输入数据的“裁剪”达到数据标准化的目的。此外,对于输入平台的敏感数据,需要使用特殊的标准化方法以消除其敏感性,隐藏关键信息,这种常用的数据标准化方法就是数据脱敏技术。数据脱敏技术主要包括静态脱敏技术和动态脱敏技术,对数据进行脱敏处理时,具体的脱敏方式将由对应的任务类型来决定。通常情况下,可用的数据脱敏技术主要有流式脱敏技术、批量数据脱敏技术等,可选择的脱敏方式则包括部分遮蔽、可逆脱敏、混合脱敏、同义替换以及确定性脱敏等[23]。除此之外,为了降低数据泄露风险,数据脱敏技术中还包含一些加密技术。

上面列举的几个具有标志性的传统数据标准化方法的基本表达式如式(1)~式(5)所示。式(1)为最大最小值法,式(2)为平均数方差法,式(3)为总和标准化法,式(4)为标准差标准化法,式(5)为极大值标准化法[23]。借助这些数据标准化方法,将原始数据转化为形式上更为统一而直观的标准化数据,即可实现对数据的预处理,进而简化后续的计算过程,方便平台的建模和测试,从而使得对所建立的模型的评价更为方便与直观。

2.4.3 数字虚拟工业技术

数字虚拟工业技术基于实际领域系统各设备的运行数据,通过学习和优化,建立与实际领域系统相对应的虚拟领域系统。依据学习过程中所累积的知识,逐步完善的虚拟领域系统能够结合实际的运行数据,对实际领域系统的运行状态进行评估[24]。数字虚拟工业技术主要用于对虚拟领域环境的构建,在此基础上对解决方案和系统模型的有效性和优越性进行测试,并对系统仿真和模型测试的结果进行评价,确定该模型是否可以运用到实际领域系统或实际环境中,为下一次迭代提供基准。

借助数字虚拟工业技术,能够实现对所提出的技术方案在实际运行情况下的模拟测试,评价方案的有效性和可行性,辅助研究人员采取相应整改措施,实现对解决方案的量化评估以及对研发人员的直观引导。

3 混合增强智能开放创新平台运行机制

3.1 混合增强智能开放创新平台开放创新机制

混合增强智能开放创新平台的“开放创新”在于技术成果的开源,开源理念和开源精神的核心是“以开放促创新”,但这一过程的实现却依赖开源治理机制的变革和完善。需要强化开源开放和政策引导,形成混合增强智能开源文化健康的良好生态。具体来说,开源治理描述的是围绕开源软件的开发而形成的以程序员社区为主体的治理机制,其要回答的核心问题是在一个松散的网络社区结构下如何激发参与者的积极性和创新性,进而就程序代码的开发实现共识,推动程序代码的不断完善、演进[25]

混合增强智能行业的发展在很大程度上源于算法、芯片、大数据等领域的科技创新,科技创新才是此轮智能产业发展的原动力。开源开放的理念是着力于提升技术创新研发实力和基础软硬件开放共享服务能力,鼓励各类通用软件和技术的开源开放,促进混合增强智能技术成果的扩散与转化应用[26],开源软件与非开源软件的对比见表1


表1   开源软件与非开源软件的对比

对比项

特点

开源软件

非开源软件

软件获得和发布

软件的获得成本是否包含源代码

无需费用包含

需要购买不包含

是否可以自行修改和再发布

可以

不可以

软件开发者

开发者是否有报酬

开发者组织

互联网络

企业组织

软件服务

软件技术支持服务

软件版本路线图

体验

用户体验

开发者体验

   

目前,国内外有许多基于人工智能的开源软件平台,例如,Google 发布的深度学习框架 TensorFlow、Facebook的开源深度学习框架Caffe、微软的开源深度学习与人工智能领域研究成果Computational Network Toolkit、IBM的开源机器学习平台 SystemML 等。其中,Google 开源的Kubernetes 具有可移植、可拓展和自动化等特性,可以更加轻松地自动伸缩应用,减少宕机时间,提高安全性,Kubernetes 的结构如图6 所示。使用Kubernetes 可以实现自动化容器的部署和复制,随时扩展或收缩容器规模,将容器组织成组,并且提供容器间的负载均衡,易于升级应用程序容器的新版本,提供容器弹性。

国外的人工智能平台普遍将智能决策算法和数据结合,且具有拖放建模和可视化界面等功能,可轻松地将必要的数据连接到最终解决方案上,国外的人工智能开源平台有开源开放性好、分布广、数量多、影响力大以及可持续性强等特征。目前,国外开源平台蓬勃发展,占据了绝大部分的开源市场,并在不断挤压国内人工智能平台的生存空间。


图6

图6   Kubernetes的结构


因此,在人工智能开放创新平台的发展战略上,要增强使命感和紧迫感。我国企业主导或参与的开源模式创新平台的影响力正在不断提升,如阿里巴巴集团基于开源软件构建了全球第一大电商平台,华为设立了专门的开源软件中心,2018年全球著名开源社区 Apache 基金会宣布“百度开源的ECharts项目全票通过进入 Apache 孵化器”。但人们对建设开源软件平台的认识仍然有不足之处:国内开源文化不够活跃,未形成主流的开源文化,对投资者和从业者进入、产业规模形成的促进作用有限[6]

3.1.1 开源机制的设计

混合增强智能开放创新平台的运行机制应该以混合增强智能的重大应用需求方向为牵引,依托平台推动混合增强智能的核心技术的发展,使得混合增强智能开放创新平台能够作为软硬件支撑体系,实现具体产品的应用开发。同时混合增强智能开放创新平台能够面向社会公众开放混合增强智能技术的研发资源,并且积极向社会输出混合增强智能技术的服务能力,并在此基础上推动混合增强智能技术的行业应用。更进一步地,混合增强智能开放创新平台能够鼓励地方政府、产业界、科研院所、高校等共同参与平台建设的研究,通过多方面资源的整合,构建更加开放的生态体系[27]

混合增强智能开放创新平台通过模式创新,具有优良的软件质量、更加可靠的源代码、高度的可定制性以及风险低等优势。开发者通过混合增强智能开放创新平台向社会开放软件源代码的复制、传播、发行、修改等权利,促进和保障更为便利的信息共享[28]

3.1.2 激励方法

万物互联的未来,开源之势不可阻挡。在数字经济的历史征程中,开源模式将助力我国企业参与全球市场的竞争与博弈,激励企业努力开发和掌握具有自主知识产权的核心技术。

在混合增强智能开放创新平台上,许多贡献者参与的主要动机不在于直接的经济利益,而是精神追求或间接的经济利益。通过设计成果检索程序,实现高效的查询服务,可以为研究人员查询、下载应用开源软件提供便利,促进技术成果的有效传播。

贡献者之所以参与混合增强智能开放创新平台的开发项目,更多的是自身需求的激励,技术成果的开放性会使参与者拥有创新乐趣。依托平台的开源创新,可以使参与者在与大量同行的交流中提高自身能力。高能力的贡献者在参与混合增强智能开源创新活动时,会在混合增强智能开放创新平台上进行有效的互动,在互动过程中可以为贡献者自身逐步积累在该领域的声誉,并且向众多潜在的企业展现自身在该领域的能力。除了贡献者自身能力和声誉的提升以外,混合增强智能开放创新平台通过向贡献者给予激励,以表示认可与感谢,包括给开源贡献者颁发证书、邀请贡献者成为线下沙龙的嘉宾、为贡献者赠送纪念品以及开通招聘直通车等。

混合增强智能开放创新平台对于企业来说也存在着不少的激励因素,依托混合增强智能创新性开源平台可以更加方便地实现自身的需求,通过广大贡献者的努力来完善企业的产品质量,同时还可以降低企业中产品的开发成本[29]

3.2 平台的保障机制

在混合增强智能开放创新平台中,除了较少的经济收益之外,更大的意义是:依靠对平台的热情和执着,贡献者能够通过参与平台项目开发来不断提升自我能力和建立个人声望。但是混合增强智能开放创新平台中的这种大规模分布式的创新也存在诸多问题,比如:需要管理机制的完善与跟进,以及需要稳定的著作权保护模式以促进开源软件服务应用的延展,避免陷入法律纠纷的泥潭[30]。混合增强智能开放创新平台应以传播的有效性和合法性为基础,因而需要依靠完善的知识产权法律制度加以保护。

3.2.1 法律保障机制

混合增强智能开放创新平台与以往的开放式创新平台的一个重要的区别是授权协议的引入,即借鉴著作权法律的思路和框架,创新成果的传播与扩散必须符合授权协议的规定。版权以及授权协议的存在是区分开源创新与其他开放式创新的一个重要特征[31]

法律通过确认混合增强智能开放创新平台中贡献者的著作权,承认和保护平台的创造性劳动价值,贡献者以开源软件许可证授权许可方式,将软件著作权中的一些权利许可(例如复制、修改、分发等)让渡给使用者,在此基础上,使用者可以将修改后的程序源代码不同程度地继续在混合增强智能开放创新平台上公开。

现有的法律对混合增强智能开放创新平台的不断发展和成熟起到了保障作用,做到有法必依,执法必严,对于在混合增强智能开放创新平台上出现的侵犯知识产权的行为,必须予以坚决制止和严厉制裁。

3.2.2 区块链技术的应用

新一代信息技术的发展能够为混合增强智能开放创新平台的研究提供进一步的推动力。为构建良好的开源生态,产业界要逐步完善相关机制,可采用区块链技术提升混合增强智能开放创新平台上数据的安全性。

区块链技术是一种分布式账本构造技术,它能在去中心化的系统中构建不可篡改、不可伪造的分布式账本,并保证系统中各个节点所拥有账本的动态一致性。从本质上说,区块链是一个去中心化的分布式数据库,其采用密码学的方法能保证已有数据不被篡改,采用公式算法对新增数据达成共识[32]区块链技术的问世被认为是防止数据被篡改、保证数据真实可信的特别有效的技术手段之一。区块链具有可追溯性和不可篡改性,有利于数据确权并有效促进数据的流通。区块链技术通过智能合约技术可以自动管理和执行组织之间约定好的数据共享开放使用规则,进而减少人为的干预,营造可信任的数据共享开放环境等,为数字治理提供强有力的技术支撑[33]区块链技术使得版权作品登记可以全网自证,而去中心化降低了成本,提高了登记数据库的安全性。由于区块链技术具有不可篡改的特点,无论是什么形式的版权作品,都不再需要各式各样的认证资料来证明其原创性,用区块链技术即可证明作品本身。

利用不可篡改的特性,可以通过区块链技术对开发者使用的开源软件进行管理和跟踪,以降低软件的复杂度[33]。同时,由于区块链技术本身的构成特点,任何原创作品的登记信息都是独一无二的,无论是作品的内容信息还是创作时间都会有唯一的印记。以电网大数据数字资产管理为例(如图7所示),数据发送方用接收方的公钥对数据进行加密,只有通过接收方独有的私钥才能解密,而在网络中进行传输的只有密文,并不会有原始数据在网络中进行传输,这样就保证了数据在传输过程中的安全性[34]

区块链技术不区分企业和个人,每个人都能运用区块链进行全网登记,这符合新媒体时代个人原创者大量产生的趋势。美国纽约的一家创业公司(Mine Labs)开发了一个基于区块链的元数据协议,实现了数字作品版权保护(目前主要是面向数字图片的版权保护)。中国西安的一家创业公司(纸贵科技),也开发了一个基于区块链的版权认证、确权系统“版权钢印”,实现了对版权作品的保护与实时监控。


图7

图7   电网大数据数字资产管理构架

4 结束语  

为支持我国人在回路混合增强智能领域的技术研究,本文对其开放创新平台的建设模式进行了探索。总结了平台建设的整体目标和面临的问题,提出了一种虚实系统互驱的混合增强智能开放创新平台架构,阐述了平台的基本逻辑形态,并详述了平台层次模块和关键支撑技术,最终对开放创新的保障和激励机制进行了设计。希望本文提出的架构能够为实际的混合增强智能开放创新平台建设提供切实有效的理念指导与技术参照。

致谢:

本文是文献[6]关于人工智能开源平台设想的进一步细化,是系统化建设虚实互动平行智能生态的开源体系和平台长期工作的初步设计,由衷感谢王飞跃教授对本文的贡献与指导。




https://wap.sciencenet.cn/blog-951291-1227530.html

上一篇:面向活动的网络媒体监测与建模分析:IVFC案例解析
下一篇:基于区块链技术的透明农场

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-1-22 08:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部