
下一代人机智能的关键可能在于非生成式模型的应用与发展。与生成式模型不同,非生成式模型不直接生成数据,而是通过学习数据的特征和规律来进行推理和决策。它能够更高效地处理复杂问题,适应现实世界的复杂性和不确定性,同时具备更好的推理、规划和持久记忆能力。非生成式模型有望在建立世界模型、分层行动规划、非语言推理以及适应不确定性等方面取得突破,从而推动人机智能向更安全、更可靠、更接近人类智能的方向发展。
1、非生成式模型的特点与优势
非生成式模型不直接生成数据,而是通过学习数据的特征和规律来进行推理和决策。如联合嵌入预测架构(JEPA)不直接生成像素级的预测,而是在一个更抽象的“表征空间”里进行推理。
非生成式模型能够更高效地处理复杂问题,因为它不需要生成大量的数据来模拟现实世界,人类大脑在预测物体运动时,并不是通过生成每一帧画面来实现的,而是通过抽象的表征和推理。非生成式模型具有更好的适应性,能够更好地适应现实世界的复杂性和不确定性,现实世界常常是混乱的、连续的,不像语言那样结构化,非生成式模型可以通过学习数据的特征和规律,更好地理解和应对这种复杂性。
下一代人机智能需要具备对物理世界的深刻理解,而不仅仅是处理符号或文本。非生成式模型可以通过学习物理规律,如重力、物体互动等,来建立世界模型。非生成式模型能够像人类一样进行推理和规划,思考“如果这样做,会发生什么”,并制定策略。例如,人类在规划旅行时,会从高层次目标分解到具体动作,如“打车 → 机场 → 飞机”,而非生成式模型也可以通过类似的方式进行分层行动规划。同时,非生成式模型还需要具备持久记忆能力,能够长期积累和调用经验,这与人类的记忆方式类似,人类可以通过长期积累的经验来指导当前的行为和决策。非生成式模型必须严格遵循设定的目标,不能偏离或“自作主张”,以确保人机智能系统的安全性和可靠性。
2、非生成式模型的发展方向
(1)建立世界模型,让AI能够模拟物理规律,如重力、物体互动等,从而更好地理解现实世界。
(2)分层行动规划,像人类一样,从高层次目标分解到具体动作,提高AI的行动规划能力。
(3)非语言推理,真正的智能不依赖语言,而是基于抽象表征。非生成式模型可以通过学习抽象表征来进行推理,从而提高AI的智能水平。
(4)适应不确定性,现实世界是复杂和不确定的,非生成式模型需要具备适应这种不确定性的能力。通过学习数据的特征和规律,非生成式模型可以更好地应对现实世界的复杂性和不确定性。
综上所述,非生成式模型在理解物理世界、推理和规划能力、持久记忆和安全可控性等方面具有显著优势,这些优势使其成为下一代人机智能的关键。未来,非生成式模型有望在人机智能领域取得重大突破,推动人机智能的发展。
人机系统中的新信息、控制与协同
在人机系统中,态信息反映系统的即时状态,如设备参数或用户操作行为,为控制提供实时依据;势信息则揭示系统的发展趋势和潜在变化,帮助预测并提前调整策略。感信息是人通过感官获取的原始环境数据,为感知提供基础;知信息是对感信息的提炼与理解,体现为认知和决策依据。在控制层面,人和机器依据态、势信息调整行为,同时根据感、知信息优化交互与决策。在协同方面,态与势信息的结合使人机系统能动态适应环境变化,感与知信息的协同则增强人机之间的理解和配合,三者共同作用,实现高效、智能的人机交互与系统运行。
在态势感知中,势信息是对态信息的压缩与优化,它从大量复杂的态信息中提取关键特征和趋势,忽略无关细节,从而以更简洁、更宏观的形式呈现系统的整体状态和发展方向。例如,在军事领域,势信息可以是对战场态势的概括,包括敌我双方的力量对比、战略意图和战场环境的整体趋势,而不是具体到每一个士兵的位置和行动。这种压缩与优化使得决策者能够快速把握全局,做出更有效的战略决策。
同样地,知信息是对感信息的压缩与优化。感信息是通过感官直接获取的海量、即时且具体的原始数据,而知信息则是大脑对这些感信息进行处理后的产物。它提取了感信息中的关键特征和模式,形成了结构化的知识和概念。例如,我们看到的色彩、形状和听到的声音等感信息,经过大脑处理后,被压缩为“苹果”“汽车”“音乐”等知信息。这种压缩与优化不仅提高了信息处理的效率,还减少了无关信息的干扰,使我们能够更高效地认知世界、预测未来并做出决策。
一、势信息是对态信息的压缩与优化
1、态信息
“态信息”通常是指系统在某一时刻的具体状态信息,它包含了系统中各个组成部分的所有细节。例如,在物理学中,一个粒子的态信息可能包括它的位置、速度、动量、能量等所有物理量;在计算机科学中,一个程序的态信息可能包括程序运行时的内存状态、变量值、寄存器状态等。
2、势信息
“势信息”可以理解为一种更抽象、更宏观的信息,它反映了系统整体的性质或趋势,而不是具体的细节。例如,在物理学中,势能反映了物体在力场中的能量状态,它与物体的具体位置有关,但并不需要知道物体的每一个细节(如速度、加速度等)。在经济学中,市场的“势”可能指的是整体的供需关系、价格走势等,而不是每一个交易的具体细节。
3、势信息对态信息的压缩与优化
势信息是对态信息的一种“压缩”,通过提取态信息中的关键特征或模式,舍弃一些不重要的细节,从而以更简洁的形式描述系统。如一个复杂的物理系统可能有无数个微观状态(态信息),但通过计算其势能(势信息),我们可以在宏观上把握系统的能量分布,而不需要关注每一个微观粒子的具体状态。
从某种意义上说,势信息的提取也是一种“优化”。它帮助我们从海量的态信息中找到最有价值的部分,便于我们进行分析和预测。在机器学习中,通过特征提取(可以看作是提取势信息的过程),我们可以从大量的原始数据(态信息)中找到最有代表性的特征,从而提高模型的性能和效率。虽然势信息是对态信息的压缩和优化,但它们并不是完全替代的关系。态信息提供了系统的详细描述,是势信息的基础;而势信息则提供了系统的宏观视角,帮助我们更好地理解和分析系统。在实际应用中,我们需要根据具体问题选择合适的视角和信息层次。势信息和态信息是互补的,势信息通过对态信息的压缩和优化,帮助我们更高效地理解和处理复杂系统。
二、知信息是对感信息的压缩与优化
1、感信息
“感信息”是指通过人的感官(如视觉、听觉、触觉、嗅觉、味觉等)直接从外界获取的信息。这些信息是原始的、未经加工的,具有即时性、海量性、具体性,感信息是实时获取的,反映了当前环境的状态,感信息是大量的,包含了环境中所有的细节,感信息是具体的、直接的,是对环境的直接感知。
2、知信息
“知信息”是指经过大脑处理、筛选、整合和抽象后的信息。它是人类对感信息进行加工后的产物,具有抽象性、结构化、经验性,知信息是从感信息中提取的关键特征和模式,是对感信息的抽象,知信息通常以结构化的方式存储在大脑中(如概念、规则、模型等),知信息是基于过去的经验和学习形成的。
3、知信息对感信息的压缩与优化
知信息对感信息的压缩可以提取关键特征,大脑在处理感信息时,会自动提取关键特征,忽略无关的细节。例如,当我们看到一张脸时,大脑会提取眼睛、鼻子、嘴巴等关键特征,而不是关注每一个像素的细节。压缩还可以增强模式识别,大脑会识别感信息中的模式,将相似的信息归类。例如,我们可以通过少量的特征识别出不同的动物,而不需要记住每一只动物的具体外观。大脑会将感信息压缩后存储为记忆。如我们记住一个城市的布局,而不是记住每一条街道的具体位置。知信息对感信息的优化可以提高效率,通过压缩感信息,大脑可以更快地处理和响应环境变化。例如,我们不需要处理每一个视觉信号,只需要关注重要的变化。大脑会通过知信息忽略无关的感信息,减少干扰。例如,在嘈杂的环境中,我们可以通过选择性注意力专注于重要的声音。优化有利于预测未来,知信息可以帮助我们预测未来。例如,通过过去的经验,我们可以预测物体的运动轨迹,而不需要实时处理每一个位置信息。最后,知信息为决策提供了依据,我们根据过去的知信息判断一个物体是否安全,而不需要每次都重新处理感信息。
4、举例说明
当我们看到一个苹果时,感信息是眼睛接收到的光信号,包含了苹果的颜色、形状、大小等细节。而知信息是我们大脑识别出的“苹果”这一概念,它忽略了具体的像素细节,但包含了苹果的特征和属性。当我们听到一段话时,感信息是声音的频率和强度。而知信息是我们理解的语义内容,它通过语言规则和词汇知识对声音信号进行解析和抽象。知信息确实是对感信息的压缩与优化。它通过提取关键特征、识别模式、减少无关信息,帮助我们更高效地处理和理解环境。这种压缩和优化不仅提高了信息处理的效率,还为我们的预测和决策提供了支持。
三、人机交互中的控制
在人机交互控制中,不仅关注传统的态信息和感信息的反馈,还引入了势信息和知信息的反馈机制。这种多层次的反馈机制能够更全面地反映人机交互过程中的信息流动和动态变化,从而实现更高效、更智能的交互控制。以下是对这种多层次反馈机制的详细描述:
1、态信息反馈
态信息是指系统当前的具体状态信息,通常包括系统的运行参数、设备状态、用户操作行为等。态信息反馈是传统控制论中的重要组成部分,它通过实时监测系统的状态,为控制决策提供依据。如在自动驾驶系统中,车辆的当前速度、方向、加速度等信息属于态信息,这些信息通过传感器实时反馈给控制系统,用于调整车辆的行驶状态。在工业自动化中,设备的运行温度、压力、电流等参数属于态信息,这些信息通过反馈机制用于优化生产过程。
2、势信息反馈
势信息是对态信息的压缩与优化,它反映了系统整体的发展趋势和潜在变化。势信息反馈能够帮助系统提前预测和应对可能出现的问题,从而实现更主动的控制。在自动驾驶系统中,势信息可能包括道路的拥堵趋势、交通信号的变化趋势等,通过分析这些势信息,系统可以提前调整行驶路线,避免拥堵。在金融市场中,势信息可能包括市场趋势、投资者情绪等,通过势信息反馈,交易系统可以提前调整投资策略,降低风险。
3、感信息反馈
感信息是指通过人的感官(如视觉、听觉、触觉等)直接获取的原始信息。感信息反馈是人机交互中非常重要的部分,它能够让人感知到系统的状态和环境的变化。在虚拟现实(VR)系统中,用户通过视觉和听觉获取虚拟环境中的感信息,这些信息通过头戴设备实时反馈给用户,增强沉浸感。在智能穿戴设备中,用户通过触觉感知设备的振动或温度变化,这些感信息反馈帮助用户更好地与设备交互。
4、知信息反馈
知信息是对感信息的压缩与优化,它反映了用户对感信息的理解和认知。知信息反馈能够帮助系统更好地理解用户的需求和意图,从而实现更智能的交互。在智能语音助手中,用户通过语音输入感信息,系统通过自然语言处理技术将其压缩为知信息(如用户的意图、需求等),并根据知信息反馈提供相应的服务。在智能驾驶辅助系统中,系统通过分析用户的驾驶行为和环境信息,提取知信息(如用户的安全意识、驾驶习惯等),并根据这些知信息提供个性化的驾驶建议。
5、多层次反馈机制的优势
通过引入势信息和知信息的反馈,系统能够更全面地感知和理解环境和用户的需求,从而做出更精准的决策。势信息反馈能够帮助系统提前预测和应对潜在问题,实现更主动的控制,而不是仅仅被动地响应当前状态。知信息反馈能够帮助系统更好地理解用户意图,实现更智能的人机交互,提升用户体验。
在新的人机交互控制论中,不仅有传统的态信息和感信息的反馈,还引入了势信息和知信息的反馈机制。这种多层次的反馈机制能够更全面地反映系统和用户的状态,帮助系统实现更主动、更智能的控制,提升人机交互的效率和用户体验。
四、人机交互中的协同
在新的人机交互协同论中,强调了多维度信息的协同作用,以实现更高效、更自然的人机交互体验。这种协同不仅体现在态信息与势信息之间,还体现在感信息与知信息之间。
1、态信息与势信息的协同
态信息描述系统的具体状态,包括实时数据、设备参数、用户操作行为等,提供了系统的即时状态信息,是控制和决策的基础。势信息是对态信息的压缩与优化,反映了系统整体的发展趋势和潜在变化,可帮助系统预测未来状态,提前做出调整。两者的协同机制包括互补性、动态调整,态信息提供即时细节,势信息提供宏观趋势,两者的协同能够让人机系统同时关注当前状态和未来趋势。通过态信息的实时反馈,系统可以快速响应当前变化;通过势信息的预测,系统可以提前调整策略,避免潜在问题。如自动驾驶中车辆的当前速度、方向(态信息)与交通流量、道路拥堵趋势(势信息)协同,优化行驶路线。工业自动化中设备的实时运行参数(态信息)与生产计划、市场需求趋势(势信息)协同,优化生产流程。
2、感信息与知信息的协同
感信息通过人的感官直接获取的原始信息,如视觉、听觉、触觉等。它提供了丰富的环境感知数据。知信息是对感信息的压缩与优化,反映了用户对环境的认知和理解。它帮助系统理解用户的需求和意图。二者的协同机制包括感知与认知的结合、交互优化,感信息提供丰富的细节,知信息提供对这些细节的理解和解释,两者的协同能够让人机系统更好地理解用户意图。通过感信息的实时反馈,系统可以快速响应用户的感知需求;通过知信息的理解,系统可以提供更符合用户期望的服务。在智能语音助手中,用户的语音输入(感信息)与语音助手对用户意图的理解(知信息)协同,提供更精准的回答。虚拟现实中,用户通过视觉和听觉获取虚拟环境的感信息,系统通过分析用户的认知行为(知信息)调整虚拟环境,增强沉浸感。
3、多层次协同的优势
通过态信息与势信息的协同,系统能够同时关注当前状态和未来趋势;通过感信息与知信息的协同,系统能够更好地理解用户需求。这种多层次的协同机制能够让人机系统更智能地响应用户需求,提供更个性化的服务。协同机制能够减少信息处理的冗余,提高系统的响应速度和决策效率。所以,在新的人机交互协同论中,不仅有态信息与势信息的协同,还有感信息与知信息的协同。这种多层次的协同机制能够让人机系统更全面地感知和理解环境与用户需求,从而实现更智能、更高效的交互体验。
五、人机系统
在新的人机系统论中,信息、控制与协同不再局限于人和智能机器之间的交互,而是将环境作为一个重要的组成部分纳入整体框架。这种全面的视角能够更准确地反映人机系统在实际应用中的复杂性和动态性,同时也为设计和优化人机系统提供了更全面的理论基础。以下是对这一观点的详细阐述:1、人机系统论中的信息、控制与协同
(1)信息
人的信息处理:人通过感官获取环境信息,并通过认知过程将其转化为知识和决策依据。人的信息处理能力具有灵活性和适应性,但也受到认知负荷和注意力的限制。
智能机器的信息处理:智能机器通过传感器获取数据,并通过算法和模型进行处理。机器的信息处理能力具有高效性和准确性,但需要明确的指令和规则。
环境信息:环境信息是人和机器共同感知的对象,包括物理环境(如温度、光照、地形等)、社会环境(如人群行为、社会规范等)和虚拟环境(如网络环境、虚拟现实等)。环境信息的动态变化会影响人和机器的决策和行为。
(2)控制
人的控制行为:人通过操作界面、手势、语音等方式对机器进行控制。人的控制行为具有主观性和创造性,但也可能受到情绪和经验的影响。
智能机器的控制行为:机器通过算法和控制系统对自身行为进行调整。机器的控制行为具有精确性和可重复性,但也需要适应环境的变化。
环境对控制的影响:环境的变化(如天气变化、突发事件等)会影响人和机器的控制效果。因此,控制策略需要考虑环境的不确定性和动态性。
(3)协同
人机协同:人和机器之间的协同需要明确的任务分工、信息共享和交互机制。人机协同的目标是发挥各自的优势,提高系统的整体性能。
人环协同:人与环境之间的协同需要考虑人的行为对环境的影响以及环境对人的反馈。例如,人在复杂环境中需要调整行为以适应环境的变化。
机环协同:智能机器与环境之间的协同需要机器能够感知环境变化并做出适应性调整。例如,自动驾驶车辆需要根据道路状况和交通流量调整行驶策略。
2、人机系统论中环境的重要性
(1)环境作为信息源
提供丰富的感知信息:环境是人和机器感知信息的主要来源。视觉信息可以帮助人和机器识别物体、判断距离;听觉信息可以帮助人和机器感知声音来源和环境状态。
影响信息处理:环境的复杂性和动态性会影响人和机器的信息处理能力。例如,嘈杂的环境可能干扰语音识别,复杂的地形可能影响视觉感知。
(2)环境作为控制目标
人和机器的控制行为需要适应环境:环境的变化是人和机器需要控制和适应的对象。例如,机器人在不同地形上的行走策略需要根据环境调整;人在不同气候条件下的行为也需要适应环境。
环境对控制效果的反馈:环境的变化会反馈到人和机器的控制行为中。例如,自动驾驶车辆需要根据交通流量的变化调整行驶速度;人在复杂环境中需要根据环境反馈调整行动策略。
(3)环境作为协同伙伴
人机协同需要考虑环境因素:人和机器的协同行为需要考虑环境的动态性和不确定性。例如,在复杂环境中,人和机器需要共同感知环境变化并做出适应性调整。
人环协同与机环协同的相互作用:人与环境的协同和机器与环境的协同相互影响。例如,人在复杂环境中调整行为可能会影响机器的感知和控制策略;机器的行为也可能影响环境状态,进而影响人的行为。
3、新的人机系统论的框架
在新的人机系统论中,信息、控制与协同不仅涉及人和智能机器的部分,还必须考虑环境的部分。这种框架可以概括为以下三个层次:
(1)信息层
人感知信息:通过感官获取环境信息,并转化为认知知识。
机器感知信息:通过传感器获取环境数据,并通过算法处理。环境反馈信息:环境的变化和状态反馈到人和机器的信息处理中。
(2)控制层
人控制行为:人通过操作界面、手势、语音等方式对机器进行控制。
机器控制行为:机器通过算法和控制系统对自身行为进行调整。环境适应性控制:人和机器的控制行为需要适应环境的变化。
(3)协同层
人机协同:人和机器之间的任务分工、信息共享和交互机制。
人环协同:人与环境之间的行为调整和适应性互动。
机环协同:机器与环境之间的感知和控制策略调整。
4、实际应用场景
(1)自动驾驶系统
信息:车辆通过传感器获取道路状况、交通信号、其他车辆位置等信息;驾驶员通过视觉和听觉感知环境信息。
控制:车辆的自动驾驶系统根据环境信息调整行驶策略;驾驶员通过操作界面干预车辆行为。
协同:车辆与环境(道路、交通流量)协同,驾驶员与车辆协同,共同实现安全高效的驾驶。
(2)智能工厂
信息:生产设备通过传感器获取运行参数和环境信息;操作人员通过监控系统获取设备状态信息。
控制:生产设备根据环境信息(如订单需求、原材料供应)调整生产流程;操作人员通过控制界面干预生产过程。
协同:生产设备与环境(市场需求、供应链)协同,操作人员与设备协同,共同实现高效生产。
(3)虚拟现实系统
信息:用户通过头戴设备获取虚拟环境的视觉和听觉信息;系统通过传感器获取用户的动作和行为信息。
控制:用户通过手势、语音等方式与虚拟环境交互;系统根据用户行为调整虚拟环境。
协同:用户与虚拟环境协同,系统与用户协同,共同实现沉浸式体验。
在新的人机系统中,信息、控制与协同不仅涉及人和智能机器的部分,还必须考虑环境的部分。这种全面的视角能够更准确地反映人机系统在实际应用中的复杂性和动态性。通过将环境作为信息源、控制目标和协同伙伴,人机系统能够更好地适应环境变化,提高系统的整体性能和用户体验。
转载本文请联系原作者获取授权,同时请注明本文来自刘伟科学网博客。
链接地址:https://wap.sciencenet.cn/blog-40841-1487487.html?mobile=1
收藏