信息化的本质分享 http://blog.sciencenet.cn/u/Babituo

博文

从昆辉的信息对象标识想到的

已有 3460 次阅读 2011-11-30 16:27 |个人分类:基因软件开放实验室|系统分类:科研笔记| 信息, 标识

昆辉的博文“从锦囊妙计的搜索提取看信息对象的较优提取方法” http://blog.sciencenet.cn/home.php?mod=space&uid=409757&do=blog&id=510895&cid=1369233
举例说明了几种信息对象的提取策略,说到了一种用标签封装语义对象的信息的方法。一开始我误解为是状态空间启发式搜索方法。经过讨论和思考,感觉谈到了一个信息对象编码的一般性思路。其实和早先我发的博文欧阳余山谈到的“中间变量”类似。
以下是讨论和思考过程,记录备忘。
[1]Babituo  2011-11-29 22:50
感觉昆辉提出的问题,很象是基于状态空间的产生式系统解决的问题.
存在度,就是启发搜索的估值.
博主昆辉回复(2011-11-30 14:01):不是基于状态空间的搜索,状态空间是传统理论的东西,是要处理语义内容的为前提的搜索,说白了,基于语义的搜索只是一种方法,还可以是基于“标识”的搜索,基于标识的搜索是一种绕开对象复杂语义处理的方法。
存在度可以是一种标识。它同样可以作为搜索的根据。
 
接下来我的思考:
“标签”就是“标识”,给语义对象一个标识,然后按标识查找语义对象,不需要知道语义对象内部逻辑是什么,这和晓辉的思路是一致的。只是晓辉的标识方法是具体化为一个序位矩阵的。不同的人可以发明不同的标识方法。这本来就是关系型数据库的基础。只是,不同的人选择了不同的标签语义的集合。
关系型数据库管理系统,其实就是这么一套标签集合的管理系统。用到的标签是:库,表,字段,记录。不同的信息对象被打上这些标签,然后再根据这些标签将它们定位,找出来。和信息对象有关的查找则要通过具体信息的搜索查询用SQL语言专门定义出来。可见:标签和具体对象语义在 DBMS中获得了较好的联合使用。
晓辉的序位矩阵是根据字符结构特征来对信息对象编码的,具有原始的直接性,因为任何语义想得到处理,必然是要通过符号序列来表达,符合序列的结构本身,就是一种现成的直接的标签。
一个信息对象必然会具有恰当的符号序列的表达,找到这个符号序列的序位码,就找到了这个对象。就是一种标签识别方法。
这样的方法也有自身的优缺点。
昆辉的想法是不是建立一种针对标签系统本身的设计构造工具,动态地根据实际的需要来构造标签,以及标签的语义?要这么做的一个挑战是:如何动态地得到标签语义的处理操作?因为以往的标签语义,是由固定的程序来处理的。不可能自定义一套标签,又在运行时自编写一段程序来处理这套标签。
我提出基因架构的软件,就是要解决这个问题的。
XML也是用一种类似关系型数据库的标准标签,名字就直接叫“标签”了来统一描述信息对象。并且这些“标签”本身也成为信息对象的一部分,称“自描述对象”。XML已经成为互联网上信息对象的标准标识方法,也有专门的程序对这些信息对象进行查询和处理。甚至转换为计算对象来驱动计算,而不是纯粹的被处理的数据。这些已经是现在IT技术的基础了,包括从OO到SOA的整个技术线路,都体现了这种信息对象标识处理的思路。XML是从“元语义”的角度来设置标签的,具有广泛的适应性。
其实,整个信息技术发展的历史,就是不断改进信息对象的标识方法的历史。而标识方法的改进需求,来源于更广泛的对象的信息化需求。从本地已知确定的信息对象到分布未知不确定的信息对象;从被动的信息对象到主动的信息对象;从固定的信息对象到可演进的信息对象,从孤立的信息对到可协同互操作的信息对象。不同难度级别的处理,就需要相应级别的信息对象标识方法。我提出的基因软件模式,本质上也就是要实现一种适应分布式可演进的互操作信息对象的编码方法。
 
标签如何设定的问题:标签语义实际上是对信息对象的管理语义,是从对信息对象的管理需求,而不是信息对象本身的功能作用的角度来设立的。换句话说,只需要根据标签找到信息对象,而不需要根据标签来构建可运行的信息对象。
所以,信息对象的标签是给环境使用的。这就涉及到信息对象使用环境会出于什么样的目的来查找信息对象,标签就应该表达出与目的适应的语义框架的内容。管理系统就根据这个语义框架管理信息对象。这和关系型数据库的架构确实没有太大的区别。
如果要实现针对标签语义的动态的框架,那么就需要更进一步对标签语义框架本身做进一步的抽象描述,得到“元框架”,建立以元框架为核心的管理程序,这个程序用来管理不同需求的标签语义框架,并自动产生针对不同语义框架的管理程序。这种“元元”管理的策略的实现难度,就在中间管理程序的自动产生。

如果不采用“元元策略”,可以考虑“通元策略”,就是建立通用的元语言和“元处理机”,本身也是对象语言和对象处理机的同态。通过递归运用,就可以实现到动态的演进,这便是基因架构的思路。
 
 ?ٱ?[1]hongkunhui  2011-12-1 10:20

在信息对象的搜索阶段。通过给对象贴标签,将对象与标签捆绑在一起,(捆绑可以是非人为的或是人为的,如符号与所指的捆绑是人为的)。在信息对象的搜索过程中只需要搜索到标签就可以将对象一并提取出来,这就在搜索阶段处理中回避了对象本身复杂语义的识别与处理。当然,对象的复杂语义还是要处理的,只是不放在搜索阶段来处理。这里留下了三个问题:
1、选择什么作为标签?(标签方法其实就是间接方法)以不同质的对象作为标签,还是以某种对象的量的差别(如存在度)做标签,标签是静态的,还是动态的?
2、标签与对象的捆绑如何完成,人如何介入二者的捆绑。
3、对象的语义在哪个阶段处理?
其实,对象的语义归根到底还是要处理的,不能回避,只不过是我认为是要用物理层次的“共鸣激活”来处理,不用算法来处理对象的复杂语义。是将对象质的,结构的规定性,转换为用量表述的对象的“存在度”P(x,t)值,激活时是以“质”(语义)见“量”(存在度)信息对象之间内容上的“相似度”转换为存在度。信息对象被搜索时是以“量”见“质”(语义)通过存在度的差异值找到特定对象。

博主回复(2011-12-1 11:35)看到昆辉“是将对象质的,结构的规定性,转换为用量表述的对象的“存在度”P(x,t)值,”的说法,让我联想起我曾经提出的“结构量”概念。也就是用一个单一的度量值来标识不同结构的特征的企图。进一步联想到:哈希表产生对象哈希值的哈希函数,实际上就可以看成是某种将结构化为数值的函数。
“结构哈希”可能是一个值得考虑的新概念。

结构哈希是从信息对象自身结构出来,是表现信息对象自身构造的内部特征的量,如果能建立,也是一个重要的标志。

然而,对信息对象的搜索,引发于对象的环境,存在大量的搜索需求是要根据对象和环境的关系来索引的需求。这类似概念的内涵和外延标识。如果说,“结构哈希”可以标识内涵,那么,“关系哈希”就应该存在用来标识外延。“关系哈希”就可以实现为需求:把信息对象的所有外部关系压缩为一个唯一的数值标识。

信息对象就应该存在两个哈希码:“结构哈希码”和“关系哈希码”。

也许这是信息对象的基因编码所需要的。

Babituo  2011-12-7 14:20

标签如何设定的问题:标签语义实际上是对信息对象的管理语义,是从对信息对象的管理需求,而不是信息对象本身的功能作用的角度来设立的。换句话说,只需要根据标签找到信息对象,而不需要根据标签来构建可运行的信息对象。
所以,信息对象的标签是给环境使用的。这就涉及到信息对象使用环境会出于什么样的目的来查找信息对象,标签就应该表达出与目的适应的语义框架的内容。管理系统就根据这个语义框架管理信息对象。这和关系型数据库的架构确实没有太大的区别。
如果要实现针对标签语义的动态的框架,那么就需要更进一步对标签语义框架本身做进一步的抽象描述,得到“元框架”,建立以元框架为核心的管理程序,这个程序用来管理不同需求的标签语义框架,并自动产生针对不同语义框架的管理程序。这种“元元”管理的策略的实现难度,就在中间管理程序的自动产生。

如果不采用“元元策略”,可以考虑“通元策略”,就是建立通用的元语言和“元处理机”,本身也是对象语言和对象处理机的同态。通过递归运用,就可以实现到动态的演进,这便是基因架构的思路。

 



https://wap.sciencenet.cn/blog-33982-513346.html

上一篇:合作心态的学术质疑问题清单
下一篇:通过三旋计算实现信息对象的自组织
收藏 IP: 112.91.148.*| 热度|

2 洪昆辉 邹晓辉

该博文允许注册用户评论 请点击登录 评论 (7 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 06:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部