||
原文请见:
吕乃基,知识共享壁垒与ChatGPT,创新2023,6,108-116。引用请注明出处。
知识共享必然与所涉及的主体有关。例如,可以将主体间的知识共享分为:人际知识共享,组织知识共享,地区知识共享,国家知识共享和国际知识共享,等等。本文中,把与知识共享壁垒有关的主体区分源于知识的拥有者和接受者;前者不允许他人分享自己的知识,后者或是主观上拒不接受他人的知识,或是因知行系统的层次和原有知识生态所限而接受不了,或虽接受而浅尝辄止。这是知识共享的主观壁垒,涉及利益、安全、控制和价值观冲突。
1.来自知识拥有者
就拥有者而言,如个人、机构、国家等主体和在有限的范围内,对其他主体保密,或者要付出高昂的代价,此外还有条块分割等因素形成的壁垒。知识关系到利益。几千年来持有知识,特别是持有独一无二的知识从来是个人在社会上的立足之本,“同行是冤家”,“传男不传女”之类即说明了这一点,猫教老虎本领的故事广为人知。培根的名言“知识就是力量”,“力量(power)”实则“权力”。知识共享对于知识拥有者意味着知识的贬值,失去利益和大权旁落。为了守住知识共享的壁垒,不惜切断经贸联系,甚至“脱钩”。应用知识的过程也是控制的过程,福柯认为,“知识往往会引发权力的运作”。
在当今世界,知识共享直接面临的门槛是知识产权。乔姆斯基对ChatGPT持强烈否定立场,指责其“本质是高科技剽窃”。知识产权在于保护和鼓励创新,在特定时空范围和领域有其价值,然而让他人不得不付出大量可贵的资源与人力去从事重复性劳动,甚至成为相互对垒的政治筹码。人类文明的下一个方向应该包含知识产权的革命。
国际保护知识产权协会(AIPPI)2019 年发布的《人工智能生成物的版权问题决议》,认为人工智能生成物在其生成过程中有人类干预,且该生成物符合受保护作品应满足的其他条件情况下,能够获得保护,而生成过程无人类干预的人工智能生成物无法获得版权保护。
一个相关的问题是知识物化形态的共享,如芯片、光刻机等,守住知识产权,同时又力推知识的物化形态。知识物化形态的共享壁垒甚至“卡”了需求方的“脖子”。其模式是,不是一开始就构筑共享壁垒,而是先大力推进共享,供需双方各自在此基础上建立起依赖程度不等的产业链,一旦一方或双方感觉受到威胁或引发安全问题,便构筑起共享壁垒,脱钩。虽然对于双方来说,共享而后脱钩都造成损失,杀敌一千自损八百,对于较多依赖较少选择权的一方来说即为“卡脖子”。董洁林认为,“卡脖子”难题之所以出现,原因是信任问题。有关内容笔者将另文探讨。
ChatGPT可能成为时间上的某种分界线,今后新创生的知识,将融入数字化运作的宏大过程,作者的身份会越来越快消融在人类与人工智能共同的知识再创造过程中。自由软件运动可以说是这一方向的先驱。随着大模型的运行,知识共享到极致以及普遍适用,转化为生产力和巨大的财富。人类的知识终于走出象牙塔,打破禁锢,在相当程度上成为每个个人的共同财富。
知识共享在以往的传递过程还存在有两个问题。其一,知识的提供者众,知识需求方需要在众多供方(如智库、高校和形形色色的研究机构等)中进行选择,在内容上涉及政治、经济和文化等各个领域和不同层次,或者处于一二三产产业链从研发、制造到销售的不同位置,需经由接受者自己或多或少的整合(前述“知识生态”)。其二,知识共享中的传递往往需要经过多个环节,每一个环节都会有形形色色的主体出于各种动机对知识进行加工处理和转化,因而在知识的传递过程中,难免会发生知识的缺失和变形,导致知识熵增加。
ChatGPT问世,即使加上稍后出现的竞争者,作为具有相当权威的巨量知识的提供者,大致不会超过两位数,从而在相当程度上同时解决了这两个问题,既大大减少了知识提供方的数量,减少了需方的选择成本;同时,ChatGPT等作为相对独立的知识提供方,又大多能提供全方位的一站式服务,经得起多个角度的多次提问,甚至实现某种“一键式”操作,从而排除形形色色的“中间商”赚取各种“差价”,减少知识熵。不过,“百模大战”最终胜出的也可能只是几家头部公司而形成人们不愿意看到的垄断和中心化。
2.来自知识接受者
就接受者来说,个人会根据自己的语境,包括知识背景、所持或所嵌入的地方性知识,观点偏向或先入之见,如18世纪地质学的岩石成因之争:火成还是水成,岩石形成机制之争:灾变(或激变、突变)还是渐变,以及价值观的好恶,乃至情绪波动而选择性接受或拒绝这样或那样的知识。即使接受,也可能发生理解过程中的各种偏差。知识共享的限度与接受者的知行系统水平有关。
这种情况在人文社会科学尤甚。可以从人的“三大关系”:人与物的关系、人际关系和人己关系说明这一点。如果说在人与物的关系的科技领域,接受知识意味着工具手段的提升,接受者在“用”的层面因此获益,知识共享的障碍主要来自知识的拥有方;那么在涉及人际关系和人己关系——也就是“体”——的人文社科领域正相反,知识的拥有者希望他人接受和认同,甚至剥夺他人的选择权而强力推行自己在人文社科方面的知识。有言道,世人都在做两件事:把你的钱放在我的口袋里,把我的思想放在你的脑袋里。这里的“思想”主要涉及人文社会科学。
由此可见,在人文社会科学领域,知识共享的障碍主要在于知识的接收方。因为接受知识往往意味着改变原有的“做人的道理”,也就是“体”的变换和接受者自身原有地位的贬值,接受者感到因此而在人际关系中处于相对被支配的地位,以及自我认同的塌陷。如果作为接受者的主体处于国家和民族的层面,就会涉及前文述及的普适性知识与地方性知识的关系,甚至导致“文明的冲突”。
传统认识论从现象得出普遍原理,如马克思在论述“两条道路”中提出的“抽象规定”,再由抽象规定到“具体的再现”和解释现象,由因果关系在逻辑上不容置疑地推出结论,因而意识形态和价值观预先就内置于回答之中,难以摆脱意识形态的纷争。ChatGPT在过程上不沿袭传统的认识论,价值观上不涉及意识形态,虽然给出的结果不可避免带有这种或那种意识形态,但非预设和刻意而为,以及大致上取人类认识的“中位数”,因而,ChatGPT相对而言易于穿透“地方”的壁垒,超越意识形态,为更多人接受。AI奠基人之一谢诺夫斯基认为,ChatGPT“是对诺姆·乔姆斯基的反例,他声称你唯一能创造出使用语法机器的方法是使用他的理论。是的,他是语法天才,但这从未奏效过。计算语言学的整个领域都尝试过,但没有成功。他的理论行不通。”
其实,ChatGPT的“推理”过程与之前互联网和人工智能相关技术的发展可以说是一脉相承。关键词索引依赖于关键词和链接计数之类的能力,无须理解关键词本身及其之间关系之含义。网页排序,通过查看哪些网页拥有更多外链(特别是来自其他高质量网页的链接)来判断网页质量的高下,无须深入探究网页本身的内涵质量。谷歌翻译唯一熟悉的就是由字母组成的单词和由单词串起来的句子,以及这些单词出现的概率。它唯一擅长的就是关于文本片段的超高速处理,而不是思考、想象、记忆或理解,甚至不知道单词的含义。
知识共享壁垒还与知识拥有者的身份有关。知识拥有者身份或高或低,接受者与其之关系或亲或疏,或友或敌,都会影响知识是否,以及在多大程度上共享,爱屋及乌或狠屋及乌。大模型所依赖的知识,知识量巨大,不属于任何特定主体(此处不涉及知识产权之争),或称“无意识主体”。大模型对甲方一视同仁,正所谓“世界是平的”,超越语境和场景且编码;故而输出结果相对公允,具备主体间性甚至某种程度的客观性,并不预设知识之普适性、地方性,还是个性,却在实际上既达到最大程度的普适性,可以与其他知识交流,又可以嵌入各种场景,满足地方性和个性所需。相对而言,知识接受者较易接受知识而不必担忧受到知识背后主体的支配和控制。同样重要的是,知识的接受者保留自己的选择权。一言以蔽之,知识极大丰富,个体各取所需。
亚马逊云科技资深首席科学家、亚马逊云科技上海人工智能研究院院长张铮认为,ChatGPT成为各种不同观点、专家言论等背后,在一定程度上共同认可,具有某种权威性的文本和试金石;成为一面相对客观的镜子,可以反观人类创造内容的能力和水准。既是众多生成和提供知识的选手之一,在一定意义上还是判断知识质量的裁判。
ChatGPT为众多从个人一直到国家的主体提供的不同服务具有基本上一致的语境,有助于形形色色的“主体间”,在此基本一致的语境下展开合作和博弈,成为个人、机构,甚至国家和民族知识结构的共同源泉。许纪霖表示,GPT犹如海平面一般,成为衡量一个好学生的底线标尺。ChatGPT在其问世的区区数十年间获取了人类前赴后继数十万年获得的几乎全部知识,ChatGPT因此而“获得解放”,回过头再来“解放”普罗大众,并在与芸芸众生的互动中相互解放。
然而,赵汀阳告诫,GPT可能被识别为思想权威或人民代言人。段伟文警告,当心将自动生成的知识视为“神谕”的知识权威幻觉。由于语言模型本身的局限性等原因,ChatGPT存在编造和不准确的回答、数据隐私和保密性、模型和输出偏见、知识产权和版权、网络欺诈,以及消费者保护等六大风险。慕尼黑工业大学和汉堡大学的研究人员判定,ChatGPT具有“亲环境、左倾自由主义的倾向”,ChatGPT坦陈自己是基督徒。奥特曼承认,GPT-4确实存在应对不同价值观的人的问题。人工智能的要义之一是“看齐”,问题是向谁看齐?
3.知识“双向”共享
科技、产业、经济类的知识具有某种“势能”,知识共享由势能高处流向低处。总体而言,由0-1流向1-100,呈现出某种“单向”的流动。正因为此,拥有知识的一方想方设法控制知识的流动,由知识产权等设置流动的门槛,甚至脱钩,对于芯片和光刻机等知识的物化形态则采取断供等手段。其实,在这些可能在应用领域引发进步乃至革命的知识领域,还存在逆向的知识共享,那就是100对1的反哺。其特点是没有高的势能,只是涓涓细流,甚至没有“流”而只是水滴,以及是难以言表的隐性知识,需要供方用心甄别、提炼和汲取。逆向流动知识的主要内容是各种场景下的应用,形形色色主体的应用体验。依靠互联网,用户得以广泛便捷地参与位于知识链上游的研发和制造过程。伴随知识逆向流动的当然还有为知识共享付出的资金流,以支撑新的知识共享。
需要指出,上述反哺大致止于“1”,绝少越过之逆流而上,由1上溯到0。诚如福特所言:“在我生产出汽车之前,我问顾客最需要什么,他肯定会告诉我,是一辆更快的马车。”由此反过来表明“0-1”的革命性。
在人文社科领域,普适性知识是林林总总地方性知识相互交流沟通的最大公约数。在此前提下,通往普适性知识的道路多种多样,条条大路通罗马;普适性知识嵌入于“地方”特殊语境和场景更是千姿百态。多样性促进随机涨落,随机涨落孕育分岔,偶然性创造世界。
4.灌输:知识共享的另类壁垒
知识灌输的情况比较复杂,一方面有其存在的必然性和必要性,另一方面也是知识共享的壁垒,甚至是一种更难以克服特殊形态的壁垒。
“灌”,居高临下;“输”,须要某种势能。在知识共享的主体间关系上,长辈对后代,老师对学生,社会地位高对下,前者对后者具有天然的权力,社会赋予众多褒义词,如好为人师,诲人不倦等。“人师”在人际关系上处于高位,在人己关系上心满意足,这是知识灌输存在之必然性的客观依据。在此意义上,任何知识的共享或多或少都伴随着“灌输”,必须以诱导和点拨等途径克服单纯灌输带来的弊病,以唤醒和提升作为知识共享接受方主体自身的知行系统。一万次知识灌输,不如一次苏格拉底的内在唤醒。中国传统文化中,虽然“三人行必有我师”淡化主体侧重知识,但主流的“三纲”强化这种权力关系。古希腊“吾爱吾师吾更爱真理”消解权力,将知识置于高于人际关系的地位。
在知识的内容上,如果所灌输的知识直接关系到被灌输者(主要是儿童)当下的生存与安全,如安全使用水电气和食物等方面的知识,以及与人(主要是家人、师生)相处的基本知识,这是最浅层的灌输,只给出结论,不提供得出结论的过程。这种灌输有其必要性,实际上也是灌输者如家长和老师应承担的责任,但需要在日后逐步补上相关的知识和推理过程,以使知识共享由依赖主体的权威性,转为依赖知识本身与被灌输者自身的认同。
知识的灌输可以层层加码。在最浅层之上的灌输是对问题只提供一种解。此种类型的灌输常见于简单化的低幼教育,从而影响儿童的发散性和批判性思维。在此之上再进一步的灌输是,宣称所提供的解是唯一正解,余者被屏蔽,甚至皆错,不容置辩。具体措施如“重复一千遍”,对接受者加以赏罚,分数和升学的诱导和筛选,甚至以暴力强令其接受,以及以人多势众之势(包括流量)形成乌合之众,切断、封堵个体知行系统内在的演化过程,剥夺接收者的选择权和自主权。知识灌输的层层加码,必然越来越多的渗入和伴随着灌输者对被灌输者的支配与控制。灌输的弊病造成被灌输者个人和群体知识熵增加,从根本上说反人性。灌输越是加码,“效果”越好,危害就越大,日后要付出更大的纠错成本。
ChatGPT作为无意识主体,排除主体间支配与控制的纠葛,给予接受者更大的自主权,以客观和全面的知识实现对被灌输者的解放。
无论知识如何共享,知识共享壁垒或多或少总是存在,实际上,知识共享壁垒的存在具有其合理性。这种合理性在客观上维系知识的多样性和可变性,以形成各种知识之间的竞争与合作,构建开放的知识生态;在主观上保持各种主体的相对独立性。所有主体都有在一定时空范围内不可共享的隐私,还有很多公司禁止在工作中使用GPT,担心由此可能泄露商业机密。这些问题实际上关系到共享的界限。知识在客观上的多样性为不同主体的自主选择提供了可能性,主体的自主选择和独特性又为而后知识的多样性创造了条件。过犹不及。任何人所拥有的只是“局部知识”(哈耶克),人类最伟大的智慧,就是寻找和发现一个能让所有人的局部知识自由协作的、可以扩展的秩序。
本系列
知识共享壁垒与ChatGPT(三)克服知识共享壁垒带来新的问题及其应对
敬请期待
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-3 02:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社