张鹰的博客分享 http://blog.sciencenet.cn/u/yingzhang1 农村小伙的回顾与展望

博文

2.7 科技界需要支持更好的“软件”基础设施建设

已有 46024 次阅读 2020-2-9 12:34 |个人分类:科技1|系统分类:观点评述

中国21世纪的经济快速发展离不开交通、物流住房等各方面的基础设施建设。有网友带有褒义地戏称为“基建狂魔”,因为这是其他发国家都没有办法比拟的建设速度。即便是90年代从发达国家开始兴起的“信息高速公路”的建设,中国的进展也很迅速,在4G,5G的通讯设施建设都处于比较领先的地位。但是我们也很容易看到,这里的基础设施建设的侧重点都是“硬件”的:从高速公路、摩天大楼、跨海大桥、北斗导航到5G通讯设备,都是看得见摸得着的硬件设施。什么是可以发展的软件基础设施呢?我们相对于其他国家有所欠缺的“软件”类型的基础设施建设,主要有公共知识与数据平台建设、开源系统与开源软件的建设。

《人猿星球》的系列科幻电影,问出了一个很有意思的问题,当人猿的智慧程度优于人类,而且体力、战斗力也比人类更高,那么为什么他们没有能够拿下人类,统治世界呢,就好像人类超越了所有其他动物一般,统治地球呢?当然因为初始的智慧人猿的数量和代际传递不多,所以一定程度上限制了他们扩展。科幻评论的自媒体问舰给出了一个参考答案:即便人猿的智慧程度已经高于人类,但是由于没有知识的积累,没有教育的传播,所以他们没有办法短时间内超越人类,智慧人猿的初始一代,还没有办法得到系统的教育,即便可以操纵使用简单的武器,却不能操纵更加复杂的武器或者制造武器[1]笔者也深以为然。聪明如爱因斯坦,穿越到牛顿的时代,因为还没有洛伦兹变换等等重要的基础理论,他也无法在彼时发现相对论。这或许也便是牛顿自谦,如果他看得比别人更远,那也是因为我站在巨人的肩膀上的原因之一。智商再高的人,关在一个孤岛上也很难发明发现新的知识。穿越到古代的小说主人公通常都是携带了后世的知识,才可以开挂一般所向无敌;如果古代人反向穿越到现代,很容易被轰杀至渣,只能制造各种反差对比的搞笑桥段。司马贺对于知识的外部存储的重要性做出了一个概括:当一个领域的知识积累到一定程度,即便是一个专业人员也无法在大约十年左右的时间习得的话,那么对应会有若干种适应措施的发展;专业化(specialization,细分)的程度会增加(比如说,医学领域的专业、科室划分),从业人员也会更多利用图书及外部参考来辅助工作[2]。随着科技的发展,信息与数据出现了爆发式增长,普通的硬盘也无法承载人类知识的结晶。一个公共的外部存储(相对于大脑而言)的知识的集合变得极为重要。

有网络的接入的确因为我们的基础设施建设而变得非常便捷,一个公共的网络知识百科的建设变得尤其重要。我们经常抱怨中文搜索引擎的质量堪忧,除开一些互联网公司的竞价排名的逐利行为扭曲搜索结果以外,一个长期困扰大家的问题是:中文网络中的各种信息质量良莠不齐,而中文网络百科(百度百科,互动百科,搜狗百科等等)的质量与维基百科与巨大的差距。优秀与哗众取宠的劣质内容可能点击数量一样火,这对于根据热点进行排序的搜索引擎而言,的确是难以区分。打个不恰当的比方,不管你是用部首检字法、音序查字法还是数笔画查字法,在一本我的字典里没有失败一词的盗版字典里,你能找到的就只有瞎掰的内容了。一个健康的网络生态环境,可以有广泛的意见,可以鱼龙混杂,而科技界从业人员应该做的是创建一个专业的、被广泛认可的专业网络百科,这样不管是什么搜索引擎,在科普、核实内容、辟谣等各方面搜索时,都可以出现在搜索结果的前几名,而保证网络用户可以有一个值得信赖的专业知识渠道。

公共知识与数据的平台并不只包括网络百科,问答互动平台也是一个重要部分。因为很多时候,我们工作学习的时候都有一个倾向,为了解决一个不涉及根本的小问题之时,只要找到解决方案就好,不必把原理弄通、知其所以然。汽车的使用手册常常有一两百页之巨,但是大多数的驾驶员都没有读过使用手册,哪怕是通读。问答的互动平台,就是嫁接这样一个庞大知识体系的百科网站与常用问题(FAQ)的精略相宜的补充。我们比较熟知的知乎,对应于美国的quora,但是为了商业化运营,需要更多的订阅者及活跃用户,所以通常会有不少的热门话题的探讨,对一些专业性内容的讨论有所欠缺。(准)专业的统计、计算机、Linux操作系统、以及科学等内容的stackexchangestackoverflow等问答网站,我们还没有一个比较好的对应的网络问答平台(CSDN较杂,各种分类信息都有,侧重于计算机)。这也是科技界可以考虑建设的软件基础设施。

除了提供普通人使用的公共知识与数据以外,更大程度的专业数据的分享也在进行中,比如材料科学界的欧洲的NOMAD数据、美国疾控中心的流感数据等等。这样一些数据的共享对于科学的开放和进步都有巨大的推动。每年的不同地理区域的气候数据记录存储下来构成了气候与水文信息的数据库,流感数据的历史趋势也可以同样地记录下来。在气候异常的时候,过去的气象数据可以提供防灾策略,而流感等常见流行病的历年数据,可以用来构造模型,辅助预测重大传染性疾病的传播,以及如何干预的手段等等。由于笔者知识所限,这些更加专业的信息与数据库还需要科技领域的专家们进一步研究与探讨如何建设与共享。

司马贺在《管理行为》一书中提到,一些起初依赖于颠覆性新科技的工业,通常会经历若干个不同的产品发展与优化的阶段;在最初阶段,产品的优化的主要来源在于新科技本身以及背后的科学,...,在后期阶段,产品的优化很大程度上源于如何改善终端使用的适应性,比如提供用户应用的合适的软件[3]。这个说法在计算机与智能手机都得到印证。计算机的硬件发展的基础突破已经慢慢接近摩尔定理的极限,变成主要是软件与云计算等服务。智能手机的突破性进展,以十多年前苹果手机的出现而作为一个标志,经过这些年的发展,更多的改善也与基础性科技突破越来越远,而更加侧重于操作系统、以及各种应用(APP)的发展了。而在这后期的软件发展中,实际上也是产品竞争的一个重要要素。而这一方面,中国与美国有明显的差距,计算机的视窗操作系统、开源的Linux系统、智能手机的苹果操作系统与安卓系统(也是基于Linux内核)都是美国在引领。

中兴公司受到美国商务部门制裁的时候,这当头一棒让大家开始考虑,硬件方面的芯片行业的整体安全性,是否过于依赖进口。当时并没有预料,软件行业的的操作系统与商用软件的安全性也让人担忧。两年后,华为手机被禁止安装谷歌的安卓操作系统(安卓开源项目部分可以安装,但是谷歌服务被禁止),华为电脑被禁止安装视窗操作系统,这对于它的海外销售都造成了巨大的影响。华为在研发中的鸿蒙操作系统,可以算是公司运营安全的整体性考虑。但是单个公司的研发,很难抵挡跨公司的研发贡献。三星试图开发的Tizen操作系统并没有用于其智能手机上,诺基亚手机试图采用的视窗操作系统,最后也被安卓所取代。中国有世界上最多的智能手机硬件制造商,但是在价格等问题中的谈判权(negotiation power)处境却与十几年前的DVD制造商类似(因为专利而被掣肘)。

苹果操作系统与安卓操作系统看上去也并不是铁板一块,难以逾越。苹果由于抽取APP开发人员高达30%的佣金而被控告[4],而不少用户对于使用谷歌收集用户隐私数据而担忧[5],更有甚者因为fitbit被谷歌收购以后,不再使用fitbit的可穿戴智能设备了[6]。而传统汽车制造商,因为汽车里面的那块智能屏幕,加速与IT巨头搅局者的竞争步伐[7]。对于计算机行业从业人员,由于工作内容或者编程语言的不同,在跳槽的时候有一定的限制,比如如果公司采用小众的编程语言,跳槽其他公司的时候,至少在初期代码能力受到一定影响(不考虑其他学习能力、程序设计、或架构等考量)。所以有一个跨公司的操作系统框架与软件应用对于从业人员的跳槽与议价能力也有帮助。由此我们也可以看到,挑战视窗、苹果与安卓的操作系统的新系统的一些特征:1)继承Linux内核,计算机从业人员不用费力去学新的设计理念;2)免费或者较低的应用开发者的佣金,以聚集不同的应用软件开发团队;3)开源与透明的系统,较少收集用户数据,才能吸引其他国家的开发者和注重隐私的用户,扩大平台通用性、使用率和用户数。但是一个比较显然的问题就出现了,大家花了时间与经历,建设一个通用的操作系统,然后还是比较透明、不搜集隐私,也不怎么收费,那么我们获得了什么?中国的很多字幕组也都不是盈利的,但是翻译的字幕质量也很高,他们看似唯一的目标仅仅是观众的一句称赞,但是在做字幕与翻译的过程中,外语能力得到了提高。同样的,新系统的网络开发者技术能力得到了锻炼,而且这个新系统成长的过程中,可以类似谷歌服务一般,由不同的公司嫁接一些更加稳定安全的商业版本(proprietary)也是非常重要的,而这个时候,了解系统的开发者也会有更好的就业机会与保障。

计算机与信息行业比起化工、汽车等传统工业发展更快更迅速的原因,很大程度上由于开源代码与开源软件,还有各种开放获取的计算机科学论文,专业人员可以很好地重复其他人的工作,建立在别人的基础上,即便可能存在一些算法的专利,但是很多情况下,实现某个功能都可以绕过专利,而不像碳纤维制造工艺的专利或者商业机密难以逾越。这种开放的努力不仅体现在github等开源网站,学术工业界人士也是大力支持免费的研发知识共享。《机器学习研究期刊》(Journal of Machine Learning Research)便是研究人员集体抵制收费期刊《机器学习》的产物,为了解决学术发行公司高昂的会议论文发表费用,该期刊与其他研究者推动了现在机器学习的顶尖会议ICMLNeurIPS等,而且也都是免费获取,因为在因特网的时代,将论文放在高昂的收费期刊限制了研究者和广泛的潜在读者[8],这或许也就是很多人工智能研究者集体抵制《自然·机器智能》(Nature Machine Intelligence)的原因

公共知识网络百科、问答与共享数据的建设可以解决普通网络用户的需要更加值得信赖的中文内容的需求,衔接了科研一线研究人员与普通读者之间的鸿沟,而且可以在不同的搜索引擎下,保证专业知识的获取,是增加普通人科技素养的一环。计算机与信息技术发展的后期,更多依赖于产品终端使用的改进的阶段,我们的基础设施建设也应该更加侧重于软件方向:开源系统与软件的推广,这些是未来的主要竞争方向。不同于新技术刚出现时的基础突破很有可能有地域的偶然性,在这个量变的发展阶段,众人拾柴火焰高的人口数量将是中国的一大竞争优势。中国具有最广大的外语学习人口,字幕组翻译了大多数国家的主流影视作品;不难猜测在不久的将来,会有更多优质的开源系统和软件,伴随着更多让人期待的计算机与信息人才。


引用文献:

[1] 问舰科幻,未来猩猩统治地球后,人类会怎样?解读《人猿星球》系列 34https://www.bilibili.com/video/av14692152202028日最后访问。

[2] 司马贺,《人工科学》,麻省理工学院出版社,1996年,Herbert A Simon, The sciences of the Artificial, MIT press, 1996.

[3] 司马贺,管理行为,第四版,自由出版社,1997,54页。Herbert A. Simon, Administrative behavior, fourth edition, the Free Press (New York), 1997,p54.

[4] 斯蒂芬·奈里斯,开发者控告苹果的应用商店的惯例,路透社,20196月,Stephen Nellis, Developers sue Apple over App Store practicesReutersJune 2019, 2020年2月8日最后访问

[5]维基百科:针对谷歌的隐私忧虑,Wikipedia: Privacy concerns regarding Google  2020年2月8日最后访问

[6] 珍妮弗·艾列思,一些fitbit(可穿戴智能设备)的用户说他们不用fitbit了,因为他们不信任谷歌, CNBC新闻网,201911月。Jennifer Elias, Some Fitbit users say they’re getting rid of the devices because they don’t trust Google, CNBC news, Nov 2019.2020年2月8日最后访问

[7] 蒂姆·希金斯,威廉·波士顿,最后一块还没有被征服的屏幕的战役,华尔街日报,2019年4月Tim Higgins, William Boston, The Battle for the Last Unconquered Screen—The One in Your CarWall Street Journal, April 2019.

2020年2月8日最后访问

[8] 机器学习研究期刊的声明,http://www.jmlr.org/statement.html2020年2月8日最后访问




https://wap.sciencenet.cn/blog-3116575-1217724.html

上一篇:2.6 流感的传播趋势的监控与预测
下一篇:2.8 大学毕业论文(设计)的“6/3/1”分流
收藏 IP: 68.42.77.*| 热度|

3 杨正瓴 苏保霞 邹德虎

该博文允许注册用户评论 请点击登录 评论 (11 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 02:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部