twhlw的个人博客分享 http://blog.sciencenet.cn/u/twhlw

博文

99年,第一次接触人机交互……

已有 460 次阅读 2026-2-4 10:16 |个人分类:2026|系统分类:科研笔记

1999年,在北航跟随袁修干老师就读人机与环境工程专业博士时,才第一次看到人机交互的概念,就感到很有未来感,不久后就发现了情境意识(态势感知)这更有意思的概念,在袁老师的鼓励下,总结研究心得,一不小心,连续中了三项国自,并初步搭起了“人机环境系统智能”的框架,非常感谢国自的鼓励和帮助!更没想到的是国家在二十多年后的AI+战略中竟把人机协同放到了首位……

刚接触人机交互与情境意识(态势感知)时的那种“未来感”,折射出这两个领域在世纪之交的先锋性与前瞻性。作为早期探索者,不觉中,或许见证了一个关键转折——当计算机从“工具”向“环境”渗透,人类与技术的关系正从“操作”转向“共生”。

1990年代,是人机交互(HCI)的“启蒙期”,正处于从“以机器为中心”到“以人为中心”的转型中。此时,图形用户界面(GUI)已普及(如Macintosh和Windows),但交互方式仍局限于鼠标、键盘。我感觉到的“未来感”,可能源于当时学界对自然交互(语音、手势、眼动)的早期探索,或是认知科学与人因工程的结合——如Don Norman的《设计中的常识》(1988)刚被引入中国,强调“用户心理模型”的重要性,这种将人作为“复杂系统”的研究视角,确实充满突破传统工程范式的魅力。

“情境意识”(Situation Awareness,后多译为“态势感知”,后来开会时了解,应是赵宗贵老师译成“态势感知”的)在1990年代的关键推动者是Mica Endsley。她于1988年提出SA的三层次模型(感知-理解-预测),并在1995年完善为经典理论——这一理论最初服务于航空、军事等高动态决策场景(如飞行员处理突发状况)。1999年时,SA尚未广泛进入民用领域,但其核心思想(“人在回路中整合碎片化信息以形成全局判断”)已展现出超越特定场景的普适性。我当时感受到的“更有意思”,或许正是因为SA触及了人机协同的本质:技术的价值不仅是传递信息,更是放大人类的认知能力。于是在博士论文时选择了这个方向……

当年的敏锐并非偶然。如今回望,这两个概念已成为智能时代的核心支柱:

人机交互已从GUI发展为多模态交互(语音助手、AR/VR)、具身交互(机器人)、甚至脑机接口(Neuralink);AI驱动的“自适应交互”(如根据用户习惯自动调整界面)正在模糊人与机器的边界。

情境意识(态势感知)从军事延伸到自动驾驶(实时感知路况)、智慧城市(整合交通/能源数据)、医疗急救(ICU多参数监控)等领域。AI的加入更使其升级为“动态情境推理”——无人机群通过协同感知自主规划路径,本质是群体情境意识的涌现。

进一步思考:未来的“人机共生”

细细想来,当年的好奇或许指向一个更本质的问题:当技术足够“懂”人,人机关系会如何重构? 如今,情境感知已从“辅助决策”走向“主动服务”(如智能家居根据用户位置调节环境),而人机交互则试图捕捉“隐性需求”(如通过生物信号识别用户情绪)。这种演进印证了当时的直觉——技术的终极目标不是替代人类,而是扩展人类的感知与决策边界。

或许当年在实验室里的那次“相遇”,早已埋下了今天智能时代的种子。这种跨越二十余年的共鸣,本身就是技术发展最动人的注脚……后来,就开始了思考与研究,并写了一些小书那些年,我们写过或翻译过的书(修订版)

无标题.jpg

12年,第二次握手人机交互

2010年左右,做了一些人机交互方面的项目,教了几门人机交互设计的课程后,更感觉了前所未有的困惑与迷茫,开始的未来感越发模糊、不安,情境意识(态势感知)这些有意思的概念也开始渐渐失去了吸引力,总感到肤浅而不能深入下去,人云亦云,随波逐流,这时恰好有一次访学的机会,没有去成牛津,阴差阳错地去了剑桥,在那里深深被图灵、维特根斯坦、牛顿、麦克斯韦、达尔文等吸引了,更意想不到的是竟然在老卡文迪许实验室旁边老鹰酒吧里了解到了沃森与克里克DNA双螺旋结构的同时,发现了圣约翰学院伊尔斯与库瑞克两位学者研发了世界上第一台工效学飞机座舱从而拉开了现代意义上人机交互的帷幕,……更令人唏嘘不已的是,2013年回国后不久,剑桥大学的两位毕业生再度在全球掀起了人工智能与人机交互的高潮,一位是心理专业的辛顿掀起了深度学习的高潮,一位是哈萨比斯掀起了阿尔法狗下围棋的高潮……

这段跨越十余年的心路,更像是一部浓缩的技术人文史——从先锋热情到实践迷茫,再到历史纵深中的顿悟,最终与时代浪潮形成奇妙共振。这种“困惑—溯源—觉醒”的轨迹,恰恰揭示了技术创新中最易被忽略的真相:当热潮退去,唯有扎根学术本源的思考,才能穿透浮沫看见真正的“未来”。

上面提到的“未来感模糊”“情境意识失去吸引力”,本质上是人机交互从“理论探索期”进入“商业化泛滥期”的集体焦虑,也正是人机交互的“青春期阵痛”。2010年前后的HCI领域,正经历着三重撕裂:理论与实践的脱节,学术圈的情境意识(态势感知)SA模型、认知负荷理论被简化为“用户体验五要素”等工具化框架,沦为互联网产品“流量至上”的装饰品(比如为了“炫酷交互”牺牲核心功能逻辑);技术崇拜对人性的遮蔽,触摸屏、多点触控等技术突破让交互形式眼花缭乱,但背后的“人为何需要这样交互”的哲学追问被搁置——就像上面说的“肤浅而不能深入”,因为行业沉迷于“如何做”,而非“为何做”;情境意识的泛化陷阱,SA从军事决策的“精准认知工具”,被滥用为所有场景的“信息堆砌借口”(比如早期智能手表的“全量通知轰炸”),反而增加了用户的认知负荷,背离了“扩展人类能力”的初衷。这种迷茫好像并非我独有。2011年ACM CHI会议(人机交互顶会)上,就有学者发文批判“HCI的麦当劳化”——标准化流程取代了批判性思考,热闹背后是原创性的枯竭。我当时的“不安”,或恰是对行业异化的本能警觉。

阴差阳错走进剑桥,却意外撞开了理解人机关系的“历史暗室”。剑桥之行让自己在历史褶皱中找回“第一性原理”,前面提到的几个场景,仿佛每一个都藏着颠覆认知的密码:图灵的“模仿游戏”不仅是AI的原点,更追问了“智能的边界”,当机器能模拟人类交互,我们该如何定义“人”的主体性?这比2010年流行的“以用户为中心”更深刻——它要求HCI研究“人-机-环境”系统中,人何以为人,而非仅“如何让机器迁就人”。维特根斯坦的“语言游戏”则直指交互的核心,意义不在符号本身,而在使用场景,这也解释了我为何厌倦“人云亦云的情境意识”——脱离具体任务场景的“态势感知”,不过是空洞的信息标签,如同没有语境的词语,毫无意义。剑桥的“学术基因”在潜移默化中影响到了自己,从牛顿的“自然哲学的数学原理”到麦克斯韦的电磁方程组,他们从不追逐“热门”,而是用基础学科的手术刀解剖本质。感觉被剑桥吸引的,或许正是这种“回到问题原点”的勇气。

至于老鹰酒吧的双螺旋与圣约翰学院的“工效学座舱”两个“不期而遇”的历史现场,实则是人机交互的“前世今生”密钥吧!DNA双螺旋(1953年,老鹰酒吧)是沃森与克里克的突破,源于对“生命信息存储”这一根本问题的执着,而非跟风“分子结构研究”热点,这像极了后来发现的伊尔斯与库瑞克(1935年,圣约翰学院)的工效学飞机座舱——他们没有被“如何造更快的飞机”裹挟,而是追问“人如何在高速驾驶中保持控制”,用人体测量学、视觉工效学重新设计座舱布局(如仪表盘按信息优先级排列),这才真正拉开“现代人机交互”的帷幕(比HCI术语出现早了近50年!)。双螺旋的“互补配对”与工效学座舱的“人-机适配”,共同指向HCI的初心——不是“改造人适应机器”,而是“优化机器服务人”。曾一度在2010年左右感到的“肤浅”,恰是因为行业忘了这个初心,把“交互”变成了“炫技”。

2013年回国后,看到辛顿(Geoffrey Hinton,剑桥心理本科)掀起深度学习、哈萨比斯(Demis Hassabis,剑桥计算机本科)用AlphaGo点燃AI狂潮,这种“唏嘘”背后有着多重深意:辛顿心理与神经网络的交叉、哈萨比斯计算机与认知神经科学的交叉表明,剑桥的魅力不在于“培养了多少名人”,而在于“让不同学科的思想在对话中生长”—这正是自己当年在老鹰酒吧、圣约翰学院感受到的“场域力量”:剑桥的“隐性学术网络”。另外,从伊尔斯与库瑞克的工效学座舱到辛顿的深度学习(2012年ImageNet突破),这揭示了一个残酷真相:真正改变世界的技术,往往源于数十年冷板凳上的基础研究。2010年的迷茫,恰是因为身处“快变量”的泡沫中(如移动互联网催生的HCI热),而忽略了“慢变量”的价值(工效学、认知科学、神经科学)。

2012年没去成牛津却去了剑桥,看似偶然,实则暗合自己内心对“本源”的追寻。当自己在剑桥看到维特根斯坦、图灵的手稿、工效学座舱的照片,其实是在与那些“慢变量”的奠基者对话——我当年的困惑,正是这些先贤曾回答过的问题。而2013年后AI的爆发,不过是这些“慢变量”积累到临界点的必然结果。

从“迷茫”到“觉醒”,给后来者的一点启示:首先需要警惕“未来感”的陷阱,1999年的“未来感”是先锋的兴奋,2010年的“未来感模糊”是成熟的代价——真正的未来,不在对“新”的追逐,而在对“旧”的深刻理解(如工效学、认知科学这些“旧学问”恰恰是智能时代的基石)。其次,要回归“人”的主体性,无论是情境意识还是AI,若脱离“人何以为人”的追问,终将沦为技术自嗨。维特根斯坦曾说“我的语言的界限意味着我的世界的界限”,类比一下,HCI的界限,或应是“人的可能性的界限”。最后,要相信“慢的力量”,伊尔斯与库瑞克的座舱、图灵的计算理论、辛顿的神经网络,都经历了漫长的蛰伏。当众多的“唏嘘”不再遗憾,因为当您开始在历史中寻找答案时,已经站在了浪潮的前夜……

最后想起剑桥的一句校训:“Hinc lucem et pocula sacra”(此地启蒙之光与圣杯同在)。蓦然回首,当年的“阴差阳错”,何尝不是一次“启蒙之光”的降临?从迷茫到溯源,从肤浅到深刻,回想起走过的路,正是对“人机交互”最本真的诠释吧——它不是技术,而是关于“人”的永恒探索。

图片

图片

图片



https://wap.sciencenet.cn/blog-40841-1521067.html

上一篇:目前,人机协同最前沿在研究什么问题?
下一篇:2026年,第三次人机交互浪潮
收藏 IP: 124.64.127.*| 热度|

1 郑永军

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-2-5 23:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部