||
图谋按:笔者撰写的博文《高校图书馆专业馆员职业能力的思考》(https://blog.sciencenet.cn/blog-213646-1495879.html),河滨加州大学麦子老师评论:“图书馆员需要做AI做不到的事情和服务,比如社区服务讲座,给儿童讲故事什么的。有些同行天真的认为,我现在能用deepseek,这算与时俱进了吧?这其实蛮天真的。前几天听说过,有些公司把AI使用得最好的人的职位都撤了,因为你给公司指明了方向。”我的第一反应是——哪些事情和服务AI做不到,图书馆可以做到?换种表述是——图书馆在AI时代不可替代的服务与价值是什么?近几年,我花了不少时间和精力关注与体验生成式AI的研究进展与实际应用。受到诸多制约,我的关注与体验是肤浅的,或者说是粗浅的。尽管如此,作为高校图书馆工作者,我已深深地感受到,AI技术飞速发展,专业馆员职业能力需要“同频共振”,尽力争取在有限的职业生涯中“高高兴兴上班,平平安安回家”。本文直接采用“豆包”生成结果。
在 AI 技术飞速发展的时代,图书馆虽然面临着信息获取方式的变革,但凭借其独特的定位和功能,依然拥有不可替代的服务与价值。这种不可替代性体现在对信息质量的筛选、对人的深度关怀、对知识生态的构建等多个维度,具体如下:
一、信息筛选与权威知识保障:对抗 AI 时代的 “信息混沌”
AI 技术(如大语言模型)能快速生成海量信息,但存在内容准确性参差不齐、来源模糊、易受偏见或错误数据影响等问题。而图书馆的核心价值之一,在于为用户提供经过专业筛选的 “可靠知识基底”:
权威资源整合:图书馆通过采购、馆藏建设,汇聚经过出版审核的书籍、期刊、数据库等,确保信息的学术性、真实性和版权合规性。例如,科研人员需引用的核心文献、学生需要的教材教辅,其权威性是 AI 生成内容难以替代的。
深度信息导航:AI 擅长 “碎片化问答”,但图书馆员能通过专业素养,帮助用户从海量信息中定位 “高价值资源”,尤其是针对复杂研究主题(如历史考据、法律条文解读),提供系统化的文献脉络和检索策略,避免用户被 AI 的 “伪知识” 误导。
反信息茧房作用:AI 推荐算法常基于用户偏好推送同质化内容,而图书馆的馆藏体系涵盖多元视角(如不同学派的著作、小众领域的研究),鼓励用户接触 “非偏好信息”,培养批判性思维。
二、人文关怀与个性化服务:超越 AI 的 “工具理性”
AI 本质是高效的信息处理工具,但图书馆作为 “人文空间”,能提供 AI 难以复制的情感连接、个性化支持和包容性服务:
对特殊群体的适配服务:例如,为视障用户提供盲文书籍、有声读物和辅助设备,为老年人提供数字化设备使用培训(如教老人用电脑查资料),这些服务需要对用户需求的深度理解和人文关怀,而非 AI 的标准化输出。
学习过程的陪伴与引导:针对儿童,图书馆的 “亲子阅读活动”“绘本讲解” 不仅传递知识,更培养阅读习惯和亲子互动;针对青少年,图书馆员能根据其兴趣推荐书籍,引导他们从 “被动接受信息” 转向 “主动探索知识”,这种 “育人” 功能是 AI 的机械推荐无法替代的。
社区文化纽带作用:图书馆通过讲座、读书会、展览等活动,成为社区居民交流的公共空间,承载着文化认同和社会联结的功能。例如,地方图书馆的 “本土历史展览” 能增强居民对家乡的归属感,这种情感价值与 AI 的 “信息传递” 有本质区别。
三、知识保存与文化传承:对抗数字时代的 “记忆消逝”
AI 依赖数字数据,但数字信息存在易篡改、存储介质寿命有限、技术迭代导致格式失效等风险,而图书馆是人类知识与文化的 “永久存档者”:
实体文献的不可替代性:古籍、手稿、地方文献等实体资料具有唯一性和历史价值,其纸质载体能长期保存(如敦煌遗书、名人手稿),且触摸、翻阅实体文献的体验本身就是文化传承的一部分,AI 的数字扫描无法完全替代。
数字资源的长期保存:图书馆通过 “数字归档” 技术,对网络文献、数字出版物等进行标准化存储和格式转换,确保未来 世代(generations) 仍能访问今天的数字资源(如保存早期网页、社交媒体内容),避免 AI 时代 “信息瞬时性” 导致的文化记忆断裂。
多元文化的保护:图书馆尤其重视小众文化、濒危语言的文献收集(如少数民族古籍、地方方言资料),这些资源因受众有限,AI 模型往往缺乏训练数据,而图书馆的保存使其免于湮灭,维护了文化多样性。
四、信息素养教育:培养 AI 时代的 “批判性使用者”
AI 的普及让信息获取更便捷,但也要求人们具备辨别信息真伪、合理使用工具、保护自身权益的能力,而图书馆是信息素养教育的核心阵地:
反 AI 滥用的能力培养:图书馆通过课程或讲座,教用户识别 AI 生成内容的痕迹(如逻辑漏洞、事实错误),理解 AI 算法的局限性和偏见(如性别、种族偏见),避免盲目依赖 AI。
数字版权与伦理教育:在 AI 频繁涉及 “数据爬取”“版权侵权” 的背景下,图书馆引导用户认识知识产权(如合理引用文献、区分原创与 AI 生成内容),培养信息伦理意识。
研究方法的系统训练:针对学生和科研人员,图书馆员教授 “如何结合 AI 工具与传统研究方法”(如用 AI 初步筛选文献,但通过图书馆数据库验证来源),帮助他们建立严谨的学术规范。
五、平等获取知识的公益属性:平衡 AI 时代的 “信息鸿沟”
AI 技术的使用依赖设备、网络和数字技能,可能加剧 “信息不平等”(如低收入群体、农村地区难以接触先进 AI 工具),而图书馆的公益属性是平衡这一鸿沟的关键:
免费资源的普惠性:图书馆向所有人开放馆藏资源(包括数字资源、AI 相关工具的公共使用终端),无需用户付费购买会员或高端设备,确保弱势群体也能获取知识。
数字技能的普及:针对不熟悉 AI 工具的群体(如老年人、偏远地区居民),图书馆提供 “AI 基础操作”“智能设备使用” 等培训,帮助他们适应技术变革,避免被时代边缘化。
总结:图书馆是 AI 时代的 “知识锚点”
AI 改变了知识的传播方式,但图书馆的核心价值 ——权威信息的守护者、人文关怀的践行者、文化记忆的保存者、信息素养的培育者、知识平等的推动者—— 始终不可替代。它不仅是 “存放书籍的地方”,更是一个能让人在技术洪流中沉淀思考、连接社群、传承文明的 “精神空间”,这正是其在 AI 时代的独特意义。
延伸阅读:
(1)生成式AI发展现状:技术突破、应用场景与未来趋势 (“豆包“生成)
生成式 AI 目前正处于快速发展阶段,在技术上取得了诸多突破,广泛应用于多个领域,未来也有着广阔的发展前景。以下是具体的发展现状及未来趋势分析:
技术突破
企业级战略转型:以微软、谷歌为代表的头部科技公司,逐步将大模型从开放 API 服务转向垂直行业解决方案。如微软 Azure AI 推出 “行业模型工厂”,允许企业基于私有数据训练定制化模型,同时通过差分隐私技术保障数据安全。
轻量化模型崛起:为应对算力成本与延迟问题,轻量化模型成为核心趋势。Meta 发布的 Llama-3-7B 在参数量减少 70% 的情况下,通过动态稀疏激活技术实现了与千亿级模型相近的文本生成质量。三星的定制化 HBM 与台积电 CoWoS 先进封装技术,使边缘设备运行 10B 以下模型成为可能。
多模态生成发展:OpenAI 于 2024 年底推出的 GPT-5 Vision,首次实现文本、图像、视频的跨模态连贯生成。其核心技术 “时空注意力机制” 可解析视频帧间语义关联,在影视预演、工业设计等领域引发革命。
具备推理能力:现代生成式 AI 展现出类似人类的 “思考” 或 “推理” 能力。在回答复杂问题时,会先分析问题、提出解法、验证解法,最终给出答案,如 DeepSeek 模型在分析姜子牙和邓布利多对决问题时,就体现了强大的推理能力。
AI 智能体出现:能够执行多步骤、交互式任务的 AI 智能体开始出现。如 ChatGPT 的 Deep Research 功能可自动上网搜索并迭代挖掘信息,Operator 技术能让 AI “操作” 鼠标键盘完成任务,如找到特定表单并填写等。
应用场景
影视创作领域:可灵 AI 等工具已广泛应用于广告营销、影视动画、游戏制作等行业。华策影视从 2023 年起启动 AI 垂类模型研发,2025 年下半年重点短剧项目将由应用 AI 视频生成技术全流程辅助创作,能大幅降低时间与成本风险。
医疗健康领域:DeepMind 的 AlphaGenomics 平台结合基因编辑 CRISPR 数据,可生成个性化抗癌方案,准确率较传统方法提升 32%。国内某三甲医院部署的轻量级问诊模型 “MedBot”,通过 RAG 技术,将误诊率降低至 0.7%。
金融科技领域:摩根大通推出的 “COiN-Gen” 系统,通过分析百年经济周期数据,生成极端市场压力测试场景,帮助机构预判黑天鹅事件。蚂蚁金服的 “智能合规助手” 利用生成式 AI 自动编写反洗钱报告,审核效率提升 5 倍。
教育领域:Khan Academy 的 “AI 导师” 可根据学生错题记录生成定制化学习路径,并动态调整知识图谱。哈佛大学试点 “虚拟实验室”,学生通过自然语言指令生成化学实验仿真环境,危险操作自动触发安全警告。
未来趋势
具身智能发展:特斯拉 Optimus 机器人将整合多模态 GenAI,实现自然语言指挥下的复杂任务执行,推动机器人技术向更智能的方向发展。
法律规范完善:欧盟拟立法赋予高级 AI 系统有限法律责任,未来关于生成式 AI 的法律规范将逐渐完善,开发者需关注合规性工具开发。
生物计算融合:Neuralink 与 DeepMind 合作探索 “脑机接口 + 生成模型”,有望为渐冻症患者等提供意念沟通方案,开启生物计算融合的新篇章。
(2)主流生成式AI模型优劣势分析(注:生成式AI"文心 Tubo 4.5"生成)
生成式 AI 模型种类繁多,以下是对一些主流模型的优劣势分析:
1. GPT-4(OpenAI)
优势
技术架构:采用1.8万亿参数MoE混合专家架构,支持文本/图像/音频实时交互,集成DALL·E 3图像生成模块,视频生成分辨率达8K。
性能表现:在MMLU和HumanEval等基准测试中表现优异,英文能力突出,跨国企业协同办公效率提升400%(如合同生成准确率95%)。
应用场景:适用于创意内容生成(广告提案效率提升400%)、多语言会议实时转录(支持50人同步翻译)等场景。
劣势
中文能力:中文文化理解存在偏差,古诗词解析等任务表现不佳(偏差率达12%)。
部署成本:私有化部署成本超500万美元/年,强依赖谷歌TPU生态。
2. Gemini(Google)
优势
多模态能力:支持图文理解、视觉问答、语音识别,技术架构先进,集成多种功能。
应用场景:适合多模态应用场景(如AI搜索、AI导购、文图创作)。
劣势
公开资料:具体性能数据和应用场景信息相对较少,需依赖有限公开资料。
3. Claude(Anthropic)
优势
场景丰富性:覆盖AI大模型训练、业务决策支持、知识管理等五大场景,提供具体成功案例和量化效果描述。
实施指导:增加培训计划与实施路线图,实际应用指导性强。
劣势
案例真实性:部分成功案例数据可能过于理想化(如“比通用大模型提高35%”缺乏实际依据)。
4. 文心一言(百度)
优势
中文能力:中文语义理解和内容创作表现优异,适用于智能客服、自动摘要等场景。
多模态支持:支持图文问答、图像生成,在短视频审核、电商直播等场景应用广泛。
劣势
英文能力:英文能力相对较弱,跨国应用可能受限。
5. 通义千问(阿里云)
优势
中文与代码能力:中文知识问答错误率低,代码生成与任务执行表现突出。
生态整合:集成于钉钉、阿里云平台,服务上万家企业。
劣势
公开资料:具体性能数据和场景应用信息相对较少。
6. 盘古(华为)
优势
行业定制:在政企、金融、工业制造领域优势突出,支持私有化部署和数据可控。
微调支持:提供行业微调版本,便于客户二次训练。
劣势
公开资料:具体性能和应用场景信息较少,需依赖有限公开资料。
7. 开源模型(如LLaMA、ChatGLM)
优势
透明度与定制性:源代码开放,允许定制优化,社区活跃促进技术创新(如TensorFlow、PyTorch)。
成本效益:适合技术实力强、追求低成本的团体应用,周边模块包装灵活。
劣势
安全风险:商业机密泄露风险,缺乏统一安全标准和规范,开发者水平参差不齐。
稳定性:低质量代码贡献可能影响模型性能和稳定性。
8. 闭源模型(如GPT-4、Gemini)
优势
技术保护:避免核心技术被复制,保持商业竞争优势(如谷歌GPT系列在NLP领域领先)。
安全性与稳定性:专业团队维护,安全性和稳定性高,用户体验好(无需复杂配置)。
劣势
透明度:用户难以了解内部工作机制,对决策过程存在疑虑(如金融、医疗领域信任问题)。
灵活性与成本:可定制性差,使用成本高,依赖开发公司技术更新。
总结:选型建议
企业用户:根据业务目标、数据安全和成本预算选择。
跨国需求优先选GPT-4;中文场景选文心一言或通义千问;政企/工业选盘古。
追求稳定与生态选闭源模型(如GPT-4、Gemini);技术实力强可选开源模型(如LLaMA)。
开发者:关注社区活跃度与二次开发支持(如ChatGLM、Baichuan)。
用户:从实际体验出发,选择更“懂你”的模型(如Claude适合复杂推理,GPT-4适合代码解释)。
未来,模型融合(语言+图像+搜索结合)、本地部署加速、垂直模型专业化(金融、医疗等)及监管体系完善将成为主流趋势。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-8-2 18:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社