科学网-个人中心

李维

访问数：19512905

教育情况：Simon Fraser University，博士

研究领域：信息科学

加为好友

发送消息

全部博文

Yann LeCun 所鼓吹的「世界模型」与GPT+Diffusion有什么不同

Yann LeCun 所鼓吹的「世界模型」（World Model）是一種旨在模仿人類和動物學習世界運作方式的新興 AI 概念。他認為，這條路徑不同於主流的 GPT/Diffusion 模型所依賴的大數據、大參數和自迴歸 Transformer 架構，是實現通用人工智慧（AGI）的關鍵。以下將從實際能力、優缺點等方面，對最新發布的 LeCun 世界模型（ ...

2025-6-22 02:08

像素值是“连续变量”，还是工程上的伪装？

“视觉是连续空间的模拟信号，每个像素点就是一个连续变量。”这是很多计算机视觉教材和模型论文中默认的假设。听起来合理，似乎也和物理世界接轨。但只要稍加推敲，就会暴露出它并非科学结论，而是工程手段的一种近似表达。我们必须首先区分几个层面：一、在物理上，光照和颜色确实是连续信号自然界的光波、亮度和 ...

2025-6-22 02:01

父亲节：老爸

老爸出身于一个破落的知识分子家庭。那座承载着岁月沧桑的青瓦老宅，宛如一位沉默的老人，见证着家族的兴衰荣辱。墙皮早已剥落，露出内里斑驳的砖石，每一道裂痕都像是岁月刻下的皱纹，又仿佛是他布满补丁的童年写照。因交不起学费，他从未踏入过小学的校门，爷爷用废旧报纸装订的课本，成了他最初的启蒙老师。在昏 ...

2025-6-22 02:00

老爸的四则小故事

1 ．大年三十的急诊有一年春节，我回老家陪老爸过年。除夕夜，暖黄色的灯光洒在房间里，一家人围坐在电视机前，春晚的欢声笑语和瓜子嗑开的脆响交织在一起，营造出浓浓的年味。老爸斜靠在那张老藤椅上，保温杯里的枸杞随着他偶尔的晃动轻轻沉浮，这是他一年中难得的清闲时刻。然而，十一点的钟声还未敲响，茶几上 ...

2025-6-22 01:58

从0实现并理解GPT

立委按：鉴于语言大模型GPT的重要性，特此根据AI大神Karpathy的nanoGPT讲座，编纂此科普系列。你可能已经听说过GPT（Generative Pre-trained Transformer）的鼎鼎大名，无论是能与你流畅对话的ChatGPT，还是能帮你写代码、写诗歌的AI助手，它们背后都有GPT的强大身影。但是，这个神奇的“黑箱”究竟是如何运作的呢 ...

2025-6-4 00:43

大模型科普：探秘莎翁风格的诞生之旅（无代码版）

立委按：鉴于语言大模型GPT的重要性，特此根据AI大神Karpathy的nanoGPT讲座，编纂此科普系列，计五篇，其中此篇没有代码和数学公式，是最通俗的科普。其他四篇包括一篇英文，均附带可验证的Python代码，并给予不同角度的详细解说，面对有工程背景的对象。 ChatGPT这样的大语言模型在今天已展现出惊人的能力：它们能与 ...

2025-6-3 15:32

LLM的后训练强化学习是怎么工作的

立委按：LLM的强化学习后训练是当前热点，也是最新思维链（CoT）推理模型范式的红利期。推理强化后的模型在复杂任务的表现上普遍性能提升。强化后训练的新范式正在不断推广到不同场景，而且也在多模态方面取得进展。应该是了解一点强化学习的基本工作流程的时候了。一、训练阶段：延迟奖励如何影响参数更新 1.1 生成一个完 ...

2025-6-2 10:26

《镜子大全》《朝华午拾》