科学网—liwei999的博文

Yann LeCun 所鼓吹的「世界模型」与GPT+Diffusion有什么不同

李维 2025-6-22 02:08

Yann LeCun 所鼓吹的「世界模型」（World Model）是一種旨在模仿人類和動物學習世界運作方式的新興 AI 概念。他認為，這條路徑不同於主流的 GPT/Diffusion 模型所依賴的大數據、大參數和自迴歸 Transformer 架構，是實現通用人工智慧（AGI）的關鍵。以下將從實際能力、優缺點等方面，對最新發布的 LeCun 世界模型（ ...

个人分类: AI 浪潮|460 次阅读|没有评论

像素值是“连续变量”，还是工程上的伪装？

李维 2025-6-22 02:01

“视觉是连续空间的模拟信号，每个像素点就是一个连续变量。”这是很多计算机视觉教材和模型论文中默认的假设。听起来合理，似乎也和物理世界接轨。但只要稍加推敲，就会暴露出它并非科学结论，而是工程手段的一种近似表达。我们必须首先区分几个层面：一、在物理上，光照和颜色确实是连续信号自然界的光波、亮度和 ...

个人分类: AI 浪潮|314 次阅读|没有评论

EMPO强化学习项目复现Claude4学习总结

李维 2025-5-27 16:44

跟 Claude 4 学复现 EMPO 无监督强化学习笔记 📋 今日学习成果回顾🛠️ 技术栈掌握云计算平台 : Google Cloud Platform 完整使用流程编程环境 : Python 虚拟环境、依赖管理、包安装深度学习框架 : PyTorch, Transformers, Accelerate 配置管理 : YAML 配置文件格式和应用 ...

个人分类: 其他杂碎|629 次阅读|没有评论

MeanFlow: AI图像生成的降维打击

李维 2025-5-22 19:15

何恺明团队最新力作，MeanFlow无需预训练、无需蒸馏，仅需一次函数评估 (1-NFE) 即可实现SOTA性能，为高效高质量图像生成开辟新道路。 MeanFlow的核心思想是引入“平均速度场”来直接建模数据点和噪声点之间的转换路径，摆脱了传统扩散模型和流匹配方法对多步迭代的依赖。这项研究在ImageNet 256x256数据集上取得 ...

个人分类: AI 浪潮|1128 次阅读|没有评论

Review of Autoregressive and Diffusion Models for Video Gene

李维 2025-5-3 04:02

Abstract The past three years have marked an inflection point for video generation research. Two modelling families dominate current progress— Autoregressive (AR) sequence models and Diffusion Models (DMs) —while a third, increasingly influential branch explores their ...

个人分类: AI 浪潮|848 次阅读|没有评论

Unveiling the Two "Superpowers" Behind AI Video Creation

李维 2025-5-2 12:49

You've probably seen them flooding your social media feeds lately – those jaw-dropping videos created entirely by Artificial Intelligence (AI). Whether it's a stunningly realistic snowy Tokyo street scene 1 or the imaginative life story of a cyberpunk robot 1 ...

个人分类: AI 浪潮|1193 次阅读|没有评论

非量化自回归视频生成模型NOVA的技术路线

李维 2025-5-2 11:11

Your browser does not support the audio tag 最近，你一定被社交媒体上那些由人工智能（AI）创作的视频刷屏了吧？无论是“雪中的东京街景” 1 ，还是“机器人赛博朋克生活” 1 ，抑或是各种天马行空的想象，AI似乎一夜之间掌握了导演和摄像的魔法，生成的视频效果越来越逼真、流畅，甚至充满了电影感 ...

个人分类: AI 浪潮|1043 次阅读|没有评论

中文分词的前世今生

热度 2 李维 2025-3-30 12:57

-- 从“切哪儿都头疼”到“各语言一刀切” 说起自然语言处理（NLP）里的中文分词往事，真是让人感慨。曾经，“这串汉字哪儿切一刀才对”是个让学者们抓耳挠腮的大难题。如今看看大模型的处理方式，这事儿咋就这么轻松化解了呢？从“切哪儿都不对”到“各语言一刀切”，这背后的故事，值得我们聊一聊。分词的“切刀 ...

个人分类: AI 浪潮|1155 次阅读|2 个评论热度 2

Grok：大模型为什么要超大数据？（4o配图）

李维 2025-3-28 06:14

各位同学，想象一下这个场景：你在兴致勃勃地榨油，刚开始，新鲜原料下去，哗啦啦全是金黄的油，心里美滋滋。可榨着榨着，出来的渣子越来越多，油却越来越少。按咱们朴素的常识，这时候是不是该见好就收，别浪费原料了？然而，到了人工智能语言模型（LLM）这片神奇的土地，剧情发生了一百八十度大转弯！数据量从1亿token ...

个人分类: AI 浪潮|967 次阅读|没有评论

帐号		自动登录	找回密码
密码			注册

关闭 安全验证

liwei999

关闭安全验证