科学网

 找回密码
  注册
Yann LeCun 所鼓吹的「世界模型」与GPT+Diffusion有什么不同
李维 2025-6-22 02:08
Yann LeCun 所鼓吹的「世界模型」(World Model)是一種旨在模仿人類和動物學習世界運作方式的新興 AI 概念 。他認為,這條路徑不同於主流的 GPT/Diffusion 模型所依賴的大數據、大參數和自迴歸 Transformer 架構,是實現通用人工智慧(AGI)的關鍵 。 以下將從實際能力、優缺點等方面,對最新發布的 LeCun 世界模型( ...
个人分类: AI 浪潮|460 次阅读|没有评论
像素值是“连续变量”,还是工程上的伪装?
李维 2025-6-22 02:01
“视觉是连续空间的模拟信号,每个像素点就是一个连续变量。”这是很多计算机视觉教材和模型论文中默认的假设。听起来合理,似乎也和物理世界接轨。但只要稍加推敲,就会暴露出它并非科学结论,而是工程手段的一种近似表达。 我们必须首先区分几个层面: 一、在物理上,光照和颜色确实是连续信号 自然界的光波、亮度和 ...
个人分类: AI 浪潮|314 次阅读|没有评论
EMPO强化学习项目复现Claude4学习总结
李维 2025-5-27 16:44
跟 Claude 4 学 复现 EMPO 无监督强化学习笔记 📋 今日学习成果回顾🛠️ 技术栈掌握 云计算平台 : Google Cloud Platform 完整使用流程 编程环境 : Python 虚拟环境、依赖管理、包安装 深度学习框架 : PyTorch, Transformers, Accelerate 配置管理 : YAML 配置文件格式和应用 ...
个人分类: 其他杂碎|629 次阅读|没有评论
MeanFlow: AI图像生成的降维打击
李维 2025-5-22 19:15
何恺明团队最新力作,MeanFlow无需预训练、无需蒸馏,仅需 一次函数评估 (1-NFE) 即可实现SOTA性能,为高效高质量图像生成开辟新道路。 MeanFlow的核心思想是引入“平均速度场”来直接建模数据点和噪声点之间的转换路径,摆脱了传统扩散模型和流匹配方法对多步迭代的依赖。这项研究在ImageNet 256x256数据集上取得 ...
个人分类: AI 浪潮|1128 次阅读|没有评论
Review of Autoregressive and Diffusion Models for Video Gene
李维 2025-5-3 04:02
Abstract The past three years have marked an inflection point for video generation research. Two modelling families dominate current progress— Autoregressive (AR) sequence models and Diffusion Models (DMs) —while a third, increasingly influential branch explores their ...
个人分类: AI 浪潮|848 次阅读|没有评论
Unveiling the Two "Superpowers" Behind AI Video Creation
李维 2025-5-2 12:49
You've probably seen them flooding your social media feeds lately – those jaw-dropping videos created entirely by Artificial Intelligence (AI). Whether it's a stunningly realistic snowy Tokyo street scene 1 or the imaginative life story of a cyberpunk robot 1 ...
个人分类: AI 浪潮|1193 次阅读|没有评论
非量化自回归视频生成模型NOVA的技术路线
李维 2025-5-2 11:11
Your browser does not support the audio tag 最近,你一定被社交媒体上那些由人工智能(AI)创作的视频刷屏了吧?无论是“雪中的东京街景” 1 ,还是“机器人赛博朋克生活” 1 ,抑或是各种天马行空的想象,AI似乎一夜之间掌握了导演和摄像的魔法,生成的视频效果越来越逼真、流畅,甚至充满了电影感 ...
个人分类: AI 浪潮|1043 次阅读|没有评论
中文分词的前世今生
热度 2 李维 2025-3-30 12:57
-- 从“切哪儿都头疼”到“各语言一刀切” 说起自然语言处理(NLP)里的中文分词往事,真是让人感慨。曾经,“这串汉字哪儿切一刀才对”是个让学者们抓耳挠腮的大难题。如今看看大模型的处理方式,这事儿咋就这么轻松化解了呢?从“切哪儿都不对”到“各语言一刀切”,这背后的故事,值得我们聊一聊。 分词的“切刀 ...
个人分类: AI 浪潮|1155 次阅读|2 个评论 热度 2
Grok:大模型为什么要超大数据?(4o配图)
李维 2025-3-28 06:14
各位同学,想象一下这个场景:你在兴致勃勃地榨油,刚开始,新鲜原料下去,哗啦啦全是金黄的油,心里美滋滋。可榨着榨着,出来的渣子越来越多,油却越来越少。按咱们朴素的常识,这时候是不是该见好就收,别浪费原料了? 然而,到了人工智能语言模型(LLM)这片神奇的土地,剧情发生了一百八十度大转弯!数据量从1亿token ...
个人分类: AI 浪潮|967 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-7-1 06:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部