|
一。本周完成的工作
精读论文《Compressing Large Language Models by Joint Sparsification and Quantization》
运行调试FBQuant代码,现能正常运行训练,但是占用显存过大,且原代码未开源降低显存占用的办法
二。下周工作计划
继续修改FBQuant的代码
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-10-15 07:28
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社