你手上的显卡能跑Llama 2等大模型吗? 用这个开源的项目测测看
2023-10-25 03:40:56 老林 【 字体:大 中 小 】举报
{ "Total": 4000, "KV Cache": 1000, "Model Size": 2000, "Activation Memory": 500, "Grad & Optimizer memory": 0, "cuda + other overhead": 500 }至于为什么要做这个项目,作者 Rahul Shiv Chand 表示,有以下原因:
- 在GPU上运行 LLM 时,应该采用什么的量化方法来适应模型;
- GPU 可以处理的最大上下文长度是多少;
- 什么样的微调方法比较适合自己? Full? LoRA? 还是 QLoRA?
- 微调期间,可以使用的最大 batch 是多少;
- 到底是哪项任务在消耗GPU内存,该如何调整,进而让LLM适应GPU。
猜你喜欢
ChatGPT文生图提示词新玩法:「make it more」
电脑上sata接口和m.2接口的硬盘有什么区别?
浏览器一直提示“当前网页正在试图打开您的受信任的站点列表中的站点”怎么取消提示?
n卡官网怎么下载驱动程序?应该下载哪一个?
电脑能开机但是进不了系统怎么办?
AMD显卡测试版驱动在哪里下载?AFMF插帧要怎么开?
AMD显卡的ROCm加速Stable Diffusion AI计算绘图等相关问题
电脑装机是选择水冷还是风冷散热器?水冷真的是从入门到理赔?
AMD锐龙cpu使用win11、win10系统时不时出现撕裂、爆音、卡顿怎么解决?
机械键盘如何选择?和普通键盘有什么区别?轴体有什么区别?
联发科携手ARM发布天玑9400处理器:技术特色、性能对比及市场前景全面解析
天玑9300+处理器亮相!联发科技再次引领移动芯片领域,性能惊人,业内热议
华为与苹果巅峰对决:5月7日新品发布会预告揭晓,MateBook、MatePad、iPadPro等齐登场
OPPO即将发布全新旗舰机型OPPOReno12Pro,搭载天玑9200处理器和实时照片功能
OPPO FindX7Ultra卫星版手机:16GB+512GB存储,双模卫星电话与摄影功能全面提升
iQOO Z9 Turbo:突显卓越性能,尽享游戏乐趣的旗舰智能手机预售活动深度剖析
RedmiK60至尊版荣获高度好评,用户期待下一代至尊版机型的大容量电池升级
一方不签字就永远不能离婚吗(一方不肯签名离婚怎么处理)
离婚后同居犯法吗(离婚后同居算不算非法同居)
冷静期出轨算婚内出轨吗(冷静期出轨算婚内出轨吗)