话说,我也有这个想法
目前试过gemma qwen llama
这东西部署消耗CPU与内存,微调耗GPU。想过用趋动云这类花钱训练大模型,但问题是微调的数据集数据不够
没什么简介?时而整整软件时而玩玩硬件......有时玩玩火箭。 有一个个人博客:https://zbsgr.chat (访问时温柔点,服务器挺不住)
1. 公式行内显示(inline):请使用 $....$ 或 \(....\) 包裹代码
2. 公式独占一行显示(display):请使用 $$....$$ 或 \[....\] 包裹代码
3. 插入的公式在编辑时不会渲染,请检查无误后再插入。