从 YdrMaster/llama2.rs 发展来的手写 transformer 模型项目。
推荐测试模型:TinyLlama-1.1B-Chat。
下文所述“模型目录”,需要至少包含下列 3 个文件:
config.json: 模型配置文件;model.safetesnors: 模型参数文件;tokenizer.model/vocab.txt: 分词器词表;
cargo cast --model <model> --dt <date_type>
用于转换参数类型以加速模型加载。
参数:
-
model: 模型目录;生成的模型会存放在
model同级目录下,并添加_<date_type>后缀。 -
date_type: 参数类型,可为f32/f16/bf16;
cargo chat --model <model>
必要参数:
-
model: 模型目录;目前仅支持
f16精度,必须先转换模型;
其他参数参见 cargo chat --help。
cargo generate --model <model> --prompt <prompt>
必要参数:
-
model: 模型目录;目前仅支持
f16精度,必须先转换模型。 -
prompt: 生成文本的开头;
其他参数参见 cargo generate --help。