8884361 / SakuraLLM-Notebooks Public

forked from Isotr0py/SakuraLLM-Notebooks

Notifications You must be signed in to change notification settings
Fork 0
Star 0

Notebooks to run SakuraLLM on colab/kaggle

0 stars 6 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
README.md		README.md
Sakura-13B-Galgame-Colab.ipynb		Sakura-13B-Galgame-Colab.ipynb
Sakura-13B-Galgame-Kaggle-ChatGPTQ.ipynb		Sakura-13B-Galgame-Kaggle-ChatGPTQ.ipynb
Sakura-13B-Galgame-Kaggle-llama.cpp.ipynb		Sakura-13B-Galgame-Kaggle-llama.cpp.ipynb
Sakura-13B-Galgame-Kaggle-ollama.ipynb		Sakura-13B-Galgame-Kaggle-ollama.ipynb

Repository files navigation

SakuraLLM-Notebooks

介绍

在colab/kaggle上运行Sakura-13B-Galgame模型

部署教程

如果是初次接触kaggle/ngrok，请参考Sakura-13B-Galgame的kaggle部署教程进行部署

News

2024-03-09: 新增 ollama 后端 Notebook
2024-02-07: 新增 llama-cpp-python prebuilt wheels
2024-01-11: 更新 Kaggle-llama.cpp 模型版本至 Sakura-13B-LNovel-v0.9
2024-01-01: 新增 localtunnel 内网穿透工具（无需注册），ngrokToken 留空即可启用 localtunnel

模型运行情况

transformers autogptq模型（使用v0.8版本进行测试）

模型量化类型	colab (T4)	kaggle (T4×2)
全量	❌	❌
8bit	❌	✔
4bit	✔	✔
3bit	✔	✔

llama.cpp GGUF模型（使用v0.9版本进行测试）

模型量化类型	colab (T4)	kaggle (T4×2)
fp16	❌	❌
Q8_0	❌	✔
Q6_K	❌	✔
Q5_K_M	✔	✔
Q4_K_M	✔	✔
Q3_K_M	✔	✔
Q2_K	✔	✔

致谢

SakuraLLM/Sakura-13B-Galgame

About

Notebooks to run SakuraLLM on colab/kaggle

Report repository

Releases

Packages

No packages published

Languages

Jupyter Notebook 100.0%