Skip to content

Latest commit

 

History

History
27 lines (19 loc) · 1.04 KB

README.md

File metadata and controls

27 lines (19 loc) · 1.04 KB

ucllm_nedo_dev

以下、Geniac LLM開発案件におけるLLM開発コード・手順の標準化です。
利用しても利用しなくても構いません。ご自由にお使いください。
ただし「LLM評価手順」は必ず利用してください(開発したLLMのランキングに使うため)。

ジョブシステム利用手順

サーバにログインしてジョブシステムを利用する手順です。
こちら(工事中)

データ収集加工手順

LLM学習用データを収集加工する手順です。
mC4(Japanese)のダウンロード、一連の加工処理を含みます。
こちら

LLM学習手順

LLM学習手順です。
トークナイザー学習、事前学習、事後学習(ファインチューニング)を含みます。
こちら

LLM評価手順

LLM評価手順です。
本企画の評価指標であるNejumi Leaderboard Neoにおける評価手順となります。
こちら