LIC2023大语言模型评估 本次竞赛希望参赛者能够从自身对LLM的理解出发,设计独特新颖的评估体系,对大语言模型的底层能力(如记忆、推理、常识理解等)或专项能力(如文本创作、知识问答、代码生成等)进行系统性、可量化的评估,深入考察模型的能力的同时提升业界对于LLM的理解。 本人利用国考、事业单位联考、省考等行测题目作为数据集,对文心一言大模型能力进行了相关评估,结果在论文和评估报告部分。 欢迎大家交流