作业帮发布自研“银河大模型”，将落地智能硬件、教育数字化等场景

文章正文

发布时间：2023-09-03 21:17

图源：作业帮

芥末堆文根据作业帮微信公众号消息，9 月 2 日，作业帮正式发布自研 " 银河大模型 "，同时公布了银河大模型在 C-Eval、CMMLU 两大权威大语言模型评测基准的成绩。

今年 6 月，有消息称作业帮正在内测基于中国市场的教育大模型，包含多学科解题、中英文作文批改、多语言对话方向等多个教育应用场景，涉及工具类 App、智能硬件、图书等业务。该项目由 CTO 罗亮牵头进行底层研发支持及 AIGC 大方向建设，研发经费优先调拨。同时，除了组织架构调整，作业帮产研团队中近百人也已并入 GPT 相关项目，估计有两百人以上的团队规模。

据悉，银河大模型是一款专为教育领域打造的覆盖多学科、多学段、多场景的教育大模型，具备智能解题、知识问答、中英文写作及 AI 伴学等方面的能力。

作业帮数据显示，作业帮银河大模型以平均分 73.7 分位居 C-Eval 榜首；同时在 CMMLU 榜单 Five-shot 和 Zero-shot 测评中分别以平均分 74.03 分及 73.85 分位列第一，成为首个同时在上述两大权威榜单平均分排名第一的教育大模型。

据介绍，C-Eval 是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集，包含 13948 道多项选择题，涵盖 52 个不同学科和四个难度级别。CMMLU 榜单则由 MBZUAI、上海交通大学、微软亚洲研究院共同推出。

图源：作业帮

作业帮表示，作业帮银河大模型即将在作业帮 APP 等学习工具、智能硬件、智能图书、教育数字化等业务场景中实现应用，同时将持续优化银河大模型性能与多模态能力，加速推进在更多教育场景的落地实践。

标签