ChatGLM
AI大模型
ChatGLM

智谱 AI 公司于2023训练的语言模型

ChatGLM 是智谱 AI 公司(chatglm.cn)开发的一款语言模型,它是基于 GLM-130B 模型的中英双语对话模型,具备问答、多轮对话、代码生成功能。ChatGLM-6B 版本是一个开源的双语对话模型,含有 62 亿参数,能够处理对话聊天、智能问答等多种自然语言任务,并且支持在单张消费级显卡上推理使用。

智谱 AI 与清华大学 KEG 实验室合作研发了这款模型,并在内容创作、文本理解、信息抽取等任务上表现突出。它经过海量中英标识符的预训练与人类偏好对齐训练,相比一代模型在 MMLU、C-Eval、GSM8K 分别取得了显著的提升,并在中文任务榜单 C-Eval 上取得了优异成绩。

相关导航

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注