核手提箱 海洋云增白 可扩展服务 policy 颈挂空调 计算机硬件 极端主义 PostgreSQL AI工具 儿童读物 化学 即时消息 代码审查 反向工程 KDE 数据安全 效率工具 超级计算机 植物学 分析化学 插图 Three.js 泄露 大会 残疾人学校 初创 Verizon 海水淡化 加速器项目 更多

StructLM: 构建用于结构化知识基础的通用模型 (arxiv.org)

大型语言模型 (LLM) 在处理结构化数据方面能力不足,例如,ChatGPT 在结构化知识基础 (SKG) 方面的表现落后于最先进 (SoTA) 模型平均 35%。为了增强 LLM 的 SKG 能力,研究人员开发了一个包含 110 万个示例的指令调整数据集,并基于 Mistral 和 CodeLlama 模型系列训练了一系列名为 StructLM 的模型,参数范围从 70 亿到 340 亿不等。StructLM 系列在 18 个评估数据集中有 16 个超过了特定任务模型,并在 8 个 SKG 任务上建立了新的 SoTA 性能。