大型语言模型的局限性：HTML标签与顶级域名匹配测试

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

2025-09-21

作者测试了三个大型语言模型（LLM）识别HTML5元素与顶级域名（TLD）之间匹配的能力。结果显示，这些模型的表现参差不齐，有的遗漏了大量匹配项，有的则产生了错误的匹配，甚至出现了完全不相关的结果。这表明，即使是看似简单的任务，LLM也可能出现显著的错误，其准确性取决于用户对领域的熟悉程度。

(shkspr.mobi)