大型语言模型的局限性:HTML标签与顶级域名匹配测试

2025-09-21
大型语言模型的局限性:HTML标签与顶级域名匹配测试

作者测试了三个大型语言模型(LLM)识别HTML5元素与顶级域名(TLD)之间匹配的能力。结果显示,这些模型的表现参差不齐,有的遗漏了大量匹配项,有的则产生了错误的匹配,甚至出现了完全不相关的结果。这表明,即使是看似简单的任务,LLM也可能出现显著的错误,其准确性取决于用户对领域的熟悉程度。

AI