炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
日前,苹果研究团队发布了一项新研究,对当前大语言模型(LLMs)的能力提出了质疑。研究指出,尽管LLMs引入了复杂的自我反思机制,但仍存在根本性限制,无法在超过一定复杂度阈值的问题中表现出可泛化的推理能力。研究发现,LLMs在不同复杂度问题中的表现存在明显分界:在低复杂度问题中标准LLMs表现优于逻辑推理模型(LRMs),在中等复杂度问题中LRMs占优,而在高复杂度问题中两者均表现失败。此外,LLMs在执行精确计算方面也有局限性,甚至在简单问题上也会出现“过度思考”的低效行为。纽约大学教授Gary Marcus认为,LLMs无法替代精心设计的传统算法,且通往通用人工智能(AGI)的道路并不现实。苹果的这项研究进一步证实了LLMs在结构性问题上的不可靠性,例如在解决汉诺塔问题时表现不佳,即使直接给出标准算法,模型也无法正确执行。这表明,尽管LLMs在某些领域有其用途,但它们并非通往真正智能的万能钥匙。