算术能力成为GPT-4模型的短板,新加坡研究团队推出具备高准确度的Goat模型
【本站】6月7日消息,新加坡国立大学的研究者最近推出了一种名为Goat的模型,专门用于解决算术问题。该模型的推出被认为是针对当下GPT-4模型在算术能力方面存在的短板,因为GPT-4在逻辑推理能力方面尚待提升,无法正确解答许多人认为相对简单的计算问题。
研究人员通过一种新的方法,将算术问题根据可学习性进行分类,并利用基本算术原理将不可学习的任务分解为一系列可以学习的任务。这种分解过程将复杂的计算过程拆解成简单的步骤,让模型能够学习答题模式,并将过程泛化为看不见的数据,而非仅仅依靠权重记忆计算。这种新方法的应用使得Goat模型能够在算术性能方面取得显著提高,尤其在零样本学习中展现出近乎完美的精度,特别是在大数加法和减法生成答案的领域。
研究人员在24GB显存的GPU上进行了Goat模型的训练,并使用BIG-bench算术子任务对其进行了测试。结果显示,Goat模型在准确率方面表现出色,超过了业内的Bloom、GPT-NeoX、OPT等模型。尤其是Goat-7B模型在零样本学习中的准确率甚至一度超过了经过少样本学习后的PaLM-540模型,在大数计算方面更是远远超过了GPT-4。 新加坡国立大学研究者的这一成果对于改进自然语言处理模型在算术问题上的表现具有重要意义。通过将任务分解为可学习的部分,并利用基本算术原理来指导模型学习,Goat模型实现了较高的准确度和性能。未来,这一方法可能会被应用于其他领域的问题求解,为人工智能技术的发展带来更多可能性。 |