AI长期任务能力研究:Opus 4.5展现4小时49分钟处理极限
本文探讨了AI系统完成长期任务能力的测量方法,并展示了Opus 4.5系统的性能数据。研究结果表明,Opus 4.5有50%的概率能够完成长达4小时49分钟的任务,这代表了当前AI技术在长期任务处理方面的重要进展。这种能力评估对于需要长时间...
本文探讨了AI系统完成长期任务能力的测量方法,并展示了Opus 4.5系统的性能数据。研究结果表明,Opus 4.5有50%的概率能够完成长达4小时49分钟的任务,这代表了当前AI技术在长期任务处理方面的重要进展。这种能力评估对于需要长时间...