基于GPT-4o,最强「AI工程师」Genie的诞生确实是一个令人瞩目的事件。Genie由AI初创公司Cognition推出,并在权威测试平台SWE-Bench上取得了显著成绩,超越了Devin和GPT-4,成为全球最强的AI程序员。
Genie的主要优势在于其能够像人类工程师一样思考和行动。它不仅能够在84秒内跑通代码,还具备自我改进机制,能够处理各种复杂甚至从未见过的问题。此外,Genie的推理过程包括规划、检索、代码编写和代码运行四个主要步骤,突破了其他AI工程师依靠基础模型之上添加额外工具的限制。 值得注意的是,Genie背后的团队Cosine仅有5人,但得益于OpenAI大模型的支持,他们成功打造出了这款强大的AI软件工程师。Genie在SWE-Bench中以解决了30.07%问题的成绩夺得榜首,领先于第二名19.27%,解锁了提升SOTA的最大增幅——57%。 综上所述,Genie的成功不仅在于其卓越的性能和高效的代码处理能力,更在于其能够模拟人类工程师的认知过程和工作流,使其在面对复杂问题时展现出与人类工程师相似的判断力和处理能力. |