“超人类人工智能”是指在特定领域内表现优于人类的人工智能系统。OpenAI的首席科学家伊尔亚·苏茨克维认为,随着人工智能的发展,终将会有领域出现超人类AI。然而,最近的研究对这一观点提出了质疑。
研究人员以KataGo2为例,这是目前最成功的开源围棋人工智能系统。他们通过使用对抗性攻击,发现KataGo并非在所有情况下都能轻易击败人类。这些对抗性AI机器人找到了击败KataGo的漏洞,尽管在其他方面表现并不出色。人类可以理解这些机器人的技巧并采用它们来击败KataGo。
研究人员进一步测试了围棋AI的防御策略,但发现对抗性机器人仍然能够找到AI的弱点,胜率可达80%-90%。这表明,漏洞难以消除。这一发现不仅适用于围棋AI,也可能对大型语言模型如ChatGPT产生影响。
这项研究结果表明,让高级AI模型稳定地表现出预期行为是困难的。构建一个可以信任的、强大的现实世界AI系统还有很长的路要走。最重要的结论是,我们今天构建的AI系统,人类自己并不完全理解。
总的来说,虽然人工智能在某些领域取得了显著的进展,但仍然存在许多挑战。构建超人类AI并非易事,需要深入的研究和解决各种技术问题。