OpenAI的最新AI通过观看40,000小时的YouTube来学习玩Minecraft。
该公司专门研究人工智能,开发了一种视频预训练 (VPT) 算法,该算法允许其AI通过观看进行学习。
VPT方法概述
与以前创建Minecraft算法的尝试不同,OpenAI进行游戏时,会与人类在相同的环境中使用相同的鼠标和键盘动作,这使AI技术实现了巨大的飞跃。
开箱即用,AI学会了诸如砍树,制作木板,制作工具和游泳,狩猎,烹饪等动作。
制作工作台所需的物品顺序,并标有熟练的人类到达每一步所需的中位数时间。
经过一些调整,AI最终提高了生产力,并能够学习制造钻石镐,这项技能需要人类玩家游戏大约20分钟并有24000个动作才能完成。
然而,原始素材不足以让人工智能学习。这是因为仅视频只能显示了可以做什么,而不是如何做这件事。
因此,承包商记录并标记了基本的Minecraft技能,以创建另一种算法,该算法通过键盘和鼠标输入提示准确地注释了70,000小时的YouTube素材。
这使得人工智能可以通过观察人类的行为来学习,而不是测试随机的行为,并使用过去和未来的信息来预测所采取的行为。
虽然该团队只使用Minecraft测试了AI,但他们认为游戏的开放性和通用人机界面 (鼠标和键盘) 意味着AI也可以用于一般计算机使用。
如果你想查看更多关于OpenAI学习Minecraft,你可以查看这篇文章。
© 版权声明
- 本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。
- 若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
- 如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!
- 本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。
- 本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!
THE END