手机浏览器扫描二维码访问
换个说法就是,娜芙的学习进步速度太恐怖了,每一次对抗对“她”来说都是学习。
罗晟通过这五场与人类玩家对抗的比赛中也看到了娜芙暴露出来的一个缺陷,就是除了特定的分兵战术,“她”并不能形成灵活的兵力分配。
在输掉的第四局对抗中,一名高水平的人类玩家对娜芙的基地不停的多线骚扰,而“她”一旦回防对方就立刻跑路,等“她”的兵出门展开进攻的时候又转回来继续骚扰。
这场对抗,面对人类玩家的灵活出兵策略,娜芙只能被动应战,无法形成对人类玩家的有效进攻,也导致了最后滚雪球效应起来了。
最终落败。
第五局对抗结束之后,罗晟让娜芙停止了匹配对手,然后对其重新进行了一次大幅的升级优化。
他觉得这样的学习效率仍然显得太慢。
娜芙的智能体采用的是深度学习算法,罗晟对其进行了一次精心升级之后,包括了神经网络、通过强化学习的自我对弈,多智能体学习、模仿学习等算法或技术。
其中所谓的自我对弈,简单说就是自我学习,通过不断的试错找到让自己胜率最大的游戏方式。
而通过自我对弈和强化学习,构成了开放端学习算法的基本范式,学习人的策略,并确保娜芙的智能体在整个游戏过程中不断探索这些策略,从而让“她”获得更大的升级与进步。
此外,由于星际争霸这款游戏具有巨大的动作空间,会让许多先前强化学习方法变得无效。
罗晟因此还为娜芙开发了一种全新的算法进行非策略强化学习,使得“她”能从旧有的历史决策的游戏中有效的更新决策。
而罗晟的终极目的可不是让娜芙成为一个“IMBA”的星际争霸AI玩家,而是以此为起点,让“她”能够胜任复杂多变的其它应用场景。
如果“她”只是在星际争霸的比赛中成为超级高手,换个场景,例如在围棋、语言或其它领域就不行了,那依然是个纯粹的人工智障,和真正的人工智能有着巨大的差距。
……
时间一分一秒的流逝,罗晟猫在他的办公室不知不觉就耗费了三个多小时,为娜芙完成了第二次的优化升级才下班,时间已经不早了。
罗晟在离开办公室之前,又把娜芙放进了暴雪星际战网的天梯中,让“她”与人类玩家不停的对抗。
搞定这一切就没有在管了,下午还要去蔚蓝海岸公司处理一些工作,还有一场会议什么。
而被放养的娜芙就在做一件事情,不断与人类玩家对战。
娜芙的背后支撑“她”的几乎是整个苏城数据中心,消耗的是算力资源,是电费。
事实上如果没有钱,是不可能养得起一个人工智能的,就更别说是开发阶段了。
如果是像IBM公司这样的人工智能研发机构,制约其发展的可能是开发者本身,但见证过人工智能的罗晟,对于开发而言反而是最轻松的。
但仍然有问题制约着他。
那就是硬件,娜芙的成长被现在的硬件水平限制了,如果有更好的硬件基础,会迎来一次质的飞跃。
深度网络需要高端GPU在大量数据的合理时间内进行训练,这些硬件非常昂贵,当然在罗晟这里没有贵这个说法。
【看书领红包】关注公。。众号【书友大本营】,看书抽最高888现金红包!
可问题是现在没有符合他要求的硬件,有钱都没得买,今后只能自己起炉灶搞硬件了,
如果没有先进硬件基础来训练深层网络以实现高性能是不可行的。
不仅仅要使用高端GPU,还需要快速的CPU、存储以及快速和超大容量的RAM。
……
随着时间的推移,娜芙通过不断的对战,胜率从“她”赛事生涯第一局开始的惨不忍睹,逐渐出现了反转,胜率正在快速的提高。
爷爷去世的时候,轰动全城...
偶得上古神帝之传承,身为赘婿的萧凌然,新的人生开启。纵横都市,唯我最强!...
一个苦逼的小屌丝,无意中买了一个智能软件,啥是天才,一看就会,金钱,赚到手软,美女,我不稀罕,且看一个小屌丝的逆袭之路。...
叶凌天,神秘部队退伍军人,为了给妹妹凑集五十万的治疗费用不得不给三元集团的千金小姐李雨欣当贴身保镖。且看经历过太多生死的铮铮硬汉叶凌天如何在这个繁华都市里走出属于自己的一条不平凡的路来。...
世如棋,人如子。庙堂尔虞我诈,江湖爱恨情仇,市井喜怒哀乐,无非是一颗颗棋子,在棋盘上串联交织,迸发出的点点火光。昭鸿年间,坊间盛传有藩王窥伺金殿上那张龙椅,皇帝召各路藩王世子入京求学,实为质子。许不令身为肃王世子,天子脚下,本该谨言慎行‘藏拙自污’。结果群众许世子德才兼备,实乃‘不鸣则已,一鸣惊人’。许不...
我叫林怀安,我干掉了系统君,又一拳打死了天下九大宗师之一的老王,然后我就无敌了后来,高高在上的神明告诉我,你这只是开始,于是,我儒雅随和的给了他一拳,并且告诉他,这个世界不需要神明直到有一天,仙门大开,一群玩家突然降临了,跪着喊我大佬...