a***m 发帖数: 5037 | 1 没有online adaption
不像小李一样,输了几盘 据能改进自己的策略
deep learning 只能用海量样本训练
几盘棋没用
其实 deep learning 受到密集关注也才5年吧 已经能解决很多问题了,
但就这么个简单东西正巧就能为大部分AI 问题建模,人类没这么幸运吧
肯定还需要很多改进
还是看好这个方向的发展 |
a****t 发帖数: 7049 | 2 这很容易解决,比如像这种多局赛事时,每次输的时候这种局面的价值自动微调,避免
在赛后深度训练修正模型前再碰到自己弱的局面。 |
a***m 发帖数: 5037 | 3 按目前的算法 那一盘两盘的影响微乎其微 几乎可以忽略
人就不一样,一盘就够学到教训
【在 a****t 的大作中提到】 : 这很容易解决,比如像这种多局赛事时,每次输的时候这种局面的价值自动微调,避免 : 在赛后深度训练修正模型前再碰到自己弱的局面。
|
b****e 发帖数: 906 | 4 不能探索未知,所有的决策都是在已有的样本空间内部生成的,extrapolation的功能
非常差。但第四盘78的子它没有算到太不可思议了,那个地方的棋形和位置似乎是很有
可能被对方打入的地方,尽管可能不是在那个时候。 |
a****t 发帖数: 7049 | 5 没看我写的吗,不是用一两盘来影响整个模型,而是避开导致输棋的那个局面。比如这
次突然赢率降了很多,而和模型的判断误差很大,这个电脑事后就知道了,那么误差发
生前的几个棋盘可以价值降低很多,下次不去探索这些局面。又不是说让他立刻学会怎
么赢那些棋盘。
【在 a***m 的大作中提到】 : 按目前的算法 那一盘两盘的影响微乎其微 几乎可以忽略 : 人就不一样,一盘就够学到教训
|
a***m 发帖数: 5037 | 6 不知所云 我敢肯定你没用过 deep learning
【在 a****t 的大作中提到】 : 没看我写的吗,不是用一两盘来影响整个模型,而是避开导致输棋的那个局面。比如这 : 次突然赢率降了很多,而和模型的判断误差很大,这个电脑事后就知道了,那么误差发 : 生前的几个棋盘可以价值降低很多,下次不去探索这些局面。又不是说让他立刻学会怎 : 么赢那些棋盘。
|
a****t 发帖数: 7049 | 7 我敢肯定你语体教
【在 a***m 的大作中提到】 : 不知所云 我敢肯定你没用过 deep learning
|