蒙特卡洛树搜索

时间:2024-11-11 03:58:05编辑:流行君

蒙特卡洛树搜索的主要流程有

蒙特卡罗树搜索大概可以分为四部,分别是选择拓展模拟和反向传播。蒙特卡罗树搜索大概可以被分成四步,分别包括选择(Selection),拓展(Expansion),模拟(Simulation),反向传播(Backpropagation)。利用CPOP算法求出DAG图的关键路径,设定搜索树的根节点为S0,从根节点S0开始,每经过一个结点,开始判断经过的这个结点是否扩展完。若当前为扩展任务结点,则从待调度的任务队列中选择一个任务,添加到搜索树上,作为新的任务结点。从扩展结点开始,在每一个位置Si,使用随机策略交替选择任务和处理器,并将同一状态下选择的任务调度到处理器上,直到模拟到全部任务都被调度到处理器上为止,最后会得到一个makespan值。蒙特卡罗树搜索是什么蒙特卡罗树搜索(Monte Carlo Tree Search)并不是一种"模拟人"的算法。而是通过随机的对游戏进行推演来逐渐建立一棵不对称的搜索树的过程。可以看成是某种意义上的强化学习,当然这一点学界还有一些争议。蒙特卡洛树搜索又称随机抽样或统计试验方法,属于计算数学的一个分支,它是在上世纪四十年代中期为了适应当时原子能事业的发展而发展起来的。传统的经验方法由于不能逼近真实的物理过程,很难得到满意的结果。

蒙特卡洛树搜索的主要流程是

蒙特卡洛树搜索的主要流程是选择、扩张、模拟、反馈。蒙特卡洛树搜索的流程1、利用CPOP算法求出DAG图的关键路径。2、选择阶段:设定搜索树的根节点为S0,从根节点S0开始,每经过一个结点,开始判断经过的这个结点是否扩展完。3、扩展阶段:若当前为扩展任务结点,则从待调度的任务队列中选择一个任务,添加到搜索树上,作为新的任务结点。4、模拟阶段:从扩展结点开始,在每一个位置Si,使用随机策略交替选择任务和处理器,并将同一状态下选择的任务调度到处理器上,直到模拟到全部任务都被调度到处理器上为止,最后会得到一个makespan值。5、回传阶段:当模拟结束后,获得搜索树中各节点的信息,同时根据makespan值,将搜索后所得最新结点由叶子结点回传到根节点上进行更新。6、重复执行以上步骤直到DAG图的最后一个任务结点被调度到处理器上为止,并最后根据结果找到一条能使makespan值最小的调度顺序。

上一篇:叮当码头

下一篇:没有了