- 浏览: 4332515 次
- 性别:
- 来自: 湛江
博客专栏
-
SQLite源码剖析
浏览量:79402
-
WIN32汇编语言学习应用...
浏览量:68357
-
神奇的perl
浏览量:101480
-
lucene等搜索引擎解析...
浏览量:281131
-
深入lucene3.5源码...
浏览量:14596
-
VB.NET并行与分布式编...
浏览量:65547
-
silverlight 5...
浏览量:31310
-
算法下午茶系列
浏览量:45197
最新评论
-
yoyo837:
counters15 写道目前只支持IE吗?插件的东西是跨浏览 ...
Silverlight 5 轻松开启绚丽的网页3D世界 -
shuiyunbing:
直接在前台导出方式:excel中的单元格样式怎么处理,比如某行 ...
Flex导出Excel -
di1984HIT:
写的很好~
lucene入门-索引网页 -
rjguanwen:
在win7 64位操作系统下,pygtk的Entry无法输入怎 ...
pygtk-entry -
ldl_xz:
http://www.9958.pw/post/php_exc ...
PHPExcel常用方法汇总(转载)
相关推荐
寻找规划解都是NP甚至NP完全问题,如果动作的执行效果带有不确定性,如在Markov决策过程的规划问题中,规划的求解将会更加困难,现有的Markov决策过程的规划算法往往用一个整体状态节点来描述某个动作的实际执行效果...
为了解决该问题,现有的车载异构无线网络垂直切换算法不考虑网络状态的多样性,提出了一种基于马尔可夫过程的优化垂直切换算法。 该算法考虑到可用网络的状态转换将影响车辆终端通信服务的服务质量(QoS)。 首先,...
并依据部分可观马尔可夫决策过程理论,给出AUV软件自修复POMDP模型,同时采用基于点的值迭代(PBVI)算法求解生成修复策略,以最小化累积修复代价为目标,使系统在部分可观环境下能够以较低的修复代价执行修复动作。...
为了一般化此类问题,我们引入了一类称为动态多模态随机最短路径 (DMSSP) 的马尔可夫决策过程 (MDP)。 这些领域的大部分工作都解决了确定性变体,当不确定性具有下游影响时,可能会产生较差的结果。 我们开发了一种...
利用部分可观测马尔可夫决策过程理论,将自适应感知调度建模为决策优化控制问题,当每个时隙开始时,从频谱感知、数据传输、休眠等待、信道切换4种可选策略中选择最优策略执行,从而尽可能地减少感知开销浪费....
任务调度的过程被描述为一个马尔可夫决策过程,其调度策略由所提出的序列到序列深度神经网络表示,并通过近端策略优化(proximal policy optimization)方法进行训练。仿真实验表明,所提出的算法具有良好的收敛能力...
马尔可夫决策过程(MDP)是离散的时间随机控制过程。 它提供了一个数学框架,用于在结果部分随机且部分受决策者控制的情况下对决策建模。 MDP对于研究通过动态编程和强化学习解决的优化问题非常有用。 MDP至少早在...
针对马尔可夫随机场模型(MRF)在姿态变化人脸识别中复杂度较高的问题,提出了一种多尺度MRF算法,通过串联超级耦合变换(SCT)优化多尺度MRF过程的子问题,明显降低了MRF的计算复杂度。首先,通过两层图像完成对称...
生成可执行文件demo.sh:调试入口model.conf:模型参数从线性到非线性模型1、线性回归,岭回归,Lasso回归,局部加权线性回归2、logistic回归,softmax回归,最大熵模型3、广义线性模型4、Fisher线性判别和线性感知机5...
首先通过马尔可夫“生灭”过程预测资源状态,筛选出“非专用”资源;接着建立查询期望代价矩阵,使用A-MM(Adaptive Min-Min and Max-Min)算法进行自适应查询处理;最后实验表明,预测错误率低,性能稳定;A-MM有较...
在IEEE 802.11标准定义的BEB退避算法基础上,提出一种生命周期约束的自适应退避算法LCAB,以生命周期代替最大重传次数作为分组丢弃的依据,并根据网络忙闲程度自适应地调整节点执行退避过程的权限,以最大化系统归一...
例如,它与支持向量机(SVM)一起使用来执行自动文本分类(Perrone和Connell,2000年)。 它也可以用作预处理方法,例如在隐马尔可夫模型(HMM)中初始化(Hu和Zanibbi,2011年)。 它的广泛应用和简单的计算复杂度...
针对马尔可夫随机场模型(MRF)在姿态变化人脸识别中复杂度较高的问题,提出了一种多尺度MRF算法,通过串联超级耦合变换(SCT)优化多尺度MRF过程的子问题,明显降低了MRF的计算复杂度。首先,通过两层图像完成对称...
matlab最简单的代码在变化的环境中模拟理想观察者决策过程的脚本 到目前为止,此存储库包含四个项目,其对应的文件夹为:NeuralCompCode / ClickTask / PerformanceSims / sims_learning_rate /。 NeuralCompCode / ...
使用动态编程的策略和价值迭代学习目标了解政策评估与政策改进之间的区别以及这些流程如何相互作用了解策略迭代算法了解值迭代算法了解动态编程方法的局限性概括动态编程(DP)方法假定我们具有环境的马尔可夫决策...
生成器使用马尔可夫过程生成名称,并采用Katz Backoff技术来避免该算法的某些缺点。 它非常符合此处提供的描述: 它使用Slf4J作为日志外观框架。 用法 当前仅使用基于马尔可夫链的模型。 也许稍后会扩展该框架以...
马尔可夫决策过程建模 ### 状态空间 1. 当前执行的时间(1维) 2. 当前资源中剩余的 CPU 资源(1维) 3. 当前资源中剩余的 Memory 资源(1维) 4. Ready_task 任务列表(长度为 10)中的任务要求时间(30维)...
马尔可夫决策过程建模 ### 状态空间 1. 当前执行的时间(1维) 2. 当前资源中剩余的 CPU 资源(1维) 3. 当前资源中剩余的 Memory 资源(1维) 4. Ready_task 任务列表(长度为 10)中的任务要求时间(30维)...
我们提出了一种在双重分解框架下在马尔可夫随机场(MRF)中寻找最大后验(MAP)配置的有效算法。 在该框架中,已经引入了诸如二进制平面子问题(BPSP)之类的易处理子问题,以获得比树结构子问题更准确的解决方案。 ...
出租车队管理的DQN 提案:创建一个Deep Q... 具体而言,可以使用Q学习为任何给定的马尔可夫决策过程(MDP)找到最佳的动作选择策略。 它通过学习动作值函数(Q函数)来工作,该函数最终给出了在给定状态下执行给定动作