function-approximation相关内容

在强化学习中使用函数逼近时,如何选择动作?

这张幻灯片显示了Q(状态,动作)的方程em> 就一组权重和特征函数而言.我对如何编写特征函数感到困惑. 给定一个观察,我可以理解如何从观察中提取特征.但是根据观察,人们不知道对特征采取行动的结果是什么.那么如何编写一个将观察和动作映射到数值的函数呢? 在几张幻灯片后显示的 Pacman 示例中,人们知道,给定状态,动作的效果将是什么.但情况并非总是如此.例如,考虑车杆问题(在 Open ..
发布时间:2021-07-07 18:56:44 其他开发

如何在x64 CPU上快速计算sincos?

这是一个熟悉SSE/AVX指令系列的用户以及熟悉其性能分析的用户所面临的一个问题.我看到了许多不同的实现和方法,范围从 SSE2较旧到较新的.网络充斥着这样的链接.但是就我个人而言,我在sse组装分析方面没有丰富的经验.有些人指出了微指令,缓存,这需要一些低级的知识.因此,我要求您提供一些提示和您的个人经历.如果您有时间展开一些比较,那么您将了解“什么是最快的"以及为什么选择了什么方法.实现可能不 ..
发布时间:2021-04-12 20:54:17 其他开发

Taylor系列exp(-x)和exp(+ x)

我试图写一个程序,计算exp(-x)和exp(x)的泰勒级数高达200次迭代,对于大x。 (exp(x)= 1 + x + x ^ 2/2 + ...)。 我的程序非常简单, 。然而,它对于exp(-x)发散,但是对于exp(+ x)​​恰好收敛。这里是我的代码到目前为止: long double x = 100.0,sum = 1.0,last = for(int i = ..
发布时间:2016-10-30 05:06:56 C/C++开发