内容简介:最近在学习首先是其中
最近在学习 Vulkan ,结果在查看示例代码的时候,对于如下两句出现了疑问:
layout(local_size_x = X, local_size_y = Y, local_size_z = Z) in;
ivec3 pos = ivec3(gl_GlobalInvocationID);
首先是 Invocation 这个单词的理解,计算机语言中他的意思是 " the act of making a particular function start " ,中文意思是 " 调用,启用 "。
其中
layout(local_size_x = X, local_size_y = Y, local_size_z = Z) in;
意思是初始化, X * Y * Z 个计算单元供我们的代码调用,可以简单理解成线程数。
而使用如下的代码
ivec3 pos = ivec3(gl_GlobalInvocationID);
意思是获取当前代码运行的计算单元的编号,也可以理解成获取当前线程的索引。
比如下面的代码,就是一个简单的利用 gl_GlobalInvocationID ,进行并行计算的例子:
#version 430 core
layout (local_size_x = 64) in;
layout(std430, binding=4 ) buffer INFO
{
vec2 info[];
};
void main()
{
uint gid = gl_GlobalInvocationID.x;
info[gid].x += 1.0;
info[gid].y += 1.0;
memoryBarrier();
}
但是,如果传入的数组的大小超过我们设置的计算单元的数量的情况,上述的代码是处理不了的。
可以如下方式处理上述情况:
#version 430
layout (local_size_x = 64) in;
uniform atomic_uint counter = 0;
layout(std430, binding=4 ) buffer INFO
{
vec2 info[];
uint len;
};
void main()
{
uint gid = atomicAdd(counter,1);
if (gid <= len ) {
info[gid].x += 1.0;
info[gid].y += 1.0;
memoryBarrier();
}
}
如果想动态调整计算单元的数量,增加处理灵活性,可以参考下面的代码:
#version 450 //commented out previous definitions /*layout (constant_id = 0) const int TX = 512; layout (constant_id = 1) const int TY = 1; layout (constant_id = 2) const int TZ = 1; */ layout(local_size_x_id = 0) in; layout(local_size_y_id = 1) in; layout(local_size_z_id = 2) in; //rest of the shader
外部通过修改 TX , TY , TZ 的数值来动态调整所需要的计算单元的数量。
具体信息,可以参考下图:
相关介绍,请参考 Compute Shader 。网页如果打不开,可以点击下图,查看详细内容:
参考链接
- opengl渲染管线 不能再详细了
- / jessie / opengl-4-man-doc / gl_GlobalInvocationID(3G)
- 基于OpenGL ES的深度学习框架编写
- How are tasks divided up with compute shaders?
- Vulkan ® 1.1.95 - A Specification (with all registered Vulkan extensions)
- Compute Shader
- User defined WorkGroup sizes in Vulkan Compute shaders
- Vulkan atomic counters
- Atomic Counter
- atomicAdd — perform an atomic addition to a variable
以上所述就是小编给大家介绍的《OpenGL/OpenCL中的gl_GlobalInvocationID, local_size_x的理解》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 理解原型其实是理解原型链
- 要理解深度学习,必须突破常规视角去理解优化
- 深入理解java虚拟机(1) -- 理解HotSpot内存区域
- 荐 【C++100问】深入理解理解顶层const和底层const
- 深入理解 HTTPS
- 深入理解 HTTPS
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Cyberwar
Kathleen Hall Jamieson / Oxford University Press / 2018-10-3 / USD 16.96
The question of how Donald Trump won the 2016 election looms over his presidency. In particular, were the 78,000 voters who gave him an Electoral College victory affected by the Russian trolls and hac......一起来看看 《Cyberwar》 这本书的介绍吧!