内容简介:这是侑虎科技第507篇文章,感谢作者FrankZhou供稿。欢迎转发分享,未经作者授权请勿转载。如果您有任何独到的见解或者发现也欢迎联系我们,一起探讨。(QQ群:793972859)作者主页:遮挡剔除是当一个物体被其他物体遮挡住而不在摄像机的可视范围内时,不对其进行渲染。在3D图形计算中并不是一个自动进行的过程,因为在绝大多数情况下离相机最远的物体首先被渲染,靠近摄像机的物体后渲染,并覆盖先前渲染的物体(这种重复渲染又叫做"OverDraw"), 它不同于视锥剪裁。
这是侑虎科技第507篇文章,感谢作者FrankZhou供稿。欢迎转发分享,未经作者授权请勿转载。如果您有任何独到的见解或者发现也欢迎联系我们,一起探讨。(QQ群:793972859)
作者主页: https://www.zhihu.com/people/pkhere ,作者也是U Sparkle活动参与者,UWA欢迎更多开发朋友加入U Sparkle开发者计划,这个舞台有你更精彩!
遮挡剔除是当一个物体被其他物体遮挡住而不在摄像机的可视范围内时,不对其进行渲染。在3D图形计算中并不是一个自动进行的过程,因为在绝大多数情况下离相机最远的物体首先被渲染,靠近摄像机的物体后渲染,并覆盖先前渲染的物体(这种重复渲染又叫做"OverDraw"), 它不同于视锥剪裁。
视锥剪裁只是不渲染摄像机视角范围外的物体,而对于那些被其他物体遮挡,但是依然在镜头范围内的物体,则不会被视锥剔除。当然当你使用遮挡剔除时,视锥裁剪还是会生效的。我们在游戏中主流的Occlusion Culling 方案基本上是以下几种方式:
CPU端:
预计算的原始的PVS
Umbra的dPVS
SoftWare Occlsion
GPU端:
GPU-Driven
Hierarchical Z-Buffering
其他硬件层面:
Early-Z Culling
1. 预计算原始的PVS(UE4自带)
首先划分好格子,然后离线计算每个格子内的所有物体的可见性状态,这里的划格子是用Cell来描述的,格子一般是10M*10M,对于格子内的每个物体都会生成OCID,通过存一个BitArray记录可见性,这样做的好处是内存的占用空间会尽可能小,我们用Unity实现了一遍。
优点:
运行时消耗极低,能有效的降低OverDraw的开销,比较适合开阔的场景,个人认为非常适合目前的手游场景,而且实现比较容易。
缺点:
可见性计算算法一般偏于保守,无法处理动态模型的剔除,可见性烘培的时间较长,需要额外的占用内存,调试 工具 需要自己开发。
几个注意点:
-
Cell划分和布置:看了下UE4的算法,看平面上Cell尽可能进行等分,高度上的面片是动态计算,在实际操作时候,可以平面上也可以按照密度自适应合并Cell大小,采取用四叉树进行管理划分,高度上也可以分层然后考虑是否进行合并。
-
可视计算烘培:Cell内的可见性物体,根据自己的算法如何来操作。一般做法都比较保守,具体可以参照UE4的实现,蒙特卡洛随机选取,细节在这里就不赘述了。
-
Streaming:如果是大世界,需要考虑到内存的占用和IO的换入换出,看过UE4它是随着关卡的加载全部加载的。对于Unity中的实现,因为大世界一般采用Streaming方案,所以可以随着Chunk加载卸载去管理,Obect ID就得按Chunk去给,Visible BitArray也一样,保证只有局部的可见性数据,内存比较好控制。
2. Umbra的dPVS(Unity自带)
这种方式是Unity目前通过Umbra内建的OC方案,虽然也叫PVS,看了Umbra创始人Timo Aila的毕业论文,发现和纯离线的原理有很大的区别。它的离线下是不计算所有可见性的,而只是生成一个空间数据结构,也就是一个BSP描述的节点信息,用于之后的空间位置查询。因此它在离线计算的时候速度可以提升很多,但是在线消耗也会提升,因为它还是会产生很多问题,比如跟踪可见物体的标记点,提取轮廓生成HOM等步骤。
优点:
引擎内建使用方便,烘培速度很快,简单易用,调试工具方便。
缺点:
可见性计算算法同样偏于保守,手游上实测运行时CPU消耗不稳定,有时候一帧2-3ms是常事,不支持Streaming大世界内存可观。
Unity中的具体过程参考,大家可以参考:
https://docs.unity3d.com/Manual/OcclusionCulling.html3. SoftWare Occlsion
4. GPU-Driven
后面的趋势,可以全部采用Compute Shader来做OC,后面对于IB/VB进行合并处理。
优点:
可以用来结合Virtual Texturing和DrawInstanceIndirect基本可以做到花1-2个DP搞定整个场景。
缺点:
定制整个自己的Rending PipeLine,不过后面肯定是趋势。
具体参考鲍鹏对于Siggraph15和GDC16的相关翻译:
5. Early-Z Culling
传统Z-Test其实是发生在PS之后的,因此仅仅依靠Z-Test并不能加快多少渲染速度。而Early-Z Culling则发生在光栅化之后,调用PS之前,这样能提前对深度进行比较,如果测试通过则执行PS,否则跳过此片段/像素(Fragment/Pixel)。需要注意的是,在PS中不能修改深度值,否则Early-Z Culling会被禁用。这个方式是基于硬件的,因此一旦在硬件不支持这个特性的显卡上使用此技术,反而会导致效率下降,目前Geforce 6系列上是支持这个特性的。
总结:
如果是手游不是大世界,且原先CPU的负载就不高,那么第二种方案是可以接受的;如果是大世界,且对于CPU耗时比较扣,那么第一种方案适合;对于Unity就简单粗暴一点,先照着UE顺一遍很快就能出来。如果自己能定制管线,那么CPU的OC方案就可以不用,直接用GPU-Driven。对于优化这件事,在通用引擎上需要自己更细粒度的定制化方案。
文末,再次感谢FrankZhou的分享,如果您有任何独到的见解或者发现也欢迎联系我们,一起探讨。(QQ群:793972859)
也欢迎大家来积极参与U Sparkle开发者计划,简称“US”,代表你和我,代表UWA和开发者在一起!
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 有效遮挡检测的鲁棒人脸识别
- 通过剔除上下文依赖减弱封装的耦合性
- OpenGL 优化项之面剔除和注意点
- 结合Ribbon实现的微服务自动故障剔除
- react在安卓下输入框被手机键盘遮挡问题
- iOS:轻量可定制的防键盘遮挡textField实现总结
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
iOS应用逆向工程 第2版
沙梓社、吴航 / 机械工业出版社 / 2015-4-1 / 79.00
你是否曾因应用上线的第一天即遭破解而无奈苦恼,想要加以防范,却又束手无策? 你是否曾为某一应用深深折服,想要借鉴学习,却又无从下手? 你是否已不满足于public API,想要进军Cydia开发,却又求学无门? 你是否已产生“不识Apple真面目,只缘身在App Store中”的危机感,想要通过阅读来一窥这冰山一角外的整个北极,却又找不到合适的书? 你是否已经因无法跨越开发......一起来看看 《iOS应用逆向工程 第2版》 这本书的介绍吧!