OpenGL-渲染流程
在OpenGL中,任何事物都处于 3D 空间中,而屏幕和窗口却都是 2D 像素数组,这就导致了OpenGL大部分工作都是关于把3D坐标转变为适配你屏幕的2D像素,3D坐标转为2D坐标的处理过程是由OpenGL的 图形渲染管线 (指的是一堆原始图形数据途经一个输送管道,期间经过各种变化处理最终出现在屏幕的过程)管理的。
图形渲染管线接受一组3D坐标,然后把它们转变为你屏幕上的有色2D像素输出。图形渲染管线可以被划分为几个阶段,每个阶段将会把前一个阶段的输出作为输入。所有这些阶段都是高度专门化的(它们都有一个特定的函数),并且很容易并行执行。正是由于它们具有并行执行的特性,当今大多数显卡都有成千上万的小处理核心,它们在GPU上为每一个(渲染管线)阶段运行各自的小程序,从而在图形渲染管线中快速处理你的数据。这些小程序叫做 着色器 (Shader)。
下图是图形渲染管线的每个阶段的抽象展示。要注意蓝色部分代表的是我们可以注入自定义的着色器的部分。
首先,我们以数组的形式传递3个3D坐标作为图形渲染管线的输入,用来表示一个三角形,这个数组叫做顶点数据(Vertex Data);顶点数据是一系列顶点的集合。一个顶点(Vertex)是一个3D坐标的数据的集合。而顶点数据是用顶点属性(Vertex Attribute)表示的,它可以包含任何我们想用的数据。
图形渲染管线的第一个部分是 顶点着色器 (Vertex Shader),它把一个单独的顶点作为输入。顶点着色器主要的目的是把3D坐标转为另一种3D坐标(后面会解释),同时顶点着色器允许我们对顶点属性进行一些基本处理。
图元装配 (Primitive Assembly)阶段将顶点着色器输出的所有顶点作为输入(如果是GL_POINTS,那么就是一个顶点),并所有的点装配成指定图元的形状;本节例子中是一个三角形。
图元装配阶段的输出会传递给 几何着色器 (Geometry Shader)。几何着色器把图元形式的一系列顶点的集合作为输入,它可以通过产生新顶点构造出新的(或是其它的)图元来生成其他形状。例子中,它生成了另一个三角形。
几何着色器的输出会被传入 光栅化阶段 (Rasterization Stage),这里它会把图元映射为最终屏幕上相应的像素,生成供片段着色器(Fragment Shader)使用的片段(Fragment)。在片段着色器运行之前会执行 裁切 (Clipping)。裁切会丢弃超出你的视图以外的所有像素,用来提升执行效率。
片段着色器 的主要目的是计算一个像素的最终颜色,这也是所有OpenGL高级效果产生的地方。通常,片段着色器包含3D场景的数据(比如光照、阴影、光的颜色等等),这些数据可以被用来计算最终像素的颜色。
在所有对应颜色值确定以后,最终的对象将会被传到最后一个阶段,我们叫做 Alpha测试 和 混合 (Blending)阶段。这个阶段检测片段的对应的深度(和模板(Stencil))值,用它们来判断这个像素是其它物体的前面还是后面,决定是否应该丢弃。这个阶段也会检查 alpha 值(alpha值定义了一个物体的透明度)并对物体进行 混合 (Blend)。所以,即使在片段着色器中计算出来了一个像素输出的颜色,在渲染多个三角形的时候最后的像素颜色也可能完全不同。
可以看到,图形渲染管线非常复杂,它包含很多可配置的部分。然而,对于大多数场合,我们只需要配置顶点和片段着色器就行了。几何着色器是可选的,通常使用它默认的着色器就行了。
在现代OpenGL中,我们必须定义至少一个顶点着色器和一个片段着色器(因为GPU中没有默认的顶点/片段着色器)。
OpenGL 首先接收用户提供的 几何数据 (顶点和几何图元),并且将它输入到一系列 着色器阶段 中进行处理,包括:顶点着色、细分着色(它本身包含两个着色器),以及最后的几何着色,然后它将被送入 光栅化单元(rasterizer) 。光栅化单元负责对所有 剪切区域(clipping region) 内的图元生成 片元数据 ,然后对每个生成的片元都执行一个 片元着色器 。
没必要每次绘图时都复制顶点数据,而是在 图形内存中缓存 这些数据,这样可以显著改善渲染性能,也可以降低内存带宽和电力消耗需求。这就是 顶点缓冲区 对象发挥作用的地方
顶点数组对象 :Vertex Array Object,VAO 保存缓存以及顶点属性状态信息。
顶点缓冲对象 :Vertex Buffer Object,VBO 用于分配内存,保存顶点数据 给图形卡使用的一种缓存对象。
索引缓冲对象 :Element Buffer Object,EBO或Index Buffer Object,IBO 保存顶点索引的一种缓存对象。
在定义好顶点数据以后,需要在内存中存储这些顶点,我们通过 顶点缓冲对象(Vertex Buffer Objects, VBO) 管理这个内存,它会在GPU内存(通常被称为显存)中储存大量顶点。使用这些缓冲对象的好处是我们可以一次性的发送一大批数据到显卡上,而不是每个顶点发送一次。从CPU把数据发送到显卡相对较慢,所以只要可能我们都要尝试尽量一次性发送尽可能多的数据。当数据发送至显卡的内存中后,顶点着色器几乎能立即访问顶点,这是个非常快的过程。
下面是一个生成顶点缓冲区的例子
glGenBuffers(GLsizei n, GLuint * buffers) :分配n个缓冲区对象名称,并在buffers中返回它们。
glBindBuffer 用于指定当前缓冲区对象。第一次通过调用
glBindBuffer 绑定缓冲区对象名称时,缓冲区对象可以默认状态分配;如果分配成功,则分配的对象绑定微目标的当前缓冲区对象。
glBufferData 用于创建和初始化顶点数组或元素数组。
简而言之,光栅化阶段绘制对应的图元(点、线、三角形),将 图元 转化为一组 二维数组 的过程,然后传递给 片元着色器 处理。这些二维数组代表屏幕上绘制的 像素
片元着色器主要是对 光栅化 处理后生成的片元 逐个进行 处理(并行)。接收顶点着色器输出的值,需要传入的数据,以及它经过变换矩阵后输出值存储位置。
关于混合可以参考 这篇文章
拓展阅读:
iOS 渲染原理解析
2024-11-08 广告