理解Vulkan同步(Synchronization)

最新推荐文章于 2025-05-10 15:14:00 发布

原创最新推荐文章于 2025-05-10 15:14:00 发布 · 643 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#数据结构

一、Vulkan同步的基本概念

（一）为什么需要同步

在Vulkan中，图形和计算任务通常是在多个不同的阶段和多个硬件单元（如GPU的不同引擎）中执行的。例如，一个典型的渲染管线可能包括顶点处理、片段处理等阶段。如果没有适当的同步，可能会出现以下问题：

数据竞争（Data Races）：当多个操作同时访问和修改同一块内存区域时，就会出现数据竞争。例如，一个着色器正在写入一个缓冲区，而另一个操作（如另一个着色器或CPU代码）同时在读取或写入该缓冲区，这可能导致未定义的行为和错误的结果。

执行顺序问题（Execution Order）：在没有同步的情况下，GPU执行指令的顺序可能与预期不符。例如，一个渲染操作可能在其依赖的纹理更新完成之前就开始执行，导致使用了过期或不正确的数据。

（二）同步的基本目标

Vulkan同步的主要目标是确保操作按照正确的顺序执行，并且避免数据竞争。这是通过在操作之间建立依赖关系来实现的，这样可以明确地告诉GPU和CPU哪些操作必须在其他操作开始之前完成。

二、Vulkan同步的主要工具

（一）栅栏（Fences）

概念：栅栏是一种用于CPU GPU同步的基本机制。它是一个简单的对象，GPU在执行一系列命令后可以“标记”这个栅栏，表示已完成特定的工作。CPU可以查询这个栅栏的状态，以确定GPU是否已经完成了相应的操作。

使用示例：假设你提交了一个渲染命令缓冲区到GPU执行。你可以创建一个栅栏，当GPU完成该命令缓冲区的执行后，它会对这个栅栏进行信号操作。然后CPU可以通过轮询或者等待事件的方式来检查栅栏是否被信号，从而确定渲染操作是否完成。例如：

VkFence fence;

VkFenceCreateInfo fenceCreateInfo = {};

fenceCreateInfo.sType = VK_STRUCTURE_TYPE_FENCE_CREATE_INFO;

// 创建栅栏

vkCreateFence(device, &fenceCreateInfo, nullptr, &fence);

// 提交命令缓冲区时设置信号栅栏

VkSubmitInfo submitInfo = {};

submitInfo.sType = VK_STRUCTURE_TYPE_SUBMIT_INFO;

submitInfo.commandBufferCount = 1;

submitInfo.pCommandBuffers = &commandBuffer;

submitInfo.signalFenceCount = 1;

submitInfo.pSignalFences = &fence;

vkQueueSubmit(graphicsQueue, 1, &submitInfo, VK_NULL_HANDLE);

// 等待栅栏被信号

vkWaitForFences(device, 1, &fence, VK_TRUE, UINT64_MAX);

在上述代码中，首先创建了一个栅栏，然后在提交命令缓冲区时指定这个栅栏作为信号栅栏。最后，CPU等待这个栅栏被信号，以确保GPU完成了相应的操作。

（二）信号量（Semaphores）

概念：信号量主要用于GPU内部的同步，特别是在不同的队列之间或者不同的提交操作之间。信号量可以看作是一种计数器，用于控制对资源的访问。当一个操作完成时，它可以增加信号量的值（信号操作），而另一个操作在开始之前可以等待这个信号量的值达到一定的条件（等待操作）。

使用示例：考虑一个场景，你有一个图形渲染管线和一个计算管线，它们需要共享一个纹理。图形渲染管线首先写入纹理，然后计算管线读取并处理这个纹理。在这种情况下，可以使用信号量来确保计算管线在图形管线完成写入后再开始读取。

VkSemaphore imageAvailableSemaphore;

VkSemaphoreCreateInfo semaphoreCreateInfo = {};

semaphoreCreateInfo.sType = VK_STRUCTURE_TYPE_SEMAPHORE_CREATE_INFO;

// 创建信号量

vkCreateSemaphore(device, &semaphoreCreateInfo, nullptr, &imageAvailableSemaphore);

// 图形管线提交时信号信号量

VkSubmitInfo submitInfoGraphics = {};

submitInfoGraphics.sType = VK_STRUCTURE_TYPE_SUBMIT_INFO;

submitInfoGraphics.commandBufferCount = 1;

submitInfoGraphics.pCommandBuffers = &graphicsCommandBuffer;

submitInfoGraphics.signalSemaphoreCount = 1;

submitInfoGraphics.pSignalSemaphores = &imageAvailableSemaphore;

vkQueueSubmit(graphicsQueue, 1, &submitInfoGraphics, VK_NULL_HANDLE);

// 计算管线提交时等待信号量

VkSubmitInfo submitInfoCompute = {};

submitInfoCompute.sType = VK_STRUCTURE_TYPE_SUBMIT_INFO;

submitInfoCompute.commandBufferCount = 1;

submitInfoCompute.pCommandBuffers = &computeCommandBuffer;

submitInfoCompute.waitSemaphoreCount = 1;

submitInfoCompute.pWaitSemaphores = &imageAvailableSemaphore;

vkQueueSubmit(computeQueue, 1, &submitInfoCompute, VK_NULL_HANDLE);

在这里，图形管线提交时会信号一个信号量，表示纹理已经可用。计算管线提交时会等待这个信号量，直到它被信号，从而确保了正确的执行顺序。

（三）事件（Events）

概念：事件是一种更为灵活的同步机制，它可以在GPU内部和CPU GPU之间进行同步。与栅栏和信号量不同，事件可以在命令缓冲区内部设置和等待。一个操作可以在命令缓冲区中设置一个事件，表示某个特定的点已经到达，而另一个操作可以等待这个事件，这样可以在GPU内部精确地控制执行顺序。

使用示例：假设你想要在一个复杂的渲染过程中，确保某个后处理步骤在某个特定的几何处理步骤完成后才开始。你可以在几何处理命令缓冲区中设置一个事件，然后在后处理命令缓冲区中等待这个事件。

VkEvent event;

VkEventCreateInfo eventCreateInfo = {};

eventCreateInfo.sType = VK_STRUCTURE_TYPE_EVENT_CREATE_INFO;

// 创建事件

vkCreateEvent(device, &eventCreateInfo, nullptr, &event);

// 在几何处理命令缓冲区中设置事件

vkCmdSetEvent(commandBufferGeometry, event, VK_PIPELINE_STAGE_ALL_GRAPHICS_BIT);

// 在后处理命令缓冲区中等待事件

vkCmdWaitEvents(commandBufferPostProcess, 1, &event, VK_PIPELINE_STAGE_ALL_GRAPHICS_BIT, VK_PIPELINE_STAGE_ALL_GRAPHICS_BIT, 0, nullptr, nullptr);

在这个例子中，在几何处理命令缓冲区中设置了一个事件，当几何处理到达指定阶段时，事件被设置。然后在后处理命令缓冲区中等待这个事件，只有当事件被设置后，后处理操作才会开始。

三、同步范围和阶段

（一）同步范围（Scope）

概念：同步范围定义了同步对象（如栅栏、信号量和事件）所作用的范围。在Vulkan中，有两种主要的同步范围：队列范围和设备范围。

队列范围同步：这种同步主要涉及到同一个队列中的操作。例如，使用栅栏来同步一个队列中的多个命令缓冲区提交。当你提交多个命令缓冲区到同一个队列时，你可以使用栅栏来确保它们按照正确的顺序执行，并且CPU可以准确地知道每个提交的完成情况。

设备范围同步：设备范围同步涉及到不同队列之间的操作。信号量和事件通常用于设备范围的同步。例如，在一个具有图形队列和计算队列的设备中，使用信号量来协调图形和计算操作之间的资源共享和执行顺序。

（二）同步阶段（Stage）

概念：同步阶段定义了在渲染管线或者计算管线的哪个阶段进行同步操作。Vulkan定义了多个不同的管线阶段，如顶点着色阶段、片段着色阶段、计算阶段等。

示例：在使用信号量进行图形计算同步时，需要明确图形管线在哪个阶段信号信号量，以及计算管线在哪个阶段等待信号量。例如，图形管线可能在片段着色完成后信号表示渲染结果已经准备好，而计算管线可能在计算开始阶段等待这个信号，以确保它读取到正确的渲染数据。

四、总结

Vulkan同步是确保正确执行和避免数据竞争的关键机制。通过使用栅栏、信号量和事件等工具，结合正确的同步范围和阶段定义，可以有效地协调CPU GPU以及GPU内部不同操作之间的执行顺序，从而实现高效、正确的图形和计算任务。同时，正确地理解和运用这些同步机制需要对Vulkan的渲染和计算管线有深入的理解，并且需要根据具体的应用场景和硬件特性进行合理的设计和调整。