独立于架构的自旋等待循环

为了充分利用当今多核处理器的功能，游戏开发人员正使用更高级的任务处理系统使工作分散到线程池的多个线程之中。随着线程数量的增加，诸如任务队列锁和其他共享资源结构上的线程之间发生争用的可能性也会增加。有多种解决办法，但是自旋等待循环是常见的结构。

while (!acquire_lock())
{
	// Spin for a specific number of iterations
	for (int i = 0; i < max_spin_count; i++)
	{
		// Pause intrinsic
		_mm_pause();
	}
}

本文使用了 The _mm_pause 指令，因为它可以提示处理器调用线程位于自选等待循环中。这将暂停下一条指令的执行，不再需要处理器，也不会使用部分管线，因此降低了能耗。

_mm_pause 指令在多数前几代英特尔平台上拥有相似的延迟。由于存在这种历史一致性，许多开发人员在调整自旋循环时会考虑到这一点。但是，从第六代智能英特尔® 酷睿™ i 处理器产品家族开始，pause 指令的延迟增加了多个数量级，旨在为许多场景提供更好的节能机会。

由于延迟发生了变化，以上固定数量的自旋循环将消耗比之前高一个数量级的周期，这将对您的应用性能造成不利影响。为了避免未来的指令架构变动引起任何问题，对所有自旋等待循环进行检查，以确保未使用固定数量的 pause 指令实施它们。可以对上述自旋等待循环进行以下适当修改：

while (!acquire_lock())
{
	// __rdtsc intrinsic is used to read the time stamp counter
	// This allows the loop to run for a fixed number of cycles
	uint64_t prev = __rdtsc();
	do
	{
		// Pause intrinsic

		_mm_pause();
	}
	while ((__rdtsc() - prev) < max_spin_time)
	}

尽管上述自旋等待循环非常简单，软件开发人员一般会使用更高级的自旋循环（支持指数退避等），但是它展示了如何使软件变得更强大，以应对未来指令延迟的架构变动。

请参阅以下文章，进一步了解 _mm_pause 指令与自旋等待循环：有益于功耗与性能的睡眠循环

如欲获取关于英特尔® 架构编程的更多信息，请参阅以下软件开发手册：《64 位和 32 位英特尔®架构软件开发人员手册》

独立于架构的自旋等待循环

Trending Articles

《沈冰自述——我和周永康的故事》全本

Moog - Subsequent 25

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

acermark龍璿國際展出多款包裝設備

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

MAS v2.8 magicgenius 汉化版 - 11.11更新

出售: Monster Cable Interlink Reference 2

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

[转载]煞貢、直星、人專吉日\金神七煞歌

HAKERS哈克士戶外 12月8~14日廠拍

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

<請教>行駛中安卓機會重新開機

Udp2raw-tunnel 及其一键安装脚本