Channel: 英特尔开发人员专区文章

↧

在英特尔® 至强融核™ 协处理器上微调矢量化和内存流量：对小型矩阵进行 LU 分解

February 21, 2017, 6:52 pm

Latest and popular articles on Intel Technologies

≫ Next: 面向英特尔® 至强融核™ 处理器的 Offload over Fabric教程

≪ Previous: 英特尔® 实感™ SDK 互联网组件卸载指导

作者：Andrey Vladimirov（Colfax International）

之前已经讨论了有关微调基于英特尔® 至强融核™ 协处理器应用的自动矢量化循环性能的常用技术，这些技术包括强度折减、调整矢量化模式、数据对齐、对齐数据提示和指示器消歧。还展示了内存流量调优的循环分块技术。以下示例阐述了优化方法，该示例对 128×128 尺寸的单精度矩阵进行单线程 LU 分解。

性能指标评测显示，优化后的协处理器性能比未经优化的代码提升了 2.8 倍，多核主机系统的性能提升了 1.7 倍，主机和协处理器的性能大致相同。

可以通过以下链接免费下载文中涉及的代码 https://github.com/ColfaxResearch/LU-decomposition

↧

Trending Articles

《沈冰自述——我和周永康的故事》全本

February 8, 2015, 9:08 pm

Moog - Subsequent 25

January 16, 2020, 12:00 am

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

March 9, 2013, 11:02 am

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

July 16, 2019, 11:03 pm

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

April 24, 2019, 6:56 am

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

October 28, 2019, 8:49 pm

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

December 28, 2017, 6:55 pm

acermark龍璿國際展出多款包裝設備

April 18, 2016, 6:02 am

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

October 15, 2018, 6:03 am

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

September 4, 2013, 2:57 am

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

June 23, 2020, 2:17 am

MAS v2.8 magicgenius 汉化版 - 11.11更新

November 10, 2024, 5:46 pm

出售: Monster Cable Interlink Reference 2

May 23, 2018, 2:00 am

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

August 17, 2015, 1:12 am

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

December 21, 2016, 9:38 pm

[转载]煞貢、直星、人專吉日\金神七煞歌

March 3, 2016, 6:37 am

HAKERS哈克士戶外 12月8~14日廠拍

December 6, 2016, 3:52 am

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

June 16, 2019, 8:10 am

<請教>行駛中安卓機會重新開機

August 5, 2018, 7:25 am

Udp2raw-tunnel 及其一键安装脚本

October 23, 2017, 6:46 pm

© 2025 //www.rssing.com