ナビゲーション
次へ
A64FX向けチューニングドキュメント整備
»
A64FXプロセッサ向けチューニングtips集
A64FXプロセッサ向けチューニングtips集
¶
1. はじめに
1.1. 本ドキュメントの位置付け
1.2. 本ドキュメントの構成
1.3. 性能測定環境
2. SIMD化の促進
2.1. データ依存最内ループのループ交換
2.2. 少回転最内ループのループ交換
2.3. 不完全入れ子ループのループ分割
3. 演算待ち時間の削減
3.1. 巨大ループのループ分割
3.2. 少回転最内ループのループストライピング
4. キャッシュアクセス待ち時間の削減
4.1. 非連続アクセス最内ループのフルアンローリング
4.2. AoS型多次元配列の次元入れ替え
4.3. 配列ポインタへのcontiguous属性追加
5. まとめ
次のトピックへ
1.
はじめに
クイック検索
ナビゲーション
次へ
A64FX向けチューニングドキュメント整備
»
A64FXプロセッサ向けチューニングtips集