ナビゲーション

  • 次へ
  • A64FX向けチューニングドキュメント整備 »
  • A64FXプロセッサ向けチューニングtips集

A64FXプロセッサ向けチューニングtips集¶

  • 1. はじめに
    • 1.1. 本ドキュメントの位置付け
    • 1.2. 本ドキュメントの構成
    • 1.3. 性能測定環境
  • 2. SIMD化の促進
    • 2.1. データ依存最内ループのループ交換
    • 2.2. 少回転最内ループのループ交換
    • 2.3. 不完全入れ子ループのループ分割
  • 3. 演算待ち時間の削減
    • 3.1. 巨大ループのループ分割
    • 3.2. 少回転最内ループのループストライピング
  • 4. キャッシュアクセス待ち時間の削減
    • 4.1. 非連続アクセス最内ループのフルアンローリング
    • 4.2. AoS型多次元配列の次元入れ替え
    • 4.3. 配列ポインタへのcontiguous属性追加
  • 5. まとめ

次のトピックへ

1. はじめに

クイック検索

ナビゲーション

  • 次へ
  • A64FX向けチューニングドキュメント整備 »
  • A64FXプロセッサ向けチューニングtips集
© 著作権 2023, 理化学研究所 計算科学研究センター. Created using Sphinx 7.2.6.