4. キャッシュアクセス待ち時間の削減¶
CPU性能解析レポートを作成し、サイクルアカウンティング測定結果を参照した結果、L1Dキャッシュアクセス待ち時間の占める割合が大きい場合、ソースプログラムのデータアクセスパターンを見直す余地が考えられます。 そのような場合の施策の例を以下で説明します。
なおサイクルアカウンティング測定結果の演算待ち時間やキャッシュアクセス待ち時間は、A64FXプロセッサが実行中で未完了状態の命令のうち、各CPUサイクルにおいてプログラム順で最も古い命令の状態にもとづいて算出されます。
そのため、例えば非連続的な配列アクセスが多く含まれる場合などでは、 演算待ち時間の削減 向けの施策によって、キャッシュアクセス待ち時間も併せて削減されるケースがあります。