3. 演算待ち時間の削減¶
CPU性能解析レポートを作成し、サイクルアカウンティング測定結果を参照した結果、浮動小数点演算待ち時間や整数演算待ち時間の占める割合が大きい場合、コンパイラによる最適化内容を見直す余地が考えられます。 そのような場合の施策の例を以下で説明します。
なおサイクルアカウンティング測定結果の演算待ち時間やキャッシュアクセス待ち時間は、A64FXプロセッサが実行中で未完了状態の命令のうち、各CPUサイクルにおいてプログラム順で最も古い命令の状態にもとづいて算出されます。
そのため、例えば配列アクセスの結果に依存し連鎖する演算が多く含まれる場合などでは、 キャッシュアクセス待ち時間の削減 向けの施策が、結果的に演算待ち時間の削減につながるケースもあります。