『CUDA C プロフェッショナル プログラミング』にたいする評価の中で,
>>
普通のCPUのループ展開に当たることを何度も本の中で紹介していますが、
NVIDIAのGPUはSIMT方式であるため、独立して実行可能な機械語をイテ
レーションの中で増やすことが大きな意味を持つことは考えられません。
明らかに筆者の誤りです。
<<
https://www.amazon.co.jp/review/R3232KRB74WDI6/
とものを見掛けたんだけど,この解説(というかAmazonでの評価)は信じていいのかな?
@cmplstofB 条件分岐のコストがループ内部のコストより大幅に大きくなければやたらめったらループ展開しても意味ないでしょうね