AVX命令セットを活用した1次元畳み込み演算の高速化技術

AVXによる1次元畳み込み演算の最適化 基本的なAVX最適化実装 // conv_avx_optimized.cpp bool Execute1DConvolution_AVX(double* __restrict__ output, const double* __restrict__ input, const double* __restrict__ filter, int64_t data_length) { constexpr int64_t filter_width = 5; constexpr int64_t half_width = filter_width / 2; if (data_leng ...

5月29日 02:34 投稿