AVX命令セットを活用した1次元畳み込み演算の高速化技術
AVXによる1次元畳み込み演算の最適化
基本的なAVX最適化実装
// conv_avx_optimized.cpp
bool Execute1DConvolution_AVX(double* __restrict__ output, const double* __restrict__ input, const double* __restrict__ filter, int64_t data_length) {
constexpr int64_t filter_width = 5;
constexpr int64_t half_width = filter_width / 2;
if (data_leng ...
5月29日 02:34 投稿