/dports/graphics/vapoursynth-waifu2x-ncnn-vulkan/vapoursynth-waifu2x-ncnn-vulkan-r4/deps/ncnn/src/layer/arm/ |
H A D | convolutiondepthwise_3x3_pack4.h | 214 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 314 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 394 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 508 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 609 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 687 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 760 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 949 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() 1084 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() 1165 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() [all …]
|
H A D | convolutiondepthwise_3x3_pack4_bf16s.h | 286 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 432 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 537 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 689 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 822 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 918 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 1009 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 1036 _sum0 = vmlaq_f32(_sum0, _k22, _r22); in convdw3x3s1_pack4_bf16s_neon() 1251 "w"(_k22), // %16 in convdw3x3s2_pack4_bf16s_neon() 1359 "w"(_k22), // %16 in convdw3x3s2_pack4_bf16s_neon() [all …]
|
H A D | convolutiondepthwise_3x3_pack8_fp16s.h | 53 float16x8_t _k22 = vld1q_f16(k0 + 64); in convdw3x3s1_pack8_fp16sa_neon() local 210 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 305 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 384 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 489 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 556 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 613 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 663 float16x8_t _k22 = vld1q_f16(k0 + 64); in convdw3x3s2_pack8_fp16sa_neon() local 767 "w"(_k22), // %16 in convdw3x3s2_pack8_fp16sa_neon() 842 "w"(_k22), // %16 in convdw3x3s2_pack8_fp16sa_neon() [all …]
|
H A D | convolution_3x3_pack1to4_fp16s.h | 53 float16x4_t _k22 = vld1_f16(k0 + 32); in conv3x3s1_pack1to4_fp16sa_neon() local 182 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 267 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 328 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 380 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 435 float16x4_t _k22 = vld1_f16(k0 + 32); in conv3x3s2_pack1to4_fp16sa_neon() local 522 "w"(_k22) // %16 in conv3x3s2_pack1to4_fp16sa_neon() 582 "w"(_k22) // %16 in conv3x3s2_pack1to4_fp16sa_neon() 634 "w"(_k22) // %16 in conv3x3s2_pack1to4_fp16sa_neon()
|
H A D | convolution_3x3_pack1to8_fp16s.h | 53 float16x8_t _k22 = vld1q_f16(k0 + 64); in conv3x3s1_pack1to8_fp16sa_neon() local 182 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 267 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 328 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 380 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 435 float16x8_t _k22 = vld1q_f16(k0 + 64); in conv3x3s2_pack1to8_fp16sa_neon() local 522 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon() 582 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon() 634 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon()
|
/dports/graphics/waifu2x-ncnn-vulkan/waifu2x-ncnn-vulkan-20210521/src/ncnn/src/layer/arm/ |
H A D | convolutiondepthwise_3x3_pack4.h | 214 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 314 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 394 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 508 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 609 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 687 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 760 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 949 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() 1084 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() 1165 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() [all …]
|
H A D | convolutiondepthwise_3x3_pack4_bf16s.h | 286 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 432 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 537 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 689 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 822 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 918 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 1009 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 1036 _sum0 = vmlaq_f32(_sum0, _k22, _r22); in convdw3x3s1_pack4_bf16s_neon() 1251 "w"(_k22), // %16 in convdw3x3s2_pack4_bf16s_neon() 1359 "w"(_k22), // %16 in convdw3x3s2_pack4_bf16s_neon() [all …]
|
H A D | convolutiondepthwise_3x3_pack8_fp16s.h | 53 float16x8_t _k22 = vld1q_f16(k0 + 64); in convdw3x3s1_pack8_fp16sa_neon() local 210 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 305 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 384 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 489 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 556 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 613 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 663 float16x8_t _k22 = vld1q_f16(k0 + 64); in convdw3x3s2_pack8_fp16sa_neon() local 767 "w"(_k22), // %16 in convdw3x3s2_pack8_fp16sa_neon() 842 "w"(_k22), // %16 in convdw3x3s2_pack8_fp16sa_neon() [all …]
|
H A D | convolution_3x3_pack1to8_fp16s.h | 53 float16x8_t _k22 = vld1q_f16(k0 + 64); in conv3x3s1_pack1to8_fp16sa_neon() local 182 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 267 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 328 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 380 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 435 float16x8_t _k22 = vld1q_f16(k0 + 64); in conv3x3s2_pack1to8_fp16sa_neon() local 522 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon() 582 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon() 634 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon()
|
H A D | convolution_3x3_pack1to4_fp16s.h | 53 float16x4_t _k22 = vld1_f16(k0 + 32); in conv3x3s1_pack1to4_fp16sa_neon() local 182 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 267 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 328 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 380 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 435 float16x4_t _k22 = vld1_f16(k0 + 32); in conv3x3s2_pack1to4_fp16sa_neon() local 522 "w"(_k22) // %16 in conv3x3s2_pack1to4_fp16sa_neon() 582 "w"(_k22) // %16 in conv3x3s2_pack1to4_fp16sa_neon() 634 "w"(_k22) // %16 in conv3x3s2_pack1to4_fp16sa_neon()
|
/dports/benchmarks/vkpeak/vkpeak-20210430/ncnn/src/layer/arm/ |
H A D | convolutiondepthwise_3x3_pack4.h | 214 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 314 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 394 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 508 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 609 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 687 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 760 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 949 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() 1084 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() 1165 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() [all …]
|
H A D | convolutiondepthwise_3x3_pack4_bf16s.h | 286 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 432 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 537 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 689 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 822 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 918 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 1009 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 1036 _sum0 = vmlaq_f32(_sum0, _k22, _r22); in convdw3x3s1_pack4_bf16s_neon() 1251 "w"(_k22), // %16 in convdw3x3s2_pack4_bf16s_neon() 1359 "w"(_k22), // %16 in convdw3x3s2_pack4_bf16s_neon() [all …]
|
H A D | convolutiondepthwise_3x3_pack8_fp16s.h | 53 float16x8_t _k22 = vld1q_f16(k0 + 64); in convdw3x3s1_pack8_fp16sa_neon() local 210 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 305 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 384 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 489 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 556 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 613 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 663 float16x8_t _k22 = vld1q_f16(k0 + 64); in convdw3x3s2_pack8_fp16sa_neon() local 767 "w"(_k22), // %16 in convdw3x3s2_pack8_fp16sa_neon() 842 "w"(_k22), // %16 in convdw3x3s2_pack8_fp16sa_neon() [all …]
|
H A D | convolution_3x3_pack1to4_fp16s.h | 53 float16x4_t _k22 = vld1_f16(k0 + 32); in conv3x3s1_pack1to4_fp16sa_neon() local 182 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 267 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 328 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 380 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 435 float16x4_t _k22 = vld1_f16(k0 + 32); in conv3x3s2_pack1to4_fp16sa_neon() local 522 "w"(_k22) // %16 in conv3x3s2_pack1to4_fp16sa_neon() 582 "w"(_k22) // %16 in conv3x3s2_pack1to4_fp16sa_neon() 634 "w"(_k22) // %16 in conv3x3s2_pack1to4_fp16sa_neon()
|
H A D | convolution_3x3_pack1to8_fp16s.h | 53 float16x8_t _k22 = vld1q_f16(k0 + 64); in conv3x3s1_pack1to8_fp16sa_neon() local 182 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 267 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 328 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 380 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 435 float16x8_t _k22 = vld1q_f16(k0 + 64); in conv3x3s2_pack1to8_fp16sa_neon() local 522 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon() 582 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon() 634 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon()
|
/dports/misc/ncnn/ncnn-20211208/src/layer/arm/ |
H A D | convolutiondepthwise_3x3_pack4.h | 214 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 314 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 394 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 508 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 609 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 687 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 760 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 949 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() 1084 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() 1165 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() [all …]
|
H A D | convolutiondepthwise_3x3_pack4_bf16s.h | 286 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 432 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 537 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 689 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 822 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 918 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 1009 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 1036 _sum0 = vmlaq_f32(_sum0, _k22, _r22); in convdw3x3s1_pack4_bf16s_neon() 1251 "w"(_k22), // %16 in convdw3x3s2_pack4_bf16s_neon() 1359 "w"(_k22), // %16 in convdw3x3s2_pack4_bf16s_neon() [all …]
|
H A D | convolutiondepthwise_3x3_pack8_fp16s.h | 53 float16x8_t _k22 = vld1q_f16(k0 + 64); in convdw3x3s1_pack8_fp16sa_neon() local 210 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 305 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 384 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 489 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 556 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 613 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 663 float16x8_t _k22 = vld1q_f16(k0 + 64); in convdw3x3s2_pack8_fp16sa_neon() local 767 "w"(_k22), // %16 in convdw3x3s2_pack8_fp16sa_neon() 842 "w"(_k22), // %16 in convdw3x3s2_pack8_fp16sa_neon() [all …]
|
H A D | convolution_3x3_pack1to4_fp16s.h | 53 float16x4_t _k22 = vld1_f16(k0 + 32); in conv3x3s1_pack1to4_fp16sa_neon() local 182 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 267 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 328 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 380 "w"(_k22) // %16 in conv3x3s1_pack1to4_fp16sa_neon() 435 float16x4_t _k22 = vld1_f16(k0 + 32); in conv3x3s2_pack1to4_fp16sa_neon() local 522 "w"(_k22) // %16 in conv3x3s2_pack1to4_fp16sa_neon() 582 "w"(_k22) // %16 in conv3x3s2_pack1to4_fp16sa_neon() 634 "w"(_k22) // %16 in conv3x3s2_pack1to4_fp16sa_neon()
|
H A D | convolution_3x3_pack1to8_fp16s.h | 53 float16x8_t _k22 = vld1q_f16(k0 + 64); in conv3x3s1_pack1to8_fp16sa_neon() local 182 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 267 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 328 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 380 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 435 float16x8_t _k22 = vld1q_f16(k0 + 64); in conv3x3s2_pack1to8_fp16sa_neon() local 522 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon() 582 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon() 634 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon()
|
/dports/graphics/realsr-ncnn-vulkan/realsr-ncnn-vulkan-20210210/src/ncnn/src/layer/arm/ |
H A D | convolutiondepthwise_3x3_pack4.h | 214 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 314 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 394 "w"(_k22), // %20 in convdw3x3s1_pack4_neon() 508 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 609 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 687 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 760 "w"(_k22), // %16 in convdw3x3s1_pack4_neon() 949 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() 1084 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() 1165 "w"(_k22), // %16 in convdw3x3s2_pack4_neon() [all …]
|
H A D | convolutiondepthwise_3x3_pack4_bf16s.h | 286 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 432 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 537 "w"(_k22), // %20 in convdw3x3s1_pack4_bf16s_neon() 689 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 822 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 918 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 1009 "w"(_k22), // %16 in convdw3x3s1_pack4_bf16s_neon() 1036 _sum0 = vmlaq_f32(_sum0, _k22, _r22); in convdw3x3s1_pack4_bf16s_neon() 1251 "w"(_k22), // %16 in convdw3x3s2_pack4_bf16s_neon() 1359 "w"(_k22), // %16 in convdw3x3s2_pack4_bf16s_neon() [all …]
|
H A D | convolutiondepthwise_3x3_pack8_fp16s.h | 53 float16x8_t _k22 = vld1q_f16(k0 + 64); in convdw3x3s1_pack8_fp16sa_neon() local 210 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 305 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 384 "w"(_k22), // %20 in convdw3x3s1_pack8_fp16sa_neon() 489 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 556 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 613 "w"(_k22), // %16 in convdw3x3s1_pack8_fp16sa_neon() 663 float16x8_t _k22 = vld1q_f16(k0 + 64); in convdw3x3s2_pack8_fp16sa_neon() local 767 "w"(_k22), // %16 in convdw3x3s2_pack8_fp16sa_neon() 842 "w"(_k22), // %16 in convdw3x3s2_pack8_fp16sa_neon() [all …]
|
H A D | convolution_3x3_pack1to8_fp16s.h | 53 float16x8_t _k22 = vld1q_f16(k0 + 64); in conv3x3s1_pack1to8_fp16sa_neon() local 182 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 267 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 328 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 380 "w"(_k22) // %16 in conv3x3s1_pack1to8_fp16sa_neon() 435 float16x8_t _k22 = vld1q_f16(k0 + 64); in conv3x3s2_pack1to8_fp16sa_neon() local 522 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon() 582 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon() 634 "w"(_k22) // %16 in conv3x3s2_pack1to8_fp16sa_neon()
|
/dports/misc/ncnn/ncnn-20211208/src/layer/riscv/ |
H A D | convolution_3x3_pack1ton.h | 56 vfloat32m1_t _k22 = vle32_v_f32m1(k0 + packn * 8, vl); in conv3x3s1_pack1ton_rvv() local 139 _sum0 = vfmacc_vf_f32m1(_sum0, r2[2], _k22, vl); in conv3x3s1_pack1ton_rvv() 140 _sum1 = vfmacc_vf_f32m1(_sum1, r2[3], _k22, vl); in conv3x3s1_pack1ton_rvv() 141 _sum2 = vfmacc_vf_f32m1(_sum2, r2[4], _k22, vl); in conv3x3s1_pack1ton_rvv() 142 _sum3 = vfmacc_vf_f32m1(_sum3, r2[5], _k22, vl); in conv3x3s1_pack1ton_rvv() 143 _sum4 = vfmacc_vf_f32m1(_sum4, r2[6], _k22, vl); in conv3x3s1_pack1ton_rvv() 144 _sum5 = vfmacc_vf_f32m1(_sum5, r2[7], _k22, vl); in conv3x3s1_pack1ton_rvv() 145 _sum6 = vfmacc_vf_f32m1(_sum6, r2[8], _k22, vl); in conv3x3s1_pack1ton_rvv() 146 _sum7 = vfmacc_vf_f32m1(_sum7, r2[9], _k22, vl); in conv3x3s1_pack1ton_rvv() 204 _sum0 = vfmacc_vf_f32m1(_sum0, r2[2], _k22, vl); in conv3x3s1_pack1ton_rvv() [all …]
|