Searched refs:yvec2 (Results 1 – 5 of 5) sorted by relevance
/dports/math/openblas/OpenBLAS-0.3.18/kernel/x86_64/ |
H A D | zgemm_kernel_4x4_sandy.S | 405 SHUF_DY $0x03, yvec2, yvec2, yvec4; 459 SHUF_DY $0x03, yvec2, yvec2, yvec4; 513 SHUF_DY $0x03, yvec2, yvec2, yvec4; 634 SHUF_DY $0x03, yvec2, yvec2, yvec4; 699 SHUF_DY $0x03, yvec2, yvec2, yvec4; 812 MUL_DY yvec6, yvec2, yvec2; 1053 SHUF_DY $0x03, yvec2, yvec2, yvec4; 1068 SHUF_DY $0x03, yvec2, yvec2, yvec4; 1085 SHUF_DY $0x03, yvec2, yvec2, yvec4; 1340 MUL_DY yvec6, yvec2, yvec2; [all …]
|
H A D | cgemm_kernel_4x8_sandy.S | 820 MUL_SY yvec2, yvec6, yvec2; 1104 SHUF_SY $0x03, yvec2, yvec2, yvec4; 1118 SHUF_SY $0x03, yvec2, yvec2, yvec4; 1135 SHUF_SY $0x03, yvec2, yvec2, yvec4; 1149 SHUF_SY $0x03, yvec2, yvec2, yvec4; 1166 SHUF_SY $0x03, yvec2, yvec2, yvec4; 1180 SHUF_SY $0x03, yvec2, yvec2, yvec4; 1197 SHUF_SY $0x03, yvec2, yvec2, yvec4; 1211 SHUF_SY $0x03, yvec2, yvec2, yvec4; 1241 SHUF_SY $0x03, yvec2, yvec2, yvec4; [all …]
|
H A D | dgemm_kernel_4x8_sandy.S | 323 SHUF_DY $0x03, yvec2, yvec2, yvec4; 351 SHUF_DY $0x03, yvec2, yvec2, yvec4; 379 SHUF_DY $0x03, yvec2, yvec2, yvec4; 408 SHUF_DY $0x03, yvec2, yvec2, yvec4; 453 SHUF_DY $0x03, yvec2, yvec2, yvec4; 482 SHUF_DY $0x03, yvec2, yvec2, yvec4; 523 SHUF_DY $0x03, yvec2, yvec2, yvec4; 812 SHUF_DY $0x03, yvec2, yvec2, yvec4; 828 SHUF_DY $0x03, yvec2, yvec2, yvec4; 844 SHUF_DY $0x03, yvec2, yvec2, yvec4; [all …]
|
H A D | sgemm_kernel_8x8_sandy.S | 335 SHUF_SY $0x03, yvec2, yvec2, yvec4; 350 SHUF_SY $0x03, yvec2, yvec2, yvec4; 365 SHUF_SY $0x03, yvec2, yvec2, yvec4; 380 SHUF_SY $0x03, yvec2, yvec2, yvec4; 396 SHUF_SY $0x03, yvec2, yvec2, yvec4; 412 SHUF_SY $0x03, yvec2, yvec2, yvec4; 427 SHUF_SY $0x03, yvec2, yvec2, yvec4; 443 SHUF_SY $0x03, yvec2, yvec2, yvec4; 470 SHUF_SY $0x03, yvec2, yvec2, yvec4; 486 SHUF_SY $0x03, yvec2, yvec2, yvec4; [all …]
|
/dports/math/ntl/ntl-11.5.1/src/ |
H A D | mat_lzz_p.cpp | 1350 __m256d yvec0, yvec1, yvec2, yvec3; in muladd_interval() local 1362 yvec2 = _mm256_load_pd(y+2*4); in muladd_interval() 1367 MUL_ADD(xvec2, yvec2, cvec); in muladd_interval() 1384 __m256d yvec0, yvec1, yvec2, yvec3; in muladd_interval1() local 1399 yvec2 = _mm256_load_pd(y+2*4); in muladd_interval1() 1404 MUL_ADD(xvec2, yvec2, cvec); in muladd_interval1()
|