Home
last modified time | relevance | path

Searched refs:yvec2 (Results 1 – 5 of 5) sorted by relevance

/dports/math/openblas/OpenBLAS-0.3.18/kernel/x86_64/
H A Dzgemm_kernel_4x4_sandy.S405 SHUF_DY $0x03, yvec2, yvec2, yvec4;
459 SHUF_DY $0x03, yvec2, yvec2, yvec4;
513 SHUF_DY $0x03, yvec2, yvec2, yvec4;
634 SHUF_DY $0x03, yvec2, yvec2, yvec4;
699 SHUF_DY $0x03, yvec2, yvec2, yvec4;
812 MUL_DY yvec6, yvec2, yvec2;
1053 SHUF_DY $0x03, yvec2, yvec2, yvec4;
1068 SHUF_DY $0x03, yvec2, yvec2, yvec4;
1085 SHUF_DY $0x03, yvec2, yvec2, yvec4;
1340 MUL_DY yvec6, yvec2, yvec2;
[all …]
H A Dcgemm_kernel_4x8_sandy.S820 MUL_SY yvec2, yvec6, yvec2;
1104 SHUF_SY $0x03, yvec2, yvec2, yvec4;
1118 SHUF_SY $0x03, yvec2, yvec2, yvec4;
1135 SHUF_SY $0x03, yvec2, yvec2, yvec4;
1149 SHUF_SY $0x03, yvec2, yvec2, yvec4;
1166 SHUF_SY $0x03, yvec2, yvec2, yvec4;
1180 SHUF_SY $0x03, yvec2, yvec2, yvec4;
1197 SHUF_SY $0x03, yvec2, yvec2, yvec4;
1211 SHUF_SY $0x03, yvec2, yvec2, yvec4;
1241 SHUF_SY $0x03, yvec2, yvec2, yvec4;
[all …]
H A Ddgemm_kernel_4x8_sandy.S323 SHUF_DY $0x03, yvec2, yvec2, yvec4;
351 SHUF_DY $0x03, yvec2, yvec2, yvec4;
379 SHUF_DY $0x03, yvec2, yvec2, yvec4;
408 SHUF_DY $0x03, yvec2, yvec2, yvec4;
453 SHUF_DY $0x03, yvec2, yvec2, yvec4;
482 SHUF_DY $0x03, yvec2, yvec2, yvec4;
523 SHUF_DY $0x03, yvec2, yvec2, yvec4;
812 SHUF_DY $0x03, yvec2, yvec2, yvec4;
828 SHUF_DY $0x03, yvec2, yvec2, yvec4;
844 SHUF_DY $0x03, yvec2, yvec2, yvec4;
[all …]
H A Dsgemm_kernel_8x8_sandy.S335 SHUF_SY $0x03, yvec2, yvec2, yvec4;
350 SHUF_SY $0x03, yvec2, yvec2, yvec4;
365 SHUF_SY $0x03, yvec2, yvec2, yvec4;
380 SHUF_SY $0x03, yvec2, yvec2, yvec4;
396 SHUF_SY $0x03, yvec2, yvec2, yvec4;
412 SHUF_SY $0x03, yvec2, yvec2, yvec4;
427 SHUF_SY $0x03, yvec2, yvec2, yvec4;
443 SHUF_SY $0x03, yvec2, yvec2, yvec4;
470 SHUF_SY $0x03, yvec2, yvec2, yvec4;
486 SHUF_SY $0x03, yvec2, yvec2, yvec4;
[all …]
/dports/math/ntl/ntl-11.5.1/src/
H A Dmat_lzz_p.cpp1350 __m256d yvec0, yvec1, yvec2, yvec3; in muladd_interval() local
1362 yvec2 = _mm256_load_pd(y+2*4); in muladd_interval()
1367 MUL_ADD(xvec2, yvec2, cvec); in muladd_interval()
1384 __m256d yvec0, yvec1, yvec2, yvec3; in muladd_interval1() local
1399 yvec2 = _mm256_load_pd(y+2*4); in muladd_interval1()
1404 MUL_ADD(xvec2, yvec2, cvec); in muladd_interval1()