/dports/math/blasfeo/blasfeo-0.1.2/experimental/giaf/blas/kernel/avx2/ |
H A D | archive.S | 92 vbroadcastsd 0(%r13), %ymm12 // B 94 vbroadcastsd 8(%r13), %ymm12 // B 105 vbroadcastsd 0(%r13), %ymm12 // B 107 vbroadcastsd 8(%r13), %ymm12 // B 118 vbroadcastsd 0(%r13), %ymm12 // B 120 vbroadcastsd 8(%r13), %ymm12 // B 131 vbroadcastsd 0(%r13), %ymm12 // B 133 vbroadcastsd 8(%r13), %ymm12 // B 155 vbroadcastsd 0(%r13), %ymm12 // B 157 vbroadcastsd 8(%r13), %ymm12 // B [all …]
|
H A D | kernel_dgemm_12x4_lib.S | 215 vbroadcastsd 0(%r13), %ymm12 // B 219 vbroadcastsd 8(%r13), %ymm12 // B 237 vbroadcastsd 0(%r13), %ymm12 // B 241 vbroadcastsd 8(%r13), %ymm12 // B 259 vbroadcastsd 0(%r13), %ymm12 // B 263 vbroadcastsd 8(%r13), %ymm12 // B 281 vbroadcastsd 0(%r13), %ymm12 // B 285 vbroadcastsd 8(%r13), %ymm12 // B 315 vbroadcastsd 0(%r13), %ymm12 // B 319 vbroadcastsd 8(%r13), %ymm12 // B [all …]
|
H A D | kernel_dgemm_8x4_lib.S | 210 vbroadcastsd 0(%r13), %ymm12 // B 213 vbroadcastsd 8(%r13), %ymm12 // B 227 vbroadcastsd 0(%r13), %ymm12 // B 230 vbroadcastsd 8(%r13), %ymm12 // B 244 vbroadcastsd 0(%r13), %ymm12 // B 247 vbroadcastsd 8(%r13), %ymm12 // B 261 vbroadcastsd 0(%r13), %ymm12 // B 264 vbroadcastsd 8(%r13), %ymm12 // B 290 vbroadcastsd 0(%r13), %ymm12 // B 293 vbroadcastsd 8(%r13), %ymm12 // B [all …]
|
H A D | kernel_dgemm_4x4_lib.S | 208 vbroadcastsd 0(%r12), %ymm12 // B 210 vbroadcastsd 8(%r12), %ymm12 // B 220 vbroadcastsd 0(%r12), %ymm12 // B 222 vbroadcastsd 8(%r12), %ymm12 // B 232 vbroadcastsd 0(%r12), %ymm12 // B 234 vbroadcastsd 8(%r12), %ymm12 // B 244 vbroadcastsd 0(%r12), %ymm12 // B 246 vbroadcastsd 8(%r12), %ymm12 // B 268 vbroadcastsd 0(%r12), %ymm12 // B 270 vbroadcastsd 8(%r12), %ymm12 // B [all …]
|
/dports/math/blasfeo/blasfeo-0.1.2/kernel/avx2/archive/ |
H A D | kernel_dgemm_12x4_lib.S | 98 vbroadcastsd 0(%r13), %ymm12 // B 99 vfmadd231pd %ymm13, %ymm12, %ymm0 102 vbroadcastsd 8(%r13), %ymm12 // B 121 vbroadcastsd 0(%r13), %ymm12 // B 125 vbroadcastsd 8(%r13), %ymm12 // B 144 vbroadcastsd 0(%r13), %ymm12 // B 148 vbroadcastsd 8(%r13), %ymm12 // B 167 vbroadcastsd 0(%r13), %ymm12 // B 171 vbroadcastsd 8(%r13), %ymm12 // B 201 vbroadcastsd 0(%r13), %ymm12 // B [all …]
|
H A D | kernel_dgemm_8x4_lib.S | 93 vbroadcastsd 0(%r13), %ymm12 // B 96 vbroadcastsd 8(%r13), %ymm12 // B 111 vbroadcastsd 0(%r13), %ymm12 // B 114 vbroadcastsd 8(%r13), %ymm12 // B 129 vbroadcastsd 0(%r13), %ymm12 // B 132 vbroadcastsd 8(%r13), %ymm12 // B 147 vbroadcastsd 0(%r13), %ymm12 // B 150 vbroadcastsd 8(%r13), %ymm12 // B 176 vbroadcastsd 0(%r13), %ymm12 // B 179 vbroadcastsd 8(%r13), %ymm12 // B [all …]
|
H A D | archive.S | 543 vbroadcastsd 0(%r12), %ymm12 // B 545 vbroadcastsd 8(%r12), %ymm12 // B 555 vbroadcastsd 0(%r12), %ymm12 // B 557 vbroadcastsd 8(%r12), %ymm12 // B 567 vbroadcastsd 0(%r12), %ymm12 // B 569 vbroadcastsd 8(%r12), %ymm12 // B 579 vbroadcastsd 0(%r12), %ymm12 // B 581 vbroadcastsd 8(%r12), %ymm12 // B 603 vbroadcastsd 0(%r12), %ymm12 // B 605 vbroadcastsd 8(%r12), %ymm12 // B [all …]
|
H A D | kernel_dgemm_4x4_lib.S | 92 vbroadcastsd 0(%r13), %ymm12 // B 94 vbroadcastsd 8(%r13), %ymm12 // B 105 vbroadcastsd 0(%r13), %ymm12 // B 107 vbroadcastsd 8(%r13), %ymm12 // B 118 vbroadcastsd 0(%r13), %ymm12 // B 120 vbroadcastsd 8(%r13), %ymm12 // B 131 vbroadcastsd 0(%r13), %ymm12 // B 133 vbroadcastsd 8(%r13), %ymm12 // B 155 vbroadcastsd 0(%r13), %ymm12 // B 157 vbroadcastsd 8(%r13), %ymm12 // B [all …]
|
/dports/math/blasfeo/blasfeo-0.1.2/kernel/avx2/ |
H A D | kernel_dgemm_12x4_lib.S | 11181 vblendpd $0x1, %ymm15, %ymm12, %ymm12 11204 vblendpd $0x3, %ymm15, %ymm12, %ymm12 11227 vblendpd $0x7, %ymm15, %ymm12, %ymm12 11269 vblendpd $0x1, %ymm14, %ymm12, %ymm12 11287 vblendpd $0x3, %ymm14, %ymm12, %ymm12 11305 vblendpd $0x7, %ymm14, %ymm12, %ymm12 11338 vblendpd $0x1, %ymm14, %ymm12, %ymm12 11350 vblendpd $0x3, %ymm14, %ymm12, %ymm12 12910 vblendpd $0x4, %ymm6, %ymm12, %ymm12 12929 vblendpd $0x4, %ymm7, %ymm12, %ymm12 [all …]
|
H A D | kernel_dgemm_8x4_lib.S | 9162 vblendpd $0x1, %ymm14, %ymm12, %ymm12 9180 vblendpd $0x3, %ymm14, %ymm12, %ymm12 9198 vblendpd $0x7, %ymm14, %ymm12, %ymm12 9230 vblendpd $0x1, %ymm14, %ymm12, %ymm12 9242 vblendpd $0x3, %ymm14, %ymm12, %ymm12 9254 vblendpd $0x7, %ymm14, %ymm12, %ymm12 10536 vblendpd $0x1, %ymm15, %ymm12, %ymm12 10553 vblendpd $0x3, %ymm15, %ymm12, %ymm12 10633 vblendpd $0x4, %ymm6, %ymm12, %ymm12 10649 vblendpd $0x4, %ymm7, %ymm12, %ymm12 [all …]
|
H A D | kernel_dgemm_12x4_lib4.S | 6002 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 6017 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 6032 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 6047 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 6352 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 6363 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 6374 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 6385 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 6396 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 6407 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 [all …]
|
H A D | kernel_dgemm_4x4_lib4.S | 2929 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 2939 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 3392 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 3402 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 5758 vandpd %ymm12, %ymm15, %ymm12 5787 vandpd %ymm12, %ymm15, %ymm12 5818 vandpd %ymm12, %ymm15, %ymm12 6043 vandpd %ymm12, %ymm15, %ymm12 6134 vandpd %ymm12, %ymm15, %ymm12 6228 vandpd %ymm12, %ymm15, %ymm12 [all …]
|
H A D | kernel_dgemm_8x4_lib4.S | 3976 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 3986 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 3996 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4006 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4246 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4257 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4268 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4279 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4972 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4982 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 [all …]
|
H A D | kernel_dgebp_lib4.S | 211 vmovapd 0(%r14), %ymm12 231 vmovapd %ymm12, 0(%r14) 235 vmovapd 32(%r14), %ymm12 254 vmovapd %ymm12, 32(%r14) 258 vmovapd 64(%r14), %ymm12 314 vmovapd 0(%r14), %ymm12 333 vmovapd %ymm12, 0(%r14) 423 vmovapd 0(%r14), %ymm12 443 vmovapd %ymm12, 0(%r14) 526 vmovapd 0(%r14), %ymm12 [all …]
|
H A D | kernel_sgemm_16x4_lib8.S | 504 vshufps $0x00, %ymm12, %ymm12, %ymm14 517 vshufps $0x55, %ymm12, %ymm12, %ymm14 523 vshufps $0xaa, %ymm12, %ymm12, %ymm14 528 vshufps $0xff, %ymm12, %ymm12, %ymm14 553 vshufps $0x00, %ymm12, %ymm12, %ymm14 560 vshufps $0x55, %ymm12, %ymm12, %ymm14 566 vshufps $0xaa, %ymm12, %ymm12, %ymm14 572 vshufps $0xff, %ymm12, %ymm12, %ymm14 598 vshufps $0x00, %ymm12, %ymm12, %ymm14 615 vshufps $0x55, %ymm12, %ymm12, %ymm14 [all …]
|
H A D | kernel_sgemm_24x4_lib8.S | 577 vpermilps $0xb1, %ymm12, %ymm12 582 vpermilps $0x4e, %ymm12, %ymm12 587 vpermilps $0xb1, %ymm12, %ymm12 602 vpermilps $0xb1, %ymm12, %ymm12 607 vpermilps $0x4e, %ymm12, %ymm12 612 vpermilps $0xb1, %ymm12, %ymm12 628 vpermilps $0xb1, %ymm12, %ymm12 633 vpermilps $0x4e, %ymm12, %ymm12 638 vpermilps $0xb1, %ymm12, %ymm12 654 vpermilps $0xb1, %ymm12, %ymm12 [all …]
|
H A D | kernel_sgemm_8x8_lib8.S | 1900 vmovaps 0(%r13), %ymm12 1902 vmovaps 32(%r13), %ymm12 1904 vmovaps 64(%r13), %ymm12 1906 vmovaps 96(%r13), %ymm12 2117 vmovaps 0(%r11), %ymm12 2119 vmovaps 32(%r11), %ymm12 2121 vmovaps 64(%r11), %ymm12 2123 vmovaps 96(%r11), %ymm12 2426 vmovaps 0(%r13), %ymm12 2428 vmovaps 32(%r13), %ymm12 [all …]
|
H A D | kernel_dgemm_4x4_lib.S | 4807 vbroadcastsd 0(%r12), %ymm12 4812 vbroadcastsd 0(%r12), %ymm12 4814 vbroadcastsd 8(%r12), %ymm12 4819 vbroadcastsd 0(%r12), %ymm12 4821 vbroadcastsd 8(%r12), %ymm12 5126 vmovupd 0(%r10), %ymm12 5127 vblendpd $0x1, %ymm14, %ymm12, %ymm12 5138 vmovupd 0(%r10), %ymm12 5139 vblendpd $0x3, %ymm14, %ymm12, %ymm12 5150 vmovupd 0(%r10), %ymm12 [all …]
|
H A D | kernel_sgemm_16x8_lib8.S | 1317 vmovaps 0(%r10), %ymm12 1323 vmovaps %ymm14, %ymm12 1333 vmovaps 64(%r10), %ymm12 1339 vmovaps %ymm14, %ymm12 1395 vbroadcastss 0(%r10), %ymm12 1397 vmulps %ymm0, %ymm12, %ymm0 1398 vmulps %ymm1, %ymm12, %ymm1 1399 vmulps %ymm2, %ymm12, %ymm2 1400 vmulps %ymm3, %ymm12, %ymm3 1402 vmulps %ymm4, %ymm12, %ymm4 [all …]
|
H A D | kernel_sgemm_8x4_lib8.S | 3275 vmovaps 0(%r13), %ymm12 3276 vmulps %ymm12, %ymm15, %ymm12 3278 vmovaps 32(%r13), %ymm12 3279 vmulps %ymm12, %ymm15, %ymm12 3281 vmovaps 64(%r13), %ymm12 3282 vmulps %ymm12, %ymm15, %ymm12 3284 vmovaps 96(%r13), %ymm12 3285 vmulps %ymm12, %ymm15, %ymm12 3479 vmovaps 0(%r11), %ymm12 3481 vmovaps 32(%r11), %ymm12 [all …]
|
/dports/math/blasfeo/blasfeo-0.1.2/kernel/avx/ |
H A D | kernel_dgemm_4x4_lib4.S | 809 vaddpd %ymm15, %ymm12, %ymm12 813 vaddpd %ymm15, %ymm12, %ymm12 816 vaddpd %ymm15, %ymm12, %ymm12 819 vaddpd %ymm15, %ymm12, %ymm12 825 vaddpd %ymm15, %ymm12, %ymm12 828 vaddpd %ymm15, %ymm12, %ymm12 831 vaddpd %ymm15, %ymm12, %ymm12 3063 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 3075 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 3550 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 [all …]
|
H A D | kernel_dgemm_8x4_lib4.S | 4476 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4488 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4500 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4512 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4778 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4791 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4804 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 4817 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 5482 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 5494 vperm2f128 $0x01, %ymm12, %ymm12, %ymm12 [all …]
|
H A D | kernel_dgemv_4_lib4.S | 1485 vperm2f128 $0x00, %ymm12, %ymm12, %ymm12 1495 vperm2f128 $0x00, %ymm12, %ymm12, %ymm12 1505 vperm2f128 $0x11, %ymm12, %ymm12, %ymm12 1559 vperm2f128 $0x00, %ymm12, %ymm12, %ymm12 1572 vperm2f128 $0x00, %ymm12, %ymm12, %ymm12 1585 vperm2f128 $0x11, %ymm12, %ymm12, %ymm12 1635 vperm2f128 $0x00, %ymm12, %ymm12, %ymm12 1642 vperm2f128 $0x00, %ymm12, %ymm12, %ymm12 1649 vperm2f128 $0x11, %ymm12, %ymm12, %ymm12 1691 vperm2f128 $0x00, %ymm12, %ymm12, %ymm12 [all …]
|
H A D | kernel_sgemm_8x8_lib8.S | 2316 vmovaps 0(%r13), %ymm12 2317 vmulps %ymm12, %ymm15, %ymm12 2320 vmulps %ymm12, %ymm15, %ymm12 2323 vmulps %ymm12, %ymm15, %ymm12 2326 vmulps %ymm12, %ymm15, %ymm12 2662 vmovaps 0(%r13), %ymm12 2663 vmulps %ymm12, %ymm15, %ymm12 2666 vmulps %ymm12, %ymm15, %ymm12 2669 vmulps %ymm12, %ymm15, %ymm12 2672 vmulps %ymm12, %ymm15, %ymm12 [all …]
|
/dports/math/blasfeo/blasfeo-0.1.2/experimental/giaf/blas/kernel/avx/ |
H A D | kernel_dgemm_4x4_lib.S | 209 vmulpd %ymm13, %ymm12, %ymm15 212 vmulpd %ymm13, %ymm12, %ymm15 215 vmulpd %ymm13, %ymm12, %ymm15 218 vmulpd %ymm13, %ymm12, %ymm15 225 vmulpd %ymm13, %ymm12, %ymm15 228 vmulpd %ymm13, %ymm12, %ymm15 231 vmulpd %ymm13, %ymm12, %ymm15 234 vmulpd %ymm13, %ymm12, %ymm15 241 vmulpd %ymm13, %ymm12, %ymm15 244 vmulpd %ymm13, %ymm12, %ymm15 [all …]
|