/dports/math/blasfeo/blasfeo-0.1.2/kernel/avx2/archive/ |
H A D | kernel_dgemm_12x4_lib.S | 99 vfmadd231pd %ymm13, %ymm12, %ymm0 100 vfmadd231pd %ymm14, %ymm12, %ymm4 101 vfmadd231pd %ymm15, %ymm12, %ymm8 103 vfmadd231pd %ymm13, %ymm12, %ymm1 104 vfmadd231pd %ymm14, %ymm12, %ymm5 105 vfmadd231pd %ymm15, %ymm12, %ymm9 107 vfmadd231pd %ymm13, %ymm12, %ymm2 108 vfmadd231pd %ymm14, %ymm12, %ymm6 111 vfmadd231pd %ymm13, %ymm12, %ymm3 112 vfmadd231pd %ymm14, %ymm12, %ymm7 [all …]
|
H A D | kernel_dgemm_8x4_lib.S | 94 vfmadd231pd %ymm13, %ymm12, %ymm0 95 vfmadd231pd %ymm14, %ymm12, %ymm4 97 vfmadd231pd %ymm13, %ymm12, %ymm1 98 vfmadd231pd %ymm14, %ymm12, %ymm5 100 vfmadd231pd %ymm13, %ymm12, %ymm2 101 vfmadd231pd %ymm14, %ymm12, %ymm6 103 vfmadd231pd %ymm13, %ymm12, %ymm3 104 vfmadd231pd %ymm14, %ymm12, %ymm7 112 vfmadd231pd %ymm13, %ymm12, %ymm0 113 vfmadd231pd %ymm14, %ymm12, %ymm4 [all …]
|
H A D | kernel_dgemm_6xX_lib4.S | 211 vfmadd231pd %ymm12, %ymm14, %ymm0 212 vfmadd231pd %ymm13, %ymm14, %ymm6 215 vfmadd231pd %ymm12, %ymm14, %ymm1 216 vfmadd231pd %ymm13, %ymm14, %ymm7 219 vfmadd231pd %ymm12, %ymm14, %ymm2 220 vfmadd231pd %ymm13, %ymm14, %ymm8 223 vfmadd231pd %ymm12, %ymm14, %ymm3 224 vfmadd231pd %ymm13, %ymm14, %ymm9 227 vfmadd231pd %ymm12, %ymm14, %ymm4 231 vfmadd231pd %ymm12, %ymm14, %ymm5 [all …]
|
H A D | kernel_dgemm_4x4_lib.S | 93 vfmadd231pd %ymm13, %ymm12, %ymm0 95 vfmadd231pd %ymm13, %ymm12, %ymm1 97 vfmadd231pd %ymm13, %ymm12, %ymm2 99 vfmadd231pd %ymm13, %ymm12, %ymm3 106 vfmadd231pd %ymm13, %ymm12, %ymm4 108 vfmadd231pd %ymm13, %ymm12, %ymm5 110 vfmadd231pd %ymm13, %ymm12, %ymm6 112 vfmadd231pd %ymm13, %ymm12, %ymm7 119 vfmadd231pd %ymm13, %ymm12, %ymm0 121 vfmadd231pd %ymm13, %ymm12, %ymm1 [all …]
|
/dports/math/blasfeo/blasfeo-0.1.2/kernel/avx2/ |
H A D | kernel_dgemm_12x4_lib.S | 84 vfmadd231pd %ymm13, %ymm12, %ymm0 85 vfmadd231pd %ymm14, %ymm12, %ymm4 86 vfmadd231pd %ymm15, %ymm12, %ymm8 88 vfmadd231pd %ymm13, %ymm12, %ymm1 90 vfmadd231pd %ymm14, %ymm12, %ymm5 91 vfmadd231pd %ymm15, %ymm12, %ymm9 93 vfmadd231pd %ymm13, %ymm12, %ymm2 94 vfmadd231pd %ymm14, %ymm12, %ymm6 97 vfmadd231pd %ymm13, %ymm12, %ymm3 98 vfmadd231pd %ymm14, %ymm12, %ymm7 [all …]
|
H A D | kernel_dgemm_12x4_lib4.S | 632 vfmadd231pd %ymm12, %ymm15, %ymm0 634 vfmadd231pd %ymm13, %ymm15, %ymm4 635 vfmadd231pd %ymm14, %ymm15, %ymm8 638 vfmadd231pd %ymm12, %ymm15, %ymm1 639 vfmadd231pd %ymm13, %ymm15, %ymm5 640 vfmadd231pd %ymm14, %ymm15, %ymm9 643 vfmadd231pd %ymm12, %ymm15, %ymm3 644 vfmadd231pd %ymm13, %ymm15, %ymm7 648 vfmadd231pd %ymm12, %ymm15, %ymm2 650 vfmadd231pd %ymm13, %ymm15, %ymm6 [all …]
|
H A D | kernel_dgemm_8x4_lib.S | 79 vfmadd231pd %ymm13, %ymm12, %ymm0 80 vfmadd231pd %ymm14, %ymm12, %ymm4 82 vfmadd231pd %ymm13, %ymm12, %ymm1 84 vfmadd231pd %ymm14, %ymm12, %ymm5 86 vfmadd231pd %ymm13, %ymm12, %ymm2 87 vfmadd231pd %ymm14, %ymm12, %ymm6 89 vfmadd231pd %ymm13, %ymm12, %ymm3 90 vfmadd231pd %ymm14, %ymm12, %ymm7 97 vfmadd231pd %ymm13, %ymm12, %ymm0 98 vfmadd231pd %ymm14, %ymm12, %ymm4 [all …]
|
H A D | kernel_dgebp_lib4.S | 966 vfmadd231pd %ymm12, %ymm13, %ymm0 968 vfmadd231pd %ymm12, %ymm13, %ymm1 970 vfmadd231pd %ymm12, %ymm13, %ymm2 972 vfmadd231pd %ymm12, %ymm13, %ymm3 974 vfmadd231pd %ymm12, %ymm13, %ymm4 976 vfmadd231pd %ymm12, %ymm13, %ymm5 978 vfmadd231pd %ymm12, %ymm13, %ymm6 980 vfmadd231pd %ymm12, %ymm13, %ymm7 982 vfmadd231pd %ymm12, %ymm13, %ymm8 984 vfmadd231pd %ymm12, %ymm13, %ymm9 [all …]
|
H A D | kernel_dgelqf_4_lib4.S | 341 vfmadd231pd %ymm0, %ymm14, %ymm8 342 vfmadd231pd %ymm1, %ymm14, %ymm9 352 vfmadd231pd %ymm0, %ymm14, %ymm8 353 vfmadd231pd %ymm1, %ymm14, %ymm9 364 vfmadd231pd %ymm0, %ymm14, %ymm8 365 vfmadd231pd %ymm1, %ymm14, %ymm9 367 vfmadd231pd %ymm8, %ymm8, %ymm15 382 vfmadd231pd %ymm0, %ymm14, %ymm8 383 vfmadd231pd %ymm1, %ymm14, %ymm9 385 vfmadd231pd %ymm8, %ymm8, %ymm15 [all …]
|
/dports/math/blasfeo/blasfeo-0.1.2/experimental/giaf/blas/kernel/avx2/ |
H A D | kernel_dgemm_12x4_lib.S | 216 vfmadd231pd %ymm13, %ymm12, %ymm0 217 vfmadd231pd %ymm14, %ymm12, %ymm4 218 vfmadd231pd %ymm15, %ymm12, %ymm8 220 vfmadd231pd %ymm13, %ymm12, %ymm1 221 vfmadd231pd %ymm14, %ymm12, %ymm5 222 vfmadd231pd %ymm15, %ymm12, %ymm9 224 vfmadd231pd %ymm13, %ymm12, %ymm2 225 vfmadd231pd %ymm14, %ymm12, %ymm6 228 vfmadd231pd %ymm13, %ymm12, %ymm3 229 vfmadd231pd %ymm14, %ymm12, %ymm7 [all …]
|
H A D | archive.S | 93 vfmadd231pd %ymm13, %ymm12, %ymm0 95 vfmadd231pd %ymm13, %ymm12, %ymm1 97 vfmadd231pd %ymm13, %ymm12, %ymm2 99 vfmadd231pd %ymm13, %ymm12, %ymm3 106 vfmadd231pd %ymm13, %ymm12, %ymm4 108 vfmadd231pd %ymm13, %ymm12, %ymm5 110 vfmadd231pd %ymm13, %ymm12, %ymm6 112 vfmadd231pd %ymm13, %ymm12, %ymm7 119 vfmadd231pd %ymm13, %ymm12, %ymm0 121 vfmadd231pd %ymm13, %ymm12, %ymm1 [all …]
|
H A D | kernel_dgemm_8x4_lib.S | 211 vfmadd231pd %ymm13, %ymm12, %ymm0 212 vfmadd231pd %ymm14, %ymm12, %ymm4 214 vfmadd231pd %ymm13, %ymm12, %ymm1 215 vfmadd231pd %ymm14, %ymm12, %ymm5 217 vfmadd231pd %ymm13, %ymm12, %ymm2 218 vfmadd231pd %ymm14, %ymm12, %ymm6 220 vfmadd231pd %ymm13, %ymm12, %ymm3 221 vfmadd231pd %ymm14, %ymm12, %ymm7 228 vfmadd231pd %ymm13, %ymm12, %ymm0 229 vfmadd231pd %ymm14, %ymm12, %ymm4 [all …]
|
/dports/math/blis/blis-0.8.1/kernels/knc/3/ |
H A D | bli_dgemm_knc_asm_30x8.c | 419 vfmadd231pd zmm0, zmm31, [r9+0] in bli_dgemm_knc_asm_30x8() 420 vfmadd231pd zmm1, zmm31, [r9+r11+0] in bli_dgemm_knc_asm_30x8() 422 vfmadd231pd zmm3, zmm31, [r9+r10+0] in bli_dgemm_knc_asm_30x8() 433 vfmadd231pd zmm4, zmm31, [r9+0] in bli_dgemm_knc_asm_30x8() 434 vfmadd231pd zmm5, zmm31, [r9+r11+0] in bli_dgemm_knc_asm_30x8() 447 vfmadd231pd zmm8, zmm31, [r9+0] in bli_dgemm_knc_asm_30x8() 461 vfmadd231pd zmm12, zmm31, [r9+0] in bli_dgemm_knc_asm_30x8() 475 vfmadd231pd zmm16, zmm31, [r9+0] in bli_dgemm_knc_asm_30x8() 489 vfmadd231pd zmm20, zmm31, [r9+0] in bli_dgemm_knc_asm_30x8() 503 vfmadd231pd zmm24, zmm31, [r9+0] in bli_dgemm_knc_asm_30x8() [all …]
|
/dports/math/blis/blis-0.8.1/kernels/haswell/3/sup/old/ |
H A D | bli_gemmsup_rd_haswell_asm_d6x8m.c | 301 vfmadd231pd(ymm0, ymm3, ymm4) 302 vfmadd231pd(ymm1, ymm3, ymm5) 303 vfmadd231pd(ymm2, ymm3, ymm6) 306 vfmadd231pd(ymm0, ymm3, ymm7) 307 vfmadd231pd(ymm1, ymm3, ymm8) 308 vfmadd231pd(ymm2, ymm3, ymm9) 330 vfmadd231pd(ymm0, ymm3, ymm4) 331 vfmadd231pd(ymm1, ymm3, ymm5) 332 vfmadd231pd(ymm2, ymm3, ymm6) 335 vfmadd231pd(ymm0, ymm3, ymm7) [all …]
|
H A D | bli_gemmsup_rd_haswell_asm_d6x8.c | 274 vfmadd231pd(ymm0, ymm3, ymm4) in bli_dgemmsup_rd_haswell_asm_6x8() 275 vfmadd231pd(ymm1, ymm3, ymm5) in bli_dgemmsup_rd_haswell_asm_6x8() 276 vfmadd231pd(ymm2, ymm3, ymm6) in bli_dgemmsup_rd_haswell_asm_6x8() 279 vfmadd231pd(ymm0, ymm3, ymm7) in bli_dgemmsup_rd_haswell_asm_6x8() 280 vfmadd231pd(ymm1, ymm3, ymm8) in bli_dgemmsup_rd_haswell_asm_6x8() 281 vfmadd231pd(ymm2, ymm3, ymm9) in bli_dgemmsup_rd_haswell_asm_6x8() 303 vfmadd231pd(ymm0, ymm3, ymm4) in bli_dgemmsup_rd_haswell_asm_6x8() 304 vfmadd231pd(ymm1, ymm3, ymm5) in bli_dgemmsup_rd_haswell_asm_6x8() 305 vfmadd231pd(ymm2, ymm3, ymm6) in bli_dgemmsup_rd_haswell_asm_6x8() 308 vfmadd231pd(ymm0, ymm3, ymm7) in bli_dgemmsup_rd_haswell_asm_6x8() [all …]
|
H A D | bli_gemmsup_rd_haswell_asm_d6x8n.c | 317 vfmadd231pd(ymm0, ymm3, ymm4) 318 vfmadd231pd(ymm1, ymm3, ymm5) 319 vfmadd231pd(ymm2, ymm3, ymm6) 322 vfmadd231pd(ymm0, ymm3, ymm7) 323 vfmadd231pd(ymm1, ymm3, ymm8) 324 vfmadd231pd(ymm2, ymm3, ymm9) 351 vfmadd231pd(ymm0, ymm3, ymm4) 352 vfmadd231pd(ymm1, ymm3, ymm5) 353 vfmadd231pd(ymm2, ymm3, ymm6) 356 vfmadd231pd(ymm0, ymm3, ymm7) [all …]
|
/dports/math/blis/blis-0.8.1/kernels/haswell/3/sup/ |
H A D | bli_gemmsup_rd_haswell_asm_d6x8m.c | 288 vfmadd231pd(ymm0, ymm3, ymm4) in GEMMSUP_KER_PROT() 289 vfmadd231pd(ymm1, ymm3, ymm5) in GEMMSUP_KER_PROT() 290 vfmadd231pd(ymm2, ymm3, ymm6) in GEMMSUP_KER_PROT() 293 vfmadd231pd(ymm0, ymm3, ymm7) in GEMMSUP_KER_PROT() 294 vfmadd231pd(ymm1, ymm3, ymm8) in GEMMSUP_KER_PROT() 295 vfmadd231pd(ymm2, ymm3, ymm9) in GEMMSUP_KER_PROT() 317 vfmadd231pd(ymm0, ymm3, ymm4) in GEMMSUP_KER_PROT() 318 vfmadd231pd(ymm1, ymm3, ymm5) in GEMMSUP_KER_PROT() 319 vfmadd231pd(ymm2, ymm3, ymm6) in GEMMSUP_KER_PROT() 322 vfmadd231pd(ymm0, ymm3, ymm7) in GEMMSUP_KER_PROT() [all …]
|
H A D | bli_gemmsup_rd_haswell_asm_d6x8n.c | 345 vfmadd231pd(ymm0, ymm3, ymm4) in GEMMSUP_KER_PROT() 346 vfmadd231pd(ymm1, ymm3, ymm5) in GEMMSUP_KER_PROT() 347 vfmadd231pd(ymm2, ymm3, ymm6) in GEMMSUP_KER_PROT() 350 vfmadd231pd(ymm0, ymm3, ymm7) in GEMMSUP_KER_PROT() 351 vfmadd231pd(ymm1, ymm3, ymm8) in GEMMSUP_KER_PROT() 352 vfmadd231pd(ymm2, ymm3, ymm9) in GEMMSUP_KER_PROT() 379 vfmadd231pd(ymm0, ymm3, ymm4) in GEMMSUP_KER_PROT() 380 vfmadd231pd(ymm1, ymm3, ymm5) in GEMMSUP_KER_PROT() 381 vfmadd231pd(ymm2, ymm3, ymm6) in GEMMSUP_KER_PROT() 384 vfmadd231pd(ymm0, ymm3, ymm7) in GEMMSUP_KER_PROT() [all …]
|
H A D | bli_gemmsup_rv_haswell_asm_d6x8m.c | 366 vfmadd231pd(ymm0, ymm2, ymm4) in GEMMSUP_KER_PROT() 367 vfmadd231pd(ymm1, ymm2, ymm5) in GEMMSUP_KER_PROT() 368 vfmadd231pd(ymm0, ymm3, ymm6) in GEMMSUP_KER_PROT() 369 vfmadd231pd(ymm1, ymm3, ymm7) in GEMMSUP_KER_PROT() 373 vfmadd231pd(ymm0, ymm2, ymm8) in GEMMSUP_KER_PROT() 374 vfmadd231pd(ymm1, ymm2, ymm9) in GEMMSUP_KER_PROT() 401 vfmadd231pd(ymm0, ymm2, ymm4) in GEMMSUP_KER_PROT() 402 vfmadd231pd(ymm1, ymm2, ymm5) in GEMMSUP_KER_PROT() 403 vfmadd231pd(ymm0, ymm3, ymm6) in GEMMSUP_KER_PROT() 404 vfmadd231pd(ymm1, ymm3, ymm7) in GEMMSUP_KER_PROT() [all …]
|
/dports/math/blis/blis-0.8.1/kernels/haswell/3/sup/d6x8/ |
H A D | bli_gemmsup_rd_haswell_asm_dMx4.c | 202 vfmadd231pd(ymm0, ymm3, ymm4) in GEMMSUP_KER_PROT() 203 vfmadd231pd(ymm1, ymm3, ymm5) in GEMMSUP_KER_PROT() 204 vfmadd231pd(ymm2, ymm3, ymm6) in GEMMSUP_KER_PROT() 207 vfmadd231pd(ymm0, ymm3, ymm7) in GEMMSUP_KER_PROT() 208 vfmadd231pd(ymm1, ymm3, ymm8) in GEMMSUP_KER_PROT() 209 vfmadd231pd(ymm2, ymm3, ymm9) in GEMMSUP_KER_PROT() 231 vfmadd231pd(ymm0, ymm3, ymm4) in GEMMSUP_KER_PROT() 232 vfmadd231pd(ymm1, ymm3, ymm5) in GEMMSUP_KER_PROT() 233 vfmadd231pd(ymm2, ymm3, ymm6) in GEMMSUP_KER_PROT() 236 vfmadd231pd(ymm0, ymm3, ymm7) in GEMMSUP_KER_PROT() [all …]
|
H A D | bli_gemmsup_rd_haswell_asm_dMx8.c | 285 vfmadd231pd(ymm0, ymm3, ymm4) in GEMMSUP_KER_PROT() 286 vfmadd231pd(ymm1, ymm3, ymm5) in GEMMSUP_KER_PROT() 287 vfmadd231pd(ymm2, ymm3, ymm6) in GEMMSUP_KER_PROT() 290 vfmadd231pd(ymm0, ymm3, ymm7) in GEMMSUP_KER_PROT() 291 vfmadd231pd(ymm1, ymm3, ymm8) in GEMMSUP_KER_PROT() 292 vfmadd231pd(ymm2, ymm3, ymm9) in GEMMSUP_KER_PROT() 314 vfmadd231pd(ymm0, ymm3, ymm4) in GEMMSUP_KER_PROT() 315 vfmadd231pd(ymm1, ymm3, ymm5) in GEMMSUP_KER_PROT() 316 vfmadd231pd(ymm2, ymm3, ymm6) in GEMMSUP_KER_PROT() 319 vfmadd231pd(ymm0, ymm3, ymm7) in GEMMSUP_KER_PROT() [all …]
|
H A D | bli_gemmsup_rd_haswell_asm_dMx2.c | 198 vfmadd231pd(ymm0, ymm3, ymm4) in GEMMSUP_KER_PROT() 199 vfmadd231pd(ymm1, ymm3, ymm5) in GEMMSUP_KER_PROT() 202 vfmadd231pd(ymm0, ymm3, ymm6) in GEMMSUP_KER_PROT() 203 vfmadd231pd(ymm1, ymm3, ymm7) in GEMMSUP_KER_PROT() 206 vfmadd231pd(ymm0, ymm3, ymm8) in GEMMSUP_KER_PROT() 207 vfmadd231pd(ymm1, ymm3, ymm9) in GEMMSUP_KER_PROT() 230 vfmadd231pd(ymm0, ymm3, ymm4) in GEMMSUP_KER_PROT() 231 vfmadd231pd(ymm1, ymm3, ymm5) in GEMMSUP_KER_PROT() 234 vfmadd231pd(ymm0, ymm3, ymm6) in GEMMSUP_KER_PROT() 235 vfmadd231pd(ymm1, ymm3, ymm7) in GEMMSUP_KER_PROT() [all …]
|
H A D | bli_gemmsup_rv_haswell_asm_dMx6.c | 207 vfmadd231pd(ymm0, ymm2, ymm4) in GEMMSUP_KER_PROT() 208 vfmadd231pd(ymm1, ymm2, ymm5) in GEMMSUP_KER_PROT() 209 vfmadd231pd(ymm0, ymm3, ymm6) in GEMMSUP_KER_PROT() 210 vfmadd231pd(ymm1, ymm3, ymm7) in GEMMSUP_KER_PROT() 214 vfmadd231pd(ymm0, ymm2, ymm8) in GEMMSUP_KER_PROT() 215 vfmadd231pd(ymm1, ymm2, ymm9) in GEMMSUP_KER_PROT() 240 vfmadd231pd(ymm0, ymm2, ymm4) in GEMMSUP_KER_PROT() 241 vfmadd231pd(ymm1, ymm2, ymm5) in GEMMSUP_KER_PROT() 242 vfmadd231pd(ymm0, ymm3, ymm6) in GEMMSUP_KER_PROT() 243 vfmadd231pd(ymm1, ymm3, ymm7) in GEMMSUP_KER_PROT() [all …]
|
H A D | bli_gemmsup_rv_haswell_asm_dMx8.c | 303 vfmadd231pd(ymm0, ymm2, ymm4) in bli_dgemmsup_rv_haswell_asm_6x8() 304 vfmadd231pd(ymm1, ymm2, ymm5) in bli_dgemmsup_rv_haswell_asm_6x8() 305 vfmadd231pd(ymm0, ymm3, ymm6) in bli_dgemmsup_rv_haswell_asm_6x8() 306 vfmadd231pd(ymm1, ymm3, ymm7) in bli_dgemmsup_rv_haswell_asm_6x8() 310 vfmadd231pd(ymm0, ymm2, ymm8) in bli_dgemmsup_rv_haswell_asm_6x8() 311 vfmadd231pd(ymm1, ymm2, ymm9) in bli_dgemmsup_rv_haswell_asm_6x8() 336 vfmadd231pd(ymm0, ymm2, ymm4) in bli_dgemmsup_rv_haswell_asm_6x8() 337 vfmadd231pd(ymm1, ymm2, ymm5) in bli_dgemmsup_rv_haswell_asm_6x8() 338 vfmadd231pd(ymm0, ymm3, ymm6) in bli_dgemmsup_rv_haswell_asm_6x8() 339 vfmadd231pd(ymm1, ymm3, ymm7) in bli_dgemmsup_rv_haswell_asm_6x8() [all …]
|
/dports/math/blis/blis-0.8.1/kernels/haswell/3/sup/d6x8/old/ |
H A D | bli_gemmsup_rd_haswell_asm_d6x8.c | 298 vfmadd231pd(ymm0, ymm3, ymm4) 299 vfmadd231pd(ymm1, ymm3, ymm5) 300 vfmadd231pd(ymm2, ymm3, ymm6) 303 vfmadd231pd(ymm0, ymm3, ymm7) 304 vfmadd231pd(ymm1, ymm3, ymm8) 305 vfmadd231pd(ymm2, ymm3, ymm9) 327 vfmadd231pd(ymm0, ymm3, ymm4) 328 vfmadd231pd(ymm1, ymm3, ymm5) 329 vfmadd231pd(ymm2, ymm3, ymm6) 332 vfmadd231pd(ymm0, ymm3, ymm7) [all …]
|