Lines Matching refs:BO

38 #define BO	%rsi  macro
88 movaps -16 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm1 ;\
91 movapd -14 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
94 mulpd -10 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm0 ;\
96 movapd -12 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
103 movapd 0 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm1 ;\
106 movapd -6 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
108 mulpd -10 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm2 ;\
110 movapd -4 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
117 movapd -8 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm7 ;\
120 movapd -6 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
122 mulpd -2 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm4 ;\
124 movapd -4 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
131 movapd 8 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm7 ;\
134 movapd 2 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
136 mulpd -2 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm6 ;\
138 movapd 4 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
146 movapd 0 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm1 ;\
149 movapd 2 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
151 mulpd 6 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm0 ;\
153 movapd 4 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
160 movapd 16 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm1 ;\
163 movapd 10 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
165 mulpd 6 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm2 ;\
167 movapd 12 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
174 movapd 8 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm7 ;\
177 movapd 10 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
179 mulpd 14 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm4 ;\
181 movapd 12 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
188 movapd 24 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm7 ;\
191 movapd 18 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
193 mulpd 14 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm6 ;\
195 movapd 20 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
204 movapd -16 * SIZE + 2 * (xx) * SIZE(BO), %xmm1 ;\
207 movapd -14 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
210 mulpd -10 * SIZE + 2 * (xx) * SIZE(BO), %xmm0 ;\
212 movapd -12 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
219 movapd 0 * SIZE + 2 * (xx) * SIZE(BO), %xmm1 ;\
222 movapd -6 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
224 mulpd -10 * SIZE + 2 * (xx) * SIZE(BO), %xmm2 ;\
226 movapd -4 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
233 movapd -8 * SIZE + 2 * (xx) * SIZE(BO), %xmm7 ;\
236 movapd -6 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
238 mulpd -2 * SIZE + 2 * (xx) * SIZE(BO), %xmm4 ;\
240 movapd -4 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
247 movapd 8 * SIZE + 2 * (xx) * SIZE(BO), %xmm7 ;\
250 movapd 2 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
252 mulpd -2 * SIZE + 2 * (xx) * SIZE(BO), %xmm6 ;\
254 movapd 4 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
262 movapd 0 * SIZE + 2 * (xx) * SIZE(BO), %xmm1 ;\
265 movapd 2 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
267 mulpd 6 * SIZE + 2 * (xx) * SIZE(BO), %xmm0 ;\
269 movapd 4 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
276 movapd 16 * SIZE + 2 * (xx) * SIZE(BO), %xmm1 ;\
279 movapd 10 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
281 mulpd 6 * SIZE + 2 * (xx) * SIZE(BO), %xmm2 ;\
283 movapd 12 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
290 movapd 8 * SIZE + 2 * (xx) * SIZE(BO), %xmm7 ;\
293 movapd 10 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
295 mulpd 14 * SIZE + 2 * (xx) * SIZE(BO), %xmm4 ;\
297 movapd 12 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
304 movapd 24 * SIZE + 2 * (xx) * SIZE(BO), %xmm7 ;\
307 movapd 18 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
309 mulpd 14 * SIZE + 2 * (xx) * SIZE(BO), %xmm6 ;\
311 movapd 20 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
393 leaq 16 * SIZE + BUFFER, BO
415 movq %mm0, -16 * SIZE(BO)
416 movq %mm0, -15 * SIZE(BO)
418 movq %mm1, -14 * SIZE(BO)
419 movq %mm1, -13 * SIZE(BO)
422 movq %mm2, -12 * SIZE(BO)
423 movq %mm2, -11 * SIZE(BO)
425 movq %mm3, -10 * SIZE(BO)
426 movq %mm3, -9 * SIZE(BO)
428 PREFETCHW (WPREFETCHSIZE + 0) * SIZE(BO)
431 movq %mm4, -8 * SIZE(BO)
432 movq %mm4, -7 * SIZE(BO)
434 movq %mm5, -6 * SIZE(BO)
435 movq %mm5, -5 * SIZE(BO)
437 PREFETCHW (WPREFETCHSIZE + 8) * SIZE(BO)
440 movq %mm6, -4 * SIZE(BO)
441 movq %mm6, -3 * SIZE(BO)
443 movq %mm7, -2 * SIZE(BO)
444 movq %mm7, -1 * SIZE(BO)
449 movq %mm0, 0 * SIZE(BO)
450 movq %mm0, 1 * SIZE(BO)
452 movq %mm1, 2 * SIZE(BO)
453 movq %mm1, 3 * SIZE(BO)
456 movq %mm2, 4 * SIZE(BO)
457 movq %mm2, 5 * SIZE(BO)
459 movq %mm3, 6 * SIZE(BO)
460 movq %mm3, 7 * SIZE(BO)
462 PREFETCHW (WPREFETCHSIZE + 16) * SIZE(BO)
465 movq %mm4, 8 * SIZE(BO)
466 movq %mm4, 9 * SIZE(BO)
468 movq %mm5, 10 * SIZE(BO)
469 movq %mm5, 11 * SIZE(BO)
471 PREFETCHW (WPREFETCHSIZE + 24) * SIZE(BO)
474 movq %mm6, 12 * SIZE(BO)
475 movq %mm6, 13 * SIZE(BO)
477 movq %mm7, 14 * SIZE(BO)
478 movq %mm7, 15 * SIZE(BO)
480 addq $ 32 * SIZE, BO
496 movq %mm0, -16 * SIZE(BO)
497 movq %mm0, -15 * SIZE(BO)
499 movq %mm1, -14 * SIZE(BO)
500 movq %mm1, -13 * SIZE(BO)
503 movq %mm2, -12 * SIZE(BO)
504 movq %mm2, -11 * SIZE(BO)
506 movq %mm3, -10 * SIZE(BO)
507 movq %mm3, -9 * SIZE(BO)
510 addq $8 * SIZE, BO
530 leaq 16 * SIZE + BUFFER, BO
532 leaq 16 * SIZE + BUFFER, BO
536 leaq (BO, %rax, 8), BO
540 movapd -16 * SIZE(BO), %xmm1
543 movapd -14 * SIZE(BO), %xmm3
546 movapd -12 * SIZE(BO), %xmm5
549 movapd -8 * SIZE(BO), %xmm7
584 leaq (BO, %rax, 8), BO
788 addq $32 * SIZE, BO
808 addq $ 32 * SIZE, BO
828 leaq (BO, %rax, 8), BO
835 movapd -14 * SIZE(BO, %rax, 8), %xmm1
838 movapd -12 * SIZE(BO, %rax, 8), %xmm1
840 mulpd -10 * SIZE(BO, %rax, 8), %xmm0
842 movapd -16 * SIZE(BO, %rax, 8), %xmm1
847 movapd -14 * SIZE(BO, %rax, 8), %xmm1
850 movapd -12 * SIZE(BO, %rax, 8), %xmm1
852 mulpd -10 * SIZE(BO, %rax, 8), %xmm2
854 movapd -8 * SIZE(BO, %rax, 8), %xmm1
938 leaq (BO, %rax, 8), BO
965 leaq BUFFER, BO
967 leaq BUFFER, BO
971 leaq (BO, %rax, 8), BO
976 movapd 0 * SIZE(BO), %xmm1
980 movapd 8 * SIZE(BO), %xmm3
983 movapd 16 * SIZE(BO), %xmm5
984 movapd 24 * SIZE(BO), %xmm7
1009 movapd 2 * SIZE(BO), %xmm1
1012 movapd 4 * SIZE(BO), %xmm1
1014 mulpd 6 * SIZE(BO), %xmm0
1016 movapd 32 * SIZE(BO), %xmm1
1022 movapd 10 * SIZE(BO), %xmm3
1025 movapd 12 * SIZE(BO), %xmm3
1027 mulpd 14 * SIZE(BO), %xmm0
1029 movapd 40 * SIZE(BO), %xmm3
1035 movapd 18 * SIZE(BO), %xmm5
1038 movapd 20 * SIZE(BO), %xmm5
1040 mulpd 22 * SIZE(BO), %xmm0
1042 movapd 48 * SIZE(BO), %xmm5
1048 movapd 26 * SIZE(BO), %xmm7
1051 movapd 28 * SIZE(BO), %xmm7
1053 mulpd 30 * SIZE(BO), %xmm0
1055 movapd 56 * SIZE(BO), %xmm7
1062 movapd 34 * SIZE(BO), %xmm1
1065 movapd 36 * SIZE(BO), %xmm1
1067 mulpd 38 * SIZE(BO), %xmm2
1069 movapd 64 * SIZE(BO), %xmm1
1075 movapd 42 * SIZE(BO), %xmm3
1078 movapd 44 * SIZE(BO), %xmm3
1080 mulpd 46 * SIZE(BO), %xmm2
1082 movapd 72 * SIZE(BO), %xmm3
1088 movapd 50 * SIZE(BO), %xmm5
1091 movapd 52 * SIZE(BO), %xmm5
1093 mulpd 54 * SIZE(BO), %xmm2
1095 movapd 80 * SIZE(BO), %xmm5
1101 movapd 58 * SIZE(BO), %xmm7
1104 movapd 60 * SIZE(BO), %xmm7
1106 mulpd 62 * SIZE(BO), %xmm2
1108 movapd 88 * SIZE(BO), %xmm7
1113 addq $64 * SIZE, BO
1133 movapd 2 * SIZE(BO), %xmm1
1136 movapd 4 * SIZE(BO), %xmm1
1138 mulpd 6 * SIZE(BO), %xmm0
1140 movapd 8 * SIZE(BO), %xmm1
1145 addq $8 * SIZE, BO # boffset1 += 8
1189 leaq (BO, %rax, 8), BO
1210 leaq BUFFER, BO
1212 leaq BUFFER, BO
1216 leaq (BO, %rax, 8), BO
1221 movsd 0 * SIZE(BO), %xmm1
1225 movsd 8 * SIZE(BO), %xmm3
1228 movsd 16 * SIZE(BO), %xmm5
1229 movsd 24 * SIZE(BO), %xmm7
1254 movsd 2 * SIZE(BO), %xmm1
1257 movsd 4 * SIZE(BO), %xmm1
1259 mulsd 6 * SIZE(BO), %xmm0
1261 movsd 32 * SIZE(BO), %xmm1
1267 movsd 10 * SIZE(BO), %xmm3
1270 movsd 12 * SIZE(BO), %xmm3
1272 mulsd 14 * SIZE(BO), %xmm0
1274 movsd 40 * SIZE(BO), %xmm3
1280 movsd 18 * SIZE(BO), %xmm5
1283 movsd 20 * SIZE(BO), %xmm5
1285 mulsd 22 * SIZE(BO), %xmm0
1287 movsd 48 * SIZE(BO), %xmm5
1293 movsd 26 * SIZE(BO), %xmm7
1296 movsd 28 * SIZE(BO), %xmm7
1298 mulsd 30 * SIZE(BO), %xmm0
1300 movsd 56 * SIZE(BO), %xmm7
1306 movsd 34 * SIZE(BO), %xmm1
1309 movsd 36 * SIZE(BO), %xmm1
1311 mulsd 38 * SIZE(BO), %xmm0
1313 movsd 64 * SIZE(BO), %xmm1
1319 movsd 42 * SIZE(BO), %xmm3
1322 movsd 44 * SIZE(BO), %xmm3
1324 mulsd 46 * SIZE(BO), %xmm0
1326 movsd 72 * SIZE(BO), %xmm3
1332 movsd 50 * SIZE(BO), %xmm5
1335 movsd 52 * SIZE(BO), %xmm5
1337 mulsd 54 * SIZE(BO), %xmm0
1339 movsd 80 * SIZE(BO), %xmm5
1345 movsd 58 * SIZE(BO), %xmm7
1348 movsd 60 * SIZE(BO), %xmm7
1350 mulsd 62 * SIZE(BO), %xmm0
1352 movsd 88 * SIZE(BO), %xmm7
1357 addq $64 * SIZE, BO
1377 movsd 2 * SIZE(BO), %xmm1
1380 movsd 4 * SIZE(BO), %xmm1
1382 mulsd 6 * SIZE(BO), %xmm0
1384 movsd 8 * SIZE(BO), %xmm1
1389 addq $8 * SIZE, BO # boffset1 += 8
1425 leaq (BO, %rax, 8), BO
1453 leaq BUFFER, BO
1478 addq $16 * SIZE, BO
1480 movq %mm0, -16 * SIZE(BO)
1481 movq %mm0, -15 * SIZE(BO)
1482 movq %mm1, -14 * SIZE(BO)
1483 movq %mm1, -13 * SIZE(BO)
1484 movq %mm2, -12 * SIZE(BO)
1485 movq %mm2, -11 * SIZE(BO)
1486 movq %mm3, -10 * SIZE(BO)
1487 movq %mm3, -9 * SIZE(BO)
1488 movq %mm4, -8 * SIZE(BO)
1489 movq %mm4, -7 * SIZE(BO)
1490 movq %mm5, -6 * SIZE(BO)
1491 movq %mm5, -5 * SIZE(BO)
1492 movq %mm6, -4 * SIZE(BO)
1493 movq %mm6, -3 * SIZE(BO)
1494 movq %mm7, -2 * SIZE(BO)
1495 movq %mm7, -1 * SIZE(BO)
1512 movq %mm0, 0 * SIZE(BO)
1513 movq %mm0, 1 * SIZE(BO)
1514 movq %mm1, 2 * SIZE(BO)
1515 movq %mm1, 3 * SIZE(BO)
1518 addq $4 * SIZE, BO
1538 leaq BUFFER, BO
1540 leaq BUFFER, BO
1544 leaq (BO, %rax, 4), BO
1549 movapd 0 * SIZE(BO), %xmm1
1553 movapd 8 * SIZE(BO), %xmm3
1557 movapd 16 * SIZE(BO), %xmm5
1559 movapd 24 * SIZE(BO), %xmm7
1586 mulpd 2 * SIZE(BO), %xmm0
1588 movapd 0 * SIZE(BO), %xmm1
1592 mulpd 2 * SIZE(BO), %xmm0
1594 movapd 4 * SIZE(BO), %xmm1
1599 mulpd 6 * SIZE(BO), %xmm0
1601 movapd 4 * SIZE(BO), %xmm1
1605 mulpd 6 * SIZE(BO), %xmm0
1607 movapd 32 * SIZE(BO), %xmm1
1613 mulpd 10 * SIZE(BO), %xmm2
1615 movapd 8 * SIZE(BO), %xmm3
1619 mulpd 10 * SIZE(BO), %xmm2
1621 movapd 12 * SIZE(BO), %xmm3
1626 mulpd 14 * SIZE(BO), %xmm2
1628 movapd 12 * SIZE(BO), %xmm3
1632 mulpd 14 * SIZE(BO), %xmm2
1634 movapd 40 * SIZE(BO), %xmm3
1640 mulpd 18 * SIZE(BO), %xmm4
1642 movapd 16 * SIZE(BO), %xmm5
1646 mulpd 18 * SIZE(BO), %xmm4
1648 movapd 20 * SIZE(BO), %xmm5
1653 mulpd 22 * SIZE(BO), %xmm4
1655 movapd 20 * SIZE(BO), %xmm5
1659 mulpd 22 * SIZE(BO), %xmm4
1661 movapd 48 * SIZE(BO), %xmm5
1667 mulpd 26 * SIZE(BO), %xmm6
1669 movapd 24 * SIZE(BO), %xmm7
1673 mulpd 26 * SIZE(BO), %xmm6
1675 movapd 28 * SIZE(BO), %xmm7
1680 mulpd 30 * SIZE(BO), %xmm6
1682 movapd 28 * SIZE(BO), %xmm7
1686 mulpd 30 * SIZE(BO), %xmm6
1688 movapd 56 * SIZE(BO), %xmm7
1693 addq $32 * SIZE, BO
1711 movapd 0 * SIZE(BO), %xmm1
1714 mulpd 2 * SIZE(BO), %xmm0
1717 movapd 0 * SIZE(BO), %xmm1
1720 mulpd 2 * SIZE(BO), %xmm0
1725 addq $4 * SIZE, BO # boffset1 += 8
1769 leaq (BO, %rax, 4), BO
1792 leaq BUFFER, BO
1794 leaq BUFFER, BO
1798 leaq (BO, %rax, 4), BO
1803 movapd 0 * SIZE(BO), %xmm1
1807 movapd 8 * SIZE(BO), %xmm3
1810 movapd 16 * SIZE(BO), %xmm5
1811 movapd 24 * SIZE(BO), %xmm7
1835 mulpd 2 * SIZE(BO), %xmm0
1837 movapd 4 * SIZE(BO), %xmm1
1842 mulpd 6 * SIZE(BO), %xmm0
1844 movapd 32 * SIZE(BO), %xmm1
1849 mulpd 10 * SIZE(BO), %xmm0
1851 movapd 12 * SIZE(BO), %xmm3
1856 mulpd 14 * SIZE(BO), %xmm0
1858 movapd 40 * SIZE(BO), %xmm3
1864 mulpd 18 * SIZE(BO), %xmm2
1866 movapd 20 * SIZE(BO), %xmm5
1871 mulpd 22 * SIZE(BO), %xmm2
1873 movapd 48 * SIZE(BO), %xmm5
1878 mulpd 26 * SIZE(BO), %xmm2
1880 movapd 28 * SIZE(BO), %xmm7
1885 mulpd 30 * SIZE(BO), %xmm2
1887 movapd 56 * SIZE(BO), %xmm7
1892 addq $32 * SIZE, BO
1911 mulpd 2 * SIZE(BO), %xmm0
1913 movapd 4 * SIZE(BO), %xmm1
1918 addq $4 * SIZE, BO # boffset1 += 8
1953 leaq (BO, %rax, 4), BO
1974 leaq BUFFER, BO
1976 leaq BUFFER, BO
1980 leaq (BO, %rax, 4), BO
1985 movsd 0 * SIZE(BO), %xmm1
1989 movsd 8 * SIZE(BO), %xmm3
1992 movsd 16 * SIZE(BO), %xmm5
1993 movsd 24 * SIZE(BO), %xmm7
2017 mulsd 2 * SIZE(BO), %xmm0
2019 movsd 4 * SIZE(BO), %xmm1
2024 mulsd 6 * SIZE(BO), %xmm0
2026 movsd 32 * SIZE(BO), %xmm1
2031 mulsd 10 * SIZE(BO), %xmm0
2033 movsd 12 * SIZE(BO), %xmm3
2038 mulsd 14 * SIZE(BO), %xmm0
2040 movsd 40 * SIZE(BO), %xmm3
2045 mulsd 18 * SIZE(BO), %xmm2
2047 movsd 20 * SIZE(BO), %xmm5
2052 mulsd 22 * SIZE(BO), %xmm2
2054 movsd 48 * SIZE(BO), %xmm5
2059 mulsd 26 * SIZE(BO), %xmm2
2061 movsd 28 * SIZE(BO), %xmm7
2066 mulsd 30 * SIZE(BO), %xmm2
2068 movsd 56 * SIZE(BO), %xmm7
2073 addq $32 * SIZE, BO
2092 mulsd 2 * SIZE(BO), %xmm0
2096 movsd 4 * SIZE(BO), %xmm1
2099 addq $4 * SIZE, BO # boffset1 += 8
2130 leaq (BO, %rax, 4), BO
2152 leaq BUFFER, BO
2177 addq $16 * SIZE, BO
2179 movq %mm0, -16 * SIZE(BO)
2180 movq %mm0, -15 * SIZE(BO)
2181 movq %mm1, -14 * SIZE(BO)
2182 movq %mm1, -13 * SIZE(BO)
2183 movq %mm2, -12 * SIZE(BO)
2184 movq %mm2, -11 * SIZE(BO)
2185 movq %mm3, -10 * SIZE(BO)
2186 movq %mm3, -9 * SIZE(BO)
2187 movq %mm4, -8 * SIZE(BO)
2188 movq %mm4, -7 * SIZE(BO)
2189 movq %mm5, -6 * SIZE(BO)
2190 movq %mm5, -5 * SIZE(BO)
2191 movq %mm6, -4 * SIZE(BO)
2192 movq %mm6, -3 * SIZE(BO)
2193 movq %mm7, -2 * SIZE(BO)
2194 movq %mm7, -1 * SIZE(BO)
2210 movq %mm0, 0 * SIZE(BO)
2211 movq %mm0, 1 * SIZE(BO)
2214 addq $2 * SIZE, BO
2233 leaq BUFFER, BO
2235 leaq BUFFER, BO
2239 leaq (BO, %rax, 2), BO
2244 movapd 0 * SIZE(BO), %xmm1
2248 movapd 8 * SIZE(BO), %xmm3
2282 movapd 2 * SIZE(BO), %xmm1
2289 movapd 4 * SIZE(BO), %xmm1
2295 movapd 6 * SIZE(BO), %xmm1
2302 movapd 16 * SIZE(BO), %xmm1
2308 movapd 10 * SIZE(BO), %xmm3
2315 movapd 12 * SIZE(BO), %xmm3
2321 movapd 14 * SIZE(BO), %xmm3
2327 movapd 24 * SIZE(BO), %xmm3
2330 addq $16 * SIZE, BO
2353 movapd 2 * SIZE(BO), %xmm1
2356 addq $2 * SIZE, BO # boffset1 += 8
2391 leaq (BO, %rax, 2), BO
2413 leaq BUFFER, BO
2415 leaq BUFFER, BO
2419 leaq (BO, %rax, 2), BO
2424 movapd 0 * SIZE(BO), %xmm1
2428 movapd 8 * SIZE(BO), %xmm3
2454 mulpd 2 * SIZE(BO), %xmm0
2456 movapd 16 * SIZE(BO), %xmm1
2459 mulpd 4 * SIZE(BO), %xmm0
2462 mulpd 6 * SIZE(BO), %xmm0
2468 mulpd 10 * SIZE(BO), %xmm2
2470 movapd 24 * SIZE(BO), %xmm3
2473 mulpd 12 * SIZE(BO), %xmm2
2476 mulpd 14 * SIZE(BO), %xmm2
2481 addq $16 * SIZE, BO
2502 movapd 2 * SIZE(BO), %xmm1
2505 addq $2 * SIZE, BO # boffset1 += 8
2534 leaq (BO, %rax, 2), BO
2552 leaq BUFFER, BO
2554 leaq BUFFER, BO
2558 leaq (BO, %rax, 2), BO
2563 movsd 0 * SIZE(BO), %xmm1
2567 movsd 8 * SIZE(BO), %xmm3
2594 movsd 16 * SIZE(BO), %xmm1
2595 mulsd 2 * SIZE(BO), %xmm0
2598 mulsd 4 * SIZE(BO), %xmm0
2601 mulsd 6 * SIZE(BO), %xmm0
2607 movsd 24 * SIZE(BO), %xmm3
2608 mulsd 10 * SIZE(BO), %xmm2
2611 mulsd 12 * SIZE(BO), %xmm2
2614 mulsd 14 * SIZE(BO), %xmm2
2619 addq $16 * SIZE, BO
2640 movsd 2 * SIZE(BO), %xmm1
2643 addq $2 * SIZE, BO # boffset1 += 8