Lines Matching refs:BO

55 #define BO	%rsi  macro
105 movaps -16 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm1 ;\
108 movapd -14 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
111 mulpd -10 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm0 ;\
113 movapd -12 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
120 movapd 0 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm1 ;\
123 movapd -6 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
125 mulpd -10 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm2 ;\
127 movapd -4 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
134 movapd -8 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm7 ;\
137 movapd -6 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
139 mulpd -2 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm4 ;\
141 movapd -4 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
148 movapd 8 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm7 ;\
151 movapd 2 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
153 mulpd -2 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm6 ;\
155 movapd 4 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
163 movapd 0 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm1 ;\
166 movapd 2 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
168 mulpd 6 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm0 ;\
170 movapd 4 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
177 movapd 16 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm1 ;\
180 movapd 10 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
182 mulpd 6 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm2 ;\
184 movapd 12 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
191 movapd 8 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm7 ;\
194 movapd 10 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
196 mulpd 14 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm4 ;\
198 movapd 12 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
205 movapd 24 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm7 ;\
208 movapd 18 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm3 ;\
210 mulpd 14 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm6 ;\
212 movapd 20 * SIZE + 2 * (xx) * SIZE(BO, %rax, 8), %xmm5 ;\
221 movapd -16 * SIZE + 2 * (xx) * SIZE(BO), %xmm1 ;\
224 movapd -14 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
227 mulpd -10 * SIZE + 2 * (xx) * SIZE(BO), %xmm0 ;\
229 movapd -12 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
236 movapd 0 * SIZE + 2 * (xx) * SIZE(BO), %xmm1 ;\
239 movapd -6 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
241 mulpd -10 * SIZE + 2 * (xx) * SIZE(BO), %xmm2 ;\
243 movapd -4 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
250 movapd -8 * SIZE + 2 * (xx) * SIZE(BO), %xmm7 ;\
253 movapd -6 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
255 mulpd -2 * SIZE + 2 * (xx) * SIZE(BO), %xmm4 ;\
257 movapd -4 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
264 movapd 8 * SIZE + 2 * (xx) * SIZE(BO), %xmm7 ;\
267 movapd 2 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
269 mulpd -2 * SIZE + 2 * (xx) * SIZE(BO), %xmm6 ;\
271 movapd 4 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
279 movapd 0 * SIZE + 2 * (xx) * SIZE(BO), %xmm1 ;\
282 movapd 2 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
284 mulpd 6 * SIZE + 2 * (xx) * SIZE(BO), %xmm0 ;\
286 movapd 4 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
293 movapd 16 * SIZE + 2 * (xx) * SIZE(BO), %xmm1 ;\
296 movapd 10 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
298 mulpd 6 * SIZE + 2 * (xx) * SIZE(BO), %xmm2 ;\
300 movapd 12 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
307 movapd 8 * SIZE + 2 * (xx) * SIZE(BO), %xmm7 ;\
310 movapd 10 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
312 mulpd 14 * SIZE + 2 * (xx) * SIZE(BO), %xmm4 ;\
314 movapd 12 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
321 movapd 24 * SIZE + 2 * (xx) * SIZE(BO), %xmm7 ;\
324 movapd 18 * SIZE + 2 * (xx) * SIZE(BO), %xmm3 ;\
326 mulpd 14 * SIZE + 2 * (xx) * SIZE(BO), %xmm6 ;\
328 movapd 20 * SIZE + 2 * (xx) * SIZE(BO), %xmm5 ;\
410 leaq 16 * SIZE + BUFFER, BO
432 movq %mm0, -16 * SIZE(BO)
433 movq %mm0, -15 * SIZE(BO)
435 movq %mm1, -14 * SIZE(BO)
436 movq %mm1, -13 * SIZE(BO)
439 movq %mm2, -12 * SIZE(BO)
440 movq %mm2, -11 * SIZE(BO)
442 movq %mm3, -10 * SIZE(BO)
443 movq %mm3, -9 * SIZE(BO)
445 PREFETCHW (WPREFETCHSIZE + 0) * SIZE(BO)
448 movq %mm4, -8 * SIZE(BO)
449 movq %mm4, -7 * SIZE(BO)
451 movq %mm5, -6 * SIZE(BO)
452 movq %mm5, -5 * SIZE(BO)
454 PREFETCHW (WPREFETCHSIZE + 8) * SIZE(BO)
457 movq %mm6, -4 * SIZE(BO)
458 movq %mm6, -3 * SIZE(BO)
460 movq %mm7, -2 * SIZE(BO)
461 movq %mm7, -1 * SIZE(BO)
466 movq %mm0, 0 * SIZE(BO)
467 movq %mm0, 1 * SIZE(BO)
469 movq %mm1, 2 * SIZE(BO)
470 movq %mm1, 3 * SIZE(BO)
473 movq %mm2, 4 * SIZE(BO)
474 movq %mm2, 5 * SIZE(BO)
476 movq %mm3, 6 * SIZE(BO)
477 movq %mm3, 7 * SIZE(BO)
479 PREFETCHW (WPREFETCHSIZE + 16) * SIZE(BO)
482 movq %mm4, 8 * SIZE(BO)
483 movq %mm4, 9 * SIZE(BO)
485 movq %mm5, 10 * SIZE(BO)
486 movq %mm5, 11 * SIZE(BO)
488 PREFETCHW (WPREFETCHSIZE + 24) * SIZE(BO)
491 movq %mm6, 12 * SIZE(BO)
492 movq %mm6, 13 * SIZE(BO)
494 movq %mm7, 14 * SIZE(BO)
495 movq %mm7, 15 * SIZE(BO)
497 addq $ 32 * SIZE, BO
513 movq %mm0, -16 * SIZE(BO)
514 movq %mm0, -15 * SIZE(BO)
516 movq %mm1, -14 * SIZE(BO)
517 movq %mm1, -13 * SIZE(BO)
520 movq %mm2, -12 * SIZE(BO)
521 movq %mm2, -11 * SIZE(BO)
523 movq %mm3, -10 * SIZE(BO)
524 movq %mm3, -9 * SIZE(BO)
527 addq $8 * SIZE, BO
547 leaq 16 * SIZE + BUFFER, BO
549 leaq 16 * SIZE + BUFFER, BO
553 leaq (BO, %rax, 8), BO
557 movapd -16 * SIZE(BO), %xmm1
560 movapd -14 * SIZE(BO), %xmm3
563 movapd -12 * SIZE(BO), %xmm5
566 movapd -8 * SIZE(BO), %xmm7
601 leaq (BO, %rax, 8), BO
805 addq $32 * SIZE, BO
825 addq $ 32 * SIZE, BO
845 leaq (BO, %rax, 8), BO
852 movapd -14 * SIZE(BO, %rax, 8), %xmm1
855 movapd -12 * SIZE(BO, %rax, 8), %xmm1
857 mulpd -10 * SIZE(BO, %rax, 8), %xmm0
859 movapd -16 * SIZE(BO, %rax, 8), %xmm1
864 movapd -14 * SIZE(BO, %rax, 8), %xmm1
867 movapd -12 * SIZE(BO, %rax, 8), %xmm1
869 mulpd -10 * SIZE(BO, %rax, 8), %xmm2
871 movapd -8 * SIZE(BO, %rax, 8), %xmm1
955 leaq (BO, %rax, 8), BO
982 leaq BUFFER, BO
984 leaq BUFFER, BO
988 leaq (BO, %rax, 8), BO
993 movapd 0 * SIZE(BO), %xmm1
997 movapd 8 * SIZE(BO), %xmm3
1000 movapd 16 * SIZE(BO), %xmm5
1001 movapd 24 * SIZE(BO), %xmm7
1026 movapd 2 * SIZE(BO), %xmm1
1029 movapd 4 * SIZE(BO), %xmm1
1031 mulpd 6 * SIZE(BO), %xmm0
1033 movapd 32 * SIZE(BO), %xmm1
1039 movapd 10 * SIZE(BO), %xmm3
1042 movapd 12 * SIZE(BO), %xmm3
1044 mulpd 14 * SIZE(BO), %xmm0
1046 movapd 40 * SIZE(BO), %xmm3
1052 movapd 18 * SIZE(BO), %xmm5
1055 movapd 20 * SIZE(BO), %xmm5
1057 mulpd 22 * SIZE(BO), %xmm0
1059 movapd 48 * SIZE(BO), %xmm5
1065 movapd 26 * SIZE(BO), %xmm7
1068 movapd 28 * SIZE(BO), %xmm7
1070 mulpd 30 * SIZE(BO), %xmm0
1072 movapd 56 * SIZE(BO), %xmm7
1079 movapd 34 * SIZE(BO), %xmm1
1082 movapd 36 * SIZE(BO), %xmm1
1084 mulpd 38 * SIZE(BO), %xmm2
1086 movapd 64 * SIZE(BO), %xmm1
1092 movapd 42 * SIZE(BO), %xmm3
1095 movapd 44 * SIZE(BO), %xmm3
1097 mulpd 46 * SIZE(BO), %xmm2
1099 movapd 72 * SIZE(BO), %xmm3
1105 movapd 50 * SIZE(BO), %xmm5
1108 movapd 52 * SIZE(BO), %xmm5
1110 mulpd 54 * SIZE(BO), %xmm2
1112 movapd 80 * SIZE(BO), %xmm5
1118 movapd 58 * SIZE(BO), %xmm7
1121 movapd 60 * SIZE(BO), %xmm7
1123 mulpd 62 * SIZE(BO), %xmm2
1125 movapd 88 * SIZE(BO), %xmm7
1130 addq $64 * SIZE, BO
1150 movapd 2 * SIZE(BO), %xmm1
1153 movapd 4 * SIZE(BO), %xmm1
1155 mulpd 6 * SIZE(BO), %xmm0
1157 movapd 8 * SIZE(BO), %xmm1
1162 addq $8 * SIZE, BO # boffset1 += 8
1206 leaq (BO, %rax, 8), BO
1227 leaq BUFFER, BO
1229 leaq BUFFER, BO
1233 leaq (BO, %rax, 8), BO
1238 movsd 0 * SIZE(BO), %xmm1
1242 movsd 8 * SIZE(BO), %xmm3
1245 movsd 16 * SIZE(BO), %xmm5
1246 movsd 24 * SIZE(BO), %xmm7
1271 movsd 2 * SIZE(BO), %xmm1
1274 movsd 4 * SIZE(BO), %xmm1
1276 mulsd 6 * SIZE(BO), %xmm0
1278 movsd 32 * SIZE(BO), %xmm1
1284 movsd 10 * SIZE(BO), %xmm3
1287 movsd 12 * SIZE(BO), %xmm3
1289 mulsd 14 * SIZE(BO), %xmm0
1291 movsd 40 * SIZE(BO), %xmm3
1297 movsd 18 * SIZE(BO), %xmm5
1300 movsd 20 * SIZE(BO), %xmm5
1302 mulsd 22 * SIZE(BO), %xmm0
1304 movsd 48 * SIZE(BO), %xmm5
1310 movsd 26 * SIZE(BO), %xmm7
1313 movsd 28 * SIZE(BO), %xmm7
1315 mulsd 30 * SIZE(BO), %xmm0
1317 movsd 56 * SIZE(BO), %xmm7
1323 movsd 34 * SIZE(BO), %xmm1
1326 movsd 36 * SIZE(BO), %xmm1
1328 mulsd 38 * SIZE(BO), %xmm0
1330 movsd 64 * SIZE(BO), %xmm1
1336 movsd 42 * SIZE(BO), %xmm3
1339 movsd 44 * SIZE(BO), %xmm3
1341 mulsd 46 * SIZE(BO), %xmm0
1343 movsd 72 * SIZE(BO), %xmm3
1349 movsd 50 * SIZE(BO), %xmm5
1352 movsd 52 * SIZE(BO), %xmm5
1354 mulsd 54 * SIZE(BO), %xmm0
1356 movsd 80 * SIZE(BO), %xmm5
1362 movsd 58 * SIZE(BO), %xmm7
1365 movsd 60 * SIZE(BO), %xmm7
1367 mulsd 62 * SIZE(BO), %xmm0
1369 movsd 88 * SIZE(BO), %xmm7
1374 addq $64 * SIZE, BO
1394 movsd 2 * SIZE(BO), %xmm1
1397 movsd 4 * SIZE(BO), %xmm1
1399 mulsd 6 * SIZE(BO), %xmm0
1401 movsd 8 * SIZE(BO), %xmm1
1406 addq $8 * SIZE, BO # boffset1 += 8
1442 leaq (BO, %rax, 8), BO
1470 leaq BUFFER, BO
1495 addq $16 * SIZE, BO
1497 movq %mm0, -16 * SIZE(BO)
1498 movq %mm0, -15 * SIZE(BO)
1499 movq %mm1, -14 * SIZE(BO)
1500 movq %mm1, -13 * SIZE(BO)
1501 movq %mm2, -12 * SIZE(BO)
1502 movq %mm2, -11 * SIZE(BO)
1503 movq %mm3, -10 * SIZE(BO)
1504 movq %mm3, -9 * SIZE(BO)
1505 movq %mm4, -8 * SIZE(BO)
1506 movq %mm4, -7 * SIZE(BO)
1507 movq %mm5, -6 * SIZE(BO)
1508 movq %mm5, -5 * SIZE(BO)
1509 movq %mm6, -4 * SIZE(BO)
1510 movq %mm6, -3 * SIZE(BO)
1511 movq %mm7, -2 * SIZE(BO)
1512 movq %mm7, -1 * SIZE(BO)
1529 movq %mm0, 0 * SIZE(BO)
1530 movq %mm0, 1 * SIZE(BO)
1531 movq %mm1, 2 * SIZE(BO)
1532 movq %mm1, 3 * SIZE(BO)
1535 addq $4 * SIZE, BO
1555 leaq BUFFER, BO
1557 leaq BUFFER, BO
1561 leaq (BO, %rax, 4), BO
1566 movapd 0 * SIZE(BO), %xmm1
1570 movapd 8 * SIZE(BO), %xmm3
1574 movapd 16 * SIZE(BO), %xmm5
1576 movapd 24 * SIZE(BO), %xmm7
1603 mulpd 2 * SIZE(BO), %xmm0
1605 movapd 0 * SIZE(BO), %xmm1
1609 mulpd 2 * SIZE(BO), %xmm0
1611 movapd 4 * SIZE(BO), %xmm1
1616 mulpd 6 * SIZE(BO), %xmm0
1618 movapd 4 * SIZE(BO), %xmm1
1622 mulpd 6 * SIZE(BO), %xmm0
1624 movapd 32 * SIZE(BO), %xmm1
1630 mulpd 10 * SIZE(BO), %xmm2
1632 movapd 8 * SIZE(BO), %xmm3
1636 mulpd 10 * SIZE(BO), %xmm2
1638 movapd 12 * SIZE(BO), %xmm3
1643 mulpd 14 * SIZE(BO), %xmm2
1645 movapd 12 * SIZE(BO), %xmm3
1649 mulpd 14 * SIZE(BO), %xmm2
1651 movapd 40 * SIZE(BO), %xmm3
1657 mulpd 18 * SIZE(BO), %xmm4
1659 movapd 16 * SIZE(BO), %xmm5
1663 mulpd 18 * SIZE(BO), %xmm4
1665 movapd 20 * SIZE(BO), %xmm5
1670 mulpd 22 * SIZE(BO), %xmm4
1672 movapd 20 * SIZE(BO), %xmm5
1676 mulpd 22 * SIZE(BO), %xmm4
1678 movapd 48 * SIZE(BO), %xmm5
1684 mulpd 26 * SIZE(BO), %xmm6
1686 movapd 24 * SIZE(BO), %xmm7
1690 mulpd 26 * SIZE(BO), %xmm6
1692 movapd 28 * SIZE(BO), %xmm7
1697 mulpd 30 * SIZE(BO), %xmm6
1699 movapd 28 * SIZE(BO), %xmm7
1703 mulpd 30 * SIZE(BO), %xmm6
1705 movapd 56 * SIZE(BO), %xmm7
1710 addq $32 * SIZE, BO
1728 movapd 0 * SIZE(BO), %xmm1
1731 mulpd 2 * SIZE(BO), %xmm0
1734 movapd 0 * SIZE(BO), %xmm1
1737 mulpd 2 * SIZE(BO), %xmm0
1742 addq $4 * SIZE, BO # boffset1 += 8
1786 leaq (BO, %rax, 4), BO
1809 leaq BUFFER, BO
1811 leaq BUFFER, BO
1815 leaq (BO, %rax, 4), BO
1820 movapd 0 * SIZE(BO), %xmm1
1824 movapd 8 * SIZE(BO), %xmm3
1827 movapd 16 * SIZE(BO), %xmm5
1828 movapd 24 * SIZE(BO), %xmm7
1852 mulpd 2 * SIZE(BO), %xmm0
1854 movapd 4 * SIZE(BO), %xmm1
1859 mulpd 6 * SIZE(BO), %xmm0
1861 movapd 32 * SIZE(BO), %xmm1
1866 mulpd 10 * SIZE(BO), %xmm0
1868 movapd 12 * SIZE(BO), %xmm3
1873 mulpd 14 * SIZE(BO), %xmm0
1875 movapd 40 * SIZE(BO), %xmm3
1881 mulpd 18 * SIZE(BO), %xmm2
1883 movapd 20 * SIZE(BO), %xmm5
1888 mulpd 22 * SIZE(BO), %xmm2
1890 movapd 48 * SIZE(BO), %xmm5
1895 mulpd 26 * SIZE(BO), %xmm2
1897 movapd 28 * SIZE(BO), %xmm7
1902 mulpd 30 * SIZE(BO), %xmm2
1904 movapd 56 * SIZE(BO), %xmm7
1909 addq $32 * SIZE, BO
1928 mulpd 2 * SIZE(BO), %xmm0
1930 movapd 4 * SIZE(BO), %xmm1
1935 addq $4 * SIZE, BO # boffset1 += 8
1970 leaq (BO, %rax, 4), BO
1991 leaq BUFFER, BO
1993 leaq BUFFER, BO
1997 leaq (BO, %rax, 4), BO
2002 movsd 0 * SIZE(BO), %xmm1
2006 movsd 8 * SIZE(BO), %xmm3
2009 movsd 16 * SIZE(BO), %xmm5
2010 movsd 24 * SIZE(BO), %xmm7
2034 mulsd 2 * SIZE(BO), %xmm0
2036 movsd 4 * SIZE(BO), %xmm1
2041 mulsd 6 * SIZE(BO), %xmm0
2043 movsd 32 * SIZE(BO), %xmm1
2048 mulsd 10 * SIZE(BO), %xmm0
2050 movsd 12 * SIZE(BO), %xmm3
2055 mulsd 14 * SIZE(BO), %xmm0
2057 movsd 40 * SIZE(BO), %xmm3
2062 mulsd 18 * SIZE(BO), %xmm2
2064 movsd 20 * SIZE(BO), %xmm5
2069 mulsd 22 * SIZE(BO), %xmm2
2071 movsd 48 * SIZE(BO), %xmm5
2076 mulsd 26 * SIZE(BO), %xmm2
2078 movsd 28 * SIZE(BO), %xmm7
2083 mulsd 30 * SIZE(BO), %xmm2
2085 movsd 56 * SIZE(BO), %xmm7
2090 addq $32 * SIZE, BO
2109 mulsd 2 * SIZE(BO), %xmm0
2113 movsd 4 * SIZE(BO), %xmm1
2116 addq $4 * SIZE, BO # boffset1 += 8
2147 leaq (BO, %rax, 4), BO
2169 leaq BUFFER, BO
2194 addq $16 * SIZE, BO
2196 movq %mm0, -16 * SIZE(BO)
2197 movq %mm0, -15 * SIZE(BO)
2198 movq %mm1, -14 * SIZE(BO)
2199 movq %mm1, -13 * SIZE(BO)
2200 movq %mm2, -12 * SIZE(BO)
2201 movq %mm2, -11 * SIZE(BO)
2202 movq %mm3, -10 * SIZE(BO)
2203 movq %mm3, -9 * SIZE(BO)
2204 movq %mm4, -8 * SIZE(BO)
2205 movq %mm4, -7 * SIZE(BO)
2206 movq %mm5, -6 * SIZE(BO)
2207 movq %mm5, -5 * SIZE(BO)
2208 movq %mm6, -4 * SIZE(BO)
2209 movq %mm6, -3 * SIZE(BO)
2210 movq %mm7, -2 * SIZE(BO)
2211 movq %mm7, -1 * SIZE(BO)
2227 movq %mm0, 0 * SIZE(BO)
2228 movq %mm0, 1 * SIZE(BO)
2231 addq $2 * SIZE, BO
2250 leaq BUFFER, BO
2252 leaq BUFFER, BO
2256 leaq (BO, %rax, 2), BO
2261 movapd 0 * SIZE(BO), %xmm1
2265 movapd 8 * SIZE(BO), %xmm3
2299 movapd 2 * SIZE(BO), %xmm1
2306 movapd 4 * SIZE(BO), %xmm1
2312 movapd 6 * SIZE(BO), %xmm1
2319 movapd 16 * SIZE(BO), %xmm1
2325 movapd 10 * SIZE(BO), %xmm3
2332 movapd 12 * SIZE(BO), %xmm3
2338 movapd 14 * SIZE(BO), %xmm3
2344 movapd 24 * SIZE(BO), %xmm3
2347 addq $16 * SIZE, BO
2370 movapd 2 * SIZE(BO), %xmm1
2373 addq $2 * SIZE, BO # boffset1 += 8
2408 leaq (BO, %rax, 2), BO
2430 leaq BUFFER, BO
2432 leaq BUFFER, BO
2436 leaq (BO, %rax, 2), BO
2441 movapd 0 * SIZE(BO), %xmm1
2445 movapd 8 * SIZE(BO), %xmm3
2471 mulpd 2 * SIZE(BO), %xmm0
2473 movapd 16 * SIZE(BO), %xmm1
2476 mulpd 4 * SIZE(BO), %xmm0
2479 mulpd 6 * SIZE(BO), %xmm0
2485 mulpd 10 * SIZE(BO), %xmm2
2487 movapd 24 * SIZE(BO), %xmm3
2490 mulpd 12 * SIZE(BO), %xmm2
2493 mulpd 14 * SIZE(BO), %xmm2
2498 addq $16 * SIZE, BO
2519 movapd 2 * SIZE(BO), %xmm1
2522 addq $2 * SIZE, BO # boffset1 += 8
2551 leaq (BO, %rax, 2), BO
2569 leaq BUFFER, BO
2571 leaq BUFFER, BO
2575 leaq (BO, %rax, 2), BO
2580 movsd 0 * SIZE(BO), %xmm1
2584 movsd 8 * SIZE(BO), %xmm3
2611 movsd 16 * SIZE(BO), %xmm1
2612 mulsd 2 * SIZE(BO), %xmm0
2615 mulsd 4 * SIZE(BO), %xmm0
2618 mulsd 6 * SIZE(BO), %xmm0
2624 movsd 24 * SIZE(BO), %xmm3
2625 mulsd 10 * SIZE(BO), %xmm2
2628 mulsd 12 * SIZE(BO), %xmm2
2631 mulsd 14 * SIZE(BO), %xmm2
2636 addq $16 * SIZE, BO
2657 movsd 2 * SIZE(BO), %xmm1
2660 addq $2 * SIZE, BO # boffset1 += 8