1 /* { dg-do run } */
2 /* { dg-require-effective-target avx2 } */
3 /* { dg-options "-O3 -mavx2 -mtune=skylake" } */
4 
5 #include "avx2-check.h"
6 
7 #define N 1024
8 float vf1[N+16], vf2[N];
9 double vd1[N+16], vd2[N];
10 int k[N];
11 long l[N];
12 short n[N];
13 
14 __attribute__((noinline, noclone)) void
f1(void)15 f1 (void)
16 {
17   int i;
18   for (i = 0; i < N; i++)
19     vf2[i] = vf1[k[i]];
20 }
21 
22 __attribute__((noinline, noclone)) void
f2(void)23 f2 (void)
24 {
25   int i;
26   for (i = 0; i < N; i++)
27     n[i] = (int) vf1[k[i]];
28 }
29 
30 __attribute__((noinline, noclone)) void
f3(int x)31 f3 (int x)
32 {
33   int i;
34   for (i = 0; i < N; i++)
35     vf2[i] = vf1[k[i] + x];
36 }
37 
38 __attribute__((noinline, noclone)) void
f4(int x)39 f4 (int x)
40 {
41   int i;
42   for (i = 0; i < N; i++)
43     n[i] = (int) vf1[k[i] + x];
44 }
45 
46 __attribute__((noinline, noclone)) void
f5(void)47 f5 (void)
48 {
49   int i;
50   for (i = 0; i < N; i++)
51     vd2[i] = vd1[k[i]];
52 }
53 
54 __attribute__((noinline, noclone)) void
f6(void)55 f6 (void)
56 {
57   int i;
58   for (i = 0; i < N; i++)
59     n[i] = (int) vd1[k[i]];
60 }
61 
62 __attribute__((noinline, noclone)) void
f7(int x)63 f7 (int x)
64 {
65   int i;
66   for (i = 0; i < N; i++)
67     vd2[i] = vd1[k[i] + x];
68 }
69 
70 __attribute__((noinline, noclone)) void
f8(int x)71 f8 (int x)
72 {
73   int i;
74   for (i = 0; i < N; i++)
75     n[i] = (int) vd1[k[i] + x];
76 }
77 
78 __attribute__((noinline, noclone)) void
f9(void)79 f9 (void)
80 {
81   int i;
82   for (i = 0; i < N; i++)
83     vf2[i] = vf1[l[i]];
84 }
85 
86 __attribute__((noinline, noclone)) void
f10(void)87 f10 (void)
88 {
89   int i;
90   for (i = 0; i < N; i++)
91     n[i] = (int) vf1[l[i]];
92 }
93 
94 __attribute__((noinline, noclone)) void
f11(long x)95 f11 (long x)
96 {
97   int i;
98   for (i = 0; i < N; i++)
99     vf2[i] = vf1[l[i] + x];
100 }
101 
102 __attribute__((noinline, noclone)) void
f12(long x)103 f12 (long x)
104 {
105   int i;
106   for (i = 0; i < N; i++)
107     n[i] = (int) vf1[l[i] + x];
108 }
109 
110 __attribute__((noinline, noclone)) void
f13(void)111 f13 (void)
112 {
113   int i;
114   for (i = 0; i < N; i++)
115     vd2[i] = vd1[l[i]];
116 }
117 
118 __attribute__((noinline, noclone)) void
f14(void)119 f14 (void)
120 {
121   int i;
122   for (i = 0; i < N; i++)
123     n[i] = (int) vd1[l[i]];
124 }
125 
126 __attribute__((noinline, noclone)) void
f15(long x)127 f15 (long x)
128 {
129   int i;
130   for (i = 0; i < N; i++)
131     vd2[i] = vd1[l[i] + x];
132 }
133 
134 __attribute__((noinline, noclone)) void
f16(long x)135 f16 (long x)
136 {
137   int i;
138   for (i = 0; i < N; i++)
139     n[i] = (int) vd1[l[i] + x];
140 }
141 
142 static void
avx2_test(void)143 avx2_test (void)
144 {
145   int i;
146 
147   for (i = 0; i < N + 16; i++)
148     {
149       asm ("");
150       vf1[i] = 17.0f + i;
151       vd1[i] = 19.0 + i;
152     }
153   for (i = 0; i < N; i++)
154     {
155       asm ("");
156       k[i] = (i * 731) & (N - 1);
157       l[i] = (i * 657) & (N - 1);
158     }
159 
160   f1 ();
161   f2 ();
162   for (i = 0; i < N; i++)
163     if (vf2[i] != ((i * 731) & (N - 1)) + 17
164 	|| n[i] != ((i * 731) & (N - 1)) + 17)
165       abort ();
166 
167   f3 (12);
168   f4 (14);
169   for (i = 0; i < N; i++)
170     if (vf2[i] != ((i * 731) & (N - 1)) + 17 + 12
171 	|| n[i] != ((i * 731) & (N - 1)) + 17 + 14)
172       abort ();
173 
174   f5 ();
175   f6 ();
176   for (i = 0; i < N; i++)
177     if (vd2[i] != ((i * 731) & (N - 1)) + 19
178 	|| n[i] != ((i * 731) & (N - 1)) + 19)
179       abort ();
180 
181   f7 (7);
182   f8 (9);
183   for (i = 0; i < N; i++)
184     if (vd2[i] != ((i * 731) & (N - 1)) + 19 + 7
185 	|| n[i] != ((i * 731) & (N - 1)) + 19 + 9)
186       abort ();
187 
188   f9 ();
189   f10 ();
190   for (i = 0; i < N; i++)
191     if (vf2[i] != ((i * 657) & (N - 1)) + 17
192 	|| n[i] != ((i * 657) & (N - 1)) + 17)
193       abort ();
194 
195   f11 (2);
196   f12 (4);
197   for (i = 0; i < N; i++)
198     if (vf2[i] != ((i * 657) & (N - 1)) + 17 + 2
199 	|| n[i] != ((i * 657) & (N - 1)) + 17 + 4)
200       abort ();
201 
202   f13 ();
203   f14 ();
204   for (i = 0; i < N; i++)
205     if (vd2[i] != ((i * 657) & (N - 1)) + 19
206 	|| n[i] != ((i * 657) & (N - 1)) + 19)
207       abort ();
208 
209   f15 (13);
210   f16 (15);
211   for (i = 0; i < N; i++)
212     if (vd2[i] != ((i * 657) & (N - 1)) + 19 + 13
213 	|| n[i] != ((i * 657) & (N - 1)) + 19 + 15)
214       abort ();
215 }
216