1 /* fp_sqr_comba_24.i
2 *
3 * Copyright (C) 2006-2021 wolfSSL Inc.
4 *
5 * This file is part of wolfSSL.
6 *
7 * wolfSSL is free software; you can redistribute it and/or modify
8 * it under the terms of the GNU General Public License as published by
9 * the Free Software Foundation; either version 2 of the License, or
10 * (at your option) any later version.
11 *
12 * wolfSSL is distributed in the hope that it will be useful,
13 * but WITHOUT ANY WARRANTY; without even the implied warranty of
14 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
15 * GNU General Public License for more details.
16 *
17 * You should have received a copy of the GNU General Public License
18 * along with this program; if not, write to the Free Software
19 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1335, USA
20 */
21
22
23
24 #ifdef TFM_SQR24
fp_sqr_comba24(fp_int * A,fp_int * B)25 int fp_sqr_comba24(fp_int *A, fp_int *B)
26 {
27 fp_digit *a, c0, c1, c2, sc0 = 0, sc1 = 0, sc2 = 0;
28 #ifdef TFM_ISO
29 fp_word tt;
30 #endif
31 #ifndef WOLFSSL_SMALL_STACK
32 fp_digit b[48];
33 #else
34 fp_digit *b;
35 #endif
36
37 #ifdef WOLFSSL_SMALL_STACK
38 b = (fp_digit*)XMALLOC(sizeof(fp_digit) * 48, NULL, DYNAMIC_TYPE_TMP_BUFFER);
39 if (b == NULL)
40 return FP_MEM;
41 #endif
42
43 a = A->dp;
44 COMBA_START;
45
46 /* clear carries */
47 CLEAR_CARRY;
48
49 /* output 0 */
50 SQRADD(a[0],a[0]);
51 COMBA_STORE(b[0]);
52
53 /* output 1 */
54 CARRY_FORWARD;
55 SQRADD2(a[0], a[1]);
56 COMBA_STORE(b[1]);
57
58 /* output 2 */
59 CARRY_FORWARD;
60 SQRADD2(a[0], a[2]); SQRADD(a[1], a[1]);
61 COMBA_STORE(b[2]);
62
63 /* output 3 */
64 CARRY_FORWARD;
65 SQRADD2(a[0], a[3]); SQRADD2(a[1], a[2]);
66 COMBA_STORE(b[3]);
67
68 /* output 4 */
69 CARRY_FORWARD;
70 SQRADD2(a[0], a[4]); SQRADD2(a[1], a[3]); SQRADD(a[2], a[2]);
71 COMBA_STORE(b[4]);
72
73 /* output 5 */
74 CARRY_FORWARD;
75 SQRADDSC(a[0], a[5]); SQRADDAC(a[1], a[4]); SQRADDAC(a[2], a[3]); SQRADDDB;
76 COMBA_STORE(b[5]);
77
78 /* output 6 */
79 CARRY_FORWARD;
80 SQRADDSC(a[0], a[6]); SQRADDAC(a[1], a[5]); SQRADDAC(a[2], a[4]); SQRADDDB; SQRADD(a[3], a[3]);
81 COMBA_STORE(b[6]);
82
83 /* output 7 */
84 CARRY_FORWARD;
85 SQRADDSC(a[0], a[7]); SQRADDAC(a[1], a[6]); SQRADDAC(a[2], a[5]); SQRADDAC(a[3], a[4]); SQRADDDB;
86 COMBA_STORE(b[7]);
87
88 /* output 8 */
89 CARRY_FORWARD;
90 SQRADDSC(a[0], a[8]); SQRADDAC(a[1], a[7]); SQRADDAC(a[2], a[6]); SQRADDAC(a[3], a[5]); SQRADDDB; SQRADD(a[4], a[4]);
91 COMBA_STORE(b[8]);
92
93 /* output 9 */
94 CARRY_FORWARD;
95 SQRADDSC(a[0], a[9]); SQRADDAC(a[1], a[8]); SQRADDAC(a[2], a[7]); SQRADDAC(a[3], a[6]); SQRADDAC(a[4], a[5]); SQRADDDB;
96 COMBA_STORE(b[9]);
97
98 /* output 10 */
99 CARRY_FORWARD;
100 SQRADDSC(a[0], a[10]); SQRADDAC(a[1], a[9]); SQRADDAC(a[2], a[8]); SQRADDAC(a[3], a[7]); SQRADDAC(a[4], a[6]); SQRADDDB; SQRADD(a[5], a[5]);
101 COMBA_STORE(b[10]);
102
103 /* output 11 */
104 CARRY_FORWARD;
105 SQRADDSC(a[0], a[11]); SQRADDAC(a[1], a[10]); SQRADDAC(a[2], a[9]); SQRADDAC(a[3], a[8]); SQRADDAC(a[4], a[7]); SQRADDAC(a[5], a[6]); SQRADDDB;
106 COMBA_STORE(b[11]);
107
108 /* output 12 */
109 CARRY_FORWARD;
110 SQRADDSC(a[0], a[12]); SQRADDAC(a[1], a[11]); SQRADDAC(a[2], a[10]); SQRADDAC(a[3], a[9]); SQRADDAC(a[4], a[8]); SQRADDAC(a[5], a[7]); SQRADDDB; SQRADD(a[6], a[6]);
111 COMBA_STORE(b[12]);
112
113 /* output 13 */
114 CARRY_FORWARD;
115 SQRADDSC(a[0], a[13]); SQRADDAC(a[1], a[12]); SQRADDAC(a[2], a[11]); SQRADDAC(a[3], a[10]); SQRADDAC(a[4], a[9]); SQRADDAC(a[5], a[8]); SQRADDAC(a[6], a[7]); SQRADDDB;
116 COMBA_STORE(b[13]);
117
118 /* output 14 */
119 CARRY_FORWARD;
120 SQRADDSC(a[0], a[14]); SQRADDAC(a[1], a[13]); SQRADDAC(a[2], a[12]); SQRADDAC(a[3], a[11]); SQRADDAC(a[4], a[10]); SQRADDAC(a[5], a[9]); SQRADDAC(a[6], a[8]); SQRADDDB; SQRADD(a[7], a[7]);
121 COMBA_STORE(b[14]);
122
123 /* output 15 */
124 CARRY_FORWARD;
125 SQRADDSC(a[0], a[15]); SQRADDAC(a[1], a[14]); SQRADDAC(a[2], a[13]); SQRADDAC(a[3], a[12]); SQRADDAC(a[4], a[11]); SQRADDAC(a[5], a[10]); SQRADDAC(a[6], a[9]); SQRADDAC(a[7], a[8]); SQRADDDB;
126 COMBA_STORE(b[15]);
127
128 /* output 16 */
129 CARRY_FORWARD;
130 SQRADDSC(a[0], a[16]); SQRADDAC(a[1], a[15]); SQRADDAC(a[2], a[14]); SQRADDAC(a[3], a[13]); SQRADDAC(a[4], a[12]); SQRADDAC(a[5], a[11]); SQRADDAC(a[6], a[10]); SQRADDAC(a[7], a[9]); SQRADDDB; SQRADD(a[8], a[8]);
131 COMBA_STORE(b[16]);
132
133 /* output 17 */
134 CARRY_FORWARD;
135 SQRADDSC(a[0], a[17]); SQRADDAC(a[1], a[16]); SQRADDAC(a[2], a[15]); SQRADDAC(a[3], a[14]); SQRADDAC(a[4], a[13]); SQRADDAC(a[5], a[12]); SQRADDAC(a[6], a[11]); SQRADDAC(a[7], a[10]); SQRADDAC(a[8], a[9]); SQRADDDB;
136 COMBA_STORE(b[17]);
137
138 /* output 18 */
139 CARRY_FORWARD;
140 SQRADDSC(a[0], a[18]); SQRADDAC(a[1], a[17]); SQRADDAC(a[2], a[16]); SQRADDAC(a[3], a[15]); SQRADDAC(a[4], a[14]); SQRADDAC(a[5], a[13]); SQRADDAC(a[6], a[12]); SQRADDAC(a[7], a[11]); SQRADDAC(a[8], a[10]); SQRADDDB; SQRADD(a[9], a[9]);
141 COMBA_STORE(b[18]);
142
143 /* output 19 */
144 CARRY_FORWARD;
145 SQRADDSC(a[0], a[19]); SQRADDAC(a[1], a[18]); SQRADDAC(a[2], a[17]); SQRADDAC(a[3], a[16]); SQRADDAC(a[4], a[15]); SQRADDAC(a[5], a[14]); SQRADDAC(a[6], a[13]); SQRADDAC(a[7], a[12]); SQRADDAC(a[8], a[11]); SQRADDAC(a[9], a[10]); SQRADDDB;
146 COMBA_STORE(b[19]);
147
148 /* output 20 */
149 CARRY_FORWARD;
150 SQRADDSC(a[0], a[20]); SQRADDAC(a[1], a[19]); SQRADDAC(a[2], a[18]); SQRADDAC(a[3], a[17]); SQRADDAC(a[4], a[16]); SQRADDAC(a[5], a[15]); SQRADDAC(a[6], a[14]); SQRADDAC(a[7], a[13]); SQRADDAC(a[8], a[12]); SQRADDAC(a[9], a[11]); SQRADDDB; SQRADD(a[10], a[10]);
151 COMBA_STORE(b[20]);
152
153 /* output 21 */
154 CARRY_FORWARD;
155 SQRADDSC(a[0], a[21]); SQRADDAC(a[1], a[20]); SQRADDAC(a[2], a[19]); SQRADDAC(a[3], a[18]); SQRADDAC(a[4], a[17]); SQRADDAC(a[5], a[16]); SQRADDAC(a[6], a[15]); SQRADDAC(a[7], a[14]); SQRADDAC(a[8], a[13]); SQRADDAC(a[9], a[12]); SQRADDAC(a[10], a[11]); SQRADDDB;
156 COMBA_STORE(b[21]);
157
158 /* output 22 */
159 CARRY_FORWARD;
160 SQRADDSC(a[0], a[22]); SQRADDAC(a[1], a[21]); SQRADDAC(a[2], a[20]); SQRADDAC(a[3], a[19]); SQRADDAC(a[4], a[18]); SQRADDAC(a[5], a[17]); SQRADDAC(a[6], a[16]); SQRADDAC(a[7], a[15]); SQRADDAC(a[8], a[14]); SQRADDAC(a[9], a[13]); SQRADDAC(a[10], a[12]); SQRADDDB; SQRADD(a[11], a[11]);
161 COMBA_STORE(b[22]);
162
163 /* output 23 */
164 CARRY_FORWARD;
165 SQRADDSC(a[0], a[23]); SQRADDAC(a[1], a[22]); SQRADDAC(a[2], a[21]); SQRADDAC(a[3], a[20]); SQRADDAC(a[4], a[19]); SQRADDAC(a[5], a[18]); SQRADDAC(a[6], a[17]); SQRADDAC(a[7], a[16]); SQRADDAC(a[8], a[15]); SQRADDAC(a[9], a[14]); SQRADDAC(a[10], a[13]); SQRADDAC(a[11], a[12]); SQRADDDB;
166 COMBA_STORE(b[23]);
167
168 /* output 24 */
169 CARRY_FORWARD;
170 SQRADDSC(a[1], a[23]); SQRADDAC(a[2], a[22]); SQRADDAC(a[3], a[21]); SQRADDAC(a[4], a[20]); SQRADDAC(a[5], a[19]); SQRADDAC(a[6], a[18]); SQRADDAC(a[7], a[17]); SQRADDAC(a[8], a[16]); SQRADDAC(a[9], a[15]); SQRADDAC(a[10], a[14]); SQRADDAC(a[11], a[13]); SQRADDDB; SQRADD(a[12], a[12]);
171 COMBA_STORE(b[24]);
172
173 /* output 25 */
174 CARRY_FORWARD;
175 SQRADDSC(a[2], a[23]); SQRADDAC(a[3], a[22]); SQRADDAC(a[4], a[21]); SQRADDAC(a[5], a[20]); SQRADDAC(a[6], a[19]); SQRADDAC(a[7], a[18]); SQRADDAC(a[8], a[17]); SQRADDAC(a[9], a[16]); SQRADDAC(a[10], a[15]); SQRADDAC(a[11], a[14]); SQRADDAC(a[12], a[13]); SQRADDDB;
176 COMBA_STORE(b[25]);
177
178 /* output 26 */
179 CARRY_FORWARD;
180 SQRADDSC(a[3], a[23]); SQRADDAC(a[4], a[22]); SQRADDAC(a[5], a[21]); SQRADDAC(a[6], a[20]); SQRADDAC(a[7], a[19]); SQRADDAC(a[8], a[18]); SQRADDAC(a[9], a[17]); SQRADDAC(a[10], a[16]); SQRADDAC(a[11], a[15]); SQRADDAC(a[12], a[14]); SQRADDDB; SQRADD(a[13], a[13]);
181 COMBA_STORE(b[26]);
182
183 /* output 27 */
184 CARRY_FORWARD;
185 SQRADDSC(a[4], a[23]); SQRADDAC(a[5], a[22]); SQRADDAC(a[6], a[21]); SQRADDAC(a[7], a[20]); SQRADDAC(a[8], a[19]); SQRADDAC(a[9], a[18]); SQRADDAC(a[10], a[17]); SQRADDAC(a[11], a[16]); SQRADDAC(a[12], a[15]); SQRADDAC(a[13], a[14]); SQRADDDB;
186 COMBA_STORE(b[27]);
187
188 /* output 28 */
189 CARRY_FORWARD;
190 SQRADDSC(a[5], a[23]); SQRADDAC(a[6], a[22]); SQRADDAC(a[7], a[21]); SQRADDAC(a[8], a[20]); SQRADDAC(a[9], a[19]); SQRADDAC(a[10], a[18]); SQRADDAC(a[11], a[17]); SQRADDAC(a[12], a[16]); SQRADDAC(a[13], a[15]); SQRADDDB; SQRADD(a[14], a[14]);
191 COMBA_STORE(b[28]);
192
193 /* output 29 */
194 CARRY_FORWARD;
195 SQRADDSC(a[6], a[23]); SQRADDAC(a[7], a[22]); SQRADDAC(a[8], a[21]); SQRADDAC(a[9], a[20]); SQRADDAC(a[10], a[19]); SQRADDAC(a[11], a[18]); SQRADDAC(a[12], a[17]); SQRADDAC(a[13], a[16]); SQRADDAC(a[14], a[15]); SQRADDDB;
196 COMBA_STORE(b[29]);
197
198 /* output 30 */
199 CARRY_FORWARD;
200 SQRADDSC(a[7], a[23]); SQRADDAC(a[8], a[22]); SQRADDAC(a[9], a[21]); SQRADDAC(a[10], a[20]); SQRADDAC(a[11], a[19]); SQRADDAC(a[12], a[18]); SQRADDAC(a[13], a[17]); SQRADDAC(a[14], a[16]); SQRADDDB; SQRADD(a[15], a[15]);
201 COMBA_STORE(b[30]);
202
203 /* output 31 */
204 CARRY_FORWARD;
205 SQRADDSC(a[8], a[23]); SQRADDAC(a[9], a[22]); SQRADDAC(a[10], a[21]); SQRADDAC(a[11], a[20]); SQRADDAC(a[12], a[19]); SQRADDAC(a[13], a[18]); SQRADDAC(a[14], a[17]); SQRADDAC(a[15], a[16]); SQRADDDB;
206 COMBA_STORE(b[31]);
207
208 /* output 32 */
209 CARRY_FORWARD;
210 SQRADDSC(a[9], a[23]); SQRADDAC(a[10], a[22]); SQRADDAC(a[11], a[21]); SQRADDAC(a[12], a[20]); SQRADDAC(a[13], a[19]); SQRADDAC(a[14], a[18]); SQRADDAC(a[15], a[17]); SQRADDDB; SQRADD(a[16], a[16]);
211 COMBA_STORE(b[32]);
212
213 /* output 33 */
214 CARRY_FORWARD;
215 SQRADDSC(a[10], a[23]); SQRADDAC(a[11], a[22]); SQRADDAC(a[12], a[21]); SQRADDAC(a[13], a[20]); SQRADDAC(a[14], a[19]); SQRADDAC(a[15], a[18]); SQRADDAC(a[16], a[17]); SQRADDDB;
216 COMBA_STORE(b[33]);
217
218 /* output 34 */
219 CARRY_FORWARD;
220 SQRADDSC(a[11], a[23]); SQRADDAC(a[12], a[22]); SQRADDAC(a[13], a[21]); SQRADDAC(a[14], a[20]); SQRADDAC(a[15], a[19]); SQRADDAC(a[16], a[18]); SQRADDDB; SQRADD(a[17], a[17]);
221 COMBA_STORE(b[34]);
222
223 /* output 35 */
224 CARRY_FORWARD;
225 SQRADDSC(a[12], a[23]); SQRADDAC(a[13], a[22]); SQRADDAC(a[14], a[21]); SQRADDAC(a[15], a[20]); SQRADDAC(a[16], a[19]); SQRADDAC(a[17], a[18]); SQRADDDB;
226 COMBA_STORE(b[35]);
227
228 /* output 36 */
229 CARRY_FORWARD;
230 SQRADDSC(a[13], a[23]); SQRADDAC(a[14], a[22]); SQRADDAC(a[15], a[21]); SQRADDAC(a[16], a[20]); SQRADDAC(a[17], a[19]); SQRADDDB; SQRADD(a[18], a[18]);
231 COMBA_STORE(b[36]);
232
233 /* output 37 */
234 CARRY_FORWARD;
235 SQRADDSC(a[14], a[23]); SQRADDAC(a[15], a[22]); SQRADDAC(a[16], a[21]); SQRADDAC(a[17], a[20]); SQRADDAC(a[18], a[19]); SQRADDDB;
236 COMBA_STORE(b[37]);
237
238 /* output 38 */
239 CARRY_FORWARD;
240 SQRADDSC(a[15], a[23]); SQRADDAC(a[16], a[22]); SQRADDAC(a[17], a[21]); SQRADDAC(a[18], a[20]); SQRADDDB; SQRADD(a[19], a[19]);
241 COMBA_STORE(b[38]);
242
243 /* output 39 */
244 CARRY_FORWARD;
245 SQRADDSC(a[16], a[23]); SQRADDAC(a[17], a[22]); SQRADDAC(a[18], a[21]); SQRADDAC(a[19], a[20]); SQRADDDB;
246 COMBA_STORE(b[39]);
247
248 /* output 40 */
249 CARRY_FORWARD;
250 SQRADDSC(a[17], a[23]); SQRADDAC(a[18], a[22]); SQRADDAC(a[19], a[21]); SQRADDDB; SQRADD(a[20], a[20]);
251 COMBA_STORE(b[40]);
252
253 /* output 41 */
254 CARRY_FORWARD;
255 SQRADDSC(a[18], a[23]); SQRADDAC(a[19], a[22]); SQRADDAC(a[20], a[21]); SQRADDDB;
256 COMBA_STORE(b[41]);
257
258 /* output 42 */
259 CARRY_FORWARD;
260 SQRADD2(a[19], a[23]); SQRADD2(a[20], a[22]); SQRADD(a[21], a[21]);
261 COMBA_STORE(b[42]);
262
263 /* output 43 */
264 CARRY_FORWARD;
265 SQRADD2(a[20], a[23]); SQRADD2(a[21], a[22]);
266 COMBA_STORE(b[43]);
267
268 /* output 44 */
269 CARRY_FORWARD;
270 SQRADD2(a[21], a[23]); SQRADD(a[22], a[22]);
271 COMBA_STORE(b[44]);
272
273 /* output 45 */
274 CARRY_FORWARD;
275 SQRADD2(a[22], a[23]);
276 COMBA_STORE(b[45]);
277
278 /* output 46 */
279 CARRY_FORWARD;
280 SQRADD(a[23], a[23]);
281 COMBA_STORE(b[46]);
282 COMBA_STORE2(b[47]);
283 COMBA_FINI;
284
285 B->used = 48;
286 B->sign = FP_ZPOS;
287 XMEMCPY(B->dp, b, 48 * sizeof(fp_digit));
288 fp_clamp(B);
289
290 #ifdef WOLFSSL_SMALL_STACK
291 XFREE(b, NULL, DYNAMIC_TYPE_TMP_BUFFER);
292 #endif
293 return FP_OKAY;
294 }
295 #endif
296
297
298