1 /* fp_sqr_comba_24.i
2  *
3  * Copyright (C) 2006-2021 wolfSSL Inc.
4  *
5  * This file is part of wolfSSL.
6  *
7  * wolfSSL is free software; you can redistribute it and/or modify
8  * it under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 2 of the License, or
10  * (at your option) any later version.
11  *
12  * wolfSSL is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with this program; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1335, USA
20  */
21 
22 
23 
24 #ifdef TFM_SQR24
fp_sqr_comba24(fp_int * A,fp_int * B)25 int fp_sqr_comba24(fp_int *A, fp_int *B)
26 {
27    fp_digit *a, c0, c1, c2, sc0 = 0, sc1 = 0, sc2 = 0;
28 #ifdef TFM_ISO
29    fp_word tt;
30 #endif
31 #ifndef WOLFSSL_SMALL_STACK
32    fp_digit b[48];
33 #else
34    fp_digit *b;
35 #endif
36 
37 #ifdef WOLFSSL_SMALL_STACK
38    b = (fp_digit*)XMALLOC(sizeof(fp_digit) * 48, NULL, DYNAMIC_TYPE_TMP_BUFFER);
39    if (b == NULL)
40       return FP_MEM;
41 #endif
42 
43    a = A->dp;
44    COMBA_START;
45 
46    /* clear carries */
47    CLEAR_CARRY;
48 
49    /* output 0 */
50    SQRADD(a[0],a[0]);
51    COMBA_STORE(b[0]);
52 
53    /* output 1 */
54    CARRY_FORWARD;
55    SQRADD2(a[0], a[1]);
56    COMBA_STORE(b[1]);
57 
58    /* output 2 */
59    CARRY_FORWARD;
60    SQRADD2(a[0], a[2]); SQRADD(a[1], a[1]);
61    COMBA_STORE(b[2]);
62 
63    /* output 3 */
64    CARRY_FORWARD;
65    SQRADD2(a[0], a[3]); SQRADD2(a[1], a[2]);
66    COMBA_STORE(b[3]);
67 
68    /* output 4 */
69    CARRY_FORWARD;
70    SQRADD2(a[0], a[4]); SQRADD2(a[1], a[3]); SQRADD(a[2], a[2]);
71    COMBA_STORE(b[4]);
72 
73    /* output 5 */
74    CARRY_FORWARD;
75    SQRADDSC(a[0], a[5]); SQRADDAC(a[1], a[4]); SQRADDAC(a[2], a[3]); SQRADDDB;
76    COMBA_STORE(b[5]);
77 
78    /* output 6 */
79    CARRY_FORWARD;
80    SQRADDSC(a[0], a[6]); SQRADDAC(a[1], a[5]); SQRADDAC(a[2], a[4]); SQRADDDB; SQRADD(a[3], a[3]);
81    COMBA_STORE(b[6]);
82 
83    /* output 7 */
84    CARRY_FORWARD;
85    SQRADDSC(a[0], a[7]); SQRADDAC(a[1], a[6]); SQRADDAC(a[2], a[5]); SQRADDAC(a[3], a[4]); SQRADDDB;
86    COMBA_STORE(b[7]);
87 
88    /* output 8 */
89    CARRY_FORWARD;
90    SQRADDSC(a[0], a[8]); SQRADDAC(a[1], a[7]); SQRADDAC(a[2], a[6]); SQRADDAC(a[3], a[5]); SQRADDDB; SQRADD(a[4], a[4]);
91    COMBA_STORE(b[8]);
92 
93    /* output 9 */
94    CARRY_FORWARD;
95    SQRADDSC(a[0], a[9]); SQRADDAC(a[1], a[8]); SQRADDAC(a[2], a[7]); SQRADDAC(a[3], a[6]); SQRADDAC(a[4], a[5]); SQRADDDB;
96    COMBA_STORE(b[9]);
97 
98    /* output 10 */
99    CARRY_FORWARD;
100    SQRADDSC(a[0], a[10]); SQRADDAC(a[1], a[9]); SQRADDAC(a[2], a[8]); SQRADDAC(a[3], a[7]); SQRADDAC(a[4], a[6]); SQRADDDB; SQRADD(a[5], a[5]);
101    COMBA_STORE(b[10]);
102 
103    /* output 11 */
104    CARRY_FORWARD;
105    SQRADDSC(a[0], a[11]); SQRADDAC(a[1], a[10]); SQRADDAC(a[2], a[9]); SQRADDAC(a[3], a[8]); SQRADDAC(a[4], a[7]); SQRADDAC(a[5], a[6]); SQRADDDB;
106    COMBA_STORE(b[11]);
107 
108    /* output 12 */
109    CARRY_FORWARD;
110    SQRADDSC(a[0], a[12]); SQRADDAC(a[1], a[11]); SQRADDAC(a[2], a[10]); SQRADDAC(a[3], a[9]); SQRADDAC(a[4], a[8]); SQRADDAC(a[5], a[7]); SQRADDDB; SQRADD(a[6], a[6]);
111    COMBA_STORE(b[12]);
112 
113    /* output 13 */
114    CARRY_FORWARD;
115    SQRADDSC(a[0], a[13]); SQRADDAC(a[1], a[12]); SQRADDAC(a[2], a[11]); SQRADDAC(a[3], a[10]); SQRADDAC(a[4], a[9]); SQRADDAC(a[5], a[8]); SQRADDAC(a[6], a[7]); SQRADDDB;
116    COMBA_STORE(b[13]);
117 
118    /* output 14 */
119    CARRY_FORWARD;
120    SQRADDSC(a[0], a[14]); SQRADDAC(a[1], a[13]); SQRADDAC(a[2], a[12]); SQRADDAC(a[3], a[11]); SQRADDAC(a[4], a[10]); SQRADDAC(a[5], a[9]); SQRADDAC(a[6], a[8]); SQRADDDB; SQRADD(a[7], a[7]);
121    COMBA_STORE(b[14]);
122 
123    /* output 15 */
124    CARRY_FORWARD;
125    SQRADDSC(a[0], a[15]); SQRADDAC(a[1], a[14]); SQRADDAC(a[2], a[13]); SQRADDAC(a[3], a[12]); SQRADDAC(a[4], a[11]); SQRADDAC(a[5], a[10]); SQRADDAC(a[6], a[9]); SQRADDAC(a[7], a[8]); SQRADDDB;
126    COMBA_STORE(b[15]);
127 
128    /* output 16 */
129    CARRY_FORWARD;
130    SQRADDSC(a[0], a[16]); SQRADDAC(a[1], a[15]); SQRADDAC(a[2], a[14]); SQRADDAC(a[3], a[13]); SQRADDAC(a[4], a[12]); SQRADDAC(a[5], a[11]); SQRADDAC(a[6], a[10]); SQRADDAC(a[7], a[9]); SQRADDDB; SQRADD(a[8], a[8]);
131    COMBA_STORE(b[16]);
132 
133    /* output 17 */
134    CARRY_FORWARD;
135    SQRADDSC(a[0], a[17]); SQRADDAC(a[1], a[16]); SQRADDAC(a[2], a[15]); SQRADDAC(a[3], a[14]); SQRADDAC(a[4], a[13]); SQRADDAC(a[5], a[12]); SQRADDAC(a[6], a[11]); SQRADDAC(a[7], a[10]); SQRADDAC(a[8], a[9]); SQRADDDB;
136    COMBA_STORE(b[17]);
137 
138    /* output 18 */
139    CARRY_FORWARD;
140    SQRADDSC(a[0], a[18]); SQRADDAC(a[1], a[17]); SQRADDAC(a[2], a[16]); SQRADDAC(a[3], a[15]); SQRADDAC(a[4], a[14]); SQRADDAC(a[5], a[13]); SQRADDAC(a[6], a[12]); SQRADDAC(a[7], a[11]); SQRADDAC(a[8], a[10]); SQRADDDB; SQRADD(a[9], a[9]);
141    COMBA_STORE(b[18]);
142 
143    /* output 19 */
144    CARRY_FORWARD;
145    SQRADDSC(a[0], a[19]); SQRADDAC(a[1], a[18]); SQRADDAC(a[2], a[17]); SQRADDAC(a[3], a[16]); SQRADDAC(a[4], a[15]); SQRADDAC(a[5], a[14]); SQRADDAC(a[6], a[13]); SQRADDAC(a[7], a[12]); SQRADDAC(a[8], a[11]); SQRADDAC(a[9], a[10]); SQRADDDB;
146    COMBA_STORE(b[19]);
147 
148    /* output 20 */
149    CARRY_FORWARD;
150    SQRADDSC(a[0], a[20]); SQRADDAC(a[1], a[19]); SQRADDAC(a[2], a[18]); SQRADDAC(a[3], a[17]); SQRADDAC(a[4], a[16]); SQRADDAC(a[5], a[15]); SQRADDAC(a[6], a[14]); SQRADDAC(a[7], a[13]); SQRADDAC(a[8], a[12]); SQRADDAC(a[9], a[11]); SQRADDDB; SQRADD(a[10], a[10]);
151    COMBA_STORE(b[20]);
152 
153    /* output 21 */
154    CARRY_FORWARD;
155    SQRADDSC(a[0], a[21]); SQRADDAC(a[1], a[20]); SQRADDAC(a[2], a[19]); SQRADDAC(a[3], a[18]); SQRADDAC(a[4], a[17]); SQRADDAC(a[5], a[16]); SQRADDAC(a[6], a[15]); SQRADDAC(a[7], a[14]); SQRADDAC(a[8], a[13]); SQRADDAC(a[9], a[12]); SQRADDAC(a[10], a[11]); SQRADDDB;
156    COMBA_STORE(b[21]);
157 
158    /* output 22 */
159    CARRY_FORWARD;
160    SQRADDSC(a[0], a[22]); SQRADDAC(a[1], a[21]); SQRADDAC(a[2], a[20]); SQRADDAC(a[3], a[19]); SQRADDAC(a[4], a[18]); SQRADDAC(a[5], a[17]); SQRADDAC(a[6], a[16]); SQRADDAC(a[7], a[15]); SQRADDAC(a[8], a[14]); SQRADDAC(a[9], a[13]); SQRADDAC(a[10], a[12]); SQRADDDB; SQRADD(a[11], a[11]);
161    COMBA_STORE(b[22]);
162 
163    /* output 23 */
164    CARRY_FORWARD;
165    SQRADDSC(a[0], a[23]); SQRADDAC(a[1], a[22]); SQRADDAC(a[2], a[21]); SQRADDAC(a[3], a[20]); SQRADDAC(a[4], a[19]); SQRADDAC(a[5], a[18]); SQRADDAC(a[6], a[17]); SQRADDAC(a[7], a[16]); SQRADDAC(a[8], a[15]); SQRADDAC(a[9], a[14]); SQRADDAC(a[10], a[13]); SQRADDAC(a[11], a[12]); SQRADDDB;
166    COMBA_STORE(b[23]);
167 
168    /* output 24 */
169    CARRY_FORWARD;
170    SQRADDSC(a[1], a[23]); SQRADDAC(a[2], a[22]); SQRADDAC(a[3], a[21]); SQRADDAC(a[4], a[20]); SQRADDAC(a[5], a[19]); SQRADDAC(a[6], a[18]); SQRADDAC(a[7], a[17]); SQRADDAC(a[8], a[16]); SQRADDAC(a[9], a[15]); SQRADDAC(a[10], a[14]); SQRADDAC(a[11], a[13]); SQRADDDB; SQRADD(a[12], a[12]);
171    COMBA_STORE(b[24]);
172 
173    /* output 25 */
174    CARRY_FORWARD;
175    SQRADDSC(a[2], a[23]); SQRADDAC(a[3], a[22]); SQRADDAC(a[4], a[21]); SQRADDAC(a[5], a[20]); SQRADDAC(a[6], a[19]); SQRADDAC(a[7], a[18]); SQRADDAC(a[8], a[17]); SQRADDAC(a[9], a[16]); SQRADDAC(a[10], a[15]); SQRADDAC(a[11], a[14]); SQRADDAC(a[12], a[13]); SQRADDDB;
176    COMBA_STORE(b[25]);
177 
178    /* output 26 */
179    CARRY_FORWARD;
180    SQRADDSC(a[3], a[23]); SQRADDAC(a[4], a[22]); SQRADDAC(a[5], a[21]); SQRADDAC(a[6], a[20]); SQRADDAC(a[7], a[19]); SQRADDAC(a[8], a[18]); SQRADDAC(a[9], a[17]); SQRADDAC(a[10], a[16]); SQRADDAC(a[11], a[15]); SQRADDAC(a[12], a[14]); SQRADDDB; SQRADD(a[13], a[13]);
181    COMBA_STORE(b[26]);
182 
183    /* output 27 */
184    CARRY_FORWARD;
185    SQRADDSC(a[4], a[23]); SQRADDAC(a[5], a[22]); SQRADDAC(a[6], a[21]); SQRADDAC(a[7], a[20]); SQRADDAC(a[8], a[19]); SQRADDAC(a[9], a[18]); SQRADDAC(a[10], a[17]); SQRADDAC(a[11], a[16]); SQRADDAC(a[12], a[15]); SQRADDAC(a[13], a[14]); SQRADDDB;
186    COMBA_STORE(b[27]);
187 
188    /* output 28 */
189    CARRY_FORWARD;
190    SQRADDSC(a[5], a[23]); SQRADDAC(a[6], a[22]); SQRADDAC(a[7], a[21]); SQRADDAC(a[8], a[20]); SQRADDAC(a[9], a[19]); SQRADDAC(a[10], a[18]); SQRADDAC(a[11], a[17]); SQRADDAC(a[12], a[16]); SQRADDAC(a[13], a[15]); SQRADDDB; SQRADD(a[14], a[14]);
191    COMBA_STORE(b[28]);
192 
193    /* output 29 */
194    CARRY_FORWARD;
195    SQRADDSC(a[6], a[23]); SQRADDAC(a[7], a[22]); SQRADDAC(a[8], a[21]); SQRADDAC(a[9], a[20]); SQRADDAC(a[10], a[19]); SQRADDAC(a[11], a[18]); SQRADDAC(a[12], a[17]); SQRADDAC(a[13], a[16]); SQRADDAC(a[14], a[15]); SQRADDDB;
196    COMBA_STORE(b[29]);
197 
198    /* output 30 */
199    CARRY_FORWARD;
200    SQRADDSC(a[7], a[23]); SQRADDAC(a[8], a[22]); SQRADDAC(a[9], a[21]); SQRADDAC(a[10], a[20]); SQRADDAC(a[11], a[19]); SQRADDAC(a[12], a[18]); SQRADDAC(a[13], a[17]); SQRADDAC(a[14], a[16]); SQRADDDB; SQRADD(a[15], a[15]);
201    COMBA_STORE(b[30]);
202 
203    /* output 31 */
204    CARRY_FORWARD;
205    SQRADDSC(a[8], a[23]); SQRADDAC(a[9], a[22]); SQRADDAC(a[10], a[21]); SQRADDAC(a[11], a[20]); SQRADDAC(a[12], a[19]); SQRADDAC(a[13], a[18]); SQRADDAC(a[14], a[17]); SQRADDAC(a[15], a[16]); SQRADDDB;
206    COMBA_STORE(b[31]);
207 
208    /* output 32 */
209    CARRY_FORWARD;
210    SQRADDSC(a[9], a[23]); SQRADDAC(a[10], a[22]); SQRADDAC(a[11], a[21]); SQRADDAC(a[12], a[20]); SQRADDAC(a[13], a[19]); SQRADDAC(a[14], a[18]); SQRADDAC(a[15], a[17]); SQRADDDB; SQRADD(a[16], a[16]);
211    COMBA_STORE(b[32]);
212 
213    /* output 33 */
214    CARRY_FORWARD;
215    SQRADDSC(a[10], a[23]); SQRADDAC(a[11], a[22]); SQRADDAC(a[12], a[21]); SQRADDAC(a[13], a[20]); SQRADDAC(a[14], a[19]); SQRADDAC(a[15], a[18]); SQRADDAC(a[16], a[17]); SQRADDDB;
216    COMBA_STORE(b[33]);
217 
218    /* output 34 */
219    CARRY_FORWARD;
220    SQRADDSC(a[11], a[23]); SQRADDAC(a[12], a[22]); SQRADDAC(a[13], a[21]); SQRADDAC(a[14], a[20]); SQRADDAC(a[15], a[19]); SQRADDAC(a[16], a[18]); SQRADDDB; SQRADD(a[17], a[17]);
221    COMBA_STORE(b[34]);
222 
223    /* output 35 */
224    CARRY_FORWARD;
225    SQRADDSC(a[12], a[23]); SQRADDAC(a[13], a[22]); SQRADDAC(a[14], a[21]); SQRADDAC(a[15], a[20]); SQRADDAC(a[16], a[19]); SQRADDAC(a[17], a[18]); SQRADDDB;
226    COMBA_STORE(b[35]);
227 
228    /* output 36 */
229    CARRY_FORWARD;
230    SQRADDSC(a[13], a[23]); SQRADDAC(a[14], a[22]); SQRADDAC(a[15], a[21]); SQRADDAC(a[16], a[20]); SQRADDAC(a[17], a[19]); SQRADDDB; SQRADD(a[18], a[18]);
231    COMBA_STORE(b[36]);
232 
233    /* output 37 */
234    CARRY_FORWARD;
235    SQRADDSC(a[14], a[23]); SQRADDAC(a[15], a[22]); SQRADDAC(a[16], a[21]); SQRADDAC(a[17], a[20]); SQRADDAC(a[18], a[19]); SQRADDDB;
236    COMBA_STORE(b[37]);
237 
238    /* output 38 */
239    CARRY_FORWARD;
240    SQRADDSC(a[15], a[23]); SQRADDAC(a[16], a[22]); SQRADDAC(a[17], a[21]); SQRADDAC(a[18], a[20]); SQRADDDB; SQRADD(a[19], a[19]);
241    COMBA_STORE(b[38]);
242 
243    /* output 39 */
244    CARRY_FORWARD;
245    SQRADDSC(a[16], a[23]); SQRADDAC(a[17], a[22]); SQRADDAC(a[18], a[21]); SQRADDAC(a[19], a[20]); SQRADDDB;
246    COMBA_STORE(b[39]);
247 
248    /* output 40 */
249    CARRY_FORWARD;
250    SQRADDSC(a[17], a[23]); SQRADDAC(a[18], a[22]); SQRADDAC(a[19], a[21]); SQRADDDB; SQRADD(a[20], a[20]);
251    COMBA_STORE(b[40]);
252 
253    /* output 41 */
254    CARRY_FORWARD;
255    SQRADDSC(a[18], a[23]); SQRADDAC(a[19], a[22]); SQRADDAC(a[20], a[21]); SQRADDDB;
256    COMBA_STORE(b[41]);
257 
258    /* output 42 */
259    CARRY_FORWARD;
260    SQRADD2(a[19], a[23]); SQRADD2(a[20], a[22]); SQRADD(a[21], a[21]);
261    COMBA_STORE(b[42]);
262 
263    /* output 43 */
264    CARRY_FORWARD;
265    SQRADD2(a[20], a[23]); SQRADD2(a[21], a[22]);
266    COMBA_STORE(b[43]);
267 
268    /* output 44 */
269    CARRY_FORWARD;
270    SQRADD2(a[21], a[23]); SQRADD(a[22], a[22]);
271    COMBA_STORE(b[44]);
272 
273    /* output 45 */
274    CARRY_FORWARD;
275    SQRADD2(a[22], a[23]);
276    COMBA_STORE(b[45]);
277 
278    /* output 46 */
279    CARRY_FORWARD;
280    SQRADD(a[23], a[23]);
281    COMBA_STORE(b[46]);
282    COMBA_STORE2(b[47]);
283    COMBA_FINI;
284 
285    B->used = 48;
286    B->sign = FP_ZPOS;
287    XMEMCPY(B->dp, b, 48 * sizeof(fp_digit));
288    fp_clamp(B);
289 
290 #ifdef WOLFSSL_SMALL_STACK
291    XFREE(b, NULL, DYNAMIC_TYPE_TMP_BUFFER);
292 #endif
293    return FP_OKAY;
294 }
295 #endif
296 
297 
298