xref: /freebsd/crypto/openssl/crypto/bn/bn_asm.c (revision 74664626)
174664626SKris Kennaway /* crypto/bn/bn_asm.c */
274664626SKris Kennaway /* Copyright (C) 1995-1998 Eric Young (eay@cryptsoft.com)
374664626SKris Kennaway  * All rights reserved.
474664626SKris Kennaway  *
574664626SKris Kennaway  * This package is an SSL implementation written
674664626SKris Kennaway  * by Eric Young (eay@cryptsoft.com).
774664626SKris Kennaway  * The implementation was written so as to conform with Netscapes SSL.
874664626SKris Kennaway  *
974664626SKris Kennaway  * This library is free for commercial and non-commercial use as long as
1074664626SKris Kennaway  * the following conditions are aheared to.  The following conditions
1174664626SKris Kennaway  * apply to all code found in this distribution, be it the RC4, RSA,
1274664626SKris Kennaway  * lhash, DES, etc., code; not just the SSL code.  The SSL documentation
1374664626SKris Kennaway  * included with this distribution is covered by the same copyright terms
1474664626SKris Kennaway  * except that the holder is Tim Hudson (tjh@cryptsoft.com).
1574664626SKris Kennaway  *
1674664626SKris Kennaway  * Copyright remains Eric Young's, and as such any Copyright notices in
1774664626SKris Kennaway  * the code are not to be removed.
1874664626SKris Kennaway  * If this package is used in a product, Eric Young should be given attribution
1974664626SKris Kennaway  * as the author of the parts of the library used.
2074664626SKris Kennaway  * This can be in the form of a textual message at program startup or
2174664626SKris Kennaway  * in documentation (online or textual) provided with the package.
2274664626SKris Kennaway  *
2374664626SKris Kennaway  * Redistribution and use in source and binary forms, with or without
2474664626SKris Kennaway  * modification, are permitted provided that the following conditions
2574664626SKris Kennaway  * are met:
2674664626SKris Kennaway  * 1. Redistributions of source code must retain the copyright
2774664626SKris Kennaway  *    notice, this list of conditions and the following disclaimer.
2874664626SKris Kennaway  * 2. Redistributions in binary form must reproduce the above copyright
2974664626SKris Kennaway  *    notice, this list of conditions and the following disclaimer in the
3074664626SKris Kennaway  *    documentation and/or other materials provided with the distribution.
3174664626SKris Kennaway  * 3. All advertising materials mentioning features or use of this software
3274664626SKris Kennaway  *    must display the following acknowledgement:
3374664626SKris Kennaway  *    "This product includes cryptographic software written by
3474664626SKris Kennaway  *     Eric Young (eay@cryptsoft.com)"
3574664626SKris Kennaway  *    The word 'cryptographic' can be left out if the rouines from the library
3674664626SKris Kennaway  *    being used are not cryptographic related :-).
3774664626SKris Kennaway  * 4. If you include any Windows specific code (or a derivative thereof) from
3874664626SKris Kennaway  *    the apps directory (application code) you must include an acknowledgement:
3974664626SKris Kennaway  *    "This product includes software written by Tim Hudson (tjh@cryptsoft.com)"
4074664626SKris Kennaway  *
4174664626SKris Kennaway  * THIS SOFTWARE IS PROVIDED BY ERIC YOUNG ``AS IS'' AND
4274664626SKris Kennaway  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
4374664626SKris Kennaway  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
4474664626SKris Kennaway  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
4574664626SKris Kennaway  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
4674664626SKris Kennaway  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
4774664626SKris Kennaway  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
4874664626SKris Kennaway  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
4974664626SKris Kennaway  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
5074664626SKris Kennaway  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
5174664626SKris Kennaway  * SUCH DAMAGE.
5274664626SKris Kennaway  *
5374664626SKris Kennaway  * The licence and distribution terms for any publically available version or
5474664626SKris Kennaway  * derivative of this code cannot be changed.  i.e. this code cannot simply be
5574664626SKris Kennaway  * copied and put under another distribution licence
5674664626SKris Kennaway  * [including the GNU Public Licence.]
5774664626SKris Kennaway  */
5874664626SKris Kennaway 
5974664626SKris Kennaway #include <stdio.h>
6074664626SKris Kennaway #include "cryptlib.h"
6174664626SKris Kennaway #include "bn_lcl.h"
6274664626SKris Kennaway 
6374664626SKris Kennaway #ifdef BN_LLONG
6474664626SKris Kennaway 
6574664626SKris Kennaway BN_ULONG bn_mul_add_words(BN_ULONG *rp, BN_ULONG *ap, int num, BN_ULONG w)
6674664626SKris Kennaway 	{
6774664626SKris Kennaway 	BN_ULONG c1=0;
6874664626SKris Kennaway 
6974664626SKris Kennaway 	bn_check_num(num);
7074664626SKris Kennaway 	if (num <= 0) return(c1);
7174664626SKris Kennaway 
7274664626SKris Kennaway 	for (;;)
7374664626SKris Kennaway 		{
7474664626SKris Kennaway 		mul_add(rp[0],ap[0],w,c1);
7574664626SKris Kennaway 		if (--num == 0) break;
7674664626SKris Kennaway 		mul_add(rp[1],ap[1],w,c1);
7774664626SKris Kennaway 		if (--num == 0) break;
7874664626SKris Kennaway 		mul_add(rp[2],ap[2],w,c1);
7974664626SKris Kennaway 		if (--num == 0) break;
8074664626SKris Kennaway 		mul_add(rp[3],ap[3],w,c1);
8174664626SKris Kennaway 		if (--num == 0) break;
8274664626SKris Kennaway 		ap+=4;
8374664626SKris Kennaway 		rp+=4;
8474664626SKris Kennaway 		}
8574664626SKris Kennaway 
8674664626SKris Kennaway 	return(c1);
8774664626SKris Kennaway 	}
8874664626SKris Kennaway 
8974664626SKris Kennaway BN_ULONG bn_mul_words(BN_ULONG *rp, BN_ULONG *ap, int num, BN_ULONG w)
9074664626SKris Kennaway 	{
9174664626SKris Kennaway 	BN_ULONG c1=0;
9274664626SKris Kennaway 
9374664626SKris Kennaway 	bn_check_num(num);
9474664626SKris Kennaway 	if (num <= 0) return(c1);
9574664626SKris Kennaway 
9674664626SKris Kennaway 	/* for (;;) */
9774664626SKris Kennaway 	while (1) /* circumvent egcs-1.1.2 bug */
9874664626SKris Kennaway 		{
9974664626SKris Kennaway 		mul(rp[0],ap[0],w,c1);
10074664626SKris Kennaway 		if (--num == 0) break;
10174664626SKris Kennaway 		mul(rp[1],ap[1],w,c1);
10274664626SKris Kennaway 		if (--num == 0) break;
10374664626SKris Kennaway 		mul(rp[2],ap[2],w,c1);
10474664626SKris Kennaway 		if (--num == 0) break;
10574664626SKris Kennaway 		mul(rp[3],ap[3],w,c1);
10674664626SKris Kennaway 		if (--num == 0) break;
10774664626SKris Kennaway 		ap+=4;
10874664626SKris Kennaway 		rp+=4;
10974664626SKris Kennaway 		}
11074664626SKris Kennaway 	return(c1);
11174664626SKris Kennaway 	}
11274664626SKris Kennaway 
11374664626SKris Kennaway void bn_sqr_words(BN_ULONG *r, BN_ULONG *a, int n)
11474664626SKris Kennaway         {
11574664626SKris Kennaway 	bn_check_num(n);
11674664626SKris Kennaway 	if (n <= 0) return;
11774664626SKris Kennaway 	for (;;)
11874664626SKris Kennaway 		{
11974664626SKris Kennaway 		BN_ULLONG t;
12074664626SKris Kennaway 
12174664626SKris Kennaway 		t=(BN_ULLONG)(a[0])*(a[0]);
12274664626SKris Kennaway 		r[0]=Lw(t); r[1]=Hw(t);
12374664626SKris Kennaway 		if (--n == 0) break;
12474664626SKris Kennaway 
12574664626SKris Kennaway 		t=(BN_ULLONG)(a[1])*(a[1]);
12674664626SKris Kennaway 		r[2]=Lw(t); r[3]=Hw(t);
12774664626SKris Kennaway 		if (--n == 0) break;
12874664626SKris Kennaway 
12974664626SKris Kennaway 		t=(BN_ULLONG)(a[2])*(a[2]);
13074664626SKris Kennaway 		r[4]=Lw(t); r[5]=Hw(t);
13174664626SKris Kennaway 		if (--n == 0) break;
13274664626SKris Kennaway 
13374664626SKris Kennaway 		t=(BN_ULLONG)(a[3])*(a[3]);
13474664626SKris Kennaway 		r[6]=Lw(t); r[7]=Hw(t);
13574664626SKris Kennaway 		if (--n == 0) break;
13674664626SKris Kennaway 
13774664626SKris Kennaway 		a+=4;
13874664626SKris Kennaway 		r+=8;
13974664626SKris Kennaway 		}
14074664626SKris Kennaway 	}
14174664626SKris Kennaway 
14274664626SKris Kennaway #else
14374664626SKris Kennaway 
14474664626SKris Kennaway BN_ULONG bn_mul_add_words(BN_ULONG *rp, BN_ULONG *ap, int num, BN_ULONG w)
14574664626SKris Kennaway 	{
14674664626SKris Kennaway 	BN_ULONG c=0;
14774664626SKris Kennaway 	BN_ULONG bl,bh;
14874664626SKris Kennaway 
14974664626SKris Kennaway 	bn_check_num(num);
15074664626SKris Kennaway 	if (num <= 0) return((BN_ULONG)0);
15174664626SKris Kennaway 
15274664626SKris Kennaway 	bl=LBITS(w);
15374664626SKris Kennaway 	bh=HBITS(w);
15474664626SKris Kennaway 
15574664626SKris Kennaway 	for (;;)
15674664626SKris Kennaway 		{
15774664626SKris Kennaway 		mul_add(rp[0],ap[0],bl,bh,c);
15874664626SKris Kennaway 		if (--num == 0) break;
15974664626SKris Kennaway 		mul_add(rp[1],ap[1],bl,bh,c);
16074664626SKris Kennaway 		if (--num == 0) break;
16174664626SKris Kennaway 		mul_add(rp[2],ap[2],bl,bh,c);
16274664626SKris Kennaway 		if (--num == 0) break;
16374664626SKris Kennaway 		mul_add(rp[3],ap[3],bl,bh,c);
16474664626SKris Kennaway 		if (--num == 0) break;
16574664626SKris Kennaway 		ap+=4;
16674664626SKris Kennaway 		rp+=4;
16774664626SKris Kennaway 		}
16874664626SKris Kennaway 	return(c);
16974664626SKris Kennaway 	}
17074664626SKris Kennaway 
17174664626SKris Kennaway BN_ULONG bn_mul_words(BN_ULONG *rp, BN_ULONG *ap, int num, BN_ULONG w)
17274664626SKris Kennaway 	{
17374664626SKris Kennaway 	BN_ULONG carry=0;
17474664626SKris Kennaway 	BN_ULONG bl,bh;
17574664626SKris Kennaway 
17674664626SKris Kennaway 	bn_check_num(num);
17774664626SKris Kennaway 	if (num <= 0) return((BN_ULONG)0);
17874664626SKris Kennaway 
17974664626SKris Kennaway 	bl=LBITS(w);
18074664626SKris Kennaway 	bh=HBITS(w);
18174664626SKris Kennaway 
18274664626SKris Kennaway 	for (;;)
18374664626SKris Kennaway 		{
18474664626SKris Kennaway 		mul(rp[0],ap[0],bl,bh,carry);
18574664626SKris Kennaway 		if (--num == 0) break;
18674664626SKris Kennaway 		mul(rp[1],ap[1],bl,bh,carry);
18774664626SKris Kennaway 		if (--num == 0) break;
18874664626SKris Kennaway 		mul(rp[2],ap[2],bl,bh,carry);
18974664626SKris Kennaway 		if (--num == 0) break;
19074664626SKris Kennaway 		mul(rp[3],ap[3],bl,bh,carry);
19174664626SKris Kennaway 		if (--num == 0) break;
19274664626SKris Kennaway 		ap+=4;
19374664626SKris Kennaway 		rp+=4;
19474664626SKris Kennaway 		}
19574664626SKris Kennaway 	return(carry);
19674664626SKris Kennaway 	}
19774664626SKris Kennaway 
19874664626SKris Kennaway void bn_sqr_words(BN_ULONG *r, BN_ULONG *a, int n)
19974664626SKris Kennaway         {
20074664626SKris Kennaway 	bn_check_num(n);
20174664626SKris Kennaway 	if (n <= 0) return;
20274664626SKris Kennaway 	for (;;)
20374664626SKris Kennaway 		{
20474664626SKris Kennaway 		sqr64(r[0],r[1],a[0]);
20574664626SKris Kennaway 		if (--n == 0) break;
20674664626SKris Kennaway 
20774664626SKris Kennaway 		sqr64(r[2],r[3],a[1]);
20874664626SKris Kennaway 		if (--n == 0) break;
20974664626SKris Kennaway 
21074664626SKris Kennaway 		sqr64(r[4],r[5],a[2]);
21174664626SKris Kennaway 		if (--n == 0) break;
21274664626SKris Kennaway 
21374664626SKris Kennaway 		sqr64(r[6],r[7],a[3]);
21474664626SKris Kennaway 		if (--n == 0) break;
21574664626SKris Kennaway 
21674664626SKris Kennaway 		a+=4;
21774664626SKris Kennaway 		r+=8;
21874664626SKris Kennaway 		}
21974664626SKris Kennaway 	}
22074664626SKris Kennaway 
22174664626SKris Kennaway #endif
22274664626SKris Kennaway 
22374664626SKris Kennaway #if defined(BN_LLONG) && defined(BN_DIV2W)
22474664626SKris Kennaway 
22574664626SKris Kennaway BN_ULONG bn_div_words(BN_ULONG h, BN_ULONG l, BN_ULONG d)
22674664626SKris Kennaway 	{
22774664626SKris Kennaway 	return((BN_ULONG)(((((BN_ULLONG)h)<<BN_BITS2)|l)/(BN_ULLONG)d));
22874664626SKris Kennaway 	}
22974664626SKris Kennaway 
23074664626SKris Kennaway #else
23174664626SKris Kennaway 
23274664626SKris Kennaway /* Divide h-l by d and return the result. */
23374664626SKris Kennaway /* I need to test this some more :-( */
23474664626SKris Kennaway BN_ULONG bn_div_words(BN_ULONG h, BN_ULONG l, BN_ULONG d)
23574664626SKris Kennaway 	{
23674664626SKris Kennaway 	BN_ULONG dh,dl,q,ret=0,th,tl,t;
23774664626SKris Kennaway 	int i,count=2;
23874664626SKris Kennaway 
23974664626SKris Kennaway 	if (d == 0) return(BN_MASK2);
24074664626SKris Kennaway 
24174664626SKris Kennaway 	i=BN_num_bits_word(d);
24274664626SKris Kennaway 	if ((i != BN_BITS2) && (h > (BN_ULONG)1<<i))
24374664626SKris Kennaway 		{
24474664626SKris Kennaway #if !defined(NO_STDIO) && !defined(WIN16)
24574664626SKris Kennaway 		fprintf(stderr,"Division would overflow (%d)\n",i);
24674664626SKris Kennaway #endif
24774664626SKris Kennaway 		abort();
24874664626SKris Kennaway 		}
24974664626SKris Kennaway 	i=BN_BITS2-i;
25074664626SKris Kennaway 	if (h >= d) h-=d;
25174664626SKris Kennaway 
25274664626SKris Kennaway 	if (i)
25374664626SKris Kennaway 		{
25474664626SKris Kennaway 		d<<=i;
25574664626SKris Kennaway 		h=(h<<i)|(l>>(BN_BITS2-i));
25674664626SKris Kennaway 		l<<=i;
25774664626SKris Kennaway 		}
25874664626SKris Kennaway 	dh=(d&BN_MASK2h)>>BN_BITS4;
25974664626SKris Kennaway 	dl=(d&BN_MASK2l);
26074664626SKris Kennaway 	for (;;)
26174664626SKris Kennaway 		{
26274664626SKris Kennaway 		if ((h>>BN_BITS4) == dh)
26374664626SKris Kennaway 			q=BN_MASK2l;
26474664626SKris Kennaway 		else
26574664626SKris Kennaway 			q=h/dh;
26674664626SKris Kennaway 
26774664626SKris Kennaway 		th=q*dh;
26874664626SKris Kennaway 		tl=dl*q;
26974664626SKris Kennaway 		for (;;)
27074664626SKris Kennaway 			{
27174664626SKris Kennaway 			t=h-th;
27274664626SKris Kennaway 			if ((t&BN_MASK2h) ||
27374664626SKris Kennaway 				((tl) <= (
27474664626SKris Kennaway 					(t<<BN_BITS4)|
27574664626SKris Kennaway 					((l&BN_MASK2h)>>BN_BITS4))))
27674664626SKris Kennaway 				break;
27774664626SKris Kennaway 			q--;
27874664626SKris Kennaway 			th-=dh;
27974664626SKris Kennaway 			tl-=dl;
28074664626SKris Kennaway 			}
28174664626SKris Kennaway 		t=(tl>>BN_BITS4);
28274664626SKris Kennaway 		tl=(tl<<BN_BITS4)&BN_MASK2h;
28374664626SKris Kennaway 		th+=t;
28474664626SKris Kennaway 
28574664626SKris Kennaway 		if (l < tl) th++;
28674664626SKris Kennaway 		l-=tl;
28774664626SKris Kennaway 		if (h < th)
28874664626SKris Kennaway 			{
28974664626SKris Kennaway 			h+=d;
29074664626SKris Kennaway 			q--;
29174664626SKris Kennaway 			}
29274664626SKris Kennaway 		h-=th;
29374664626SKris Kennaway 
29474664626SKris Kennaway 		if (--count == 0) break;
29574664626SKris Kennaway 
29674664626SKris Kennaway 		ret=q<<BN_BITS4;
29774664626SKris Kennaway 		h=((h<<BN_BITS4)|(l>>BN_BITS4))&BN_MASK2;
29874664626SKris Kennaway 		l=(l&BN_MASK2l)<<BN_BITS4;
29974664626SKris Kennaway 		}
30074664626SKris Kennaway 	ret|=q;
30174664626SKris Kennaway 	return(ret);
30274664626SKris Kennaway 	}
30374664626SKris Kennaway #endif
30474664626SKris Kennaway 
30574664626SKris Kennaway #ifdef BN_LLONG
30674664626SKris Kennaway BN_ULONG bn_add_words(BN_ULONG *r, BN_ULONG *a, BN_ULONG *b, int n)
30774664626SKris Kennaway         {
30874664626SKris Kennaway 	BN_ULLONG ll=0;
30974664626SKris Kennaway 
31074664626SKris Kennaway 	bn_check_num(n);
31174664626SKris Kennaway 	if (n <= 0) return((BN_ULONG)0);
31274664626SKris Kennaway 
31374664626SKris Kennaway 	for (;;)
31474664626SKris Kennaway 		{
31574664626SKris Kennaway 		ll+=(BN_ULLONG)a[0]+b[0];
31674664626SKris Kennaway 		r[0]=(BN_ULONG)ll&BN_MASK2;
31774664626SKris Kennaway 		ll>>=BN_BITS2;
31874664626SKris Kennaway 		if (--n <= 0) break;
31974664626SKris Kennaway 
32074664626SKris Kennaway 		ll+=(BN_ULLONG)a[1]+b[1];
32174664626SKris Kennaway 		r[1]=(BN_ULONG)ll&BN_MASK2;
32274664626SKris Kennaway 		ll>>=BN_BITS2;
32374664626SKris Kennaway 		if (--n <= 0) break;
32474664626SKris Kennaway 
32574664626SKris Kennaway 		ll+=(BN_ULLONG)a[2]+b[2];
32674664626SKris Kennaway 		r[2]=(BN_ULONG)ll&BN_MASK2;
32774664626SKris Kennaway 		ll>>=BN_BITS2;
32874664626SKris Kennaway 		if (--n <= 0) break;
32974664626SKris Kennaway 
33074664626SKris Kennaway 		ll+=(BN_ULLONG)a[3]+b[3];
33174664626SKris Kennaway 		r[3]=(BN_ULONG)ll&BN_MASK2;
33274664626SKris Kennaway 		ll>>=BN_BITS2;
33374664626SKris Kennaway 		if (--n <= 0) break;
33474664626SKris Kennaway 
33574664626SKris Kennaway 		a+=4;
33674664626SKris Kennaway 		b+=4;
33774664626SKris Kennaway 		r+=4;
33874664626SKris Kennaway 		}
33974664626SKris Kennaway 	return((BN_ULONG)ll);
34074664626SKris Kennaway 	}
34174664626SKris Kennaway #else
34274664626SKris Kennaway BN_ULONG bn_add_words(BN_ULONG *r, BN_ULONG *a, BN_ULONG *b, int n)
34374664626SKris Kennaway         {
34474664626SKris Kennaway 	BN_ULONG c,l,t;
34574664626SKris Kennaway 
34674664626SKris Kennaway 	bn_check_num(n);
34774664626SKris Kennaway 	if (n <= 0) return((BN_ULONG)0);
34874664626SKris Kennaway 
34974664626SKris Kennaway 	c=0;
35074664626SKris Kennaway 	for (;;)
35174664626SKris Kennaway 		{
35274664626SKris Kennaway 		t=a[0];
35374664626SKris Kennaway 		t=(t+c)&BN_MASK2;
35474664626SKris Kennaway 		c=(t < c);
35574664626SKris Kennaway 		l=(t+b[0])&BN_MASK2;
35674664626SKris Kennaway 		c+=(l < t);
35774664626SKris Kennaway 		r[0]=l;
35874664626SKris Kennaway 		if (--n <= 0) break;
35974664626SKris Kennaway 
36074664626SKris Kennaway 		t=a[1];
36174664626SKris Kennaway 		t=(t+c)&BN_MASK2;
36274664626SKris Kennaway 		c=(t < c);
36374664626SKris Kennaway 		l=(t+b[1])&BN_MASK2;
36474664626SKris Kennaway 		c+=(l < t);
36574664626SKris Kennaway 		r[1]=l;
36674664626SKris Kennaway 		if (--n <= 0) break;
36774664626SKris Kennaway 
36874664626SKris Kennaway 		t=a[2];
36974664626SKris Kennaway 		t=(t+c)&BN_MASK2;
37074664626SKris Kennaway 		c=(t < c);
37174664626SKris Kennaway 		l=(t+b[2])&BN_MASK2;
37274664626SKris Kennaway 		c+=(l < t);
37374664626SKris Kennaway 		r[2]=l;
37474664626SKris Kennaway 		if (--n <= 0) break;
37574664626SKris Kennaway 
37674664626SKris Kennaway 		t=a[3];
37774664626SKris Kennaway 		t=(t+c)&BN_MASK2;
37874664626SKris Kennaway 		c=(t < c);
37974664626SKris Kennaway 		l=(t+b[3])&BN_MASK2;
38074664626SKris Kennaway 		c+=(l < t);
38174664626SKris Kennaway 		r[3]=l;
38274664626SKris Kennaway 		if (--n <= 0) break;
38374664626SKris Kennaway 
38474664626SKris Kennaway 		a+=4;
38574664626SKris Kennaway 		b+=4;
38674664626SKris Kennaway 		r+=4;
38774664626SKris Kennaway 		}
38874664626SKris Kennaway 	return((BN_ULONG)c);
38974664626SKris Kennaway 	}
39074664626SKris Kennaway #endif
39174664626SKris Kennaway 
39274664626SKris Kennaway BN_ULONG bn_sub_words(BN_ULONG *r, BN_ULONG *a, BN_ULONG *b, int n)
39374664626SKris Kennaway         {
39474664626SKris Kennaway 	BN_ULONG t1,t2;
39574664626SKris Kennaway 	int c=0;
39674664626SKris Kennaway 
39774664626SKris Kennaway 	bn_check_num(n);
39874664626SKris Kennaway 	if (n <= 0) return((BN_ULONG)0);
39974664626SKris Kennaway 
40074664626SKris Kennaway 	for (;;)
40174664626SKris Kennaway 		{
40274664626SKris Kennaway 		t1=a[0]; t2=b[0];
40374664626SKris Kennaway 		r[0]=(t1-t2-c)&BN_MASK2;
40474664626SKris Kennaway 		if (t1 != t2) c=(t1 < t2);
40574664626SKris Kennaway 		if (--n <= 0) break;
40674664626SKris Kennaway 
40774664626SKris Kennaway 		t1=a[1]; t2=b[1];
40874664626SKris Kennaway 		r[1]=(t1-t2-c)&BN_MASK2;
40974664626SKris Kennaway 		if (t1 != t2) c=(t1 < t2);
41074664626SKris Kennaway 		if (--n <= 0) break;
41174664626SKris Kennaway 
41274664626SKris Kennaway 		t1=a[2]; t2=b[2];
41374664626SKris Kennaway 		r[2]=(t1-t2-c)&BN_MASK2;
41474664626SKris Kennaway 		if (t1 != t2) c=(t1 < t2);
41574664626SKris Kennaway 		if (--n <= 0) break;
41674664626SKris Kennaway 
41774664626SKris Kennaway 		t1=a[3]; t2=b[3];
41874664626SKris Kennaway 		r[3]=(t1-t2-c)&BN_MASK2;
41974664626SKris Kennaway 		if (t1 != t2) c=(t1 < t2);
42074664626SKris Kennaway 		if (--n <= 0) break;
42174664626SKris Kennaway 
42274664626SKris Kennaway 		a+=4;
42374664626SKris Kennaway 		b+=4;
42474664626SKris Kennaway 		r+=4;
42574664626SKris Kennaway 		}
42674664626SKris Kennaway 	return(c);
42774664626SKris Kennaway 	}
42874664626SKris Kennaway 
42974664626SKris Kennaway #ifdef BN_MUL_COMBA
43074664626SKris Kennaway 
43174664626SKris Kennaway #undef bn_mul_comba8
43274664626SKris Kennaway #undef bn_mul_comba4
43374664626SKris Kennaway #undef bn_sqr_comba8
43474664626SKris Kennaway #undef bn_sqr_comba4
43574664626SKris Kennaway 
43674664626SKris Kennaway #ifdef BN_LLONG
43774664626SKris Kennaway #define mul_add_c(a,b,c0,c1,c2) \
43874664626SKris Kennaway 	t=(BN_ULLONG)a*b; \
43974664626SKris Kennaway 	t1=(BN_ULONG)Lw(t); \
44074664626SKris Kennaway 	t2=(BN_ULONG)Hw(t); \
44174664626SKris Kennaway 	c0=(c0+t1)&BN_MASK2; if ((c0) < t1) t2++; \
44274664626SKris Kennaway 	c1=(c1+t2)&BN_MASK2; if ((c1) < t2) c2++;
44374664626SKris Kennaway 
44474664626SKris Kennaway #define mul_add_c2(a,b,c0,c1,c2) \
44574664626SKris Kennaway 	t=(BN_ULLONG)a*b; \
44674664626SKris Kennaway 	tt=(t+t)&BN_MASK; \
44774664626SKris Kennaway 	if (tt < t) c2++; \
44874664626SKris Kennaway 	t1=(BN_ULONG)Lw(tt); \
44974664626SKris Kennaway 	t2=(BN_ULONG)Hw(tt); \
45074664626SKris Kennaway 	c0=(c0+t1)&BN_MASK2;  \
45174664626SKris Kennaway 	if ((c0 < t1) && (((++t2)&BN_MASK2) == 0)) c2++; \
45274664626SKris Kennaway 	c1=(c1+t2)&BN_MASK2; if ((c1) < t2) c2++;
45374664626SKris Kennaway 
45474664626SKris Kennaway #define sqr_add_c(a,i,c0,c1,c2) \
45574664626SKris Kennaway 	t=(BN_ULLONG)a[i]*a[i]; \
45674664626SKris Kennaway 	t1=(BN_ULONG)Lw(t); \
45774664626SKris Kennaway 	t2=(BN_ULONG)Hw(t); \
45874664626SKris Kennaway 	c0=(c0+t1)&BN_MASK2; if ((c0) < t1) t2++; \
45974664626SKris Kennaway 	c1=(c1+t2)&BN_MASK2; if ((c1) < t2) c2++;
46074664626SKris Kennaway 
46174664626SKris Kennaway #define sqr_add_c2(a,i,j,c0,c1,c2) \
46274664626SKris Kennaway 	mul_add_c2((a)[i],(a)[j],c0,c1,c2)
46374664626SKris Kennaway #else
46474664626SKris Kennaway #define mul_add_c(a,b,c0,c1,c2) \
46574664626SKris Kennaway 	t1=LBITS(a); t2=HBITS(a); \
46674664626SKris Kennaway 	bl=LBITS(b); bh=HBITS(b); \
46774664626SKris Kennaway 	mul64(t1,t2,bl,bh); \
46874664626SKris Kennaway 	c0=(c0+t1)&BN_MASK2; if ((c0) < t1) t2++; \
46974664626SKris Kennaway 	c1=(c1+t2)&BN_MASK2; if ((c1) < t2) c2++;
47074664626SKris Kennaway 
47174664626SKris Kennaway #define mul_add_c2(a,b,c0,c1,c2) \
47274664626SKris Kennaway 	t1=LBITS(a); t2=HBITS(a); \
47374664626SKris Kennaway 	bl=LBITS(b); bh=HBITS(b); \
47474664626SKris Kennaway 	mul64(t1,t2,bl,bh); \
47574664626SKris Kennaway 	if (t2 & BN_TBIT) c2++; \
47674664626SKris Kennaway 	t2=(t2+t2)&BN_MASK2; \
47774664626SKris Kennaway 	if (t1 & BN_TBIT) t2++; \
47874664626SKris Kennaway 	t1=(t1+t1)&BN_MASK2; \
47974664626SKris Kennaway 	c0=(c0+t1)&BN_MASK2;  \
48074664626SKris Kennaway 	if ((c0 < t1) && (((++t2)&BN_MASK2) == 0)) c2++; \
48174664626SKris Kennaway 	c1=(c1+t2)&BN_MASK2; if ((c1) < t2) c2++;
48274664626SKris Kennaway 
48374664626SKris Kennaway #define sqr_add_c(a,i,c0,c1,c2) \
48474664626SKris Kennaway 	sqr64(t1,t2,(a)[i]); \
48574664626SKris Kennaway 	c0=(c0+t1)&BN_MASK2; if ((c0) < t1) t2++; \
48674664626SKris Kennaway 	c1=(c1+t2)&BN_MASK2; if ((c1) < t2) c2++;
48774664626SKris Kennaway 
48874664626SKris Kennaway #define sqr_add_c2(a,i,j,c0,c1,c2) \
48974664626SKris Kennaway 	mul_add_c2((a)[i],(a)[j],c0,c1,c2)
49074664626SKris Kennaway #endif
49174664626SKris Kennaway 
49274664626SKris Kennaway void bn_mul_comba8(BN_ULONG *r, BN_ULONG *a, BN_ULONG *b)
49374664626SKris Kennaway 	{
49474664626SKris Kennaway #ifdef BN_LLONG
49574664626SKris Kennaway 	BN_ULLONG t;
49674664626SKris Kennaway #else
49774664626SKris Kennaway 	BN_ULONG bl,bh;
49874664626SKris Kennaway #endif
49974664626SKris Kennaway 	BN_ULONG t1,t2;
50074664626SKris Kennaway 	BN_ULONG c1,c2,c3;
50174664626SKris Kennaway 
50274664626SKris Kennaway 	c1=0;
50374664626SKris Kennaway 	c2=0;
50474664626SKris Kennaway 	c3=0;
50574664626SKris Kennaway 	mul_add_c(a[0],b[0],c1,c2,c3);
50674664626SKris Kennaway 	r[0]=c1;
50774664626SKris Kennaway 	c1=0;
50874664626SKris Kennaway 	mul_add_c(a[0],b[1],c2,c3,c1);
50974664626SKris Kennaway 	mul_add_c(a[1],b[0],c2,c3,c1);
51074664626SKris Kennaway 	r[1]=c2;
51174664626SKris Kennaway 	c2=0;
51274664626SKris Kennaway 	mul_add_c(a[2],b[0],c3,c1,c2);
51374664626SKris Kennaway 	mul_add_c(a[1],b[1],c3,c1,c2);
51474664626SKris Kennaway 	mul_add_c(a[0],b[2],c3,c1,c2);
51574664626SKris Kennaway 	r[2]=c3;
51674664626SKris Kennaway 	c3=0;
51774664626SKris Kennaway 	mul_add_c(a[0],b[3],c1,c2,c3);
51874664626SKris Kennaway 	mul_add_c(a[1],b[2],c1,c2,c3);
51974664626SKris Kennaway 	mul_add_c(a[2],b[1],c1,c2,c3);
52074664626SKris Kennaway 	mul_add_c(a[3],b[0],c1,c2,c3);
52174664626SKris Kennaway 	r[3]=c1;
52274664626SKris Kennaway 	c1=0;
52374664626SKris Kennaway 	mul_add_c(a[4],b[0],c2,c3,c1);
52474664626SKris Kennaway 	mul_add_c(a[3],b[1],c2,c3,c1);
52574664626SKris Kennaway 	mul_add_c(a[2],b[2],c2,c3,c1);
52674664626SKris Kennaway 	mul_add_c(a[1],b[3],c2,c3,c1);
52774664626SKris Kennaway 	mul_add_c(a[0],b[4],c2,c3,c1);
52874664626SKris Kennaway 	r[4]=c2;
52974664626SKris Kennaway 	c2=0;
53074664626SKris Kennaway 	mul_add_c(a[0],b[5],c3,c1,c2);
53174664626SKris Kennaway 	mul_add_c(a[1],b[4],c3,c1,c2);
53274664626SKris Kennaway 	mul_add_c(a[2],b[3],c3,c1,c2);
53374664626SKris Kennaway 	mul_add_c(a[3],b[2],c3,c1,c2);
53474664626SKris Kennaway 	mul_add_c(a[4],b[1],c3,c1,c2);
53574664626SKris Kennaway 	mul_add_c(a[5],b[0],c3,c1,c2);
53674664626SKris Kennaway 	r[5]=c3;
53774664626SKris Kennaway 	c3=0;
53874664626SKris Kennaway 	mul_add_c(a[6],b[0],c1,c2,c3);
53974664626SKris Kennaway 	mul_add_c(a[5],b[1],c1,c2,c3);
54074664626SKris Kennaway 	mul_add_c(a[4],b[2],c1,c2,c3);
54174664626SKris Kennaway 	mul_add_c(a[3],b[3],c1,c2,c3);
54274664626SKris Kennaway 	mul_add_c(a[2],b[4],c1,c2,c3);
54374664626SKris Kennaway 	mul_add_c(a[1],b[5],c1,c2,c3);
54474664626SKris Kennaway 	mul_add_c(a[0],b[6],c1,c2,c3);
54574664626SKris Kennaway 	r[6]=c1;
54674664626SKris Kennaway 	c1=0;
54774664626SKris Kennaway 	mul_add_c(a[0],b[7],c2,c3,c1);
54874664626SKris Kennaway 	mul_add_c(a[1],b[6],c2,c3,c1);
54974664626SKris Kennaway 	mul_add_c(a[2],b[5],c2,c3,c1);
55074664626SKris Kennaway 	mul_add_c(a[3],b[4],c2,c3,c1);
55174664626SKris Kennaway 	mul_add_c(a[4],b[3],c2,c3,c1);
55274664626SKris Kennaway 	mul_add_c(a[5],b[2],c2,c3,c1);
55374664626SKris Kennaway 	mul_add_c(a[6],b[1],c2,c3,c1);
55474664626SKris Kennaway 	mul_add_c(a[7],b[0],c2,c3,c1);
55574664626SKris Kennaway 	r[7]=c2;
55674664626SKris Kennaway 	c2=0;
55774664626SKris Kennaway 	mul_add_c(a[7],b[1],c3,c1,c2);
55874664626SKris Kennaway 	mul_add_c(a[6],b[2],c3,c1,c2);
55974664626SKris Kennaway 	mul_add_c(a[5],b[3],c3,c1,c2);
56074664626SKris Kennaway 	mul_add_c(a[4],b[4],c3,c1,c2);
56174664626SKris Kennaway 	mul_add_c(a[3],b[5],c3,c1,c2);
56274664626SKris Kennaway 	mul_add_c(a[2],b[6],c3,c1,c2);
56374664626SKris Kennaway 	mul_add_c(a[1],b[7],c3,c1,c2);
56474664626SKris Kennaway 	r[8]=c3;
56574664626SKris Kennaway 	c3=0;
56674664626SKris Kennaway 	mul_add_c(a[2],b[7],c1,c2,c3);
56774664626SKris Kennaway 	mul_add_c(a[3],b[6],c1,c2,c3);
56874664626SKris Kennaway 	mul_add_c(a[4],b[5],c1,c2,c3);
56974664626SKris Kennaway 	mul_add_c(a[5],b[4],c1,c2,c3);
57074664626SKris Kennaway 	mul_add_c(a[6],b[3],c1,c2,c3);
57174664626SKris Kennaway 	mul_add_c(a[7],b[2],c1,c2,c3);
57274664626SKris Kennaway 	r[9]=c1;
57374664626SKris Kennaway 	c1=0;
57474664626SKris Kennaway 	mul_add_c(a[7],b[3],c2,c3,c1);
57574664626SKris Kennaway 	mul_add_c(a[6],b[4],c2,c3,c1);
57674664626SKris Kennaway 	mul_add_c(a[5],b[5],c2,c3,c1);
57774664626SKris Kennaway 	mul_add_c(a[4],b[6],c2,c3,c1);
57874664626SKris Kennaway 	mul_add_c(a[3],b[7],c2,c3,c1);
57974664626SKris Kennaway 	r[10]=c2;
58074664626SKris Kennaway 	c2=0;
58174664626SKris Kennaway 	mul_add_c(a[4],b[7],c3,c1,c2);
58274664626SKris Kennaway 	mul_add_c(a[5],b[6],c3,c1,c2);
58374664626SKris Kennaway 	mul_add_c(a[6],b[5],c3,c1,c2);
58474664626SKris Kennaway 	mul_add_c(a[7],b[4],c3,c1,c2);
58574664626SKris Kennaway 	r[11]=c3;
58674664626SKris Kennaway 	c3=0;
58774664626SKris Kennaway 	mul_add_c(a[7],b[5],c1,c2,c3);
58874664626SKris Kennaway 	mul_add_c(a[6],b[6],c1,c2,c3);
58974664626SKris Kennaway 	mul_add_c(a[5],b[7],c1,c2,c3);
59074664626SKris Kennaway 	r[12]=c1;
59174664626SKris Kennaway 	c1=0;
59274664626SKris Kennaway 	mul_add_c(a[6],b[7],c2,c3,c1);
59374664626SKris Kennaway 	mul_add_c(a[7],b[6],c2,c3,c1);
59474664626SKris Kennaway 	r[13]=c2;
59574664626SKris Kennaway 	c2=0;
59674664626SKris Kennaway 	mul_add_c(a[7],b[7],c3,c1,c2);
59774664626SKris Kennaway 	r[14]=c3;
59874664626SKris Kennaway 	r[15]=c1;
59974664626SKris Kennaway 	}
60074664626SKris Kennaway 
60174664626SKris Kennaway void bn_mul_comba4(BN_ULONG *r, BN_ULONG *a, BN_ULONG *b)
60274664626SKris Kennaway 	{
60374664626SKris Kennaway #ifdef BN_LLONG
60474664626SKris Kennaway 	BN_ULLONG t;
60574664626SKris Kennaway #else
60674664626SKris Kennaway 	BN_ULONG bl,bh;
60774664626SKris Kennaway #endif
60874664626SKris Kennaway 	BN_ULONG t1,t2;
60974664626SKris Kennaway 	BN_ULONG c1,c2,c3;
61074664626SKris Kennaway 
61174664626SKris Kennaway 	c1=0;
61274664626SKris Kennaway 	c2=0;
61374664626SKris Kennaway 	c3=0;
61474664626SKris Kennaway 	mul_add_c(a[0],b[0],c1,c2,c3);
61574664626SKris Kennaway 	r[0]=c1;
61674664626SKris Kennaway 	c1=0;
61774664626SKris Kennaway 	mul_add_c(a[0],b[1],c2,c3,c1);
61874664626SKris Kennaway 	mul_add_c(a[1],b[0],c2,c3,c1);
61974664626SKris Kennaway 	r[1]=c2;
62074664626SKris Kennaway 	c2=0;
62174664626SKris Kennaway 	mul_add_c(a[2],b[0],c3,c1,c2);
62274664626SKris Kennaway 	mul_add_c(a[1],b[1],c3,c1,c2);
62374664626SKris Kennaway 	mul_add_c(a[0],b[2],c3,c1,c2);
62474664626SKris Kennaway 	r[2]=c3;
62574664626SKris Kennaway 	c3=0;
62674664626SKris Kennaway 	mul_add_c(a[0],b[3],c1,c2,c3);
62774664626SKris Kennaway 	mul_add_c(a[1],b[2],c1,c2,c3);
62874664626SKris Kennaway 	mul_add_c(a[2],b[1],c1,c2,c3);
62974664626SKris Kennaway 	mul_add_c(a[3],b[0],c1,c2,c3);
63074664626SKris Kennaway 	r[3]=c1;
63174664626SKris Kennaway 	c1=0;
63274664626SKris Kennaway 	mul_add_c(a[3],b[1],c2,c3,c1);
63374664626SKris Kennaway 	mul_add_c(a[2],b[2],c2,c3,c1);
63474664626SKris Kennaway 	mul_add_c(a[1],b[3],c2,c3,c1);
63574664626SKris Kennaway 	r[4]=c2;
63674664626SKris Kennaway 	c2=0;
63774664626SKris Kennaway 	mul_add_c(a[2],b[3],c3,c1,c2);
63874664626SKris Kennaway 	mul_add_c(a[3],b[2],c3,c1,c2);
63974664626SKris Kennaway 	r[5]=c3;
64074664626SKris Kennaway 	c3=0;
64174664626SKris Kennaway 	mul_add_c(a[3],b[3],c1,c2,c3);
64274664626SKris Kennaway 	r[6]=c1;
64374664626SKris Kennaway 	r[7]=c2;
64474664626SKris Kennaway 	}
64574664626SKris Kennaway 
64674664626SKris Kennaway void bn_sqr_comba8(BN_ULONG *r, BN_ULONG *a)
64774664626SKris Kennaway 	{
64874664626SKris Kennaway #ifdef BN_LLONG
64974664626SKris Kennaway 	BN_ULLONG t,tt;
65074664626SKris Kennaway #else
65174664626SKris Kennaway 	BN_ULONG bl,bh;
65274664626SKris Kennaway #endif
65374664626SKris Kennaway 	BN_ULONG t1,t2;
65474664626SKris Kennaway 	BN_ULONG c1,c2,c3;
65574664626SKris Kennaway 
65674664626SKris Kennaway 	c1=0;
65774664626SKris Kennaway 	c2=0;
65874664626SKris Kennaway 	c3=0;
65974664626SKris Kennaway 	sqr_add_c(a,0,c1,c2,c3);
66074664626SKris Kennaway 	r[0]=c1;
66174664626SKris Kennaway 	c1=0;
66274664626SKris Kennaway 	sqr_add_c2(a,1,0,c2,c3,c1);
66374664626SKris Kennaway 	r[1]=c2;
66474664626SKris Kennaway 	c2=0;
66574664626SKris Kennaway 	sqr_add_c(a,1,c3,c1,c2);
66674664626SKris Kennaway 	sqr_add_c2(a,2,0,c3,c1,c2);
66774664626SKris Kennaway 	r[2]=c3;
66874664626SKris Kennaway 	c3=0;
66974664626SKris Kennaway 	sqr_add_c2(a,3,0,c1,c2,c3);
67074664626SKris Kennaway 	sqr_add_c2(a,2,1,c1,c2,c3);
67174664626SKris Kennaway 	r[3]=c1;
67274664626SKris Kennaway 	c1=0;
67374664626SKris Kennaway 	sqr_add_c(a,2,c2,c3,c1);
67474664626SKris Kennaway 	sqr_add_c2(a,3,1,c2,c3,c1);
67574664626SKris Kennaway 	sqr_add_c2(a,4,0,c2,c3,c1);
67674664626SKris Kennaway 	r[4]=c2;
67774664626SKris Kennaway 	c2=0;
67874664626SKris Kennaway 	sqr_add_c2(a,5,0,c3,c1,c2);
67974664626SKris Kennaway 	sqr_add_c2(a,4,1,c3,c1,c2);
68074664626SKris Kennaway 	sqr_add_c2(a,3,2,c3,c1,c2);
68174664626SKris Kennaway 	r[5]=c3;
68274664626SKris Kennaway 	c3=0;
68374664626SKris Kennaway 	sqr_add_c(a,3,c1,c2,c3);
68474664626SKris Kennaway 	sqr_add_c2(a,4,2,c1,c2,c3);
68574664626SKris Kennaway 	sqr_add_c2(a,5,1,c1,c2,c3);
68674664626SKris Kennaway 	sqr_add_c2(a,6,0,c1,c2,c3);
68774664626SKris Kennaway 	r[6]=c1;
68874664626SKris Kennaway 	c1=0;
68974664626SKris Kennaway 	sqr_add_c2(a,7,0,c2,c3,c1);
69074664626SKris Kennaway 	sqr_add_c2(a,6,1,c2,c3,c1);
69174664626SKris Kennaway 	sqr_add_c2(a,5,2,c2,c3,c1);
69274664626SKris Kennaway 	sqr_add_c2(a,4,3,c2,c3,c1);
69374664626SKris Kennaway 	r[7]=c2;
69474664626SKris Kennaway 	c2=0;
69574664626SKris Kennaway 	sqr_add_c(a,4,c3,c1,c2);
69674664626SKris Kennaway 	sqr_add_c2(a,5,3,c3,c1,c2);
69774664626SKris Kennaway 	sqr_add_c2(a,6,2,c3,c1,c2);
69874664626SKris Kennaway 	sqr_add_c2(a,7,1,c3,c1,c2);
69974664626SKris Kennaway 	r[8]=c3;
70074664626SKris Kennaway 	c3=0;
70174664626SKris Kennaway 	sqr_add_c2(a,7,2,c1,c2,c3);
70274664626SKris Kennaway 	sqr_add_c2(a,6,3,c1,c2,c3);
70374664626SKris Kennaway 	sqr_add_c2(a,5,4,c1,c2,c3);
70474664626SKris Kennaway 	r[9]=c1;
70574664626SKris Kennaway 	c1=0;
70674664626SKris Kennaway 	sqr_add_c(a,5,c2,c3,c1);
70774664626SKris Kennaway 	sqr_add_c2(a,6,4,c2,c3,c1);
70874664626SKris Kennaway 	sqr_add_c2(a,7,3,c2,c3,c1);
70974664626SKris Kennaway 	r[10]=c2;
71074664626SKris Kennaway 	c2=0;
71174664626SKris Kennaway 	sqr_add_c2(a,7,4,c3,c1,c2);
71274664626SKris Kennaway 	sqr_add_c2(a,6,5,c3,c1,c2);
71374664626SKris Kennaway 	r[11]=c3;
71474664626SKris Kennaway 	c3=0;
71574664626SKris Kennaway 	sqr_add_c(a,6,c1,c2,c3);
71674664626SKris Kennaway 	sqr_add_c2(a,7,5,c1,c2,c3);
71774664626SKris Kennaway 	r[12]=c1;
71874664626SKris Kennaway 	c1=0;
71974664626SKris Kennaway 	sqr_add_c2(a,7,6,c2,c3,c1);
72074664626SKris Kennaway 	r[13]=c2;
72174664626SKris Kennaway 	c2=0;
72274664626SKris Kennaway 	sqr_add_c(a,7,c3,c1,c2);
72374664626SKris Kennaway 	r[14]=c3;
72474664626SKris Kennaway 	r[15]=c1;
72574664626SKris Kennaway 	}
72674664626SKris Kennaway 
72774664626SKris Kennaway void bn_sqr_comba4(BN_ULONG *r, BN_ULONG *a)
72874664626SKris Kennaway 	{
72974664626SKris Kennaway #ifdef BN_LLONG
73074664626SKris Kennaway 	BN_ULLONG t,tt;
73174664626SKris Kennaway #else
73274664626SKris Kennaway 	BN_ULONG bl,bh;
73374664626SKris Kennaway #endif
73474664626SKris Kennaway 	BN_ULONG t1,t2;
73574664626SKris Kennaway 	BN_ULONG c1,c2,c3;
73674664626SKris Kennaway 
73774664626SKris Kennaway 	c1=0;
73874664626SKris Kennaway 	c2=0;
73974664626SKris Kennaway 	c3=0;
74074664626SKris Kennaway 	sqr_add_c(a,0,c1,c2,c3);
74174664626SKris Kennaway 	r[0]=c1;
74274664626SKris Kennaway 	c1=0;
74374664626SKris Kennaway 	sqr_add_c2(a,1,0,c2,c3,c1);
74474664626SKris Kennaway 	r[1]=c2;
74574664626SKris Kennaway 	c2=0;
74674664626SKris Kennaway 	sqr_add_c(a,1,c3,c1,c2);
74774664626SKris Kennaway 	sqr_add_c2(a,2,0,c3,c1,c2);
74874664626SKris Kennaway 	r[2]=c3;
74974664626SKris Kennaway 	c3=0;
75074664626SKris Kennaway 	sqr_add_c2(a,3,0,c1,c2,c3);
75174664626SKris Kennaway 	sqr_add_c2(a,2,1,c1,c2,c3);
75274664626SKris Kennaway 	r[3]=c1;
75374664626SKris Kennaway 	c1=0;
75474664626SKris Kennaway 	sqr_add_c(a,2,c2,c3,c1);
75574664626SKris Kennaway 	sqr_add_c2(a,3,1,c2,c3,c1);
75674664626SKris Kennaway 	r[4]=c2;
75774664626SKris Kennaway 	c2=0;
75874664626SKris Kennaway 	sqr_add_c2(a,3,2,c3,c1,c2);
75974664626SKris Kennaway 	r[5]=c3;
76074664626SKris Kennaway 	c3=0;
76174664626SKris Kennaway 	sqr_add_c(a,3,c1,c2,c3);
76274664626SKris Kennaway 	r[6]=c1;
76374664626SKris Kennaway 	r[7]=c2;
76474664626SKris Kennaway 	}
76574664626SKris Kennaway #else
76674664626SKris Kennaway 
76774664626SKris Kennaway /* hmm... is it faster just to do a multiply? */
76874664626SKris Kennaway #undef bn_sqr_comba4
76974664626SKris Kennaway void bn_sqr_comba4(BN_ULONG *r, BN_ULONG *a)
77074664626SKris Kennaway 	{
77174664626SKris Kennaway 	BN_ULONG t[8];
77274664626SKris Kennaway 	bn_sqr_normal(r,a,4,t);
77374664626SKris Kennaway 	}
77474664626SKris Kennaway 
77574664626SKris Kennaway #undef bn_sqr_comba8
77674664626SKris Kennaway void bn_sqr_comba8(BN_ULONG *r, BN_ULONG *a)
77774664626SKris Kennaway 	{
77874664626SKris Kennaway 	BN_ULONG t[16];
77974664626SKris Kennaway 	bn_sqr_normal(r,a,8,t);
78074664626SKris Kennaway 	}
78174664626SKris Kennaway 
78274664626SKris Kennaway void bn_mul_comba4(BN_ULONG *r, BN_ULONG *a, BN_ULONG *b)
78374664626SKris Kennaway 	{
78474664626SKris Kennaway 	r[4]=bn_mul_words(    &(r[0]),a,4,b[0]);
78574664626SKris Kennaway 	r[5]=bn_mul_add_words(&(r[1]),a,4,b[1]);
78674664626SKris Kennaway 	r[6]=bn_mul_add_words(&(r[2]),a,4,b[2]);
78774664626SKris Kennaway 	r[7]=bn_mul_add_words(&(r[3]),a,4,b[3]);
78874664626SKris Kennaway 	}
78974664626SKris Kennaway 
79074664626SKris Kennaway void bn_mul_comba8(BN_ULONG *r, BN_ULONG *a, BN_ULONG *b)
79174664626SKris Kennaway 	{
79274664626SKris Kennaway 	r[ 8]=bn_mul_words(    &(r[0]),a,8,b[0]);
79374664626SKris Kennaway 	r[ 9]=bn_mul_add_words(&(r[1]),a,8,b[1]);
79474664626SKris Kennaway 	r[10]=bn_mul_add_words(&(r[2]),a,8,b[2]);
79574664626SKris Kennaway 	r[11]=bn_mul_add_words(&(r[3]),a,8,b[3]);
79674664626SKris Kennaway 	r[12]=bn_mul_add_words(&(r[4]),a,8,b[4]);
79774664626SKris Kennaway 	r[13]=bn_mul_add_words(&(r[5]),a,8,b[5]);
79874664626SKris Kennaway 	r[14]=bn_mul_add_words(&(r[6]),a,8,b[6]);
79974664626SKris Kennaway 	r[15]=bn_mul_add_words(&(r[7]),a,8,b[7]);
80074664626SKris Kennaway 	}
80174664626SKris Kennaway 
80274664626SKris Kennaway #endif /* BN_COMBA */
803