src/rsa/rsa_i31_keygen_inner.c

0957b409SSimon J. Gerraty/*
0957b409SSimon J. Gerraty * Copyright (c) 2018 Thomas Pornin <pornin@bolet.org>
0957b409SSimon J. Gerraty *
0957b409SSimon J. Gerraty * Permission is hereby granted, free of charge, to any person obtaining
0957b409SSimon J. Gerraty * a copy of this software and associated documentation files (the
0957b409SSimon J. Gerraty * "Software"), to deal in the Software without restriction, including
0957b409SSimon J. Gerraty * without limitation the rights to use, copy, modify, merge, publish,
0957b409SSimon J. Gerraty * distribute, sublicense, and/or sell copies of the Software, and to
0957b409SSimon J. Gerraty * permit persons to whom the Software is furnished to do so, subject to
0957b409SSimon J. Gerraty * the following conditions:
0957b409SSimon J. Gerraty *
0957b409SSimon J. Gerraty * The above copyright notice and this permission notice shall be
0957b409SSimon J. Gerraty * included in all copies or substantial portions of the Software.
0957b409SSimon J. Gerraty *
0957b409SSimon J. Gerraty * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
0957b409SSimon J. Gerraty * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
0957b409SSimon J. Gerraty * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
0957b409SSimon J. Gerraty * NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS
0957b409SSimon J. Gerraty * BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
0957b409SSimon J. Gerraty * ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN
0957b409SSimon J. Gerraty * CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
0957b409SSimon J. Gerraty * SOFTWARE.
0957b409SSimon J. Gerraty */
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty#include "inner.h"
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty/*
0957b409SSimon J. Gerraty * Make a random integer of the provided size. The size is encoded.
0957b409SSimon J. Gerraty * The header word is untouched.
0957b409SSimon J. Gerraty */
0957b409SSimon J. Gerratystatic void
0957b409SSimon J. Gerratymkrand(const br_prng_class **rng, uint32_t *x, uint32_t esize)
0957b409SSimon J. Gerraty{
0957b409SSimon J. Gerraty	size_t u, len;
0957b409SSimon J. Gerraty	unsigned m;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	len = (esize + 31) >> 5;
0957b409SSimon J. Gerraty	(*rng)->generate(rng, x + 1, len * sizeof(uint32_t));
0957b409SSimon J. Gerraty	for (u = 1; u < len; u ++) {
0957b409SSimon J. Gerraty		x[u] &= 0x7FFFFFFF;
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty	m = esize & 31;
0957b409SSimon J. Gerraty	if (m == 0) {
0957b409SSimon J. Gerraty		x[len] &= 0x7FFFFFFF;
0957b409SSimon J. Gerraty	} else {
0957b409SSimon J. Gerraty		x[len] &= 0x7FFFFFFF >> (31 - m);
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty/*
0957b409SSimon J. Gerraty * This is the big-endian unsigned representation of the product of
0957b409SSimon J. Gerraty * all small primes from 13 to 1481.
0957b409SSimon J. Gerraty */
0957b409SSimon J. Gerratystatic const unsigned char SMALL_PRIMES[] = {
0957b409SSimon J. Gerraty	0x2E, 0xAB, 0x92, 0xD1, 0x8B, 0x12, 0x47, 0x31, 0x54, 0x0A,
0957b409SSimon J. Gerraty	0x99, 0x5D, 0x25, 0x5E, 0xE2, 0x14, 0x96, 0x29, 0x1E, 0xB7,
0957b409SSimon J. Gerraty	0x78, 0x70, 0xCC, 0x1F, 0xA5, 0xAB, 0x8D, 0x72, 0x11, 0x37,
0957b409SSimon J. Gerraty	0xFB, 0xD8, 0x1E, 0x3F, 0x5B, 0x34, 0x30, 0x17, 0x8B, 0xE5,
0957b409SSimon J. Gerraty	0x26, 0x28, 0x23, 0xA1, 0x8A, 0xA4, 0x29, 0xEA, 0xFD, 0x9E,
0957b409SSimon J. Gerraty	0x39, 0x60, 0x8A, 0xF3, 0xB5, 0xA6, 0xEB, 0x3F, 0x02, 0xB6,
0957b409SSimon J. Gerraty	0x16, 0xC3, 0x96, 0x9D, 0x38, 0xB0, 0x7D, 0x82, 0x87, 0x0C,
0957b409SSimon J. Gerraty	0xF7, 0xBE, 0x24, 0xE5, 0x5F, 0x41, 0x04, 0x79, 0x76, 0x40,
0957b409SSimon J. Gerraty	0xE7, 0x00, 0x22, 0x7E, 0xB5, 0x85, 0x7F, 0x8D, 0x01, 0x50,
0957b409SSimon J. Gerraty	0xE9, 0xD3, 0x29, 0x42, 0x08, 0xB3, 0x51, 0x40, 0x7B, 0xD7,
0957b409SSimon J. Gerraty	0x8D, 0xCC, 0x10, 0x01, 0x64, 0x59, 0x28, 0xB6, 0x53, 0xF3,
0957b409SSimon J. Gerraty	0x50, 0x4E, 0xB1, 0xF2, 0x58, 0xCD, 0x6E, 0xF5, 0x56, 0x3E,
0957b409SSimon J. Gerraty	0x66, 0x2F, 0xD7, 0x07, 0x7F, 0x52, 0x4C, 0x13, 0x24, 0xDC,
0957b409SSimon J. Gerraty	0x8E, 0x8D, 0xCC, 0xED, 0x77, 0xC4, 0x21, 0xD2, 0xFD, 0x08,
0957b409SSimon J. Gerraty	0xEA, 0xD7, 0xC0, 0x5C, 0x13, 0x82, 0x81, 0x31, 0x2F, 0x2B,
0957b409SSimon J. Gerraty	0x08, 0xE4, 0x80, 0x04, 0x7A, 0x0C, 0x8A, 0x3C, 0xDC, 0x22,
0957b409SSimon J. Gerraty	0xE4, 0x5A, 0x7A, 0xB0, 0x12, 0x5E, 0x4A, 0x76, 0x94, 0x77,
0957b409SSimon J. Gerraty	0xC2, 0x0E, 0x92, 0xBA, 0x8A, 0xA0, 0x1F, 0x14, 0x51, 0x1E,
0957b409SSimon J. Gerraty	0x66, 0x6C, 0x38, 0x03, 0x6C, 0xC7, 0x4A, 0x4B, 0x70, 0x80,
0957b409SSimon J. Gerraty	0xAF, 0xCA, 0x84, 0x51, 0xD8, 0xD2, 0x26, 0x49, 0xF5, 0xA8,
0957b409SSimon J. Gerraty	0x5E, 0x35, 0x4B, 0xAC, 0xCE, 0x29, 0x92, 0x33, 0xB7, 0xA2,
0957b409SSimon J. Gerraty	0x69, 0x7D, 0x0C, 0xE0, 0x9C, 0xDB, 0x04, 0xD6, 0xB4, 0xBC,
0957b409SSimon J. Gerraty	0x39, 0xD7, 0x7F, 0x9E, 0x9D, 0x78, 0x38, 0x7F, 0x51, 0x54,
0957b409SSimon J. Gerraty	0x50, 0x8B, 0x9E, 0x9C, 0x03, 0x6C, 0xF5, 0x9D, 0x2C, 0x74,
0957b409SSimon J. Gerraty	0x57, 0xF0, 0x27, 0x2A, 0xC3, 0x47, 0xCA, 0xB9, 0xD7, 0x5C,
0957b409SSimon J. Gerraty	0xFF, 0xC2, 0xAC, 0x65, 0x4E, 0xBD
0957b409SSimon J. Gerraty};
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty/*
0957b409SSimon J. Gerraty * We need temporary values for at least 7 integers of the same size
0957b409SSimon J. Gerraty * as a factor (including header word); more space helps with performance
0957b409SSimon J. Gerraty * (in modular exponentiations), but we much prefer to remain under
0957b409SSimon J. Gerraty * 2 kilobytes in total, to save stack space. The macro TEMPS below
0957b409SSimon J. Gerraty * exceeds 512 (which is a count in 32-bit words) when BR_MAX_RSA_SIZE
0957b409SSimon J. Gerraty * is greater than 4464 (default value is 4096, so the 2-kB limit is
0957b409SSimon J. Gerraty * maintained unless BR_MAX_RSA_SIZE was modified).
0957b409SSimon J. Gerraty */
0957b409SSimon J. Gerraty#define MAX(x, y)   ((x) > (y) ? (x) : (y))
0957b409SSimon J. Gerraty#define ROUND2(x)   ((((x) + 1) >> 1) << 1)
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty#define TEMPS   MAX(512, ROUND2(7 * ((((BR_MAX_RSA_SIZE + 1) >> 1) + 61) / 31)))
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty/*
0957b409SSimon J. Gerraty * Perform trial division on a candidate prime. This computes
0957b409SSimon J. Gerraty * y = SMALL_PRIMES mod x, then tries to compute y/y mod x. The
0957b409SSimon J. Gerraty * br_i31_moddiv() function will report an error if y is not invertible
0957b409SSimon J. Gerraty * modulo x. Returned value is 1 on success (none of the small primes
0957b409SSimon J. Gerraty * divides x), 0 on error (a non-trivial GCD is obtained).
0957b409SSimon J. Gerraty *
0957b409SSimon J. Gerraty * This function assumes that x is odd.
0957b409SSimon J. Gerraty */
0957b409SSimon J. Gerratystatic uint32_t
0957b409SSimon J. Gerratytrial_divisions(const uint32_t *x, uint32_t *t)
0957b409SSimon J. Gerraty{
0957b409SSimon J. Gerraty	uint32_t *y;
0957b409SSimon J. Gerraty	uint32_t x0i;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	y = t;
0957b409SSimon J. Gerraty	t += 1 + ((x[0] + 31) >> 5);
0957b409SSimon J. Gerraty	x0i = br_i31_ninv31(x[1]);
0957b409SSimon J. Gerraty	br_i31_decode_reduce(y, SMALL_PRIMES, sizeof SMALL_PRIMES, x);
0957b409SSimon J. Gerraty	return br_i31_moddiv(y, y, x, x0i, t);
0957b409SSimon J. Gerraty}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty/*
0957b409SSimon J. Gerraty * Perform n rounds of Miller-Rabin on the candidate prime x. This
0957b409SSimon J. Gerraty * function assumes that x = 3 mod 4.
0957b409SSimon J. Gerraty *
0957b409SSimon J. Gerraty * Returned value is 1 on success (all rounds completed successfully),
0957b409SSimon J. Gerraty * 0 otherwise.
0957b409SSimon J. Gerraty */
0957b409SSimon J. Gerratystatic uint32_t
0957b409SSimon J. Gerratymiller_rabin(const br_prng_class **rng, const uint32_t *x, int n,
0957b409SSimon J. Gerraty	uint32_t *t, size_t tlen, br_i31_modpow_opt_type mp31)
0957b409SSimon J. Gerraty{
0957b409SSimon J. Gerraty	/*
0957b409SSimon J. Gerraty	 * Since x = 3 mod 4, the Miller-Rabin test is simple:
0957b409SSimon J. Gerraty	 *  - get a random base a (such that 1 < a < x-1)
0957b409SSimon J. Gerraty	 *  - compute z = a^((x-1)/2) mod x
0957b409SSimon J. Gerraty	 *  - if z != 1 and z != x-1, the number x is composite
0957b409SSimon J. Gerraty	 *
0957b409SSimon J. Gerraty	 * We generate bases 'a' randomly with a size which is
0957b409SSimon J. Gerraty	 * one bit less than x, which ensures that a < x-1. It
0957b409SSimon J. Gerraty	 * is not useful to verify that a > 1 because the probability
0957b409SSimon J. Gerraty	 * that we get a value a equal to 0 or 1 is much smaller
0957b409SSimon J. Gerraty	 * than the probability of our Miller-Rabin tests not to
0957b409SSimon J. Gerraty	 * detect a composite, which is already quite smaller than the
0957b409SSimon J. Gerraty	 * probability of the hardware misbehaving and return a
0957b409SSimon J. Gerraty	 * composite integer because of some glitch (e.g. bad RAM
0957b409SSimon J. Gerraty	 * or ill-timed cosmic ray).
0957b409SSimon J. Gerraty	 */
0957b409SSimon J. Gerraty	unsigned char *xm1d2;
0957b409SSimon J. Gerraty	size_t xlen, xm1d2_len, xm1d2_len_u32, u;
0957b409SSimon J. Gerraty	uint32_t asize;
0957b409SSimon J. Gerraty	unsigned cc;
0957b409SSimon J. Gerraty	uint32_t x0i;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	/*
0957b409SSimon J. Gerraty	 * Compute (x-1)/2 (encoded).
0957b409SSimon J. Gerraty	 */
0957b409SSimon J. Gerraty	xm1d2 = (unsigned char *)t;
0957b409SSimon J. Gerraty	xm1d2_len = ((x[0] - (x[0] >> 5)) + 7) >> 3;
0957b409SSimon J. Gerraty	br_i31_encode(xm1d2, xm1d2_len, x);
0957b409SSimon J. Gerraty	cc = 0;
0957b409SSimon J. Gerraty	for (u = 0; u < xm1d2_len; u ++) {
0957b409SSimon J. Gerraty		unsigned w;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		w = xm1d2[u];
0957b409SSimon J. Gerraty		xm1d2[u] = (unsigned char)((w >> 1) | cc);
0957b409SSimon J. Gerraty		cc = w << 7;
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	/*
0957b409SSimon J. Gerraty	 * We used some words of the provided buffer for (x-1)/2.
0957b409SSimon J. Gerraty	 */
0957b409SSimon J. Gerraty	xm1d2_len_u32 = (xm1d2_len + 3) >> 2;
0957b409SSimon J. Gerraty	t += xm1d2_len_u32;
0957b409SSimon J. Gerraty	tlen -= xm1d2_len_u32;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	xlen = (x[0] + 31) >> 5;
0957b409SSimon J. Gerraty	asize = x[0] - 1 - EQ0(x[0] & 31);
0957b409SSimon J. Gerraty	x0i = br_i31_ninv31(x[1]);
0957b409SSimon J. Gerraty	while (n -- > 0) {
0957b409SSimon J. Gerraty		uint32_t *a, *t2;
0957b409SSimon J. Gerraty		uint32_t eq1, eqm1;
0957b409SSimon J. Gerraty		size_t t2len;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		/*
0957b409SSimon J. Gerraty		 * Generate a random base. We don't need the base to be
0957b409SSimon J. Gerraty		 * really uniform modulo x, so we just get a random
0957b409SSimon J. Gerraty		 * number which is one bit shorter than x.
0957b409SSimon J. Gerraty		 */
0957b409SSimon J. Gerraty		a = t;
0957b409SSimon J. Gerraty		a[0] = x[0];
0957b409SSimon J. Gerraty		a[xlen] = 0;
0957b409SSimon J. Gerraty		mkrand(rng, a, asize);
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		/*
0957b409SSimon J. Gerraty		 * Compute a^((x-1)/2) mod x. We assume here that the
0957b409SSimon J. Gerraty		 * function will not fail (the temporary array is large
0957b409SSimon J. Gerraty		 * enough).
0957b409SSimon J. Gerraty		 */
0957b409SSimon J. Gerraty		t2 = t + 1 + xlen;
0957b409SSimon J. Gerraty		t2len = tlen - 1 - xlen;
0957b409SSimon J. Gerraty		if ((t2len & 1) != 0) {
0957b409SSimon J. Gerraty			/*
0957b409SSimon J. Gerraty			 * Since the source array is 64-bit aligned and
0957b409SSimon J. Gerraty			 * has an even number of elements (TEMPS), we
0957b409SSimon J. Gerraty			 * can use the parity of the remaining length to
0957b409SSimon J. Gerraty			 * detect and adjust alignment.
0957b409SSimon J. Gerraty			 */
0957b409SSimon J. Gerraty			t2 ++;
0957b409SSimon J. Gerraty			t2len --;
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty		mp31(a, xm1d2, xm1d2_len, x, x0i, t2, t2len);
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		/*
0957b409SSimon J. Gerraty		 * We must obtain either 1 or x-1. Note that x is odd,
0957b409SSimon J. Gerraty		 * hence x-1 differs from x only in its low word (no
0957b409SSimon J. Gerraty		 * carry).
0957b409SSimon J. Gerraty		 */
0957b409SSimon J. Gerraty		eq1 = a[1] ^ 1;
0957b409SSimon J. Gerraty		eqm1 = a[1] ^ (x[1] - 1);
0957b409SSimon J. Gerraty		for (u = 2; u <= xlen; u ++) {
0957b409SSimon J. Gerraty			eq1 |= a[u];
0957b409SSimon J. Gerraty			eqm1 |= a[u] ^ x[u];
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		if ((EQ0(eq1) | EQ0(eqm1)) == 0) {
0957b409SSimon J. Gerraty			return 0;
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty	return 1;
0957b409SSimon J. Gerraty}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty/*
0957b409SSimon J. Gerraty * Create a random prime of the provided size. 'size' is the _encoded_
0957b409SSimon J. Gerraty * bit length. The two top bits and the two bottom bits are set to 1.
0957b409SSimon J. Gerraty */
0957b409SSimon J. Gerratystatic void
0957b409SSimon J. Gerratymkprime(const br_prng_class **rng, uint32_t *x, uint32_t esize,
0957b409SSimon J. Gerraty	uint32_t pubexp, uint32_t *t, size_t tlen, br_i31_modpow_opt_type mp31)
0957b409SSimon J. Gerraty{
0957b409SSimon J. Gerraty	size_t len;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	x[0] = esize;
0957b409SSimon J. Gerraty	len = (esize + 31) >> 5;
0957b409SSimon J. Gerraty	for (;;) {
0957b409SSimon J. Gerraty		size_t u;
0957b409SSimon J. Gerraty		uint32_t m3, m5, m7, m11;
0957b409SSimon J. Gerraty		int rounds, s7, s11;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		/*
0957b409SSimon J. Gerraty		 * Generate random bits. We force the two top bits and the
0957b409SSimon J. Gerraty		 * two bottom bits to 1.
0957b409SSimon J. Gerraty		 */
0957b409SSimon J. Gerraty		mkrand(rng, x, esize);
0957b409SSimon J. Gerraty		if ((esize & 31) == 0) {
0957b409SSimon J. Gerraty			x[len] |= 0x60000000;
0957b409SSimon J. Gerraty		} else if ((esize & 31) == 1) {
0957b409SSimon J. Gerraty			x[len] |= 0x00000001;
0957b409SSimon J. Gerraty			x[len - 1] |= 0x40000000;
0957b409SSimon J. Gerraty		} else {
0957b409SSimon J. Gerraty			x[len] |= 0x00000003 << ((esize & 31) - 2);
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty		x[1] |= 0x00000003;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		/*
0957b409SSimon J. Gerraty		 * Trial division with low primes (3, 5, 7 and 11). We
0957b409SSimon J. Gerraty		 * use the following properties:
0957b409SSimon J. Gerraty		 *
0957b409SSimon J. Gerraty		 *   2^2 = 1 mod 3
0957b409SSimon J. Gerraty		 *   2^4 = 1 mod 5
0957b409SSimon J. Gerraty		 *   2^3 = 1 mod 7
0957b409SSimon J. Gerraty		 *   2^10 = 1 mod 11
0957b409SSimon J. Gerraty		 */
0957b409SSimon J. Gerraty		m3 = 0;
0957b409SSimon J. Gerraty		m5 = 0;
0957b409SSimon J. Gerraty		m7 = 0;
0957b409SSimon J. Gerraty		m11 = 0;
0957b409SSimon J. Gerraty		s7 = 0;
0957b409SSimon J. Gerraty		s11 = 0;
0957b409SSimon J. Gerraty		for (u = 0; u < len; u ++) {
0957b409SSimon J. Gerraty			uint32_t w, w3, w5, w7, w11;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty			w = x[1 + u];
0957b409SSimon J. Gerraty			w3 = (w & 0xFFFF) + (w >> 16);     /* max: 98302 */
0957b409SSimon J. Gerraty			w5 = (w & 0xFFFF) + (w >> 16);     /* max: 98302 */
0957b409SSimon J. Gerraty			w7 = (w & 0x7FFF) + (w >> 15);     /* max: 98302 */
0957b409SSimon J. Gerraty			w11 = (w & 0xFFFFF) + (w >> 20);   /* max: 1050622 */
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty			m3 += w3 << (u & 1);
0957b409SSimon J. Gerraty			m3 = (m3 & 0xFF) + (m3 >> 8);      /* max: 1025 */
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty			m5 += w5 << ((4 - u) & 3);
0957b409SSimon J. Gerraty			m5 = (m5 & 0xFFF) + (m5 >> 12);    /* max: 4479 */
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty			m7 += w7 << s7;
0957b409SSimon J. Gerraty			m7 = (m7 & 0x1FF) + (m7 >> 9);     /* max: 1280 */
0957b409SSimon J. Gerraty			if (++ s7 == 3) {
0957b409SSimon J. Gerraty				s7 = 0;
0957b409SSimon J. Gerraty			}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty			m11 += w11 << s11;
0957b409SSimon J. Gerraty			if (++ s11 == 10) {
0957b409SSimon J. Gerraty				s11 = 0;
0957b409SSimon J. Gerraty			}
0957b409SSimon J. Gerraty			m11 = (m11 & 0x3FF) + (m11 >> 10); /* max: 526847 */
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		m3 = (m3 & 0x3F) + (m3 >> 6);      /* max: 78 */
0957b409SSimon J. Gerraty		m3 = (m3 & 0x0F) + (m3 >> 4);      /* max: 18 */
0957b409SSimon J. Gerraty		m3 = ((m3 * 43) >> 5) & 3;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		m5 = (m5 & 0xFF) + (m5 >> 8);      /* max: 271 */
0957b409SSimon J. Gerraty		m5 = (m5 & 0x0F) + (m5 >> 4);      /* max: 31 */
0957b409SSimon J. Gerraty		m5 -= 20 & -GT(m5, 19);
0957b409SSimon J. Gerraty		m5 -= 10 & -GT(m5, 9);
0957b409SSimon J. Gerraty		m5 -= 5 & -GT(m5, 4);
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		m7 = (m7 & 0x3F) + (m7 >> 6);      /* max: 82 */
0957b409SSimon J. Gerraty		m7 = (m7 & 0x07) + (m7 >> 3);      /* max: 16 */
0957b409SSimon J. Gerraty		m7 = ((m7 * 147) >> 7) & 7;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		/*
0957b409SSimon J. Gerraty		 * 2^5 = 32 = -1 mod 11.
0957b409SSimon J. Gerraty		 */
0957b409SSimon J. Gerraty		m11 = (m11 & 0x3FF) + (m11 >> 10);      /* max: 1536 */
0957b409SSimon J. Gerraty		m11 = (m11 & 0x3FF) + (m11 >> 10);      /* max: 1023 */
0957b409SSimon J. Gerraty		m11 = (m11 & 0x1F) + 33 - (m11 >> 5);   /* max: 64 */
0957b409SSimon J. Gerraty		m11 -= 44 & -GT(m11, 43);
0957b409SSimon J. Gerraty		m11 -= 22 & -GT(m11, 21);
0957b409SSimon J. Gerraty		m11 -= 11 & -GT(m11, 10);
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		/*
0957b409SSimon J. Gerraty		 * If any of these modulo is 0, then the candidate is
0957b409SSimon J. Gerraty		 * not prime. Also, if pubexp is 3, 5, 7 or 11, and the
0957b409SSimon J. Gerraty		 * corresponding modulus is 1, then the candidate must
0957b409SSimon J. Gerraty		 * be rejected, because we need e to be invertible
0957b409SSimon J. Gerraty		 * modulo p-1. We can use simple comparisons here
0957b409SSimon J. Gerraty		 * because they won't leak information on a candidate
0957b409SSimon J. Gerraty		 * that we keep, only on one that we reject (and is thus
0957b409SSimon J. Gerraty		 * not secret).
0957b409SSimon J. Gerraty		 */
0957b409SSimon J. Gerraty		if (m3 == 0 || m5 == 0 || m7 == 0 || m11 == 0) {
0957b409SSimon J. Gerraty			continue;
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty		if ((pubexp == 3 && m3 == 1)
*cc9e6590SSimon J. Gerraty			|| (pubexp == 5 && m5 == 1)
*cc9e6590SSimon J. Gerraty			|| (pubexp == 7 && m7 == 1)
*cc9e6590SSimon J. Gerraty			|| (pubexp == 11 && m11 == 1))
0957b409SSimon J. Gerraty		{
0957b409SSimon J. Gerraty			continue;
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		/*
0957b409SSimon J. Gerraty		 * More trial divisions.
0957b409SSimon J. Gerraty		 */
0957b409SSimon J. Gerraty		if (!trial_divisions(x, t)) {
0957b409SSimon J. Gerraty			continue;
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		/*
0957b409SSimon J. Gerraty		 * Miller-Rabin algorithm. Since we selected a random
0957b409SSimon J. Gerraty		 * integer, not a maliciously crafted integer, we can use
0957b409SSimon J. Gerraty		 * relatively few rounds to lower the risk of a false
0957b409SSimon J. Gerraty		 * positive (i.e. declaring prime a non-prime) under
0957b409SSimon J. Gerraty		 * 2^(-80). It is not useful to lower the probability much
0957b409SSimon J. Gerraty		 * below that, since that would be substantially below
0957b409SSimon J. Gerraty		 * the probability of the hardware misbehaving. Sufficient
0957b409SSimon J. Gerraty		 * numbers of rounds are extracted from the Handbook of
0957b409SSimon J. Gerraty		 * Applied Cryptography, note 4.49 (page 149).
0957b409SSimon J. Gerraty		 *
0957b409SSimon J. Gerraty		 * Since we work on the encoded size (esize), we need to
0957b409SSimon J. Gerraty		 * compare with encoded thresholds.
0957b409SSimon J. Gerraty		 */
0957b409SSimon J. Gerraty		if (esize < 309) {
0957b409SSimon J. Gerraty			rounds = 12;
0957b409SSimon J. Gerraty		} else if (esize < 464) {
0957b409SSimon J. Gerraty			rounds = 9;
0957b409SSimon J. Gerraty		} else if (esize < 670) {
0957b409SSimon J. Gerraty			rounds = 6;
0957b409SSimon J. Gerraty		} else if (esize < 877) {
0957b409SSimon J. Gerraty			rounds = 4;
0957b409SSimon J. Gerraty		} else if (esize < 1341) {
0957b409SSimon J. Gerraty			rounds = 3;
0957b409SSimon J. Gerraty		} else {
0957b409SSimon J. Gerraty			rounds = 2;
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		if (miller_rabin(rng, x, rounds, t, tlen, mp31)) {
0957b409SSimon J. Gerraty			return;
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty/*
0957b409SSimon J. Gerraty * Let p be a prime (p > 2^33, p = 3 mod 4). Let m = (p-1)/2, provided
0957b409SSimon J. Gerraty * as parameter (with announced bit length equal to that of p). This
0957b409SSimon J. Gerraty * function computes d = 1/e mod p-1 (for an odd integer e). Returned
0957b409SSimon J. Gerraty * value is 1 on success, 0 on error (an error is reported if e is not
0957b409SSimon J. Gerraty * invertible modulo p-1).
0957b409SSimon J. Gerraty *
0957b409SSimon J. Gerraty * The temporary buffer (t) must have room for at least 4 integers of
0957b409SSimon J. Gerraty * the size of p.
0957b409SSimon J. Gerraty */
0957b409SSimon J. Gerratystatic uint32_t
0957b409SSimon J. Gerratyinvert_pubexp(uint32_t *d, const uint32_t *m, uint32_t e, uint32_t *t)
0957b409SSimon J. Gerraty{
0957b409SSimon J. Gerraty	uint32_t *f;
0957b409SSimon J. Gerraty	uint32_t r;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	f = t;
0957b409SSimon J. Gerraty	t += 1 + ((m[0] + 31) >> 5);
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	/*
0957b409SSimon J. Gerraty	 * Compute d = 1/e mod m. Since p = 3 mod 4, m is odd.
0957b409SSimon J. Gerraty	 */
0957b409SSimon J. Gerraty	br_i31_zero(d, m[0]);
0957b409SSimon J. Gerraty	d[1] = 1;
0957b409SSimon J. Gerraty	br_i31_zero(f, m[0]);
0957b409SSimon J. Gerraty	f[1] = e & 0x7FFFFFFF;
0957b409SSimon J. Gerraty	f[2] = e >> 31;
0957b409SSimon J. Gerraty	r = br_i31_moddiv(d, f, m, br_i31_ninv31(m[1]), t);
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	/*
0957b409SSimon J. Gerraty	 * We really want d = 1/e mod p-1, with p = 2m. By the CRT,
0957b409SSimon J. Gerraty	 * the result is either the d we got, or d + m.
0957b409SSimon J. Gerraty	 *
0957b409SSimon J. Gerraty	 * Let's write e*d = 1 + k*m, for some integer k. Integers e
0957b409SSimon J. Gerraty	 * and m are odd. If d is odd, then e*d is odd, which implies
0957b409SSimon J. Gerraty	 * that k must be even; in that case, e*d = 1 + (k/2)*2m, and
0957b409SSimon J. Gerraty	 * thus d is already fine. Conversely, if d is even, then k
0957b409SSimon J. Gerraty	 * is odd, and we must add m to d in order to get the correct
0957b409SSimon J. Gerraty	 * result.
0957b409SSimon J. Gerraty	 */
0957b409SSimon J. Gerraty	br_i31_add(d, m, (uint32_t)(1 - (d[1] & 1)));
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	return r;
0957b409SSimon J. Gerraty}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty/*
0957b409SSimon J. Gerraty * Swap two buffers in RAM. They must be disjoint.
0957b409SSimon J. Gerraty */
0957b409SSimon J. Gerratystatic void
0957b409SSimon J. Gerratybufswap(void *b1, void *b2, size_t len)
0957b409SSimon J. Gerraty{
0957b409SSimon J. Gerraty	size_t u;
0957b409SSimon J. Gerraty	unsigned char *buf1, *buf2;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	buf1 = b1;
0957b409SSimon J. Gerraty	buf2 = b2;
0957b409SSimon J. Gerraty	for (u = 0; u < len; u ++) {
0957b409SSimon J. Gerraty		unsigned w;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty		w = buf1[u];
0957b409SSimon J. Gerraty		buf1[u] = buf2[u];
0957b409SSimon J. Gerraty		buf2[u] = w;
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty/* see inner.h */
0957b409SSimon J. Gerratyuint32_t
0957b409SSimon J. Gerratybr_rsa_i31_keygen_inner(const br_prng_class **rng,
0957b409SSimon J. Gerraty	br_rsa_private_key *sk, void *kbuf_priv,
0957b409SSimon J. Gerraty	br_rsa_public_key *pk, void *kbuf_pub,
0957b409SSimon J. Gerraty	unsigned size, uint32_t pubexp, br_i31_modpow_opt_type mp31)
0957b409SSimon J. Gerraty{
0957b409SSimon J. Gerraty	uint32_t esize_p, esize_q;
0957b409SSimon J. Gerraty	size_t plen, qlen, tlen;
0957b409SSimon J. Gerraty	uint32_t *p, *q, *t;
0957b409SSimon J. Gerraty	union {
0957b409SSimon J. Gerraty		uint32_t t32[TEMPS];
0957b409SSimon J. Gerraty		uint64_t t64[TEMPS >> 1];  /* for 64-bit alignment */
0957b409SSimon J. Gerraty	} tmp;
0957b409SSimon J. Gerraty	uint32_t r;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	if (size < BR_MIN_RSA_SIZE || size > BR_MAX_RSA_SIZE) {
0957b409SSimon J. Gerraty		return 0;
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty	if (pubexp == 0) {
0957b409SSimon J. Gerraty		pubexp = 3;
0957b409SSimon J. Gerraty	} else if (pubexp == 1 || (pubexp & 1) == 0) {
0957b409SSimon J. Gerraty		return 0;
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	esize_p = (size + 1) >> 1;
0957b409SSimon J. Gerraty	esize_q = size - esize_p;
0957b409SSimon J. Gerraty	sk->n_bitlen = size;
0957b409SSimon J. Gerraty	sk->p = kbuf_priv;
0957b409SSimon J. Gerraty	sk->plen = (esize_p + 7) >> 3;
0957b409SSimon J. Gerraty	sk->q = sk->p + sk->plen;
0957b409SSimon J. Gerraty	sk->qlen = (esize_q + 7) >> 3;
0957b409SSimon J. Gerraty	sk->dp = sk->q + sk->qlen;
0957b409SSimon J. Gerraty	sk->dplen = sk->plen;
0957b409SSimon J. Gerraty	sk->dq = sk->dp + sk->dplen;
0957b409SSimon J. Gerraty	sk->dqlen = sk->qlen;
0957b409SSimon J. Gerraty	sk->iq = sk->dq + sk->dqlen;
0957b409SSimon J. Gerraty	sk->iqlen = sk->plen;
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	if (pk != NULL) {
0957b409SSimon J. Gerraty		pk->n = kbuf_pub;
0957b409SSimon J. Gerraty		pk->nlen = (size + 7) >> 3;
0957b409SSimon J. Gerraty		pk->e = pk->n + pk->nlen;
0957b409SSimon J. Gerraty		pk->elen = 4;
0957b409SSimon J. Gerraty		br_enc32be(pk->e, pubexp);
0957b409SSimon J. Gerraty		while (*pk->e == 0) {
0957b409SSimon J. Gerraty			pk->e ++;
0957b409SSimon J. Gerraty			pk->elen --;
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	/*
0957b409SSimon J. Gerraty	 * We now switch to encoded sizes.
0957b409SSimon J. Gerraty	 *
0957b409SSimon J. Gerraty	 * floor((x * 16913) / (2^19)) is equal to floor(x/31) for all
0957b409SSimon J. Gerraty	 * integers x from 0 to 34966; the intermediate product fits on
0957b409SSimon J. Gerraty	 * 30 bits, thus we can use MUL31().
0957b409SSimon J. Gerraty	 */
0957b409SSimon J. Gerraty	esize_p += MUL31(esize_p, 16913) >> 19;
0957b409SSimon J. Gerraty	esize_q += MUL31(esize_q, 16913) >> 19;
0957b409SSimon J. Gerraty	plen = (esize_p + 31) >> 5;
0957b409SSimon J. Gerraty	qlen = (esize_q + 31) >> 5;
0957b409SSimon J. Gerraty	p = tmp.t32;
0957b409SSimon J. Gerraty	q = p + 1 + plen;
0957b409SSimon J. Gerraty	t = q + 1 + qlen;
0957b409SSimon J. Gerraty	tlen = ((sizeof tmp.t32) / sizeof(uint32_t)) - (2 + plen + qlen);
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	/*
0957b409SSimon J. Gerraty	 * When looking for primes p and q, we temporarily divide
0957b409SSimon J. Gerraty	 * candidates by 2, in order to compute the inverse of the
0957b409SSimon J. Gerraty	 * public exponent.
0957b409SSimon J. Gerraty	 */
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	for (;;) {
0957b409SSimon J. Gerraty		mkprime(rng, p, esize_p, pubexp, t, tlen, mp31);
0957b409SSimon J. Gerraty		br_i31_rshift(p, 1);
0957b409SSimon J. Gerraty		if (invert_pubexp(t, p, pubexp, t + 1 + plen)) {
0957b409SSimon J. Gerraty			br_i31_add(p, p, 1);
0957b409SSimon J. Gerraty			p[1] |= 1;
0957b409SSimon J. Gerraty			br_i31_encode(sk->p, sk->plen, p);
0957b409SSimon J. Gerraty			br_i31_encode(sk->dp, sk->dplen, t);
0957b409SSimon J. Gerraty			break;
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	for (;;) {
0957b409SSimon J. Gerraty		mkprime(rng, q, esize_q, pubexp, t, tlen, mp31);
0957b409SSimon J. Gerraty		br_i31_rshift(q, 1);
0957b409SSimon J. Gerraty		if (invert_pubexp(t, q, pubexp, t + 1 + qlen)) {
0957b409SSimon J. Gerraty			br_i31_add(q, q, 1);
0957b409SSimon J. Gerraty			q[1] |= 1;
0957b409SSimon J. Gerraty			br_i31_encode(sk->q, sk->qlen, q);
0957b409SSimon J. Gerraty			br_i31_encode(sk->dq, sk->dqlen, t);
0957b409SSimon J. Gerraty			break;
0957b409SSimon J. Gerraty		}
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	/*
0957b409SSimon J. Gerraty	 * If p and q have the same size, then it is possible that q > p
0957b409SSimon J. Gerraty	 * (when the target modulus size is odd, we generate p with a
0957b409SSimon J. Gerraty	 * greater bit length than q). If q > p, we want to swap p and q
0957b409SSimon J. Gerraty	 * (and also dp and dq) for two reasons:
0957b409SSimon J. Gerraty	 *  - The final step below (inversion of q modulo p) is easier if
0957b409SSimon J. Gerraty	 *    p > q.
0957b409SSimon J. Gerraty	 *  - While BearSSL's RSA code is perfectly happy with RSA keys such
0957b409SSimon J. Gerraty	 *    that p < q, some other implementations have restrictions and
0957b409SSimon J. Gerraty	 *    require p > q.
0957b409SSimon J. Gerraty	 *
0957b409SSimon J. Gerraty	 * Note that we can do a simple non-constant-time swap here,
0957b409SSimon J. Gerraty	 * because the only information we leak here is that we insist on
0957b409SSimon J. Gerraty	 * returning p and q such that p > q, which is not a secret.
0957b409SSimon J. Gerraty	 */
0957b409SSimon J. Gerraty	if (esize_p == esize_q && br_i31_sub(p, q, 0) == 1) {
0957b409SSimon J. Gerraty		bufswap(p, q, (1 + plen) * sizeof *p);
0957b409SSimon J. Gerraty		bufswap(sk->p, sk->q, sk->plen);
0957b409SSimon J. Gerraty		bufswap(sk->dp, sk->dq, sk->dplen);
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	/*
0957b409SSimon J. Gerraty	 * We have produced p, q, dp and dq. We can now compute iq = 1/d mod p.
0957b409SSimon J. Gerraty	 *
0957b409SSimon J. Gerraty	 * We ensured that p >= q, so this is just a matter of updating the
0957b409SSimon J. Gerraty	 * header word for q (and possibly adding an extra word).
0957b409SSimon J. Gerraty	 *
0957b409SSimon J. Gerraty	 * Theoretically, the call below may fail, in case we were
0957b409SSimon J. Gerraty	 * extraordinarily unlucky, and p = q. Another failure case is if
0957b409SSimon J. Gerraty	 * Miller-Rabin failed us _twice_, and p and q are non-prime and
0957b409SSimon J. Gerraty	 * have a factor is common. We report the error mostly because it
0957b409SSimon J. Gerraty	 * is cheap and we can, but in practice this never happens (or, at
0957b409SSimon J. Gerraty	 * least, it happens way less often than hardware glitches).
0957b409SSimon J. Gerraty	 */
0957b409SSimon J. Gerraty	q[0] = p[0];
0957b409SSimon J. Gerraty	if (plen > qlen) {
0957b409SSimon J. Gerraty		q[plen] = 0;
0957b409SSimon J. Gerraty		t ++;
0957b409SSimon J. Gerraty		tlen --;
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty	br_i31_zero(t, p[0]);
0957b409SSimon J. Gerraty	t[1] = 1;
0957b409SSimon J. Gerraty	r = br_i31_moddiv(t, q, p, br_i31_ninv31(p[1]), t + 1 + plen);
0957b409SSimon J. Gerraty	br_i31_encode(sk->iq, sk->iqlen, t);
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	/*
0957b409SSimon J. Gerraty	 * Compute the public modulus too, if required.
0957b409SSimon J. Gerraty	 */
0957b409SSimon J. Gerraty	if (pk != NULL) {
0957b409SSimon J. Gerraty		br_i31_zero(t, p[0]);
0957b409SSimon J. Gerraty		br_i31_mulacc(t, p, q);
0957b409SSimon J. Gerraty		br_i31_encode(pk->n, pk->nlen, t);
0957b409SSimon J. Gerraty	}
0957b409SSimon J. Gerraty
0957b409SSimon J. Gerraty	return r;
0957b409SSimon J. Gerraty}