mpfr/src/mul.c

4a238c70SJohn Marino/* mpfr_mul -- multiply two floating-point numbers
4a238c70SJohn Marino
*ab6d115fSJohn MarinoCopyright 1999, 2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013 Free Software Foundation, Inc.
*ab6d115fSJohn MarinoContributed by the AriC and Caramel projects, INRIA.
4a238c70SJohn Marino
4a238c70SJohn MarinoThis file is part of the GNU MPFR Library.
4a238c70SJohn Marino
4a238c70SJohn MarinoThe GNU MPFR Library is free software; you can redistribute it and/or modify
4a238c70SJohn Marinoit under the terms of the GNU Lesser General Public License as published by
4a238c70SJohn Marinothe Free Software Foundation; either version 3 of the License, or (at your
4a238c70SJohn Marinooption) any later version.
4a238c70SJohn Marino
4a238c70SJohn MarinoThe GNU MPFR Library is distributed in the hope that it will be useful, but
4a238c70SJohn MarinoWITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
4a238c70SJohn Marinoor FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
4a238c70SJohn MarinoLicense for more details.
4a238c70SJohn Marino
4a238c70SJohn MarinoYou should have received a copy of the GNU Lesser General Public License
4a238c70SJohn Marinoalong with the GNU MPFR Library; see the file COPYING.LESSER.  If not, see
4a238c70SJohn Marinohttp://www.gnu.org/licenses/ or write to the Free Software Foundation, Inc.,
4a238c70SJohn Marino51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA. */
4a238c70SJohn Marino
4a238c70SJohn Marino#define MPFR_NEED_LONGLONG_H
4a238c70SJohn Marino#include "mpfr-impl.h"
4a238c70SJohn Marino
4a238c70SJohn Marino
4a238c70SJohn Marino/********* BEGINNING CHECK *************/
4a238c70SJohn Marino
4a238c70SJohn Marino/* Check if we have to check the result of mpfr_mul.
4a238c70SJohn Marino   TODO: Find a better (and faster?) check than using old implementation */
4a238c70SJohn Marino#ifdef WANT_ASSERT
4a238c70SJohn Marino# if WANT_ASSERT >= 3
4a238c70SJohn Marino
4a238c70SJohn Marinoint mpfr_mul2 (mpfr_ptr a, mpfr_srcptr b, mpfr_srcptr c, mpfr_rnd_t rnd_mode);
4a238c70SJohn Marinostatic int
4a238c70SJohn Marinompfr_mul3 (mpfr_ptr a, mpfr_srcptr b, mpfr_srcptr c, mpfr_rnd_t rnd_mode)
4a238c70SJohn Marino{
4a238c70SJohn Marino  /* Old implementation */
4a238c70SJohn Marino  int sign_product, cc, inexact;
4a238c70SJohn Marino  mpfr_exp_t ax;
4a238c70SJohn Marino  mp_limb_t *tmp;
4a238c70SJohn Marino  mp_limb_t b1;
4a238c70SJohn Marino  mpfr_prec_t bq, cq;
4a238c70SJohn Marino  mp_size_t bn, cn, tn, k;
4a238c70SJohn Marino  MPFR_TMP_DECL(marker);
4a238c70SJohn Marino
4a238c70SJohn Marino  /* deal with special cases */
4a238c70SJohn Marino  if (MPFR_ARE_SINGULAR(b,c))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      if (MPFR_IS_NAN(b) || MPFR_IS_NAN(c))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          MPFR_SET_NAN(a);
4a238c70SJohn Marino          MPFR_RET_NAN;
4a238c70SJohn Marino        }
4a238c70SJohn Marino      sign_product = MPFR_MULT_SIGN( MPFR_SIGN(b) , MPFR_SIGN(c) );
4a238c70SJohn Marino      if (MPFR_IS_INF(b))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          if (MPFR_IS_INF(c) || MPFR_NOTZERO(c))
4a238c70SJohn Marino            {
4a238c70SJohn Marino              MPFR_SET_SIGN(a,sign_product);
4a238c70SJohn Marino              MPFR_SET_INF(a);
4a238c70SJohn Marino              MPFR_RET(0); /* exact */
4a238c70SJohn Marino            }
4a238c70SJohn Marino          else
4a238c70SJohn Marino            {
4a238c70SJohn Marino              MPFR_SET_NAN(a);
4a238c70SJohn Marino              MPFR_RET_NAN;
4a238c70SJohn Marino            }
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else if (MPFR_IS_INF(c))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          if (MPFR_NOTZERO(b))
4a238c70SJohn Marino            {
4a238c70SJohn Marino              MPFR_SET_SIGN(a, sign_product);
4a238c70SJohn Marino              MPFR_SET_INF(a);
4a238c70SJohn Marino              MPFR_RET(0); /* exact */
4a238c70SJohn Marino            }
4a238c70SJohn Marino          else
4a238c70SJohn Marino            {
4a238c70SJohn Marino              MPFR_SET_NAN(a);
4a238c70SJohn Marino              MPFR_RET_NAN;
4a238c70SJohn Marino            }
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else
4a238c70SJohn Marino        {
4a238c70SJohn Marino          MPFR_ASSERTD(MPFR_IS_ZERO(b) || MPFR_IS_ZERO(c));
4a238c70SJohn Marino          MPFR_SET_SIGN(a, sign_product);
4a238c70SJohn Marino          MPFR_SET_ZERO(a);
4a238c70SJohn Marino          MPFR_RET(0); /* 0 * 0 is exact */
4a238c70SJohn Marino        }
4a238c70SJohn Marino    }
4a238c70SJohn Marino  sign_product = MPFR_MULT_SIGN( MPFR_SIGN(b) , MPFR_SIGN(c) );
4a238c70SJohn Marino
4a238c70SJohn Marino  ax = MPFR_GET_EXP (b) + MPFR_GET_EXP (c);
4a238c70SJohn Marino
4a238c70SJohn Marino  bq = MPFR_PREC (b);
4a238c70SJohn Marino  cq = MPFR_PREC (c);
4a238c70SJohn Marino
*ab6d115fSJohn Marino  MPFR_ASSERTN ((mpfr_uprec_t) bq + cq <= MPFR_PREC_MAX);
4a238c70SJohn Marino
*ab6d115fSJohn Marino  bn = MPFR_PREC2LIMBS (bq); /* number of limbs of b */
*ab6d115fSJohn Marino  cn = MPFR_PREC2LIMBS (cq); /* number of limbs of c */
4a238c70SJohn Marino  k = bn + cn; /* effective nb of limbs used by b*c (= tn or tn+1) below */
*ab6d115fSJohn Marino  tn = MPFR_PREC2LIMBS (bq + cq);
4a238c70SJohn Marino  /* <= k, thus no int overflow */
4a238c70SJohn Marino  MPFR_ASSERTD(tn <= k);
4a238c70SJohn Marino
4a238c70SJohn Marino  /* Check for no size_t overflow*/
4a238c70SJohn Marino  MPFR_ASSERTD((size_t) k <= ((size_t) -1) / BYTES_PER_MP_LIMB);
4a238c70SJohn Marino  MPFR_TMP_MARK(marker);
4a238c70SJohn Marino  tmp = MPFR_TMP_LIMBS_ALLOC (k);
4a238c70SJohn Marino
4a238c70SJohn Marino  /* multiplies two mantissa in temporary allocated space */
4a238c70SJohn Marino  b1 = (MPFR_LIKELY(bn >= cn)) ?
4a238c70SJohn Marino    mpn_mul (tmp, MPFR_MANT(b), bn, MPFR_MANT(c), cn)
4a238c70SJohn Marino    : mpn_mul (tmp, MPFR_MANT(c), cn, MPFR_MANT(b), bn);
4a238c70SJohn Marino
4a238c70SJohn Marino  /* now tmp[0]..tmp[k-1] contains the product of both mantissa,
4a238c70SJohn Marino     with tmp[k-1]>=2^(GMP_NUMB_BITS-2) */
4a238c70SJohn Marino  b1 >>= GMP_NUMB_BITS - 1; /* msb from the product */
4a238c70SJohn Marino
4a238c70SJohn Marino  /* if the mantissas of b and c are uniformly distributed in ]1/2, 1],
4a238c70SJohn Marino     then their product is in ]1/4, 1/2] with probability 2*ln(2)-1 ~ 0.386
4a238c70SJohn Marino     and in [1/2, 1] with probability 2-2*ln(2) ~ 0.614 */
4a238c70SJohn Marino  tmp += k - tn;
4a238c70SJohn Marino  if (MPFR_UNLIKELY(b1 == 0))
4a238c70SJohn Marino    mpn_lshift (tmp, tmp, tn, 1); /* tn <= k, so no stack corruption */
4a238c70SJohn Marino  cc = mpfr_round_raw (MPFR_MANT (a), tmp, bq + cq,
4a238c70SJohn Marino                       MPFR_IS_NEG_SIGN(sign_product),
4a238c70SJohn Marino                       MPFR_PREC (a), rnd_mode, &inexact);
4a238c70SJohn Marino
4a238c70SJohn Marino  /* cc = 1 ==> result is a power of two */
4a238c70SJohn Marino  if (MPFR_UNLIKELY(cc))
4a238c70SJohn Marino    MPFR_MANT(a)[MPFR_LIMB_SIZE(a)-1] = MPFR_LIMB_HIGHBIT;
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_TMP_FREE(marker);
4a238c70SJohn Marino
4a238c70SJohn Marino  {
4a238c70SJohn Marino    mpfr_exp_t ax2 = ax + (mpfr_exp_t) (b1 - 1 + cc);
4a238c70SJohn Marino    if (MPFR_UNLIKELY( ax2 > __gmpfr_emax))
4a238c70SJohn Marino      return mpfr_overflow (a, rnd_mode, sign_product);
4a238c70SJohn Marino    if (MPFR_UNLIKELY( ax2 < __gmpfr_emin))
4a238c70SJohn Marino      {
4a238c70SJohn Marino        /* In the rounding to the nearest mode, if the exponent of the exact
4a238c70SJohn Marino           result (i.e. before rounding, i.e. without taking cc into account)
4a238c70SJohn Marino           is < __gmpfr_emin - 1 or the exact result is a power of 2 (i.e. if
4a238c70SJohn Marino           both arguments are powers of 2) in absolute value, then round to
4a238c70SJohn Marino           zero. */
4a238c70SJohn Marino        if (rnd_mode == MPFR_RNDN &&
4a238c70SJohn Marino            (ax + (mpfr_exp_t) b1 < __gmpfr_emin ||
4a238c70SJohn Marino             (mpfr_powerof2_raw (b) && mpfr_powerof2_raw (c))))
4a238c70SJohn Marino          rnd_mode = MPFR_RNDZ;
4a238c70SJohn Marino        return mpfr_underflow (a, rnd_mode, sign_product);
4a238c70SJohn Marino      }
4a238c70SJohn Marino    MPFR_SET_EXP (a, ax2);
4a238c70SJohn Marino    MPFR_SET_SIGN(a, sign_product);
4a238c70SJohn Marino  }
4a238c70SJohn Marino  MPFR_RET (inexact);
4a238c70SJohn Marino}
4a238c70SJohn Marino
4a238c70SJohn Marinoint
4a238c70SJohn Marinompfr_mul (mpfr_ptr a, mpfr_srcptr b, mpfr_srcptr c, mpfr_rnd_t rnd_mode)
4a238c70SJohn Marino{
4a238c70SJohn Marino  mpfr_t ta, tb, tc;
4a238c70SJohn Marino  int inexact1, inexact2;
4a238c70SJohn Marino
4a238c70SJohn Marino  mpfr_init2 (ta, MPFR_PREC (a));
4a238c70SJohn Marino  mpfr_init2 (tb, MPFR_PREC (b));
4a238c70SJohn Marino  mpfr_init2 (tc, MPFR_PREC (c));
4a238c70SJohn Marino  MPFR_ASSERTN (mpfr_set (tb, b, MPFR_RNDN) == 0);
4a238c70SJohn Marino  MPFR_ASSERTN (mpfr_set (tc, c, MPFR_RNDN) == 0);
4a238c70SJohn Marino
4a238c70SJohn Marino  inexact2 = mpfr_mul3 (ta, tb, tc, rnd_mode);
4a238c70SJohn Marino  inexact1  = mpfr_mul2 (a, b, c, rnd_mode);
4a238c70SJohn Marino  if (mpfr_cmp (ta, a) || inexact1*inexact2 < 0
4a238c70SJohn Marino      || (inexact1*inexact2 == 0 && (inexact1|inexact2) != 0))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      fprintf (stderr, "mpfr_mul return different values for %s\n"
4a238c70SJohn Marino               "Prec_a = %lu, Prec_b = %lu, Prec_c = %lu\nB = ",
4a238c70SJohn Marino               mpfr_print_rnd_mode (rnd_mode),
4a238c70SJohn Marino               MPFR_PREC (a), MPFR_PREC (b), MPFR_PREC (c));
4a238c70SJohn Marino      mpfr_out_str (stderr, 16, 0, tb, MPFR_RNDN);
4a238c70SJohn Marino      fprintf (stderr, "\nC = ");
4a238c70SJohn Marino      mpfr_out_str (stderr, 16, 0, tc, MPFR_RNDN);
4a238c70SJohn Marino      fprintf (stderr, "\nOldMul: ");
4a238c70SJohn Marino      mpfr_out_str (stderr, 16, 0, ta, MPFR_RNDN);
4a238c70SJohn Marino      fprintf (stderr, "\nNewMul: ");
4a238c70SJohn Marino      mpfr_out_str (stderr, 16, 0, a, MPFR_RNDN);
4a238c70SJohn Marino      fprintf (stderr, "\nNewInexact = %d | OldInexact = %d\n",
4a238c70SJohn Marino               inexact1, inexact2);
4a238c70SJohn Marino      MPFR_ASSERTN(0);
4a238c70SJohn Marino    }
4a238c70SJohn Marino
4a238c70SJohn Marino  mpfr_clears (ta, tb, tc, (mpfr_ptr) 0);
4a238c70SJohn Marino  return inexact1;
4a238c70SJohn Marino}
4a238c70SJohn Marino
4a238c70SJohn Marino# define mpfr_mul mpfr_mul2
4a238c70SJohn Marino# endif
4a238c70SJohn Marino#endif
4a238c70SJohn Marino
4a238c70SJohn Marino/****** END OF CHECK *******/
4a238c70SJohn Marino
4a238c70SJohn Marino/* Multiply 2 mpfr_t */
4a238c70SJohn Marino
4a238c70SJohn Marino/* Note: mpfr_sqr will call mpfr_mul if bn > MPFR_SQR_THRESHOLD,
4a238c70SJohn Marino   in order to use Mulders' mulhigh, which is handled only here
4a238c70SJohn Marino   to avoid partial code duplication. There is some overhead due
4a238c70SJohn Marino   to the additional tests, but slowdown should not be noticeable
4a238c70SJohn Marino   as this code is not executed in very small precisions. */
4a238c70SJohn Marino
4a238c70SJohn Marinoint
4a238c70SJohn Marinompfr_mul (mpfr_ptr a, mpfr_srcptr b, mpfr_srcptr c, mpfr_rnd_t rnd_mode)
4a238c70SJohn Marino{
4a238c70SJohn Marino  int sign, inexact;
4a238c70SJohn Marino  mpfr_exp_t ax, ax2;
4a238c70SJohn Marino  mp_limb_t *tmp;
4a238c70SJohn Marino  mp_limb_t b1;
4a238c70SJohn Marino  mpfr_prec_t bq, cq;
4a238c70SJohn Marino  mp_size_t bn, cn, tn, k, threshold;
4a238c70SJohn Marino  MPFR_TMP_DECL (marker);
4a238c70SJohn Marino
4a238c70SJohn Marino  MPFR_LOG_FUNC
4a238c70SJohn Marino    (("b[%Pu]=%.*Rg c[%Pu]=%.*Rg rnd=%d",
4a238c70SJohn Marino      mpfr_get_prec (b), mpfr_log_prec, b,
4a238c70SJohn Marino      mpfr_get_prec (c), mpfr_log_prec, c, rnd_mode),
4a238c70SJohn Marino     ("a[%Pu]=%.*Rg inexact=%d",
4a238c70SJohn Marino      mpfr_get_prec (a), mpfr_log_prec, a, inexact));
4a238c70SJohn Marino
4a238c70SJohn Marino  /* deal with special cases */
4a238c70SJohn Marino  if (MPFR_ARE_SINGULAR (b, c))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      if (MPFR_IS_NAN (b) || MPFR_IS_NAN (c))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          MPFR_SET_NAN (a);
4a238c70SJohn Marino          MPFR_RET_NAN;
4a238c70SJohn Marino        }
4a238c70SJohn Marino      sign = MPFR_MULT_SIGN (MPFR_SIGN (b), MPFR_SIGN (c));
4a238c70SJohn Marino      if (MPFR_IS_INF (b))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          if (!MPFR_IS_ZERO (c))
4a238c70SJohn Marino            {
4a238c70SJohn Marino              MPFR_SET_SIGN (a, sign);
4a238c70SJohn Marino              MPFR_SET_INF (a);
4a238c70SJohn Marino              MPFR_RET (0);
4a238c70SJohn Marino            }
4a238c70SJohn Marino          else
4a238c70SJohn Marino            {
4a238c70SJohn Marino              MPFR_SET_NAN (a);
4a238c70SJohn Marino              MPFR_RET_NAN;
4a238c70SJohn Marino            }
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else if (MPFR_IS_INF (c))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          if (!MPFR_IS_ZERO (b))
4a238c70SJohn Marino            {
4a238c70SJohn Marino              MPFR_SET_SIGN (a, sign);
4a238c70SJohn Marino              MPFR_SET_INF (a);
4a238c70SJohn Marino              MPFR_RET(0);
4a238c70SJohn Marino            }
4a238c70SJohn Marino          else
4a238c70SJohn Marino            {
4a238c70SJohn Marino              MPFR_SET_NAN (a);
4a238c70SJohn Marino              MPFR_RET_NAN;
4a238c70SJohn Marino            }
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else
4a238c70SJohn Marino        {
4a238c70SJohn Marino          MPFR_ASSERTD (MPFR_IS_ZERO(b) || MPFR_IS_ZERO(c));
4a238c70SJohn Marino          MPFR_SET_SIGN (a, sign);
4a238c70SJohn Marino          MPFR_SET_ZERO (a);
4a238c70SJohn Marino          MPFR_RET (0);
4a238c70SJohn Marino        }
4a238c70SJohn Marino    }
4a238c70SJohn Marino  sign = MPFR_MULT_SIGN (MPFR_SIGN (b), MPFR_SIGN (c));
4a238c70SJohn Marino
4a238c70SJohn Marino  ax = MPFR_GET_EXP (b) + MPFR_GET_EXP (c);
4a238c70SJohn Marino  /* Note: the exponent of the exact result will be e = bx + cx + ec with
4a238c70SJohn Marino     ec in {-1,0,1} and the following assumes that e is representable. */
4a238c70SJohn Marino
4a238c70SJohn Marino  /* FIXME: Useful since we do an exponent check after ?
4a238c70SJohn Marino   * It is useful iff the precision is big, there is an overflow
4a238c70SJohn Marino   * and we are doing further mults...*/
4a238c70SJohn Marino#ifdef HUGE
4a238c70SJohn Marino  if (MPFR_UNLIKELY (ax > __gmpfr_emax + 1))
4a238c70SJohn Marino    return mpfr_overflow (a, rnd_mode, sign);
4a238c70SJohn Marino  if (MPFR_UNLIKELY (ax < __gmpfr_emin - 2))
4a238c70SJohn Marino    return mpfr_underflow (a, rnd_mode == MPFR_RNDN ? MPFR_RNDZ : rnd_mode,
4a238c70SJohn Marino                           sign);
4a238c70SJohn Marino#endif
4a238c70SJohn Marino
4a238c70SJohn Marino  bq = MPFR_PREC (b);
4a238c70SJohn Marino  cq = MPFR_PREC (c);
4a238c70SJohn Marino
*ab6d115fSJohn Marino  MPFR_ASSERTN ((mpfr_uprec_t) bq + cq <= MPFR_PREC_MAX);
4a238c70SJohn Marino
*ab6d115fSJohn Marino  bn = MPFR_PREC2LIMBS (bq); /* number of limbs of b */
*ab6d115fSJohn Marino  cn = MPFR_PREC2LIMBS (cq); /* number of limbs of c */
4a238c70SJohn Marino  k = bn + cn; /* effective nb of limbs used by b*c (= tn or tn+1) below */
*ab6d115fSJohn Marino  tn = MPFR_PREC2LIMBS (bq + cq);
4a238c70SJohn Marino  MPFR_ASSERTD (tn <= k); /* tn <= k, thus no int overflow */
4a238c70SJohn Marino
4a238c70SJohn Marino  /* Check for no size_t overflow*/
4a238c70SJohn Marino  MPFR_ASSERTD ((size_t) k <= ((size_t) -1) / BYTES_PER_MP_LIMB);
4a238c70SJohn Marino  MPFR_TMP_MARK (marker);
4a238c70SJohn Marino  tmp = MPFR_TMP_LIMBS_ALLOC (k);
4a238c70SJohn Marino
4a238c70SJohn Marino  /* multiplies two mantissa in temporary allocated space */
4a238c70SJohn Marino  if (MPFR_UNLIKELY (bn < cn))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      mpfr_srcptr z = b;
4a238c70SJohn Marino      mp_size_t zn  = bn;
4a238c70SJohn Marino      b = c;
4a238c70SJohn Marino      bn = cn;
4a238c70SJohn Marino      c = z;
4a238c70SJohn Marino      cn = zn;
4a238c70SJohn Marino    }
4a238c70SJohn Marino  MPFR_ASSERTD (bn >= cn);
4a238c70SJohn Marino  if (MPFR_LIKELY (bn <= 2))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      if (bn == 1)
4a238c70SJohn Marino        {
4a238c70SJohn Marino          /* 1 limb * 1 limb */
4a238c70SJohn Marino          umul_ppmm (tmp[1], tmp[0], MPFR_MANT (b)[0], MPFR_MANT (c)[0]);
4a238c70SJohn Marino          b1 = tmp[1];
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else if (MPFR_UNLIKELY (cn == 1))
4a238c70SJohn Marino        {
4a238c70SJohn Marino          /* 2 limbs * 1 limb */
4a238c70SJohn Marino          mp_limb_t t;
4a238c70SJohn Marino          umul_ppmm (tmp[1], tmp[0], MPFR_MANT (b)[0], MPFR_MANT (c)[0]);
4a238c70SJohn Marino          umul_ppmm (tmp[2], t, MPFR_MANT (b)[1], MPFR_MANT (c)[0]);
4a238c70SJohn Marino          add_ssaaaa (tmp[2], tmp[1], tmp[2], tmp[1], 0, t);
4a238c70SJohn Marino          b1 = tmp[2];
4a238c70SJohn Marino        }
4a238c70SJohn Marino      else
4a238c70SJohn Marino        {
4a238c70SJohn Marino          /* 2 limbs * 2 limbs */
4a238c70SJohn Marino          mp_limb_t t1, t2, t3;
4a238c70SJohn Marino          /* First 2 limbs * 1 limb */
4a238c70SJohn Marino          umul_ppmm (tmp[1], tmp[0], MPFR_MANT (b)[0], MPFR_MANT (c)[0]);
4a238c70SJohn Marino          umul_ppmm (tmp[2], t1, MPFR_MANT (b)[1], MPFR_MANT (c)[0]);
4a238c70SJohn Marino          add_ssaaaa (tmp[2], tmp[1], tmp[2], tmp[1], 0, t1);
4a238c70SJohn Marino          /* Second, the other 2 limbs * 1 limb product */
4a238c70SJohn Marino          umul_ppmm (t1, t2, MPFR_MANT (b)[0], MPFR_MANT (c)[1]);
4a238c70SJohn Marino          umul_ppmm (tmp[3], t3, MPFR_MANT (b)[1], MPFR_MANT (c)[1]);
4a238c70SJohn Marino          add_ssaaaa (tmp[3], t1, tmp[3], t1, 0, t3);
4a238c70SJohn Marino          /* Sum those two partial products */
4a238c70SJohn Marino          add_ssaaaa (tmp[2], tmp[1], tmp[2], tmp[1], t1, t2);
4a238c70SJohn Marino          tmp[3] += (tmp[2] < t1);
4a238c70SJohn Marino          b1 = tmp[3];
4a238c70SJohn Marino        }
4a238c70SJohn Marino      b1 >>= (GMP_NUMB_BITS - 1);
4a238c70SJohn Marino      tmp += k - tn;
4a238c70SJohn Marino      if (MPFR_UNLIKELY (b1 == 0))
4a238c70SJohn Marino        mpn_lshift (tmp, tmp, tn, 1); /* tn <= k, so no stack corruption */
4a238c70SJohn Marino    }
4a238c70SJohn Marino  else
4a238c70SJohn Marino    /* Mulders' mulhigh. This code can also be used via mpfr_sqr,
4a238c70SJohn Marino       hence the tests b != c. */
4a238c70SJohn Marino    if (MPFR_UNLIKELY (bn > (threshold = b != c ?
4a238c70SJohn Marino                             MPFR_MUL_THRESHOLD : MPFR_SQR_THRESHOLD)))
4a238c70SJohn Marino      {
4a238c70SJohn Marino        mp_limb_t *bp, *cp;
4a238c70SJohn Marino        mp_size_t n;
4a238c70SJohn Marino        mpfr_prec_t p;
4a238c70SJohn Marino
4a238c70SJohn Marino        /* First check if we can reduce the precision of b or c:
4a238c70SJohn Marino           exact values are a nightmare for the short product trick */
4a238c70SJohn Marino        bp = MPFR_MANT (b);
4a238c70SJohn Marino        cp = MPFR_MANT (c);
4a238c70SJohn Marino        MPFR_ASSERTN (threshold >= 1);
4a238c70SJohn Marino        if (MPFR_UNLIKELY ((bp[0] == 0 && bp[1] == 0) ||
4a238c70SJohn Marino                           (cp[0] == 0 && cp[1] == 0)))
4a238c70SJohn Marino          {
4a238c70SJohn Marino            mpfr_t b_tmp, c_tmp;
4a238c70SJohn Marino
4a238c70SJohn Marino            MPFR_TMP_FREE (marker);
4a238c70SJohn Marino            /* Check for b */
4a238c70SJohn Marino            while (*bp == 0)
4a238c70SJohn Marino              {
4a238c70SJohn Marino                bp++;
4a238c70SJohn Marino                bn--;
4a238c70SJohn Marino                MPFR_ASSERTD (bn > 0);
4a238c70SJohn Marino              } /* This must end since the most significant limb is != 0 */
4a238c70SJohn Marino
4a238c70SJohn Marino            /* Check for c too: if b ==c, will do nothing */
4a238c70SJohn Marino            while (*cp == 0)
4a238c70SJohn Marino              {
4a238c70SJohn Marino                cp++;
4a238c70SJohn Marino                cn--;
4a238c70SJohn Marino                MPFR_ASSERTD (cn > 0);
4a238c70SJohn Marino              } /* This must end since the most significant limb is != 0 */
4a238c70SJohn Marino
4a238c70SJohn Marino            /* It is not the faster way, but it is safer */
4a238c70SJohn Marino            MPFR_SET_SAME_SIGN (b_tmp, b);
4a238c70SJohn Marino            MPFR_SET_EXP (b_tmp, MPFR_GET_EXP (b));
4a238c70SJohn Marino            MPFR_PREC (b_tmp) = bn * GMP_NUMB_BITS;
4a238c70SJohn Marino            MPFR_MANT (b_tmp) = bp;
4a238c70SJohn Marino
4a238c70SJohn Marino            if (b != c)
4a238c70SJohn Marino              {
4a238c70SJohn Marino                MPFR_SET_SAME_SIGN (c_tmp, c);
4a238c70SJohn Marino                MPFR_SET_EXP (c_tmp, MPFR_GET_EXP (c));
4a238c70SJohn Marino                MPFR_PREC (c_tmp) = cn * GMP_NUMB_BITS;
4a238c70SJohn Marino                MPFR_MANT (c_tmp) = cp;
4a238c70SJohn Marino
4a238c70SJohn Marino                /* Call again mpfr_mul with the fixed arguments */
4a238c70SJohn Marino                return mpfr_mul (a, b_tmp, c_tmp, rnd_mode);
4a238c70SJohn Marino              }
4a238c70SJohn Marino            else
4a238c70SJohn Marino              /* Call mpfr_mul instead of mpfr_sqr as the precision
4a238c70SJohn Marino                 is probably still high enough. */
4a238c70SJohn Marino              return mpfr_mul (a, b_tmp, b_tmp, rnd_mode);
4a238c70SJohn Marino          }
4a238c70SJohn Marino
4a238c70SJohn Marino        /* Compute estimated precision of mulhigh.
4a238c70SJohn Marino           We could use `+ (n < cn) + (n < bn)' instead of `+ 2',
4a238c70SJohn Marino           but does it worth it? */
4a238c70SJohn Marino        n = MPFR_LIMB_SIZE (a) + 1;
4a238c70SJohn Marino        n = MIN (n, cn);
4a238c70SJohn Marino        MPFR_ASSERTD (n >= 1 && 2*n <= k && n <= cn && n <= bn);
4a238c70SJohn Marino        p = n * GMP_NUMB_BITS - MPFR_INT_CEIL_LOG2 (n + 2);
4a238c70SJohn Marino        bp += bn - n;
4a238c70SJohn Marino        cp += cn - n;
4a238c70SJohn Marino
4a238c70SJohn Marino        /* Check if MulHigh can produce a roundable result.
4a238c70SJohn Marino           We may lose 1 bit due to RNDN, 1 due to final shift. */
4a238c70SJohn Marino        if (MPFR_UNLIKELY (MPFR_PREC (a) > p - 5))
4a238c70SJohn Marino          {
4a238c70SJohn Marino            if (MPFR_UNLIKELY (MPFR_PREC (a) > p - 5 + GMP_NUMB_BITS
4a238c70SJohn Marino                               || bn <= threshold + 1))
4a238c70SJohn Marino              {
4a238c70SJohn Marino                /* MulHigh can't produce a roundable result. */
4a238c70SJohn Marino                MPFR_LOG_MSG (("mpfr_mulhigh can't be used (%lu VS %lu)\n",
4a238c70SJohn Marino                               MPFR_PREC (a), p));
4a238c70SJohn Marino                goto full_multiply;
4a238c70SJohn Marino              }
4a238c70SJohn Marino            /* Add one extra limb to mantissa of b and c. */
4a238c70SJohn Marino            if (bn > n)
4a238c70SJohn Marino              bp --;
4a238c70SJohn Marino            else
4a238c70SJohn Marino              {
4a238c70SJohn Marino                bp = MPFR_TMP_LIMBS_ALLOC (n + 1);
4a238c70SJohn Marino                bp[0] = 0;
4a238c70SJohn Marino                MPN_COPY (bp + 1, MPFR_MANT (b) + bn - n, n);
4a238c70SJohn Marino              }
4a238c70SJohn Marino            if (b != c)
4a238c70SJohn Marino              {
4a238c70SJohn Marino                if (cn > n)
4a238c70SJohn Marino                  cp --; /* FIXME: Could this happen? */
4a238c70SJohn Marino                else
4a238c70SJohn Marino                  {
4a238c70SJohn Marino                    cp = MPFR_TMP_LIMBS_ALLOC (n + 1);
4a238c70SJohn Marino                    cp[0] = 0;
4a238c70SJohn Marino                    MPN_COPY (cp + 1, MPFR_MANT (c) + cn - n, n);
4a238c70SJohn Marino                  }
4a238c70SJohn Marino              }
4a238c70SJohn Marino            /* We will compute with one extra limb */
4a238c70SJohn Marino            n++;
4a238c70SJohn Marino            /* ceil(log2(n+2)) takes into account the lost bits due to
4a238c70SJohn Marino               Mulders' short product */
4a238c70SJohn Marino            p = n * GMP_NUMB_BITS - MPFR_INT_CEIL_LOG2 (n + 2);
4a238c70SJohn Marino            /* Due to some nasty reasons we can have only 4 bits */
4a238c70SJohn Marino            MPFR_ASSERTD (MPFR_PREC (a) <= p - 4);
4a238c70SJohn Marino
4a238c70SJohn Marino            if (MPFR_LIKELY (k < 2*n))
4a238c70SJohn Marino              {
4a238c70SJohn Marino                tmp = MPFR_TMP_LIMBS_ALLOC (2 * n);
4a238c70SJohn Marino                tmp += 2*n-k; /* `tmp' still points to an area of `k' limbs */
4a238c70SJohn Marino              }
4a238c70SJohn Marino          }
4a238c70SJohn Marino        MPFR_LOG_MSG (("Use mpfr_mulhigh (%lu VS %lu)\n", MPFR_PREC (a), p));
4a238c70SJohn Marino        /* Compute an approximation of the product of b and c */
4a238c70SJohn Marino        if (b != c)
4a238c70SJohn Marino          mpfr_mulhigh_n (tmp + k - 2 * n, bp, cp, n);
4a238c70SJohn Marino        else
4a238c70SJohn Marino          mpfr_sqrhigh_n (tmp + k - 2 * n, bp, n);
4a238c70SJohn Marino        /* now tmp[0]..tmp[k-1] contains the product of both mantissa,
4a238c70SJohn Marino           with tmp[k-1]>=2^(GMP_NUMB_BITS-2) */
4a238c70SJohn Marino        /* [VL] FIXME: This cannot be true: mpfr_mulhigh_n only
4a238c70SJohn Marino           depends on pointers and n. As k can be arbitrarily larger,
4a238c70SJohn Marino           the result cannot depend on k. And indeed, with GMP compiled
4a238c70SJohn Marino           with --enable-alloca=debug, valgrind was complaining, at
4a238c70SJohn Marino           least because MPFR_RNDRAW at the end tried to compute the
4a238c70SJohn Marino           sticky bit even when not necessary; this problem is fixed,
4a238c70SJohn Marino           but there's at least something wrong with the comment above. */
4a238c70SJohn Marino        b1 = tmp[k-1] >> (GMP_NUMB_BITS - 1); /* msb from the product */
4a238c70SJohn Marino
4a238c70SJohn Marino        /* If the mantissas of b and c are uniformly distributed in (1/2, 1],
4a238c70SJohn Marino           then their product is in (1/4, 1/2] with probability 2*ln(2)-1
4a238c70SJohn Marino           ~ 0.386 and in [1/2, 1] with probability 2-2*ln(2) ~ 0.614 */
4a238c70SJohn Marino        if (MPFR_UNLIKELY (b1 == 0))
4a238c70SJohn Marino          /* Warning: the mpfr_mulhigh_n call above only surely affects
4a238c70SJohn Marino             tmp[k-n-1..k-1], thus we shift only those limbs */
4a238c70SJohn Marino          mpn_lshift (tmp + k - n - 1, tmp + k - n - 1, n + 1, 1);
4a238c70SJohn Marino        tmp += k - tn;
4a238c70SJohn Marino        MPFR_ASSERTD (MPFR_LIMB_MSB (tmp[tn-1]) != 0);
4a238c70SJohn Marino
4a238c70SJohn Marino        /* if the most significant bit b1 is zero, we have only p-1 correct
4a238c70SJohn Marino           bits */
4a238c70SJohn Marino        if (MPFR_UNLIKELY (!mpfr_round_p (tmp, tn, p + b1 - 1, MPFR_PREC(a)
4a238c70SJohn Marino                                          + (rnd_mode == MPFR_RNDN))))
4a238c70SJohn Marino          {
4a238c70SJohn Marino            tmp -= k - tn; /* tmp may have changed, FIX IT!!!!! */
4a238c70SJohn Marino            goto full_multiply;
4a238c70SJohn Marino          }
4a238c70SJohn Marino      }
4a238c70SJohn Marino    else
4a238c70SJohn Marino      {
4a238c70SJohn Marino      full_multiply:
4a238c70SJohn Marino        MPFR_LOG_MSG (("Use mpn_mul\n", 0));
4a238c70SJohn Marino        b1 = mpn_mul (tmp, MPFR_MANT (b), bn, MPFR_MANT (c), cn);
4a238c70SJohn Marino
4a238c70SJohn Marino        /* now tmp[0]..tmp[k-1] contains the product of both mantissa,
4a238c70SJohn Marino           with tmp[k-1]>=2^(GMP_NUMB_BITS-2) */
4a238c70SJohn Marino        b1 >>= GMP_NUMB_BITS - 1; /* msb from the product */
4a238c70SJohn Marino
4a238c70SJohn Marino        /* if the mantissas of b and c are uniformly distributed in (1/2, 1],
4a238c70SJohn Marino           then their product is in (1/4, 1/2] with probability 2*ln(2)-1
4a238c70SJohn Marino           ~ 0.386 and in [1/2, 1] with probability 2-2*ln(2) ~ 0.614 */
4a238c70SJohn Marino        tmp += k - tn;
4a238c70SJohn Marino        if (MPFR_UNLIKELY (b1 == 0))
4a238c70SJohn Marino          mpn_lshift (tmp, tmp, tn, 1); /* tn <= k, so no stack corruption */
4a238c70SJohn Marino      }
4a238c70SJohn Marino
4a238c70SJohn Marino  ax2 = ax + (mpfr_exp_t) (b1 - 1);
4a238c70SJohn Marino  MPFR_RNDRAW (inexact, a, tmp, bq+cq, rnd_mode, sign, ax2++);
4a238c70SJohn Marino  MPFR_TMP_FREE (marker);
4a238c70SJohn Marino  MPFR_EXP  (a) = ax2; /* Can't use MPFR_SET_EXP: Expo may be out of range */
4a238c70SJohn Marino  MPFR_SET_SIGN (a, sign);
4a238c70SJohn Marino  if (MPFR_UNLIKELY (ax2 > __gmpfr_emax))
4a238c70SJohn Marino    return mpfr_overflow (a, rnd_mode, sign);
4a238c70SJohn Marino  if (MPFR_UNLIKELY (ax2 < __gmpfr_emin))
4a238c70SJohn Marino    {
4a238c70SJohn Marino      /* In the rounding to the nearest mode, if the exponent of the exact
4a238c70SJohn Marino         result (i.e. before rounding, i.e. without taking cc into account)
4a238c70SJohn Marino         is < __gmpfr_emin - 1 or the exact result is a power of 2 (i.e. if
4a238c70SJohn Marino         both arguments are powers of 2), then round to zero. */
4a238c70SJohn Marino      if (rnd_mode == MPFR_RNDN
4a238c70SJohn Marino          && (ax + (mpfr_exp_t) b1 < __gmpfr_emin
4a238c70SJohn Marino              || (mpfr_powerof2_raw (b) && mpfr_powerof2_raw (c))))
4a238c70SJohn Marino        rnd_mode = MPFR_RNDZ;
4a238c70SJohn Marino      return mpfr_underflow (a, rnd_mode, sign);
4a238c70SJohn Marino    }
4a238c70SJohn Marino  MPFR_RET (inexact);
4a238c70SJohn Marino}