gmp/mpz/aorsmul_i.c

*86d7f5d3SJohn Marino/* mpz_addmul_ui, mpz_submul_ui - add or subtract small multiple.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino   THE mpz_aorsmul_1 FUNCTION IN THIS FILE IS FOR INTERNAL USE ONLY AND IS
*86d7f5d3SJohn Marino   ALMOST CERTAIN TO BE SUBJECT TO INCOMPATIBLE CHANGES OR DISAPPEAR
*86d7f5d3SJohn Marino   COMPLETELY IN FUTURE GNU MP RELEASES.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoCopyright 2001, 2002, 2004, 2005 Free Software Foundation, Inc.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoThis file is part of the GNU MP Library.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoThe GNU MP Library is free software; you can redistribute it and/or modify
*86d7f5d3SJohn Marinoit under the terms of the GNU Lesser General Public License as published by
*86d7f5d3SJohn Marinothe Free Software Foundation; either version 3 of the License, or (at your
*86d7f5d3SJohn Marinooption) any later version.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoThe GNU MP Library is distributed in the hope that it will be useful, but
*86d7f5d3SJohn MarinoWITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
*86d7f5d3SJohn Marinoor FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
*86d7f5d3SJohn MarinoLicense for more details.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoYou should have received a copy of the GNU Lesser General Public License
*86d7f5d3SJohn Marinoalong with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.  */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino#include "gmp.h"
*86d7f5d3SJohn Marino#include "gmp-impl.h"
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino#if HAVE_NATIVE_mpn_mul_1c
*86d7f5d3SJohn Marino#define MPN_MUL_1C(cout, dst, src, size, n, cin)        \
*86d7f5d3SJohn Marino  do {                                                  \
*86d7f5d3SJohn Marino    (cout) = mpn_mul_1c (dst, src, size, n, cin);       \
*86d7f5d3SJohn Marino  } while (0)
*86d7f5d3SJohn Marino#else
*86d7f5d3SJohn Marino#define MPN_MUL_1C(cout, dst, src, size, n, cin)        \
*86d7f5d3SJohn Marino  do {                                                  \
*86d7f5d3SJohn Marino    mp_limb_t __cy;                                     \
*86d7f5d3SJohn Marino    __cy = mpn_mul_1 (dst, src, size, n);               \
*86d7f5d3SJohn Marino    (cout) = __cy + mpn_add_1 (dst, dst, size, cin);    \
*86d7f5d3SJohn Marino  } while (0)
*86d7f5d3SJohn Marino#endif
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino/* sub>=0 means an addmul w += x*y, sub<0 means a submul w -= x*y.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino   All that's needed to account for negative w or x is to flip "sub".
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino   The final w will retain its sign, unless an underflow occurs in a submul
*86d7f5d3SJohn Marino   of absolute values, in which case it's flipped.
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino   If x has more limbs than w, then mpn_submul_1 followed by mpn_com is
*86d7f5d3SJohn Marino   used.  The alternative would be mpn_mul_1 into temporary space followed
*86d7f5d3SJohn Marino   by mpn_sub_n.  Avoiding temporary space seem good, and submul+com stands
*86d7f5d3SJohn Marino   a chance of being faster since it involves only one set of carry
*86d7f5d3SJohn Marino   propagations, not two.  Note that doing an addmul_1 with a
*86d7f5d3SJohn Marino   twos-complement negative y doesn't work, because it effectively adds an
*86d7f5d3SJohn Marino   extra x * 2^GMP_LIMB_BITS.  */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn MarinoREGPARM_ATTR(1) void
*86d7f5d3SJohn Marinompz_aorsmul_1 (mpz_ptr w, mpz_srcptr x, mp_limb_t y, mp_size_t sub)
*86d7f5d3SJohn Marino{
*86d7f5d3SJohn Marino  mp_size_t  xsize, wsize, wsize_signed, new_wsize, min_size, dsize;
*86d7f5d3SJohn Marino  mp_srcptr  xp;
*86d7f5d3SJohn Marino  mp_ptr     wp;
*86d7f5d3SJohn Marino  mp_limb_t  cy;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  /* w unaffected if x==0 or y==0 */
*86d7f5d3SJohn Marino  xsize = SIZ (x);
*86d7f5d3SJohn Marino  if (xsize == 0 || y == 0)
*86d7f5d3SJohn Marino    return;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  sub ^= xsize;
*86d7f5d3SJohn Marino  xsize = ABS (xsize);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  wsize_signed = SIZ (w);
*86d7f5d3SJohn Marino  if (wsize_signed == 0)
*86d7f5d3SJohn Marino    {
*86d7f5d3SJohn Marino      /* nothing to add to, just set x*y, "sub" gives the sign */
*86d7f5d3SJohn Marino      MPZ_REALLOC (w, xsize+1);
*86d7f5d3SJohn Marino      wp = PTR (w);
*86d7f5d3SJohn Marino      cy = mpn_mul_1 (wp, PTR(x), xsize, y);
*86d7f5d3SJohn Marino      wp[xsize] = cy;
*86d7f5d3SJohn Marino      xsize += (cy != 0);
*86d7f5d3SJohn Marino      SIZ (w) = (sub >= 0 ? xsize : -xsize);
*86d7f5d3SJohn Marino      return;
*86d7f5d3SJohn Marino    }
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  sub ^= wsize_signed;
*86d7f5d3SJohn Marino  wsize = ABS (wsize_signed);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  new_wsize = MAX (wsize, xsize);
*86d7f5d3SJohn Marino  MPZ_REALLOC (w, new_wsize+1);
*86d7f5d3SJohn Marino  wp = PTR (w);
*86d7f5d3SJohn Marino  xp = PTR (x);
*86d7f5d3SJohn Marino  min_size = MIN (wsize, xsize);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  if (sub >= 0)
*86d7f5d3SJohn Marino    {
*86d7f5d3SJohn Marino      /* addmul of absolute values */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      cy = mpn_addmul_1 (wp, xp, min_size, y);
*86d7f5d3SJohn Marino      wp += min_size;
*86d7f5d3SJohn Marino      xp += min_size;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      dsize = xsize - wsize;
*86d7f5d3SJohn Marino#if HAVE_NATIVE_mpn_mul_1c
*86d7f5d3SJohn Marino      if (dsize > 0)
*86d7f5d3SJohn Marino        cy = mpn_mul_1c (wp, xp, dsize, y, cy);
*86d7f5d3SJohn Marino      else if (dsize < 0)
*86d7f5d3SJohn Marino        {
*86d7f5d3SJohn Marino          dsize = -dsize;
*86d7f5d3SJohn Marino          cy = mpn_add_1 (wp, wp, dsize, cy);
*86d7f5d3SJohn Marino        }
*86d7f5d3SJohn Marino#else
*86d7f5d3SJohn Marino      if (dsize != 0)
*86d7f5d3SJohn Marino        {
*86d7f5d3SJohn Marino          mp_limb_t  cy2;
*86d7f5d3SJohn Marino          if (dsize > 0)
*86d7f5d3SJohn Marino            cy2 = mpn_mul_1 (wp, xp, dsize, y);
*86d7f5d3SJohn Marino          else
*86d7f5d3SJohn Marino            {
*86d7f5d3SJohn Marino              dsize = -dsize;
*86d7f5d3SJohn Marino              cy2 = 0;
*86d7f5d3SJohn Marino            }
*86d7f5d3SJohn Marino          cy = cy2 + mpn_add_1 (wp, wp, dsize, cy);
*86d7f5d3SJohn Marino        }
*86d7f5d3SJohn Marino#endif
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      wp[dsize] = cy;
*86d7f5d3SJohn Marino      new_wsize += (cy != 0);
*86d7f5d3SJohn Marino    }
*86d7f5d3SJohn Marino  else
*86d7f5d3SJohn Marino    {
*86d7f5d3SJohn Marino      /* submul of absolute values */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      cy = mpn_submul_1 (wp, xp, min_size, y);
*86d7f5d3SJohn Marino      if (wsize >= xsize)
*86d7f5d3SJohn Marino        {
*86d7f5d3SJohn Marino          /* if w bigger than x, then propagate borrow through it */
*86d7f5d3SJohn Marino          if (wsize != xsize)
*86d7f5d3SJohn Marino            cy = mpn_sub_1 (wp+xsize, wp+xsize, wsize-xsize, cy);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          if (cy != 0)
*86d7f5d3SJohn Marino            {
*86d7f5d3SJohn Marino              /* Borrow out of w, take twos complement negative to get
*86d7f5d3SJohn Marino                 absolute value, flip sign of w.  */
*86d7f5d3SJohn Marino              wp[new_wsize] = ~-cy;  /* extra limb is 0-cy */
*86d7f5d3SJohn Marino              mpn_com (wp, wp, new_wsize);
*86d7f5d3SJohn Marino              new_wsize++;
*86d7f5d3SJohn Marino              MPN_INCR_U (wp, new_wsize, CNST_LIMB(1));
*86d7f5d3SJohn Marino              wsize_signed = -wsize_signed;
*86d7f5d3SJohn Marino            }
*86d7f5d3SJohn Marino        }
*86d7f5d3SJohn Marino      else /* wsize < xsize */
*86d7f5d3SJohn Marino        {
*86d7f5d3SJohn Marino          /* x bigger than w, so want x*y-w.  Submul has given w-x*y, so
*86d7f5d3SJohn Marino             take twos complement and use an mpn_mul_1 for the rest.  */
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          mp_limb_t  cy2;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          /* -(-cy*b^n + w-x*y) = (cy-1)*b^n + ~(w-x*y) + 1 */
*86d7f5d3SJohn Marino          mpn_com (wp, wp, wsize);
*86d7f5d3SJohn Marino          cy += mpn_add_1 (wp, wp, wsize, CNST_LIMB(1));
*86d7f5d3SJohn Marino          cy -= 1;
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          /* If cy-1 == -1 then hold that -1 for latter.  mpn_submul_1 never
*86d7f5d3SJohn Marino             returns cy==MP_LIMB_T_MAX so that value always indicates a -1. */
*86d7f5d3SJohn Marino          cy2 = (cy == MP_LIMB_T_MAX);
*86d7f5d3SJohn Marino          cy += cy2;
*86d7f5d3SJohn Marino          MPN_MUL_1C (cy, wp+wsize, xp+wsize, xsize-wsize, y, cy);
*86d7f5d3SJohn Marino          wp[new_wsize] = cy;
*86d7f5d3SJohn Marino          new_wsize += (cy != 0);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          /* Apply any -1 from above.  The value at wp+wsize is non-zero
*86d7f5d3SJohn Marino             because y!=0 and the high limb of x will be non-zero.  */
*86d7f5d3SJohn Marino          if (cy2)
*86d7f5d3SJohn Marino            MPN_DECR_U (wp+wsize, new_wsize-wsize, CNST_LIMB(1));
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino          wsize_signed = -wsize_signed;
*86d7f5d3SJohn Marino        }
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino      /* submul can produce high zero limbs due to cancellation, both when w
*86d7f5d3SJohn Marino         has more limbs or x has more  */
*86d7f5d3SJohn Marino      MPN_NORMALIZE (wp, new_wsize);
*86d7f5d3SJohn Marino    }
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  SIZ (w) = (wsize_signed >= 0 ? new_wsize : -new_wsize);
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino  ASSERT (new_wsize == 0 || PTR(w)[new_wsize-1] != 0);
*86d7f5d3SJohn Marino}
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marinovoid
*86d7f5d3SJohn Marinompz_addmul_ui (mpz_ptr w, mpz_srcptr x, unsigned long y)
*86d7f5d3SJohn Marino{
*86d7f5d3SJohn Marino#if BITS_PER_ULONG > GMP_NUMB_BITS
*86d7f5d3SJohn Marino  if (UNLIKELY (y > GMP_NUMB_MAX && SIZ(x) != 0))
*86d7f5d3SJohn Marino    {
*86d7f5d3SJohn Marino      mpz_t t;
*86d7f5d3SJohn Marino      mp_ptr tp;
*86d7f5d3SJohn Marino      mp_size_t xn;
*86d7f5d3SJohn Marino      TMP_DECL;
*86d7f5d3SJohn Marino      TMP_MARK;
*86d7f5d3SJohn Marino      xn = SIZ (x);
*86d7f5d3SJohn Marino      MPZ_TMP_INIT (t, ABS (xn) + 1);
*86d7f5d3SJohn Marino      tp = PTR (t);
*86d7f5d3SJohn Marino      tp[0] = 0;
*86d7f5d3SJohn Marino      MPN_COPY (tp + 1, PTR(x), ABS (xn));
*86d7f5d3SJohn Marino      SIZ(t) = xn >= 0 ? xn + 1 : xn - 1;
*86d7f5d3SJohn Marino      mpz_aorsmul_1 (w, t, (mp_limb_t) y >> GMP_NUMB_BITS, (mp_size_t) 0);
*86d7f5d3SJohn Marino      PTR(t) = tp + 1;
*86d7f5d3SJohn Marino      SIZ(t) = xn;
*86d7f5d3SJohn Marino      mpz_aorsmul_1 (w, t, (mp_limb_t) y & GMP_NUMB_MASK, (mp_size_t) 0);
*86d7f5d3SJohn Marino      TMP_FREE;
*86d7f5d3SJohn Marino      return;
*86d7f5d3SJohn Marino    }
*86d7f5d3SJohn Marino#endif
*86d7f5d3SJohn Marino  mpz_aorsmul_1 (w, x, (mp_limb_t) y, (mp_size_t) 0);
*86d7f5d3SJohn Marino}
*86d7f5d3SJohn Marino
*86d7f5d3SJohn Marinovoid
*86d7f5d3SJohn Marinompz_submul_ui (mpz_ptr w, mpz_srcptr x, unsigned long y)
*86d7f5d3SJohn Marino{
*86d7f5d3SJohn Marino#if BITS_PER_ULONG > GMP_NUMB_BITS
*86d7f5d3SJohn Marino  if (y > GMP_NUMB_MAX && SIZ(x) != 0)
*86d7f5d3SJohn Marino    {
*86d7f5d3SJohn Marino      mpz_t t;
*86d7f5d3SJohn Marino      mp_ptr tp;
*86d7f5d3SJohn Marino      mp_size_t xn;
*86d7f5d3SJohn Marino      TMP_DECL;
*86d7f5d3SJohn Marino      TMP_MARK;
*86d7f5d3SJohn Marino      xn = SIZ (x);
*86d7f5d3SJohn Marino      MPZ_TMP_INIT (t, ABS (xn) + 1);
*86d7f5d3SJohn Marino      tp = PTR (t);
*86d7f5d3SJohn Marino      tp[0] = 0;
*86d7f5d3SJohn Marino      MPN_COPY (tp + 1, PTR(x), ABS (xn));
*86d7f5d3SJohn Marino      SIZ(t) = xn >= 0 ? xn + 1 : xn - 1;
*86d7f5d3SJohn Marino      mpz_aorsmul_1 (w, t, (mp_limb_t) y >> GMP_NUMB_BITS, (mp_size_t) -1);
*86d7f5d3SJohn Marino      PTR(t) = tp + 1;
*86d7f5d3SJohn Marino      SIZ(t) = xn;
*86d7f5d3SJohn Marino      mpz_aorsmul_1 (w, t, (mp_limb_t) y & GMP_NUMB_MASK, (mp_size_t) -1);
*86d7f5d3SJohn Marino      TMP_FREE;
*86d7f5d3SJohn Marino      return;
*86d7f5d3SJohn Marino    }
*86d7f5d3SJohn Marino#endif
*86d7f5d3SJohn Marino  mpz_aorsmul_1 (w, x, (mp_limb_t) y & GMP_NUMB_MASK, (mp_size_t) -1);
*86d7f5d3SJohn Marino}