binutils-2.27/gas/flonum-mult.c

*a9fa9459Szrj/* flonum_mult.c - multiply two flonums
*a9fa9459Szrj   Copyright (C) 1987-2016 Free Software Foundation, Inc.
*a9fa9459Szrj
*a9fa9459Szrj   This file is part of GAS, the GNU Assembler.
*a9fa9459Szrj
*a9fa9459Szrj   GAS is free software; you can redistribute it and/or modify
*a9fa9459Szrj   it under the terms of the GNU General Public License as published by
*a9fa9459Szrj   the Free Software Foundation; either version 3, or (at your option)
*a9fa9459Szrj   any later version.
*a9fa9459Szrj
*a9fa9459Szrj   GAS is distributed in the hope that it will be useful, but WITHOUT
*a9fa9459Szrj   ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
*a9fa9459Szrj   or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public
*a9fa9459Szrj   License for more details.
*a9fa9459Szrj
*a9fa9459Szrj   You should have received a copy of the GNU General Public License
*a9fa9459Szrj   along with GAS; see the file COPYING.  If not, write to the Free
*a9fa9459Szrj   Software Foundation, 51 Franklin Street - Fifth Floor, Boston, MA
*a9fa9459Szrj   02110-1301, USA.  */
*a9fa9459Szrj
*a9fa9459Szrj#include "ansidecl.h"
*a9fa9459Szrj#include "flonum.h"
*a9fa9459Szrj
*a9fa9459Szrj/*	plan for a . b => p(roduct)
*a9fa9459Szrj
*a9fa9459Szrj	+-------+-------+-/   /-+-------+-------+
*a9fa9459Szrj	| a	| a	|  ...	| a	| a	|
*a9fa9459Szrj	|  A	|  A-1	|	|  1	|  0	|
*a9fa9459Szrj	+-------+-------+-/   /-+-------+-------+
*a9fa9459Szrj
*a9fa9459Szrj	+-------+-------+-/   /-+-------+-------+
*a9fa9459Szrj	| b	| b	|  ...	| b	| b	|
*a9fa9459Szrj	|  B	|  B-1	|	|  1	|  0	|
*a9fa9459Szrj	+-------+-------+-/   /-+-------+-------+
*a9fa9459Szrj
*a9fa9459Szrj	+-------+-------+-/   /-+-------+-/   /-+-------+-------+
*a9fa9459Szrj	| p	| p	|  ...	| p	|  ...	| p	| p	|
*a9fa9459Szrj	|  A+B+1|  A+B	|	|  N	|	|  1	|  0	|
*a9fa9459Szrj	+-------+-------+-/   /-+-------+-/   /-+-------+-------+
*a9fa9459Szrj
*a9fa9459Szrj	/^\
*a9fa9459Szrj	(carry) a .b	   ...	    |	   ...	 a .b	 a .b
*a9fa9459Szrj	A  B 		    |		  0  1	  0  0
*a9fa9459Szrj	|
*a9fa9459Szrj	...	    |	   ...	 a .b
*a9fa9459Szrj	|		  1  0
*a9fa9459Szrj	|
*a9fa9459Szrj	|	   ...
*a9fa9459Szrj	|
*a9fa9459Szrj	|
*a9fa9459Szrj	|
*a9fa9459Szrj	|		  ___
*a9fa9459Szrj	|		  \
*a9fa9459Szrj	+-----  P  =   >  a .b
*a9fa9459Szrj	N	  /__  i  j
*a9fa9459Szrj
*a9fa9459Szrj	N = 0 ... A+B
*a9fa9459Szrj
*a9fa9459Szrj	for all i,j where i+j=N
*a9fa9459Szrj	[i,j integers > 0]
*a9fa9459Szrj
*a9fa9459Szrj	a[], b[], p[] may not intersect.
*a9fa9459Szrj	Zero length factors signify 0 significant bits: treat as 0.0.
*a9fa9459Szrj	0.0 factors do the right thing.
*a9fa9459Szrj	Zero length product OK.
*a9fa9459Szrj
*a9fa9459Szrj	I chose the ForTran accent "foo[bar]" instead of the C accent "*garply"
*a9fa9459Szrj	because I felt the ForTran way was more intuitive. The C way would
*a9fa9459Szrj	probably yield better code on most C compilers. Dean Elsner.
*a9fa9459Szrj	(C style also gives deeper insight [to me] ... oh well ...)  */
*a9fa9459Szrj
*a9fa9459Szrjvoid
*a9fa9459Szrjflonum_multip (const FLONUM_TYPE *a, const FLONUM_TYPE *b,
*a9fa9459Szrj	       FLONUM_TYPE *product)
*a9fa9459Szrj{
*a9fa9459Szrj  int size_of_a;		/* 0 origin  */
*a9fa9459Szrj  int size_of_b;		/* 0 origin  */
*a9fa9459Szrj  int size_of_product;		/* 0 origin  */
*a9fa9459Szrj  int size_of_sum;		/* 0 origin  */
*a9fa9459Szrj  int extra_product_positions;	/* 1 origin  */
*a9fa9459Szrj  unsigned long work;
*a9fa9459Szrj  unsigned long carry;
*a9fa9459Szrj  long exponent;
*a9fa9459Szrj  LITTLENUM_TYPE *q;
*a9fa9459Szrj  long significant;		/* TRUE when we emit a non-0 littlenum  */
*a9fa9459Szrj  /* ForTran accent follows.  */
*a9fa9459Szrj  int P;			/* Scan product low-order -> high.  */
*a9fa9459Szrj  int N;			/* As in sum above.  */
*a9fa9459Szrj  int A;			/* Which [] of a?  */
*a9fa9459Szrj  int B;			/* Which [] of b?  */
*a9fa9459Szrj
*a9fa9459Szrj  if ((a->sign != '-' && a->sign != '+')
*a9fa9459Szrj      || (b->sign != '-' && b->sign != '+'))
*a9fa9459Szrj    {
*a9fa9459Szrj      /* Got to fail somehow.  Any suggestions?  */
*a9fa9459Szrj      product->sign = 0;
*a9fa9459Szrj      return;
*a9fa9459Szrj    }
*a9fa9459Szrj  product->sign = (a->sign == b->sign) ? '+' : '-';
*a9fa9459Szrj  size_of_a = a->leader - a->low;
*a9fa9459Szrj  size_of_b = b->leader - b->low;
*a9fa9459Szrj  exponent = a->exponent + b->exponent;
*a9fa9459Szrj  size_of_product = product->high - product->low;
*a9fa9459Szrj  size_of_sum = size_of_a + size_of_b;
*a9fa9459Szrj  extra_product_positions = size_of_product - size_of_sum;
*a9fa9459Szrj  if (extra_product_positions < 0)
*a9fa9459Szrj    {
*a9fa9459Szrj      P = extra_product_positions;	/* P < 0  */
*a9fa9459Szrj      exponent -= extra_product_positions;	/* Increases exponent.  */
*a9fa9459Szrj    }
*a9fa9459Szrj  else
*a9fa9459Szrj    {
*a9fa9459Szrj      P = 0;
*a9fa9459Szrj    }
*a9fa9459Szrj  carry = 0;
*a9fa9459Szrj  significant = 0;
*a9fa9459Szrj  for (N = 0; N <= size_of_sum; N++)
*a9fa9459Szrj    {
*a9fa9459Szrj      work = carry;
*a9fa9459Szrj      carry = 0;
*a9fa9459Szrj      for (A = 0; A <= N; A++)
*a9fa9459Szrj	{
*a9fa9459Szrj	  B = N - A;
*a9fa9459Szrj	  if (A <= size_of_a && B <= size_of_b && B >= 0)
*a9fa9459Szrj	    {
*a9fa9459Szrj#ifdef TRACE
*a9fa9459Szrj	      printf ("a:low[%d.]=%04x b:low[%d.]=%04x work_before=%08x\n",
*a9fa9459Szrj		      A, a->low[A], B, b->low[B], work);
*a9fa9459Szrj#endif
*a9fa9459Szrj	      /* Watch out for sign extension!  Without the casts, on
*a9fa9459Szrj		 the DEC Alpha, the multiplication result is *signed*
*a9fa9459Szrj		 int, which gets sign-extended to convert to the
*a9fa9459Szrj		 unsigned long!  */
*a9fa9459Szrj	      work += (unsigned long) a->low[A] * (unsigned long) b->low[B];
*a9fa9459Szrj	      carry += work >> LITTLENUM_NUMBER_OF_BITS;
*a9fa9459Szrj	      work &= LITTLENUM_MASK;
*a9fa9459Szrj#ifdef TRACE
*a9fa9459Szrj	      printf ("work=%08x carry=%04x\n", work, carry);
*a9fa9459Szrj#endif
*a9fa9459Szrj	    }
*a9fa9459Szrj	}
*a9fa9459Szrj      significant |= work;
*a9fa9459Szrj      if (significant || P < 0)
*a9fa9459Szrj	{
*a9fa9459Szrj	  if (P >= 0)
*a9fa9459Szrj	    {
*a9fa9459Szrj	      product->low[P] = work;
*a9fa9459Szrj#ifdef TRACE
*a9fa9459Szrj	      printf ("P=%d. work[p]:=%04x\n", P, work);
*a9fa9459Szrj#endif
*a9fa9459Szrj	    }
*a9fa9459Szrj	  P++;
*a9fa9459Szrj	}
*a9fa9459Szrj      else
*a9fa9459Szrj	{
*a9fa9459Szrj	  extra_product_positions++;
*a9fa9459Szrj	  exponent++;
*a9fa9459Szrj	}
*a9fa9459Szrj    }
*a9fa9459Szrj  /* [P]-> position # size_of_sum + 1.
*a9fa9459Szrj     This is where 'carry' should go.  */
*a9fa9459Szrj#ifdef TRACE
*a9fa9459Szrj  printf ("final carry =%04x\n", carry);
*a9fa9459Szrj#endif
*a9fa9459Szrj  if (carry)
*a9fa9459Szrj    {
*a9fa9459Szrj      if (extra_product_positions > 0)
*a9fa9459Szrj	product->low[P] = carry;
*a9fa9459Szrj      else
*a9fa9459Szrj	{
*a9fa9459Szrj	  /* No room at high order for carry littlenum.  */
*a9fa9459Szrj	  /* Shift right 1 to make room for most significant littlenum.  */
*a9fa9459Szrj	  exponent++;
*a9fa9459Szrj	  P--;
*a9fa9459Szrj	  for (q = product->low + P; q >= product->low; q--)
*a9fa9459Szrj	    {
*a9fa9459Szrj	      work = *q;
*a9fa9459Szrj	      *q = carry;
*a9fa9459Szrj	      carry = work;
*a9fa9459Szrj	    }
*a9fa9459Szrj	}
*a9fa9459Szrj    }
*a9fa9459Szrj  else
*a9fa9459Szrj    P--;
*a9fa9459Szrj  product->leader = product->low + P;
*a9fa9459Szrj  product->exponent = exponent;
*a9fa9459Szrj}