config/soft-fp/op-2.h

169689Skan/* Software floating-point emulation.
169689Skan   Basic two-word fraction declaration and manipulation.
171825Skan   Copyright (C) 1997,1998,1999,2006,2007 Free Software Foundation, Inc.
169689Skan   This file is part of the GNU C Library.
169689Skan   Contributed by Richard Henderson (rth@cygnus.com),
169689Skan		  Jakub Jelinek (jj@ultra.linux.cz),
169689Skan		  David S. Miller (davem@redhat.com) and
169689Skan		  Peter Maydell (pmaydell@chiark.greenend.org.uk).
169689Skan
169689Skan   The GNU C Library is free software; you can redistribute it and/or
169689Skan   modify it under the terms of the GNU Lesser General Public
169689Skan   License as published by the Free Software Foundation; either
169689Skan   version 2.1 of the License, or (at your option) any later version.
169689Skan
169689Skan   In addition to the permissions in the GNU Lesser General Public
169689Skan   License, the Free Software Foundation gives you unlimited
169689Skan   permission to link the compiled version of this file into
169689Skan   combinations with other programs, and to distribute those
169689Skan   combinations without any restriction coming from the use of this
169689Skan   file.  (The Lesser General Public License restrictions do apply in
169689Skan   other respects; for example, they cover modification of the file,
169689Skan   and distribution when not linked into a combine executable.)
169689Skan
169689Skan   The GNU C Library is distributed in the hope that it will be useful,
169689Skan   but WITHOUT ANY WARRANTY; without even the implied warranty of
169689Skan   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
169689Skan   Lesser General Public License for more details.
169689Skan
169689Skan   You should have received a copy of the GNU Lesser General Public
169689Skan   License along with the GNU C Library; if not, write to the Free
169689Skan   Software Foundation, 51 Franklin Street, Fifth Floor, Boston,
169689Skan   MA 02110-1301, USA.  */
169689Skan
169689Skan#define _FP_FRAC_DECL_2(X)	_FP_W_TYPE X##_f0, X##_f1
169689Skan#define _FP_FRAC_COPY_2(D,S)	(D##_f0 = S##_f0, D##_f1 = S##_f1)
169689Skan#define _FP_FRAC_SET_2(X,I)	__FP_FRAC_SET_2(X, I)
169689Skan#define _FP_FRAC_HIGH_2(X)	(X##_f1)
169689Skan#define _FP_FRAC_LOW_2(X)	(X##_f0)
169689Skan#define _FP_FRAC_WORD_2(X,w)	(X##_f##w)
169689Skan
169689Skan#define _FP_FRAC_SLL_2(X,N)						    \
169689Skan(void)(((N) < _FP_W_TYPE_SIZE)						    \
169689Skan       ? ({								    \
169689Skan	    if (__builtin_constant_p(N) && (N) == 1)			    \
169689Skan	      {								    \
169689Skan		X##_f1 = X##_f1 + X##_f1 + (((_FP_WS_TYPE)(X##_f0)) < 0);   \
169689Skan		X##_f0 += X##_f0;					    \
169689Skan	      }								    \
169689Skan	    else							    \
169689Skan	      {								    \
169689Skan		X##_f1 = X##_f1 << (N) | X##_f0 >> (_FP_W_TYPE_SIZE - (N)); \
169689Skan		X##_f0 <<= (N);						    \
169689Skan	      }								    \
169689Skan	    0;								    \
169689Skan	  })								    \
169689Skan       : ({								    \
169689Skan	    X##_f1 = X##_f0 << ((N) - _FP_W_TYPE_SIZE);			    \
169689Skan	    X##_f0 = 0;							    \
169689Skan	  }))
169689Skan
169689Skan
169689Skan#define _FP_FRAC_SRL_2(X,N)						\
169689Skan(void)(((N) < _FP_W_TYPE_SIZE)						\
169689Skan       ? ({								\
169689Skan	    X##_f0 = X##_f0 >> (N) | X##_f1 << (_FP_W_TYPE_SIZE - (N));	\
169689Skan	    X##_f1 >>= (N);						\
169689Skan	  })								\
169689Skan       : ({								\
169689Skan	    X##_f0 = X##_f1 >> ((N) - _FP_W_TYPE_SIZE);			\
169689Skan	    X##_f1 = 0;							\
169689Skan	  }))
169689Skan
169689Skan/* Right shift with sticky-lsb.  */
169689Skan#define _FP_FRAC_SRST_2(X,S, N,sz)					  \
169689Skan(void)(((N) < _FP_W_TYPE_SIZE)						  \
169689Skan       ? ({								  \
169689Skan	    S = (__builtin_constant_p(N) && (N) == 1			  \
169689Skan		 ? X##_f0 & 1						  \
169689Skan		 : (X##_f0 << (_FP_W_TYPE_SIZE - (N))) != 0);		  \
169689Skan	    X##_f0 = (X##_f1 << (_FP_W_TYPE_SIZE - (N)) | X##_f0 >> (N)); \
169689Skan	    X##_f1 >>= (N);						  \
169689Skan	  })								  \
169689Skan       : ({								  \
169689Skan	    S = ((((N) == _FP_W_TYPE_SIZE				  \
169689Skan		   ? 0							  \
169689Skan		   : (X##_f1 << (2*_FP_W_TYPE_SIZE - (N))))		  \
169689Skan		  | X##_f0) != 0);					  \
169689Skan	    X##_f0 = (X##_f1 >> ((N) - _FP_W_TYPE_SIZE));		  \
169689Skan	    X##_f1 = 0;							  \
169689Skan	  }))
169689Skan
169689Skan#define _FP_FRAC_SRS_2(X,N,sz)						  \
169689Skan(void)(((N) < _FP_W_TYPE_SIZE)						  \
169689Skan       ? ({								  \
169689Skan	    X##_f0 = (X##_f1 << (_FP_W_TYPE_SIZE - (N)) | X##_f0 >> (N) | \
169689Skan		      (__builtin_constant_p(N) && (N) == 1		  \
169689Skan		       ? X##_f0 & 1					  \
169689Skan		       : (X##_f0 << (_FP_W_TYPE_SIZE - (N))) != 0));	  \
169689Skan	    X##_f1 >>= (N);						  \
169689Skan	  })								  \
169689Skan       : ({								  \
169689Skan	    X##_f0 = (X##_f1 >> ((N) - _FP_W_TYPE_SIZE) |		  \
169689Skan		      ((((N) == _FP_W_TYPE_SIZE				  \
169689Skan			 ? 0						  \
169689Skan			 : (X##_f1 << (2*_FP_W_TYPE_SIZE - (N))))	  \
169689Skan			| X##_f0) != 0));				  \
169689Skan	    X##_f1 = 0;							  \
169689Skan	  }))
169689Skan
169689Skan#define _FP_FRAC_ADDI_2(X,I)	\
169689Skan  __FP_FRAC_ADDI_2(X##_f1, X##_f0, I)
169689Skan
169689Skan#define _FP_FRAC_ADD_2(R,X,Y)	\
169689Skan  __FP_FRAC_ADD_2(R##_f1, R##_f0, X##_f1, X##_f0, Y##_f1, Y##_f0)
169689Skan
169689Skan#define _FP_FRAC_SUB_2(R,X,Y)	\
169689Skan  __FP_FRAC_SUB_2(R##_f1, R##_f0, X##_f1, X##_f0, Y##_f1, Y##_f0)
169689Skan
169689Skan#define _FP_FRAC_DEC_2(X,Y)	\
169689Skan  __FP_FRAC_DEC_2(X##_f1, X##_f0, Y##_f1, Y##_f0)
169689Skan
169689Skan#define _FP_FRAC_CLZ_2(R,X)	\
169689Skan  do {				\
169689Skan    if (X##_f1)			\
169689Skan      __FP_CLZ(R,X##_f1);	\
169689Skan    else 			\
169689Skan    {				\
169689Skan      __FP_CLZ(R,X##_f0);	\
169689Skan      R += _FP_W_TYPE_SIZE;	\
169689Skan    }				\
169689Skan  } while(0)
169689Skan
169689Skan/* Predicates */
169689Skan#define _FP_FRAC_NEGP_2(X)	((_FP_WS_TYPE)X##_f1 < 0)
169689Skan#define _FP_FRAC_ZEROP_2(X)	((X##_f1 | X##_f0) == 0)
169689Skan#define _FP_FRAC_OVERP_2(fs,X)	(_FP_FRAC_HIGH_##fs(X) & _FP_OVERFLOW_##fs)
169689Skan#define _FP_FRAC_CLEAR_OVERP_2(fs,X)	(_FP_FRAC_HIGH_##fs(X) &= ~_FP_OVERFLOW_##fs)
169689Skan#define _FP_FRAC_EQ_2(X, Y)	(X##_f1 == Y##_f1 && X##_f0 == Y##_f0)
169689Skan#define _FP_FRAC_GT_2(X, Y)	\
169689Skan  (X##_f1 > Y##_f1 || (X##_f1 == Y##_f1 && X##_f0 > Y##_f0))
169689Skan#define _FP_FRAC_GE_2(X, Y)	\
169689Skan  (X##_f1 > Y##_f1 || (X##_f1 == Y##_f1 && X##_f0 >= Y##_f0))
169689Skan
169689Skan#define _FP_ZEROFRAC_2		0, 0
169689Skan#define _FP_MINFRAC_2		0, 1
169689Skan#define _FP_MAXFRAC_2		(~(_FP_WS_TYPE)0), (~(_FP_WS_TYPE)0)
169689Skan
169689Skan/*
169689Skan * Internals
169689Skan */
169689Skan
169689Skan#define __FP_FRAC_SET_2(X,I1,I0)	(X##_f0 = I0, X##_f1 = I1)
169689Skan
169689Skan#define __FP_CLZ_2(R, xh, xl)	\
169689Skan  do {				\
169689Skan    if (xh)			\
169689Skan      __FP_CLZ(R,xh);		\
169689Skan    else 			\
169689Skan    {				\
169689Skan      __FP_CLZ(R,xl);		\
169689Skan      R += _FP_W_TYPE_SIZE;	\
169689Skan    }				\
169689Skan  } while(0)
169689Skan
169689Skan#if 0
169689Skan
169689Skan#ifndef __FP_FRAC_ADDI_2
169689Skan#define __FP_FRAC_ADDI_2(xh, xl, i)	\
169689Skan  (xh += ((xl += i) < i))
169689Skan#endif
169689Skan#ifndef __FP_FRAC_ADD_2
169689Skan#define __FP_FRAC_ADD_2(rh, rl, xh, xl, yh, yl)	\
169689Skan  (rh = xh + yh + ((rl = xl + yl) < xl))
169689Skan#endif
169689Skan#ifndef __FP_FRAC_SUB_2
169689Skan#define __FP_FRAC_SUB_2(rh, rl, xh, xl, yh, yl)	\
169689Skan  (rh = xh - yh - ((rl = xl - yl) > xl))
169689Skan#endif
169689Skan#ifndef __FP_FRAC_DEC_2
169689Skan#define __FP_FRAC_DEC_2(xh, xl, yh, yl)	\
169689Skan  do {					\
169689Skan    UWtype _t = xl;			\
169689Skan    xh -= yh + ((xl -= yl) > _t);	\
169689Skan  } while (0)
169689Skan#endif
169689Skan
169689Skan#else
169689Skan
169689Skan#undef __FP_FRAC_ADDI_2
169689Skan#define __FP_FRAC_ADDI_2(xh, xl, i)	add_ssaaaa(xh, xl, xh, xl, 0, i)
169689Skan#undef __FP_FRAC_ADD_2
169689Skan#define __FP_FRAC_ADD_2			add_ssaaaa
169689Skan#undef __FP_FRAC_SUB_2
169689Skan#define __FP_FRAC_SUB_2			sub_ddmmss
169689Skan#undef __FP_FRAC_DEC_2
169689Skan#define __FP_FRAC_DEC_2(xh, xl, yh, yl)	sub_ddmmss(xh, xl, xh, xl, yh, yl)
169689Skan
169689Skan#endif
169689Skan
169689Skan/*
169689Skan * Unpack the raw bits of a native fp value.  Do not classify or
169689Skan * normalize the data.
169689Skan */
169689Skan
169689Skan#define _FP_UNPACK_RAW_2(fs, X, val)			\
169689Skan  do {							\
169689Skan    union _FP_UNION_##fs _flo; _flo.flt = (val);	\
169689Skan							\
169689Skan    X##_f0 = _flo.bits.frac0;				\
169689Skan    X##_f1 = _flo.bits.frac1;				\
169689Skan    X##_e  = _flo.bits.exp;				\
169689Skan    X##_s  = _flo.bits.sign;				\
169689Skan  } while (0)
169689Skan
169689Skan#define _FP_UNPACK_RAW_2_P(fs, X, val)			\
169689Skan  do {							\
169689Skan    union _FP_UNION_##fs *_flo =			\
169689Skan      (union _FP_UNION_##fs *)(val);			\
169689Skan							\
169689Skan    X##_f0 = _flo->bits.frac0;				\
169689Skan    X##_f1 = _flo->bits.frac1;				\
169689Skan    X##_e  = _flo->bits.exp;				\
169689Skan    X##_s  = _flo->bits.sign;				\
169689Skan  } while (0)
169689Skan
169689Skan
169689Skan/*
169689Skan * Repack the raw bits of a native fp value.
169689Skan */
169689Skan
169689Skan#define _FP_PACK_RAW_2(fs, val, X)			\
169689Skan  do {							\
169689Skan    union _FP_UNION_##fs _flo;				\
169689Skan							\
169689Skan    _flo.bits.frac0 = X##_f0;				\
169689Skan    _flo.bits.frac1 = X##_f1;				\
169689Skan    _flo.bits.exp   = X##_e;				\
169689Skan    _flo.bits.sign  = X##_s;				\
169689Skan							\
169689Skan    (val) = _flo.flt;					\
169689Skan  } while (0)
169689Skan
169689Skan#define _FP_PACK_RAW_2_P(fs, val, X)			\
169689Skan  do {							\
169689Skan    union _FP_UNION_##fs *_flo =			\
169689Skan      (union _FP_UNION_##fs *)(val);			\
169689Skan							\
169689Skan    _flo->bits.frac0 = X##_f0;				\
169689Skan    _flo->bits.frac1 = X##_f1;				\
169689Skan    _flo->bits.exp   = X##_e;				\
169689Skan    _flo->bits.sign  = X##_s;				\
169689Skan  } while (0)
169689Skan
169689Skan
169689Skan/*
169689Skan * Multiplication algorithms:
169689Skan */
169689Skan
169689Skan/* Given a 1W * 1W => 2W primitive, do the extended multiplication.  */
169689Skan
169689Skan#define _FP_MUL_MEAT_2_wide(wfracbits, R, X, Y, doit)			\
169689Skan  do {									\
169689Skan    _FP_FRAC_DECL_4(_z); _FP_FRAC_DECL_2(_b); _FP_FRAC_DECL_2(_c);	\
169689Skan									\
169689Skan    doit(_FP_FRAC_WORD_4(_z,1), _FP_FRAC_WORD_4(_z,0), X##_f0, Y##_f0);	\
169689Skan    doit(_b_f1, _b_f0, X##_f0, Y##_f1);					\
169689Skan    doit(_c_f1, _c_f0, X##_f1, Y##_f0);					\
169689Skan    doit(_FP_FRAC_WORD_4(_z,3), _FP_FRAC_WORD_4(_z,2), X##_f1, Y##_f1);	\
169689Skan									\
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
169689Skan		    _FP_FRAC_WORD_4(_z,1), 0, _b_f1, _b_f0,		\
169689Skan		    _FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
169689Skan		    _FP_FRAC_WORD_4(_z,1));				\
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
169689Skan		    _FP_FRAC_WORD_4(_z,1), 0, _c_f1, _c_f0,		\
169689Skan		    _FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
169689Skan		    _FP_FRAC_WORD_4(_z,1));				\
169689Skan									\
169689Skan    /* Normalize since we know where the msb of the multiplicands	\
169689Skan       were (bit B), we know that the msb of the of the product is	\
169689Skan       at either 2B or 2B-1.  */					\
169689Skan    _FP_FRAC_SRS_4(_z, wfracbits-1, 2*wfracbits);			\
169689Skan    R##_f0 = _FP_FRAC_WORD_4(_z,0);					\
169689Skan    R##_f1 = _FP_FRAC_WORD_4(_z,1);					\
169689Skan  } while (0)
169689Skan
169689Skan/* Given a 1W * 1W => 2W primitive, do the extended multiplication.
169689Skan   Do only 3 multiplications instead of four. This one is for machines
169689Skan   where multiplication is much more expensive than subtraction.  */
169689Skan
169689Skan#define _FP_MUL_MEAT_2_wide_3mul(wfracbits, R, X, Y, doit)		\
169689Skan  do {									\
169689Skan    _FP_FRAC_DECL_4(_z); _FP_FRAC_DECL_2(_b); _FP_FRAC_DECL_2(_c);	\
169689Skan    _FP_W_TYPE _d;							\
169689Skan    int _c1, _c2;							\
169689Skan									\
169689Skan    _b_f0 = X##_f0 + X##_f1;						\
169689Skan    _c1 = _b_f0 < X##_f0;						\
169689Skan    _b_f1 = Y##_f0 + Y##_f1;						\
169689Skan    _c2 = _b_f1 < Y##_f0;						\
169689Skan    doit(_d, _FP_FRAC_WORD_4(_z,0), X##_f0, Y##_f0);			\
169689Skan    doit(_FP_FRAC_WORD_4(_z,2), _FP_FRAC_WORD_4(_z,1), _b_f0, _b_f1);	\
169689Skan    doit(_c_f1, _c_f0, X##_f1, Y##_f1);					\
169689Skan									\
169689Skan    _b_f0 &= -_c2;							\
169689Skan    _b_f1 &= -_c1;							\
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
169689Skan		    _FP_FRAC_WORD_4(_z,1), (_c1 & _c2), 0, _d,		\
169689Skan		    0, _FP_FRAC_WORD_4(_z,2), _FP_FRAC_WORD_4(_z,1));	\
169689Skan    __FP_FRAC_ADDI_2(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
169689Skan		     _b_f0);						\
169689Skan    __FP_FRAC_ADDI_2(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
169689Skan		     _b_f1);						\
169689Skan    __FP_FRAC_DEC_3(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
169689Skan		    _FP_FRAC_WORD_4(_z,1),				\
169689Skan		    0, _d, _FP_FRAC_WORD_4(_z,0));			\
169689Skan    __FP_FRAC_DEC_3(_FP_FRAC_WORD_4(_z,3),_FP_FRAC_WORD_4(_z,2),	\
169689Skan		    _FP_FRAC_WORD_4(_z,1), 0, _c_f1, _c_f0);		\
169689Skan    __FP_FRAC_ADD_2(_FP_FRAC_WORD_4(_z,3), _FP_FRAC_WORD_4(_z,2),	\
169689Skan		    _c_f1, _c_f0,					\
169689Skan		    _FP_FRAC_WORD_4(_z,3), _FP_FRAC_WORD_4(_z,2));	\
169689Skan									\
169689Skan    /* Normalize since we know where the msb of the multiplicands	\
169689Skan       were (bit B), we know that the msb of the of the product is	\
169689Skan       at either 2B or 2B-1.  */					\
169689Skan    _FP_FRAC_SRS_4(_z, wfracbits-1, 2*wfracbits);			\
169689Skan    R##_f0 = _FP_FRAC_WORD_4(_z,0);					\
169689Skan    R##_f1 = _FP_FRAC_WORD_4(_z,1);					\
169689Skan  } while (0)
169689Skan
169689Skan#define _FP_MUL_MEAT_2_gmp(wfracbits, R, X, Y)				\
169689Skan  do {									\
169689Skan    _FP_FRAC_DECL_4(_z);						\
169689Skan    _FP_W_TYPE _x[2], _y[2];						\
169689Skan    _x[0] = X##_f0; _x[1] = X##_f1;					\
169689Skan    _y[0] = Y##_f0; _y[1] = Y##_f1;					\
169689Skan									\
169689Skan    mpn_mul_n(_z_f, _x, _y, 2);						\
169689Skan									\
169689Skan    /* Normalize since we know where the msb of the multiplicands	\
169689Skan       were (bit B), we know that the msb of the of the product is	\
169689Skan       at either 2B or 2B-1.  */					\
169689Skan    _FP_FRAC_SRS_4(_z, wfracbits-1, 2*wfracbits);			\
169689Skan    R##_f0 = _z_f[0];							\
169689Skan    R##_f1 = _z_f[1];							\
169689Skan  } while (0)
169689Skan
169689Skan/* Do at most 120x120=240 bits multiplication using double floating
169689Skan   point multiplication.  This is useful if floating point
169689Skan   multiplication has much bigger throughput than integer multiply.
169689Skan   It is supposed to work for _FP_W_TYPE_SIZE 64 and wfracbits
169689Skan   between 106 and 120 only.
169689Skan   Caller guarantees that X and Y has (1LLL << (wfracbits - 1)) set.
169689Skan   SETFETZ is a macro which will disable all FPU exceptions and set rounding
169689Skan   towards zero,  RESETFE should optionally reset it back.  */
169689Skan
169689Skan#define _FP_MUL_MEAT_2_120_240_double(wfracbits, R, X, Y, setfetz, resetfe)	\
169689Skan  do {										\
169689Skan    static const double _const[] = {						\
169689Skan      /* 2^-24 */ 5.9604644775390625e-08,					\
169689Skan      /* 2^-48 */ 3.5527136788005009e-15,					\
169689Skan      /* 2^-72 */ 2.1175823681357508e-22,					\
169689Skan      /* 2^-96 */ 1.2621774483536189e-29,					\
169689Skan      /* 2^28 */ 2.68435456e+08,						\
169689Skan      /* 2^4 */ 1.600000e+01,							\
169689Skan      /* 2^-20 */ 9.5367431640625e-07,						\
169689Skan      /* 2^-44 */ 5.6843418860808015e-14,					\
169689Skan      /* 2^-68 */ 3.3881317890172014e-21,					\
169689Skan      /* 2^-92 */ 2.0194839173657902e-28,					\
169689Skan      /* 2^-116 */ 1.2037062152420224e-35};					\
169689Skan    double _a240, _b240, _c240, _d240, _e240, _f240, 				\
169689Skan	   _g240, _h240, _i240, _j240, _k240;					\
169689Skan    union { double d; UDItype i; } _l240, _m240, _n240, _o240,			\
169689Skan				   _p240, _q240, _r240, _s240;			\
169689Skan    UDItype _t240, _u240, _v240, _w240, _x240, _y240 = 0;			\
169689Skan										\
169689Skan    if (wfracbits < 106 || wfracbits > 120)					\
169689Skan      abort();									\
169689Skan										\
169689Skan    setfetz;									\
169689Skan										\
169689Skan    _e240 = (double)(long)(X##_f0 & 0xffffff);					\
169689Skan    _j240 = (double)(long)(Y##_f0 & 0xffffff);					\
169689Skan    _d240 = (double)(long)((X##_f0 >> 24) & 0xffffff);				\
169689Skan    _i240 = (double)(long)((Y##_f0 >> 24) & 0xffffff);				\
169689Skan    _c240 = (double)(long)(((X##_f1 << 16) & 0xffffff) | (X##_f0 >> 48));	\
169689Skan    _h240 = (double)(long)(((Y##_f1 << 16) & 0xffffff) | (Y##_f0 >> 48));	\
169689Skan    _b240 = (double)(long)((X##_f1 >> 8) & 0xffffff);				\
169689Skan    _g240 = (double)(long)((Y##_f1 >> 8) & 0xffffff);				\
169689Skan    _a240 = (double)(long)(X##_f1 >> 32);					\
169689Skan    _f240 = (double)(long)(Y##_f1 >> 32);					\
169689Skan    _e240 *= _const[3];								\
169689Skan    _j240 *= _const[3];								\
169689Skan    _d240 *= _const[2];								\
169689Skan    _i240 *= _const[2];								\
169689Skan    _c240 *= _const[1];								\
169689Skan    _h240 *= _const[1];								\
169689Skan    _b240 *= _const[0];								\
169689Skan    _g240 *= _const[0];								\
169689Skan    _s240.d =							      _e240*_j240;\
169689Skan    _r240.d =						_d240*_j240 + _e240*_i240;\
169689Skan    _q240.d =				  _c240*_j240 + _d240*_i240 + _e240*_h240;\
169689Skan    _p240.d =		    _b240*_j240 + _c240*_i240 + _d240*_h240 + _e240*_g240;\
169689Skan    _o240.d = _a240*_j240 + _b240*_i240 + _c240*_h240 + _d240*_g240 + _e240*_f240;\
169689Skan    _n240.d = _a240*_i240 + _b240*_h240 + _c240*_g240 + _d240*_f240;		\
169689Skan    _m240.d = _a240*_h240 + _b240*_g240 + _c240*_f240;				\
169689Skan    _l240.d = _a240*_g240 + _b240*_f240;					\
169689Skan    _k240 =   _a240*_f240;							\
169689Skan    _r240.d += _s240.d;								\
169689Skan    _q240.d += _r240.d;								\
169689Skan    _p240.d += _q240.d;								\
169689Skan    _o240.d += _p240.d;								\
169689Skan    _n240.d += _o240.d;								\
169689Skan    _m240.d += _n240.d;								\
169689Skan    _l240.d += _m240.d;								\
169689Skan    _k240 += _l240.d;								\
169689Skan    _s240.d -= ((_const[10]+_s240.d)-_const[10]);				\
169689Skan    _r240.d -= ((_const[9]+_r240.d)-_const[9]);					\
169689Skan    _q240.d -= ((_const[8]+_q240.d)-_const[8]);					\
169689Skan    _p240.d -= ((_const[7]+_p240.d)-_const[7]);					\
169689Skan    _o240.d += _const[7];							\
169689Skan    _n240.d += _const[6];							\
169689Skan    _m240.d += _const[5];							\
169689Skan    _l240.d += _const[4];							\
169689Skan    if (_s240.d != 0.0) _y240 = 1;						\
169689Skan    if (_r240.d != 0.0) _y240 = 1;						\
169689Skan    if (_q240.d != 0.0) _y240 = 1;						\
169689Skan    if (_p240.d != 0.0) _y240 = 1;						\
169689Skan    _t240 = (DItype)_k240;							\
169689Skan    _u240 = _l240.i;								\
169689Skan    _v240 = _m240.i;								\
169689Skan    _w240 = _n240.i;								\
169689Skan    _x240 = _o240.i;								\
169689Skan    R##_f1 = (_t240 << (128 - (wfracbits - 1)))					\
169689Skan	     | ((_u240 & 0xffffff) >> ((wfracbits - 1) - 104));			\
169689Skan    R##_f0 = ((_u240 & 0xffffff) << (168 - (wfracbits - 1)))			\
169689Skan    	     | ((_v240 & 0xffffff) << (144 - (wfracbits - 1)))			\
169689Skan    	     | ((_w240 & 0xffffff) << (120 - (wfracbits - 1)))			\
169689Skan    	     | ((_x240 & 0xffffff) >> ((wfracbits - 1) - 96))			\
169689Skan    	     | _y240;								\
169689Skan    resetfe;									\
169689Skan  } while (0)
169689Skan
169689Skan/*
169689Skan * Division algorithms:
169689Skan */
169689Skan
169689Skan#define _FP_DIV_MEAT_2_udiv(fs, R, X, Y)				\
169689Skan  do {									\
169689Skan    _FP_W_TYPE _n_f2, _n_f1, _n_f0, _r_f1, _r_f0, _m_f1, _m_f0;		\
169689Skan    if (_FP_FRAC_GT_2(X, Y))						\
169689Skan      {									\
169689Skan	_n_f2 = X##_f1 >> 1;						\
169689Skan	_n_f1 = X##_f1 << (_FP_W_TYPE_SIZE - 1) | X##_f0 >> 1;		\
169689Skan	_n_f0 = X##_f0 << (_FP_W_TYPE_SIZE - 1);			\
169689Skan      }									\
169689Skan    else								\
169689Skan      {									\
169689Skan	R##_e--;							\
169689Skan	_n_f2 = X##_f1;							\
169689Skan	_n_f1 = X##_f0;							\
169689Skan	_n_f0 = 0;							\
169689Skan      }									\
169689Skan									\
169689Skan    /* Normalize, i.e. make the most significant bit of the 		\
169689Skan       denominator set. */						\
169689Skan    _FP_FRAC_SLL_2(Y, _FP_WFRACXBITS_##fs);				\
169689Skan									\
169689Skan    udiv_qrnnd(R##_f1, _r_f1, _n_f2, _n_f1, Y##_f1);			\
169689Skan    umul_ppmm(_m_f1, _m_f0, R##_f1, Y##_f0);				\
169689Skan    _r_f0 = _n_f0;							\
169689Skan    if (_FP_FRAC_GT_2(_m, _r))						\
169689Skan      {									\
169689Skan	R##_f1--;							\
169689Skan	_FP_FRAC_ADD_2(_r, Y, _r);					\
169689Skan	if (_FP_FRAC_GE_2(_r, Y) && _FP_FRAC_GT_2(_m, _r))		\
169689Skan	  {								\
169689Skan	    R##_f1--;							\
169689Skan	    _FP_FRAC_ADD_2(_r, Y, _r);					\
169689Skan	  }								\
169689Skan      }									\
169689Skan    _FP_FRAC_DEC_2(_r, _m);						\
169689Skan									\
169689Skan    if (_r_f1 == Y##_f1)						\
169689Skan      {									\
169689Skan	/* This is a special case, not an optimization			\
169689Skan	   (_r/Y##_f1 would not fit into UWtype).			\
169689Skan	   As _r is guaranteed to be < Y,  R##_f0 can be either		\
169689Skan	   (UWtype)-1 or (UWtype)-2.  But as we know what kind		\
169689Skan	   of bits it is (sticky, guard, round),  we don't care.	\
169689Skan	   We also don't care what the reminder is,  because the	\
169689Skan	   guard bit will be set anyway.  -jj */			\
169689Skan	R##_f0 = -1;							\
169689Skan      }									\
169689Skan    else								\
169689Skan      {									\
169689Skan	udiv_qrnnd(R##_f0, _r_f1, _r_f1, _r_f0, Y##_f1);		\
169689Skan	umul_ppmm(_m_f1, _m_f0, R##_f0, Y##_f0);			\
169689Skan	_r_f0 = 0;							\
169689Skan	if (_FP_FRAC_GT_2(_m, _r))					\
169689Skan	  {								\
169689Skan	    R##_f0--;							\
169689Skan	    _FP_FRAC_ADD_2(_r, Y, _r);					\
169689Skan	    if (_FP_FRAC_GE_2(_r, Y) && _FP_FRAC_GT_2(_m, _r))		\
169689Skan	      {								\
169689Skan		R##_f0--;						\
169689Skan		_FP_FRAC_ADD_2(_r, Y, _r);				\
169689Skan	      }								\
169689Skan	  }								\
169689Skan	if (!_FP_FRAC_EQ_2(_r, _m))					\
169689Skan	  R##_f0 |= _FP_WORK_STICKY;					\
169689Skan      }									\
169689Skan  } while (0)
169689Skan
169689Skan
169689Skan#define _FP_DIV_MEAT_2_gmp(fs, R, X, Y)					\
169689Skan  do {									\
169689Skan    _FP_W_TYPE _x[4], _y[2], _z[4];					\
169689Skan    _y[0] = Y##_f0; _y[1] = Y##_f1;					\
169689Skan    _x[0] = _x[3] = 0;							\
169689Skan    if (_FP_FRAC_GT_2(X, Y))						\
169689Skan      {									\
169689Skan	R##_e++;							\
169689Skan	_x[1] = (X##_f0 << (_FP_WFRACBITS_##fs-1 - _FP_W_TYPE_SIZE) |	\
169689Skan		 X##_f1 >> (_FP_W_TYPE_SIZE -				\
169689Skan			    (_FP_WFRACBITS_##fs-1 - _FP_W_TYPE_SIZE)));	\
169689Skan	_x[2] = X##_f1 << (_FP_WFRACBITS_##fs-1 - _FP_W_TYPE_SIZE);	\
169689Skan      }									\
169689Skan    else								\
169689Skan      {									\
169689Skan	_x[1] = (X##_f0 << (_FP_WFRACBITS_##fs - _FP_W_TYPE_SIZE) |	\
169689Skan		 X##_f1 >> (_FP_W_TYPE_SIZE -				\
169689Skan			    (_FP_WFRACBITS_##fs - _FP_W_TYPE_SIZE)));	\
169689Skan	_x[2] = X##_f1 << (_FP_WFRACBITS_##fs - _FP_W_TYPE_SIZE);	\
169689Skan      }									\
169689Skan									\
169689Skan    (void) mpn_divrem (_z, 0, _x, 4, _y, 2);				\
169689Skan    R##_f1 = _z[1];							\
169689Skan    R##_f0 = _z[0] | ((_x[0] | _x[1]) != 0);				\
169689Skan  } while (0)
169689Skan
169689Skan
169689Skan/*
169689Skan * Square root algorithms:
169689Skan * We have just one right now, maybe Newton approximation
169689Skan * should be added for those machines where division is fast.
169689Skan */
169689Skan
169689Skan#define _FP_SQRT_MEAT_2(R, S, T, X, q)			\
169689Skan  do {							\
169689Skan    while (q)						\
169689Skan      {							\
169689Skan	T##_f1 = S##_f1 + q;				\
169689Skan	if (T##_f1 <= X##_f1)				\
169689Skan	  {						\
169689Skan	    S##_f1 = T##_f1 + q;			\
169689Skan	    X##_f1 -= T##_f1;				\
169689Skan	    R##_f1 += q;				\
169689Skan	  }						\
169689Skan	_FP_FRAC_SLL_2(X, 1);				\
169689Skan	q >>= 1;					\
169689Skan      }							\
169689Skan    q = (_FP_W_TYPE)1 << (_FP_W_TYPE_SIZE - 1);		\
169689Skan    while (q != _FP_WORK_ROUND)				\
169689Skan      {							\
169689Skan	T##_f0 = S##_f0 + q;				\
169689Skan	T##_f1 = S##_f1;				\
169689Skan	if (T##_f1 < X##_f1 || 				\
169689Skan	    (T##_f1 == X##_f1 && T##_f0 <= X##_f0))	\
169689Skan	  {						\
169689Skan	    S##_f0 = T##_f0 + q;			\
169689Skan	    S##_f1 += (T##_f0 > S##_f0);		\
169689Skan	    _FP_FRAC_DEC_2(X, T);			\
169689Skan	    R##_f0 += q;				\
169689Skan	  }						\
169689Skan	_FP_FRAC_SLL_2(X, 1);				\
169689Skan	q >>= 1;					\
169689Skan      }							\
169689Skan    if (X##_f0 | X##_f1)				\
169689Skan      {							\
169689Skan	if (S##_f1 < X##_f1 || 				\
169689Skan	    (S##_f1 == X##_f1 && S##_f0 < X##_f0))	\
169689Skan	  R##_f0 |= _FP_WORK_ROUND;			\
169689Skan	R##_f0 |= _FP_WORK_STICKY;			\
169689Skan      }							\
169689Skan  } while (0)
169689Skan
169689Skan
169689Skan/*
169689Skan * Assembly/disassembly for converting to/from integral types.
169689Skan * No shifting or overflow handled here.
169689Skan */
169689Skan
169689Skan#define _FP_FRAC_ASSEMBLE_2(r, X, rsize)	\
169689Skan(void)((rsize <= _FP_W_TYPE_SIZE)		\
169689Skan       ? ({ r = X##_f0; })			\
169689Skan       : ({					\
169689Skan	    r = X##_f1;				\
169689Skan	    r <<= _FP_W_TYPE_SIZE;		\
169689Skan	    r += X##_f0;			\
169689Skan	  }))
169689Skan
169689Skan#define _FP_FRAC_DISASSEMBLE_2(X, r, rsize)				\
169689Skan  do {									\
169689Skan    X##_f0 = r;								\
169689Skan    X##_f1 = (rsize <= _FP_W_TYPE_SIZE ? 0 : r >> _FP_W_TYPE_SIZE);	\
169689Skan  } while (0)
169689Skan
169689Skan/*
169689Skan * Convert FP values between word sizes
169689Skan */
169689Skan
169689Skan#define _FP_FRAC_COPY_1_2(D, S)		(D##_f = S##_f0)
169689Skan
169689Skan#define _FP_FRAC_COPY_2_1(D, S)		((D##_f0 = S##_f), (D##_f1 = 0))
171825Skan
171825Skan#define _FP_FRAC_COPY_2_2(D,S)		_FP_FRAC_COPY_2(D,S)