config/soft-fp/op-4.h

169689Skan/* Software floating-point emulation.
169689Skan   Basic four-word fraction declaration and manipulation.
171825Skan   Copyright (C) 1997,1998,1999,2006,2007 Free Software Foundation, Inc.
169689Skan   This file is part of the GNU C Library.
169689Skan   Contributed by Richard Henderson (rth@cygnus.com),
169689Skan		  Jakub Jelinek (jj@ultra.linux.cz),
169689Skan		  David S. Miller (davem@redhat.com) and
169689Skan		  Peter Maydell (pmaydell@chiark.greenend.org.uk).
169689Skan
169689Skan   The GNU C Library is free software; you can redistribute it and/or
169689Skan   modify it under the terms of the GNU Lesser General Public
169689Skan   License as published by the Free Software Foundation; either
169689Skan   version 2.1 of the License, or (at your option) any later version.
169689Skan
169689Skan   In addition to the permissions in the GNU Lesser General Public
169689Skan   License, the Free Software Foundation gives you unlimited
169689Skan   permission to link the compiled version of this file into
169689Skan   combinations with other programs, and to distribute those
169689Skan   combinations without any restriction coming from the use of this
169689Skan   file.  (The Lesser General Public License restrictions do apply in
169689Skan   other respects; for example, they cover modification of the file,
169689Skan   and distribution when not linked into a combine executable.)
169689Skan
169689Skan   The GNU C Library is distributed in the hope that it will be useful,
169689Skan   but WITHOUT ANY WARRANTY; without even the implied warranty of
169689Skan   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
169689Skan   Lesser General Public License for more details.
169689Skan
169689Skan   You should have received a copy of the GNU Lesser General Public
169689Skan   License along with the GNU C Library; if not, write to the Free
169689Skan   Software Foundation, 51 Franklin Street, Fifth Floor, Boston,
169689Skan   MA 02110-1301, USA.  */
169689Skan
169689Skan#define _FP_FRAC_DECL_4(X)	_FP_W_TYPE X##_f[4]
169689Skan#define _FP_FRAC_COPY_4(D,S)			\
169689Skan  (D##_f[0] = S##_f[0], D##_f[1] = S##_f[1],	\
169689Skan   D##_f[2] = S##_f[2], D##_f[3] = S##_f[3])
169689Skan#define _FP_FRAC_SET_4(X,I)	__FP_FRAC_SET_4(X, I)
169689Skan#define _FP_FRAC_HIGH_4(X)	(X##_f[3])
169689Skan#define _FP_FRAC_LOW_4(X)	(X##_f[0])
169689Skan#define _FP_FRAC_WORD_4(X,w)	(X##_f[w])
169689Skan
169689Skan#define _FP_FRAC_SLL_4(X,N)						\
169689Skan  do {									\
169689Skan    _FP_I_TYPE _up, _down, _skip, _i;					\
169689Skan    _skip = (N) / _FP_W_TYPE_SIZE;					\
169689Skan    _up = (N) % _FP_W_TYPE_SIZE;					\
169689Skan    _down = _FP_W_TYPE_SIZE - _up;					\
169689Skan    if (!_up)								\
169689Skan      for (_i = 3; _i >= _skip; --_i)					\
169689Skan	X##_f[_i] = X##_f[_i-_skip];					\
169689Skan    else								\
169689Skan      {									\
169689Skan	for (_i = 3; _i > _skip; --_i)					\
169689Skan	  X##_f[_i] = X##_f[_i-_skip] << _up				\
169689Skan		      | X##_f[_i-_skip-1] >> _down;			\
169689Skan	X##_f[_i--] = X##_f[0] << _up; 					\
169689Skan      }									\
169689Skan    for (; _i >= 0; --_i)						\
169689Skan      X##_f[_i] = 0;							\
169689Skan  } while (0)
169689Skan
169689Skan/* This one was broken too */
169689Skan#define _FP_FRAC_SRL_4(X,N)						\
169689Skan  do {									\
169689Skan    _FP_I_TYPE _up, _down, _skip, _i;					\
169689Skan    _skip = (N) / _FP_W_TYPE_SIZE;					\
169689Skan    _down = (N) % _FP_W_TYPE_SIZE;					\
169689Skan    _up = _FP_W_TYPE_SIZE - _down;					\
169689Skan    if (!_down)								\
169689Skan      for (_i = 0; _i <= 3-_skip; ++_i)					\
169689Skan	X##_f[_i] = X##_f[_i+_skip];					\
169689Skan    else								\
169689Skan      {									\
169689Skan	for (_i = 0; _i < 3-_skip; ++_i)				\
169689Skan	  X##_f[_i] = X##_f[_i+_skip] >> _down				\
169689Skan		      | X##_f[_i+_skip+1] << _up;			\
169689Skan	X##_f[_i++] = X##_f[3] >> _down;				\
169689Skan      }									\
169689Skan    for (; _i < 4; ++_i)						\
169689Skan      X##_f[_i] = 0;							\
169689Skan  } while (0)
169689Skan
169689Skan
169689Skan/* Right shift with sticky-lsb.
169689Skan * What this actually means is that we do a standard right-shift,
169689Skan * but that if any of the bits that fall off the right hand side
169689Skan * were one then we always set the LSbit.
169689Skan */
169689Skan#define _FP_FRAC_SRST_4(X,S,N,size)			\
169689Skan  do {							\
169689Skan    _FP_I_TYPE _up, _down, _skip, _i;			\
169689Skan    _FP_W_TYPE _s;					\
169689Skan    _skip = (N) / _FP_W_TYPE_SIZE;			\
169689Skan    _down = (N) % _FP_W_TYPE_SIZE;			\
169689Skan    _up = _FP_W_TYPE_SIZE - _down;			\
169689Skan    for (_s = _i = 0; _i < _skip; ++_i)			\
169689Skan      _s |= X##_f[_i];					\
169689Skan    if (!_down)						\
169689Skan      for (_i = 0; _i <= 3-_skip; ++_i)			\
169689Skan	X##_f[_i] = X##_f[_i+_skip];			\
169689Skan    else						\
169689Skan      {							\
169689Skan	_s |= X##_f[_i] << _up;				\
169689Skan	for (_i = 0; _i < 3-_skip; ++_i)		\
169689Skan	  X##_f[_i] = X##_f[_i+_skip] >> _down		\
169689Skan		      | X##_f[_i+_skip+1] << _up;	\
169689Skan	X##_f[_i++] = X##_f[3] >> _down;		\
169689Skan      }							\
169689Skan    for (; _i < 4; ++_i)				\
169689Skan      X##_f[_i] = 0;					\
169689Skan    S = (_s != 0);					\
169689Skan  } while (0)
169689Skan
169689Skan#define _FP_FRAC_SRS_4(X,N,size)		\
169689Skan  do {						\
169689Skan    int _sticky;				\
169689Skan    _FP_FRAC_SRST_4(X, _sticky, N, size);	\
169689Skan    X##_f[0] |= _sticky;			\
169689Skan  } while (0)
169689Skan
169689Skan#define _FP_FRAC_ADD_4(R,X,Y)						\
169689Skan  __FP_FRAC_ADD_4(R##_f[3], R##_f[2], R##_f[1], R##_f[0],		\
169689Skan		  X##_f[3], X##_f[2], X##_f[1], X##_f[0],		\
169689Skan		  Y##_f[3], Y##_f[2], Y##_f[1], Y##_f[0])
169689Skan
169689Skan#define _FP_FRAC_SUB_4(R,X,Y)						\
169689Skan  __FP_FRAC_SUB_4(R##_f[3], R##_f[2], R##_f[1], R##_f[0],		\
169689Skan		  X##_f[3], X##_f[2], X##_f[1], X##_f[0],		\
169689Skan		  Y##_f[3], Y##_f[2], Y##_f[1], Y##_f[0])
169689Skan
169689Skan#define _FP_FRAC_DEC_4(X,Y)						\
169689Skan  __FP_FRAC_DEC_4(X##_f[3], X##_f[2], X##_f[1], X##_f[0],		\
169689Skan		  Y##_f[3], Y##_f[2], Y##_f[1], Y##_f[0])
169689Skan
169689Skan#define _FP_FRAC_ADDI_4(X,I)						\
169689Skan  __FP_FRAC_ADDI_4(X##_f[3], X##_f[2], X##_f[1], X##_f[0], I)
169689Skan
169689Skan#define _FP_ZEROFRAC_4  0,0,0,0
169689Skan#define _FP_MINFRAC_4   0,0,0,1
169689Skan#define _FP_MAXFRAC_4	(~(_FP_WS_TYPE)0), (~(_FP_WS_TYPE)0), (~(_FP_WS_TYPE)0), (~(_FP_WS_TYPE)0)
169689Skan
169689Skan#define _FP_FRAC_ZEROP_4(X)     ((X##_f[0] | X##_f[1] | X##_f[2] | X##_f[3]) == 0)
169689Skan#define _FP_FRAC_NEGP_4(X)      ((_FP_WS_TYPE)X##_f[3] < 0)
169689Skan#define _FP_FRAC_OVERP_4(fs,X)  (_FP_FRAC_HIGH_##fs(X) & _FP_OVERFLOW_##fs)
169689Skan#define _FP_FRAC_CLEAR_OVERP_4(fs,X)  (_FP_FRAC_HIGH_##fs(X) &= ~_FP_OVERFLOW_##fs)
169689Skan
169689Skan#define _FP_FRAC_EQ_4(X,Y)				\
169689Skan (X##_f[0] == Y##_f[0] && X##_f[1] == Y##_f[1]		\
169689Skan  && X##_f[2] == Y##_f[2] && X##_f[3] == Y##_f[3])
169689Skan
169689Skan#define _FP_FRAC_GT_4(X,Y)				\
169689Skan (X##_f[3] > Y##_f[3] ||				\
169689Skan  (X##_f[3] == Y##_f[3] && (X##_f[2] > Y##_f[2] ||	\
169689Skan   (X##_f[2] == Y##_f[2] && (X##_f[1] > Y##_f[1] ||	\
169689Skan    (X##_f[1] == Y##_f[1] && X##_f[0] > Y##_f[0])	\
169689Skan   ))							\
169689Skan  ))							\
169689Skan )
169689Skan
169689Skan#define _FP_FRAC_GE_4(X,Y)				\
169689Skan (X##_f[3] > Y##_f[3] ||				\
169689Skan  (X##_f[3] == Y##_f[3] && (X##_f[2] > Y##_f[2] ||	\
169689Skan   (X##_f[2] == Y##_f[2] && (X##_f[1] > Y##_f[1] ||	\
169689Skan    (X##_f[1] == Y##_f[1] && X##_f[0] >= Y##_f[0])	\
169689Skan   ))							\
169689Skan  ))							\
169689Skan )
169689Skan
169689Skan
169689Skan#define _FP_FRAC_CLZ_4(R,X)		\
169689Skan  do {					\
169689Skan    if (X##_f[3])			\
169689Skan    {					\
169689Skan	__FP_CLZ(R,X##_f[3]);		\
169689Skan    }					\
169689Skan    else if (X##_f[2])			\
169689Skan    {					\
169689Skan	__FP_CLZ(R,X##_f[2]);		\
169689Skan	R += _FP_W_TYPE_SIZE;		\
169689Skan    }					\
169689Skan    else if (X##_f[1])			\
169689Skan    {					\
169689Skan	__FP_CLZ(R,X##_f[1]);		\
169689Skan	R += _FP_W_TYPE_SIZE*2;		\
169689Skan    }					\
169689Skan    else				\
169689Skan    {					\
169689Skan	__FP_CLZ(R,X##_f[0]);		\
169689Skan	R += _FP_W_TYPE_SIZE*3;		\
169689Skan    }					\
169689Skan  } while(0)
169689Skan
169689Skan
169689Skan#define _FP_UNPACK_RAW_4(fs, X, val)				\
169689Skan  do {								\
169689Skan    union _FP_UNION_##fs _flo; _flo.flt = (val);		\
169689Skan    X##_f[0] = _flo.bits.frac0;					\
169689Skan    X##_f[1] = _flo.bits.frac1;					\
169689Skan    X##_f[2] = _flo.bits.frac2;					\
169689Skan    X##_f[3] = _flo.bits.frac3;					\
169689Skan    X##_e  = _flo.bits.exp;					\
169689Skan    X##_s  = _flo.bits.sign;					\
169689Skan  } while (0)
169689Skan
169689Skan#define _FP_UNPACK_RAW_4_P(fs, X, val)				\
169689Skan  do {								\
169689Skan    union _FP_UNION_##fs *_flo =				\
169689Skan      (union _FP_UNION_##fs *)(val);				\
169689Skan								\
169689Skan    X##_f[0] = _flo->bits.frac0;				\
169689Skan    X##_f[1] = _flo->bits.frac1;				\
169689Skan    X##_f[2] = _flo->bits.frac2;				\
169689Skan    X##_f[3] = _flo->bits.frac3;				\
169689Skan    X##_e  = _flo->bits.exp;					\
169689Skan    X##_s  = _flo->bits.sign;					\
169689Skan  } while (0)
169689Skan
169689Skan#define _FP_PACK_RAW_4(fs, val, X)				\
169689Skan  do {								\
169689Skan    union _FP_UNION_##fs _flo;					\
169689Skan    _flo.bits.frac0 = X##_f[0];					\
169689Skan    _flo.bits.frac1 = X##_f[1];					\
169689Skan    _flo.bits.frac2 = X##_f[2];					\
169689Skan    _flo.bits.frac3 = X##_f[3];					\
169689Skan    _flo.bits.exp   = X##_e;					\
169689Skan    _flo.bits.sign  = X##_s;					\
169689Skan    (val) = _flo.flt;				   		\
169689Skan  } while (0)
169689Skan
169689Skan#define _FP_PACK_RAW_4_P(fs, val, X)				\
169689Skan  do {								\
169689Skan    union _FP_UNION_##fs *_flo =				\
169689Skan      (union _FP_UNION_##fs *)(val);				\
169689Skan								\
169689Skan    _flo->bits.frac0 = X##_f[0];				\
169689Skan    _flo->bits.frac1 = X##_f[1];				\
169689Skan    _flo->bits.frac2 = X##_f[2];				\
169689Skan    _flo->bits.frac3 = X##_f[3];				\
169689Skan    _flo->bits.exp   = X##_e;					\
169689Skan    _flo->bits.sign  = X##_s;					\
169689Skan  } while (0)
169689Skan
169689Skan/*
169689Skan * Multiplication algorithms:
169689Skan */
169689Skan
169689Skan/* Given a 1W * 1W => 2W primitive, do the extended multiplication.  */
169689Skan
169689Skan#define _FP_MUL_MEAT_4_wide(wfracbits, R, X, Y, doit)			    \
169689Skan  do {									    \
169689Skan    _FP_FRAC_DECL_8(_z); _FP_FRAC_DECL_2(_b); _FP_FRAC_DECL_2(_c);	    \
169689Skan    _FP_FRAC_DECL_2(_d); _FP_FRAC_DECL_2(_e); _FP_FRAC_DECL_2(_f);	    \
169689Skan									    \
169689Skan    doit(_FP_FRAC_WORD_8(_z,1), _FP_FRAC_WORD_8(_z,0), X##_f[0], Y##_f[0]); \
169689Skan    doit(_b_f1, _b_f0, X##_f[0], Y##_f[1]);				    \
169689Skan    doit(_c_f1, _c_f0, X##_f[1], Y##_f[0]);				    \
169689Skan    doit(_d_f1, _d_f0, X##_f[1], Y##_f[1]);				    \
169689Skan    doit(_e_f1, _e_f0, X##_f[0], Y##_f[2]);				    \
169689Skan    doit(_f_f1, _f_f0, X##_f[2], Y##_f[0]);				    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,3),_FP_FRAC_WORD_8(_z,2),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,1), 0,_b_f1,_b_f0,		    \
169689Skan		    0,0,_FP_FRAC_WORD_8(_z,1));				    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,3),_FP_FRAC_WORD_8(_z,2),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,1), 0,_c_f1,_c_f0,		    \
169689Skan		    _FP_FRAC_WORD_8(_z,3),_FP_FRAC_WORD_8(_z,2),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,1));				    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,4),_FP_FRAC_WORD_8(_z,3),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,2), 0,_d_f1,_d_f0,		    \
169689Skan		    0,_FP_FRAC_WORD_8(_z,3),_FP_FRAC_WORD_8(_z,2));	    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,4),_FP_FRAC_WORD_8(_z,3),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,2), 0,_e_f1,_e_f0,		    \
169689Skan		    _FP_FRAC_WORD_8(_z,4),_FP_FRAC_WORD_8(_z,3),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,2));				    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,4),_FP_FRAC_WORD_8(_z,3),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,2), 0,_f_f1,_f_f0,		    \
169689Skan		    _FP_FRAC_WORD_8(_z,4),_FP_FRAC_WORD_8(_z,3),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,2));				    \
169689Skan    doit(_b_f1, _b_f0, X##_f[0], Y##_f[3]);				    \
169689Skan    doit(_c_f1, _c_f0, X##_f[3], Y##_f[0]);				    \
169689Skan    doit(_d_f1, _d_f0, X##_f[1], Y##_f[2]);				    \
169689Skan    doit(_e_f1, _e_f0, X##_f[2], Y##_f[1]);				    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,5),_FP_FRAC_WORD_8(_z,4),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,3), 0,_b_f1,_b_f0,		    \
169689Skan		    0,_FP_FRAC_WORD_8(_z,4),_FP_FRAC_WORD_8(_z,3));	    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,5),_FP_FRAC_WORD_8(_z,4),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,3), 0,_c_f1,_c_f0,		    \
169689Skan		    _FP_FRAC_WORD_8(_z,5),_FP_FRAC_WORD_8(_z,4),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,3));				    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,5),_FP_FRAC_WORD_8(_z,4),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,3), 0,_d_f1,_d_f0,		    \
169689Skan		    _FP_FRAC_WORD_8(_z,5),_FP_FRAC_WORD_8(_z,4),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,3));				    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,5),_FP_FRAC_WORD_8(_z,4),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,3), 0,_e_f1,_e_f0,		    \
169689Skan		    _FP_FRAC_WORD_8(_z,5),_FP_FRAC_WORD_8(_z,4),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,3));				    \
169689Skan    doit(_b_f1, _b_f0, X##_f[2], Y##_f[2]);				    \
169689Skan    doit(_c_f1, _c_f0, X##_f[1], Y##_f[3]);				    \
169689Skan    doit(_d_f1, _d_f0, X##_f[3], Y##_f[1]);				    \
169689Skan    doit(_e_f1, _e_f0, X##_f[2], Y##_f[3]);				    \
169689Skan    doit(_f_f1, _f_f0, X##_f[3], Y##_f[2]);				    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,6),_FP_FRAC_WORD_8(_z,5),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,4), 0,_b_f1,_b_f0,		    \
169689Skan		    0,_FP_FRAC_WORD_8(_z,5),_FP_FRAC_WORD_8(_z,4));	    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,6),_FP_FRAC_WORD_8(_z,5),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,4), 0,_c_f1,_c_f0,		    \
169689Skan		    _FP_FRAC_WORD_8(_z,6),_FP_FRAC_WORD_8(_z,5),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,4));				    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,6),_FP_FRAC_WORD_8(_z,5),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,4), 0,_d_f1,_d_f0,		    \
169689Skan		    _FP_FRAC_WORD_8(_z,6),_FP_FRAC_WORD_8(_z,5),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,4));				    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,7),_FP_FRAC_WORD_8(_z,6),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,5), 0,_e_f1,_e_f0,		    \
169689Skan		    0,_FP_FRAC_WORD_8(_z,6),_FP_FRAC_WORD_8(_z,5));	    \
169689Skan    __FP_FRAC_ADD_3(_FP_FRAC_WORD_8(_z,7),_FP_FRAC_WORD_8(_z,6),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,5), 0,_f_f1,_f_f0,		    \
169689Skan		    _FP_FRAC_WORD_8(_z,7),_FP_FRAC_WORD_8(_z,6),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,5));				    \
169689Skan    doit(_b_f1, _b_f0, X##_f[3], Y##_f[3]);				    \
169689Skan    __FP_FRAC_ADD_2(_FP_FRAC_WORD_8(_z,7),_FP_FRAC_WORD_8(_z,6),	    \
169689Skan		    _b_f1,_b_f0,					    \
169689Skan		    _FP_FRAC_WORD_8(_z,7),_FP_FRAC_WORD_8(_z,6));	    \
169689Skan									    \
169689Skan    /* Normalize since we know where the msb of the multiplicands	    \
169689Skan       were (bit B), we know that the msb of the of the product is	    \
169689Skan       at either 2B or 2B-1.  */					    \
169689Skan    _FP_FRAC_SRS_8(_z, wfracbits-1, 2*wfracbits);			    \
169689Skan    __FP_FRAC_SET_4(R, _FP_FRAC_WORD_8(_z,3), _FP_FRAC_WORD_8(_z,2),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,1), _FP_FRAC_WORD_8(_z,0));	    \
169689Skan  } while (0)
169689Skan
169689Skan#define _FP_MUL_MEAT_4_gmp(wfracbits, R, X, Y)				    \
169689Skan  do {									    \
169689Skan    _FP_FRAC_DECL_8(_z);						    \
169689Skan									    \
169689Skan    mpn_mul_n(_z_f, _x_f, _y_f, 4);					    \
169689Skan									    \
169689Skan    /* Normalize since we know where the msb of the multiplicands	    \
169689Skan       were (bit B), we know that the msb of the of the product is	    \
169689Skan       at either 2B or 2B-1.  */					    \
169689Skan    _FP_FRAC_SRS_8(_z, wfracbits-1, 2*wfracbits);	 		    \
169689Skan    __FP_FRAC_SET_4(R, _FP_FRAC_WORD_8(_z,3), _FP_FRAC_WORD_8(_z,2),	    \
169689Skan		    _FP_FRAC_WORD_8(_z,1), _FP_FRAC_WORD_8(_z,0));	    \
169689Skan  } while (0)
169689Skan
169689Skan/*
169689Skan * Helper utility for _FP_DIV_MEAT_4_udiv:
169689Skan * pppp = m * nnn
169689Skan */
169689Skan#define umul_ppppmnnn(p3,p2,p1,p0,m,n2,n1,n0)				    \
169689Skan  do {									    \
169689Skan    UWtype _t;								    \
169689Skan    umul_ppmm(p1,p0,m,n0);						    \
169689Skan    umul_ppmm(p2,_t,m,n1);						    \
169689Skan    __FP_FRAC_ADDI_2(p2,p1,_t);						    \
169689Skan    umul_ppmm(p3,_t,m,n2);						    \
169689Skan    __FP_FRAC_ADDI_2(p3,p2,_t);						    \
169689Skan  } while (0)
169689Skan
169689Skan/*
169689Skan * Division algorithms:
169689Skan */
169689Skan
169689Skan#define _FP_DIV_MEAT_4_udiv(fs, R, X, Y)				    \
169689Skan  do {									    \
169689Skan    int _i;								    \
169689Skan    _FP_FRAC_DECL_4(_n); _FP_FRAC_DECL_4(_m);				    \
169689Skan    _FP_FRAC_SET_4(_n, _FP_ZEROFRAC_4);					    \
169689Skan    if (_FP_FRAC_GT_4(X, Y))						    \
169689Skan      {									    \
169689Skan	_n_f[3] = X##_f[0] << (_FP_W_TYPE_SIZE - 1);			    \
169689Skan	_FP_FRAC_SRL_4(X, 1);						    \
169689Skan      }									    \
169689Skan    else								    \
169689Skan      R##_e--;								    \
169689Skan									    \
169689Skan    /* Normalize, i.e. make the most significant bit of the 		    \
169689Skan       denominator set. */						    \
169689Skan    _FP_FRAC_SLL_4(Y, _FP_WFRACXBITS_##fs);				    \
169689Skan									    \
169689Skan    for (_i = 3; ; _i--)						    \
169689Skan      {									    \
169689Skan        if (X##_f[3] == Y##_f[3])					    \
169689Skan          {								    \
169689Skan            /* This is a special case, not an optimization		    \
169689Skan               (X##_f[3]/Y##_f[3] would not fit into UWtype).		    \
169689Skan               As X## is guaranteed to be < Y,  R##_f[_i] can be either	    \
169689Skan               (UWtype)-1 or (UWtype)-2.  */				    \
169689Skan            R##_f[_i] = -1;						    \
169689Skan            if (!_i)							    \
169689Skan	      break;							    \
169689Skan            __FP_FRAC_SUB_4(X##_f[3], X##_f[2], X##_f[1], X##_f[0],	    \
169689Skan			    Y##_f[2], Y##_f[1], Y##_f[0], 0,		    \
169689Skan			    X##_f[2], X##_f[1], X##_f[0], _n_f[_i]);	    \
169689Skan            _FP_FRAC_SUB_4(X, Y, X);					    \
169689Skan            if (X##_f[3] > Y##_f[3])					    \
169689Skan              {								    \
169689Skan                R##_f[_i] = -2;						    \
169689Skan                _FP_FRAC_ADD_4(X, Y, X);				    \
169689Skan              }								    \
169689Skan          }								    \
169689Skan        else								    \
169689Skan          {								    \
169689Skan            udiv_qrnnd(R##_f[_i], X##_f[3], X##_f[3], X##_f[2], Y##_f[3]);  \
169689Skan            umul_ppppmnnn(_m_f[3], _m_f[2], _m_f[1], _m_f[0],		    \
169689Skan			  R##_f[_i], Y##_f[2], Y##_f[1], Y##_f[0]);	    \
169689Skan            X##_f[2] = X##_f[1];					    \
169689Skan            X##_f[1] = X##_f[0];					    \
169689Skan            X##_f[0] = _n_f[_i];					    \
169689Skan            if (_FP_FRAC_GT_4(_m, X))					    \
169689Skan              {								    \
169689Skan                R##_f[_i]--;						    \
169689Skan                _FP_FRAC_ADD_4(X, Y, X);				    \
169689Skan                if (_FP_FRAC_GE_4(X, Y) && _FP_FRAC_GT_4(_m, X))	    \
169689Skan                  {							    \
169689Skan		    R##_f[_i]--;					    \
169689Skan		    _FP_FRAC_ADD_4(X, Y, X);				    \
169689Skan                  }							    \
169689Skan              }								    \
169689Skan            _FP_FRAC_DEC_4(X, _m);					    \
169689Skan            if (!_i)							    \
169689Skan	      {								    \
169689Skan		if (!_FP_FRAC_EQ_4(X, _m))				    \
169689Skan		  R##_f[0] |= _FP_WORK_STICKY;				    \
169689Skan		break;							    \
169689Skan	      }								    \
169689Skan          }								    \
169689Skan      }									    \
169689Skan  } while (0)
169689Skan
169689Skan
169689Skan/*
169689Skan * Square root algorithms:
169689Skan * We have just one right now, maybe Newton approximation
169689Skan * should be added for those machines where division is fast.
169689Skan */
169689Skan
169689Skan#define _FP_SQRT_MEAT_4(R, S, T, X, q)				\
169689Skan  do {								\
169689Skan    while (q)							\
169689Skan      {								\
169689Skan	T##_f[3] = S##_f[3] + q;				\
169689Skan	if (T##_f[3] <= X##_f[3])				\
169689Skan	  {							\
169689Skan	    S##_f[3] = T##_f[3] + q;				\
169689Skan	    X##_f[3] -= T##_f[3];				\
169689Skan	    R##_f[3] += q;					\
169689Skan	  }							\
169689Skan	_FP_FRAC_SLL_4(X, 1);					\
169689Skan	q >>= 1;						\
169689Skan      }								\
169689Skan    q = (_FP_W_TYPE)1 << (_FP_W_TYPE_SIZE - 1);			\
169689Skan    while (q)							\
169689Skan      {								\
169689Skan	T##_f[2] = S##_f[2] + q;				\
169689Skan	T##_f[3] = S##_f[3];					\
169689Skan	if (T##_f[3] < X##_f[3] || 				\
169689Skan	    (T##_f[3] == X##_f[3] && T##_f[2] <= X##_f[2]))	\
169689Skan	  {							\
169689Skan	    S##_f[2] = T##_f[2] + q;				\
169689Skan	    S##_f[3] += (T##_f[2] > S##_f[2]);			\
169689Skan	    __FP_FRAC_DEC_2(X##_f[3], X##_f[2],			\
169689Skan			    T##_f[3], T##_f[2]);		\
169689Skan	    R##_f[2] += q;					\
169689Skan	  }							\
169689Skan	_FP_FRAC_SLL_4(X, 1);					\
169689Skan	q >>= 1;						\
169689Skan      }								\
169689Skan    q = (_FP_W_TYPE)1 << (_FP_W_TYPE_SIZE - 1);			\
169689Skan    while (q)							\
169689Skan      {								\
169689Skan	T##_f[1] = S##_f[1] + q;				\
169689Skan	T##_f[2] = S##_f[2];					\
169689Skan	T##_f[3] = S##_f[3];					\
169689Skan	if (T##_f[3] < X##_f[3] || 				\
169689Skan	    (T##_f[3] == X##_f[3] && (T##_f[2] < X##_f[2] ||	\
169689Skan	     (T##_f[2] == X##_f[2] && T##_f[1] <= X##_f[1]))))	\
169689Skan	  {							\
169689Skan	    S##_f[1] = T##_f[1] + q;				\
169689Skan	    S##_f[2] += (T##_f[1] > S##_f[1]);			\
169689Skan	    S##_f[3] += (T##_f[2] > S##_f[2]);			\
169689Skan	    __FP_FRAC_DEC_3(X##_f[3], X##_f[2], X##_f[1],	\
169689Skan	    		    T##_f[3], T##_f[2], T##_f[1]);	\
169689Skan	    R##_f[1] += q;					\
169689Skan	  }							\
169689Skan	_FP_FRAC_SLL_4(X, 1);					\
169689Skan	q >>= 1;						\
169689Skan      }								\
169689Skan    q = (_FP_W_TYPE)1 << (_FP_W_TYPE_SIZE - 1);			\
169689Skan    while (q != _FP_WORK_ROUND)					\
169689Skan      {								\
169689Skan	T##_f[0] = S##_f[0] + q;				\
169689Skan	T##_f[1] = S##_f[1];					\
169689Skan	T##_f[2] = S##_f[2];					\
169689Skan	T##_f[3] = S##_f[3];					\
169689Skan	if (_FP_FRAC_GE_4(X,T))					\
169689Skan	  {							\
169689Skan	    S##_f[0] = T##_f[0] + q;				\
169689Skan	    S##_f[1] += (T##_f[0] > S##_f[0]);			\
169689Skan	    S##_f[2] += (T##_f[1] > S##_f[1]);			\
169689Skan	    S##_f[3] += (T##_f[2] > S##_f[2]);			\
169689Skan	    _FP_FRAC_DEC_4(X, T);				\
169689Skan	    R##_f[0] += q;					\
169689Skan	  }							\
169689Skan	_FP_FRAC_SLL_4(X, 1);					\
169689Skan	q >>= 1;						\
169689Skan      }								\
169689Skan    if (!_FP_FRAC_ZEROP_4(X))					\
169689Skan      {								\
169689Skan	if (_FP_FRAC_GT_4(X,S))					\
169689Skan	  R##_f[0] |= _FP_WORK_ROUND;				\
169689Skan	R##_f[0] |= _FP_WORK_STICKY;				\
169689Skan      }								\
169689Skan  } while (0)
169689Skan
169689Skan
169689Skan/*
169689Skan * Internals
169689Skan */
169689Skan
169689Skan#define __FP_FRAC_SET_4(X,I3,I2,I1,I0)					\
169689Skan  (X##_f[3] = I3, X##_f[2] = I2, X##_f[1] = I1, X##_f[0] = I0)
169689Skan
169689Skan#ifndef __FP_FRAC_ADD_3
169689Skan#define __FP_FRAC_ADD_3(r2,r1,r0,x2,x1,x0,y2,y1,y0)		\
169689Skan  do {								\
169689Skan    _FP_W_TYPE _c1, _c2;					\
169689Skan    r0 = x0 + y0;						\
169689Skan    _c1 = r0 < x0;						\
169689Skan    r1 = x1 + y1;						\
169689Skan    _c2 = r1 < x1;						\
169689Skan    r1 += _c1;							\
169689Skan    _c2 |= r1 < _c1;						\
169689Skan    r2 = x2 + y2 + _c2;						\
169689Skan  } while (0)
169689Skan#endif
169689Skan
169689Skan#ifndef __FP_FRAC_ADD_4
169689Skan#define __FP_FRAC_ADD_4(r3,r2,r1,r0,x3,x2,x1,x0,y3,y2,y1,y0)	\
169689Skan  do {								\
169689Skan    _FP_W_TYPE _c1, _c2, _c3;					\
169689Skan    r0 = x0 + y0;						\
169689Skan    _c1 = r0 < x0;						\
169689Skan    r1 = x1 + y1;						\
169689Skan    _c2 = r1 < x1;						\
169689Skan    r1 += _c1;							\
169689Skan    _c2 |= r1 < _c1;						\
169689Skan    r2 = x2 + y2;						\
169689Skan    _c3 = r2 < x2;						\
169689Skan    r2 += _c2;							\
169689Skan    _c3 |= r2 < _c2;						\
169689Skan    r3 = x3 + y3 + _c3;						\
169689Skan  } while (0)
169689Skan#endif
169689Skan
169689Skan#ifndef __FP_FRAC_SUB_3
169689Skan#define __FP_FRAC_SUB_3(r2,r1,r0,x2,x1,x0,y2,y1,y0)		\
169689Skan  do {								\
169689Skan    _FP_W_TYPE _c1, _c2;					\
169689Skan    r0 = x0 - y0;						\
169689Skan    _c1 = r0 > x0;						\
169689Skan    r1 = x1 - y1;						\
169689Skan    _c2 = r1 > x1;						\
169689Skan    r1 -= _c1;							\
169689Skan    _c2 |= _c1 && (y1 == x1);					\
169689Skan    r2 = x2 - y2 - _c2;						\
169689Skan  } while (0)
169689Skan#endif
169689Skan
169689Skan#ifndef __FP_FRAC_SUB_4
169689Skan#define __FP_FRAC_SUB_4(r3,r2,r1,r0,x3,x2,x1,x0,y3,y2,y1,y0)	\
169689Skan  do {								\
169689Skan    _FP_W_TYPE _c1, _c2, _c3;					\
169689Skan    r0 = x0 - y0;						\
169689Skan    _c1 = r0 > x0;						\
169689Skan    r1 = x1 - y1;						\
169689Skan    _c2 = r1 > x1;						\
169689Skan    r1 -= _c1;							\
169689Skan    _c2 |= _c1 && (y1 == x1);					\
169689Skan    r2 = x2 - y2;						\
169689Skan    _c3 = r2 > x2;						\
169689Skan    r2 -= _c2;							\
169689Skan    _c3 |= _c2 && (y2 == x2);					\
169689Skan    r3 = x3 - y3 - _c3;						\
169689Skan  } while (0)
169689Skan#endif
169689Skan
169689Skan#ifndef __FP_FRAC_DEC_3
169689Skan#define __FP_FRAC_DEC_3(x2,x1,x0,y2,y1,y0)				\
169689Skan  do {									\
169689Skan    UWtype _t0, _t1, _t2;						\
169689Skan    _t0 = x0, _t1 = x1, _t2 = x2;					\
169689Skan    __FP_FRAC_SUB_3 (x2, x1, x0, _t2, _t1, _t0, y2, y1, y0);		\
169689Skan  } while (0)
169689Skan#endif
169689Skan
169689Skan#ifndef __FP_FRAC_DEC_4
169689Skan#define __FP_FRAC_DEC_4(x3,x2,x1,x0,y3,y2,y1,y0)			\
169689Skan  do {									\
169689Skan    UWtype _t0, _t1, _t2, _t3;						\
169689Skan    _t0 = x0, _t1 = x1, _t2 = x2, _t3 = x3;				\
169689Skan    __FP_FRAC_SUB_4 (x3,x2,x1,x0,_t3,_t2,_t1,_t0, y3,y2,y1,y0);		\
169689Skan  } while (0)
169689Skan#endif
169689Skan
169689Skan#ifndef __FP_FRAC_ADDI_4
169689Skan#define __FP_FRAC_ADDI_4(x3,x2,x1,x0,i)					\
169689Skan  do {									\
169689Skan    UWtype _t;								\
169689Skan    _t = ((x0 += i) < i);						\
169689Skan    x1 += _t; _t = (x1 < _t);						\
169689Skan    x2 += _t; _t = (x2 < _t);						\
169689Skan    x3 += _t;								\
169689Skan  } while (0)
169689Skan#endif
169689Skan
169689Skan/* Convert FP values between word sizes. This appears to be more
169689Skan * complicated than I'd have expected it to be, so these might be
169689Skan * wrong... These macros are in any case somewhat bogus because they
169689Skan * use information about what various FRAC_n variables look like
169689Skan * internally [eg, that 2 word vars are X_f0 and x_f1]. But so do
169689Skan * the ones in op-2.h and op-1.h.
169689Skan */
169689Skan#define _FP_FRAC_COPY_1_4(D, S)		(D##_f = S##_f[0])
169689Skan
169689Skan#define _FP_FRAC_COPY_2_4(D, S)			\
169689Skando {						\
169689Skan  D##_f0 = S##_f[0];				\
169689Skan  D##_f1 = S##_f[1];				\
169689Skan} while (0)
169689Skan
169689Skan/* Assembly/disassembly for converting to/from integral types.
169689Skan * No shifting or overflow handled here.
169689Skan */
169689Skan/* Put the FP value X into r, which is an integer of size rsize. */
169689Skan#define _FP_FRAC_ASSEMBLE_4(r, X, rsize)				\
169689Skan  do {									\
169689Skan    if (rsize <= _FP_W_TYPE_SIZE)					\
169689Skan      r = X##_f[0];							\
169689Skan    else if (rsize <= 2*_FP_W_TYPE_SIZE)				\
169689Skan    {									\
169689Skan      r = X##_f[1];							\
169689Skan      r <<= _FP_W_TYPE_SIZE;						\
169689Skan      r += X##_f[0];							\
169689Skan    }									\
169689Skan    else								\
169689Skan    {									\
169689Skan      /* I'm feeling lazy so we deal with int == 3words (implausible)*/	\
169689Skan      /* and int == 4words as a single case.			 */	\
169689Skan      r = X##_f[3];							\
169689Skan      r <<= _FP_W_TYPE_SIZE;						\
169689Skan      r += X##_f[2];							\
169689Skan      r <<= _FP_W_TYPE_SIZE;						\
169689Skan      r += X##_f[1];							\
169689Skan      r <<= _FP_W_TYPE_SIZE;						\
169689Skan      r += X##_f[0];							\
169689Skan    }									\
169689Skan  } while (0)
169689Skan
169689Skan/* "No disassemble Number Five!" */
169689Skan/* move an integer of size rsize into X's fractional part. We rely on
169689Skan * the _f[] array consisting of words of size _FP_W_TYPE_SIZE to avoid
169689Skan * having to mask the values we store into it.
169689Skan */
169689Skan#define _FP_FRAC_DISASSEMBLE_4(X, r, rsize)				\
169689Skan  do {									\
169689Skan    X##_f[0] = r;							\
169689Skan    X##_f[1] = (rsize <= _FP_W_TYPE_SIZE ? 0 : r >> _FP_W_TYPE_SIZE);	\
169689Skan    X##_f[2] = (rsize <= 2*_FP_W_TYPE_SIZE ? 0 : r >> 2*_FP_W_TYPE_SIZE); \
169689Skan    X##_f[3] = (rsize <= 3*_FP_W_TYPE_SIZE ? 0 : r >> 3*_FP_W_TYPE_SIZE); \
169689Skan  } while (0);
169689Skan
169689Skan#define _FP_FRAC_COPY_4_1(D, S)			\
169689Skando {						\
169689Skan  D##_f[0] = S##_f;				\
169689Skan  D##_f[1] = D##_f[2] = D##_f[3] = 0;		\
169689Skan} while (0)
169689Skan
169689Skan#define _FP_FRAC_COPY_4_2(D, S)			\
169689Skando {						\
169689Skan  D##_f[0] = S##_f0;				\
169689Skan  D##_f[1] = S##_f1;				\
169689Skan  D##_f[2] = D##_f[3] = 0;			\
169689Skan} while (0)
171825Skan
171825Skan#define _FP_FRAC_COPY_4_4(D,S)	_FP_FRAC_COPY_4(D,S)