config/soft-fp/extended.h

169689Skan/* Software floating-point emulation.
169689Skan   Definitions for IEEE Extended Precision.
171825Skan   Copyright (C) 1999,2006,2007 Free Software Foundation, Inc.
169689Skan   This file is part of the GNU C Library.
169689Skan   Contributed by Jakub Jelinek (jj@ultra.linux.cz).
169689Skan
169689Skan   The GNU C Library is free software; you can redistribute it and/or
169689Skan   modify it under the terms of the GNU Lesser General Public
169689Skan   License as published by the Free Software Foundation; either
169689Skan   version 2.1 of the License, or (at your option) any later version.
169689Skan
169689Skan   In addition to the permissions in the GNU Lesser General Public
169689Skan   License, the Free Software Foundation gives you unlimited
169689Skan   permission to link the compiled version of this file into
169689Skan   combinations with other programs, and to distribute those
169689Skan   combinations without any restriction coming from the use of this
169689Skan   file.  (The Lesser General Public License restrictions do apply in
169689Skan   other respects; for example, they cover modification of the file,
169689Skan   and distribution when not linked into a combine executable.)
169689Skan
169689Skan   The GNU C Library is distributed in the hope that it will be useful,
169689Skan   but WITHOUT ANY WARRANTY; without even the implied warranty of
169689Skan   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
169689Skan   Lesser General Public License for more details.
169689Skan
169689Skan   You should have received a copy of the GNU Lesser General Public
169689Skan   License along with the GNU C Library; if not, write to the Free
169689Skan   Software Foundation, 51 Franklin Street, Fifth Floor, Boston,
169689Skan   MA 02110-1301, USA.  */
169689Skan
169689Skan#if _FP_W_TYPE_SIZE < 32
169689Skan#error "Here's a nickel, kid. Go buy yourself a real computer."
169689Skan#endif
169689Skan
169689Skan#if _FP_W_TYPE_SIZE < 64
169689Skan#define _FP_FRACTBITS_E         (4*_FP_W_TYPE_SIZE)
169689Skan#else
169689Skan#define _FP_FRACTBITS_E		(2*_FP_W_TYPE_SIZE)
169689Skan#endif
169689Skan
169689Skan#define _FP_FRACBITS_E		64
169689Skan#define _FP_FRACXBITS_E		(_FP_FRACTBITS_E - _FP_FRACBITS_E)
169689Skan#define _FP_WFRACBITS_E		(_FP_WORKBITS + _FP_FRACBITS_E)
169689Skan#define _FP_WFRACXBITS_E	(_FP_FRACTBITS_E - _FP_WFRACBITS_E)
169689Skan#define _FP_EXPBITS_E		15
169689Skan#define _FP_EXPBIAS_E		16383
169689Skan#define _FP_EXPMAX_E		32767
169689Skan
169689Skan#define _FP_QNANBIT_E		\
169689Skan	((_FP_W_TYPE)1 << (_FP_FRACBITS_E-2) % _FP_W_TYPE_SIZE)
169689Skan#define _FP_QNANBIT_SH_E		\
169689Skan	((_FP_W_TYPE)1 << (_FP_FRACBITS_E-2+_FP_WORKBITS) % _FP_W_TYPE_SIZE)
169689Skan#define _FP_IMPLBIT_E		\
169689Skan	((_FP_W_TYPE)1 << (_FP_FRACBITS_E-1) % _FP_W_TYPE_SIZE)
169689Skan#define _FP_IMPLBIT_SH_E		\
169689Skan	((_FP_W_TYPE)1 << (_FP_FRACBITS_E-1+_FP_WORKBITS) % _FP_W_TYPE_SIZE)
169689Skan#define _FP_OVERFLOW_E		\
169689Skan	((_FP_W_TYPE)1 << (_FP_WFRACBITS_E % _FP_W_TYPE_SIZE))
169689Skan
169689Skantypedef float XFtype __attribute__((mode(XF)));
169689Skan
169689Skan#if _FP_W_TYPE_SIZE < 64
169689Skan
169689Skanunion _FP_UNION_E
169689Skan{
169689Skan   XFtype flt;
169689Skan   struct
169689Skan   {
169689Skan#if __BYTE_ORDER == __BIG_ENDIAN
169689Skan      unsigned long pad1 : _FP_W_TYPE_SIZE;
169689Skan      unsigned long pad2 : (_FP_W_TYPE_SIZE - 1 - _FP_EXPBITS_E);
169689Skan      unsigned long sign : 1;
169689Skan      unsigned long exp : _FP_EXPBITS_E;
169689Skan      unsigned long frac1 : _FP_W_TYPE_SIZE;
169689Skan      unsigned long frac0 : _FP_W_TYPE_SIZE;
169689Skan#else
169689Skan      unsigned long frac0 : _FP_W_TYPE_SIZE;
169689Skan      unsigned long frac1 : _FP_W_TYPE_SIZE;
169689Skan      unsigned exp : _FP_EXPBITS_E;
169689Skan      unsigned sign : 1;
169689Skan#endif /* not bigendian */
169689Skan   } bits __attribute__((packed));
169689Skan};
169689Skan
169689Skan
169689Skan#define FP_DECL_E(X)		_FP_DECL(4,X)
169689Skan
169689Skan#define FP_UNPACK_RAW_E(X, val)				\
169689Skan  do {							\
169689Skan    union _FP_UNION_E _flo; _flo.flt = (val);		\
169689Skan							\
169689Skan    X##_f[2] = 0; X##_f[3] = 0;				\
169689Skan    X##_f[0] = _flo.bits.frac0;				\
169689Skan    X##_f[1] = _flo.bits.frac1;				\
169689Skan    X##_e  = _flo.bits.exp;				\
169689Skan    X##_s  = _flo.bits.sign;				\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_UNPACK_RAW_EP(X, val)			\
169689Skan  do {							\
169689Skan    union _FP_UNION_E *_flo =				\
169689Skan    (union _FP_UNION_E *)(val);				\
169689Skan							\
169689Skan    X##_f[2] = 0; X##_f[3] = 0;				\
169689Skan    X##_f[0] = _flo->bits.frac0;			\
169689Skan    X##_f[1] = _flo->bits.frac1;			\
169689Skan    X##_e  = _flo->bits.exp;				\
169689Skan    X##_s  = _flo->bits.sign;				\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_PACK_RAW_E(val, X)				\
169689Skan  do {							\
169689Skan    union _FP_UNION_E _flo;				\
169689Skan							\
169689Skan    if (X##_e) X##_f[1] |= _FP_IMPLBIT_E;		\
169689Skan    else X##_f[1] &= ~(_FP_IMPLBIT_E);			\
169689Skan    _flo.bits.frac0 = X##_f[0];				\
169689Skan    _flo.bits.frac1 = X##_f[1];				\
169689Skan    _flo.bits.exp   = X##_e;				\
169689Skan    _flo.bits.sign  = X##_s;				\
169689Skan							\
169689Skan    (val) = _flo.flt;					\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_PACK_RAW_EP(val, X)				\
169689Skan  do {							\
169689Skan    if (!FP_INHIBIT_RESULTS)				\
169689Skan      {							\
169689Skan	union _FP_UNION_E *_flo =			\
169689Skan	  (union _FP_UNION_E *)(val);			\
169689Skan							\
169689Skan	if (X##_e) X##_f[1] |= _FP_IMPLBIT_E;		\
169689Skan	else X##_f[1] &= ~(_FP_IMPLBIT_E);		\
169689Skan	_flo->bits.frac0 = X##_f[0];			\
169689Skan	_flo->bits.frac1 = X##_f[1];			\
169689Skan	_flo->bits.exp   = X##_e;			\
169689Skan	_flo->bits.sign  = X##_s;			\
169689Skan      }							\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_UNPACK_E(X,val)		\
169689Skan  do {					\
169689Skan    FP_UNPACK_RAW_E(X,val);		\
169689Skan    _FP_UNPACK_CANONICAL(E,4,X);	\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_UNPACK_EP(X,val)		\
169689Skan  do {					\
169689Skan    FP_UNPACK_RAW_EP(X,val);		\
169689Skan    _FP_UNPACK_CANONICAL(E,4,X);	\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_UNPACK_SEMIRAW_E(X,val)	\
169689Skan  do {					\
171825Skan    FP_UNPACK_RAW_E(X,val);		\
169689Skan    _FP_UNPACK_SEMIRAW(E,4,X);		\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_UNPACK_SEMIRAW_EP(X,val)	\
169689Skan  do {					\
171825Skan    FP_UNPACK_RAW_EP(X,val);		\
169689Skan    _FP_UNPACK_SEMIRAW(E,4,X);		\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_PACK_E(val,X)		\
169689Skan  do {					\
169689Skan    _FP_PACK_CANONICAL(E,4,X);		\
169689Skan    FP_PACK_RAW_E(val,X);		\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_PACK_EP(val,X)		\
169689Skan  do {					\
169689Skan    _FP_PACK_CANONICAL(E,4,X);		\
169689Skan    FP_PACK_RAW_EP(val,X);		\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_PACK_SEMIRAW_E(val,X)	\
169689Skan  do {					\
169689Skan    _FP_PACK_SEMIRAW(E,4,X);		\
171825Skan    FP_PACK_RAW_E(val,X);		\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_PACK_SEMIRAW_EP(val,X)	\
169689Skan  do {					\
169689Skan    _FP_PACK_SEMIRAW(E,4,X);		\
171825Skan    FP_PACK_RAW_EP(val,X);		\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_ISSIGNAN_E(X)	_FP_ISSIGNAN(E,4,X)
169689Skan#define FP_NEG_E(R,X)		_FP_NEG(E,4,R,X)
169689Skan#define FP_ADD_E(R,X,Y)		_FP_ADD(E,4,R,X,Y)
169689Skan#define FP_SUB_E(R,X,Y)		_FP_SUB(E,4,R,X,Y)
169689Skan#define FP_MUL_E(R,X,Y)		_FP_MUL(E,4,R,X,Y)
169689Skan#define FP_DIV_E(R,X,Y)		_FP_DIV(E,4,R,X,Y)
169689Skan#define FP_SQRT_E(R,X)		_FP_SQRT(E,4,R,X)
169689Skan
169689Skan/*
169689Skan * Square root algorithms:
169689Skan * We have just one right now, maybe Newton approximation
169689Skan * should be added for those machines where division is fast.
169689Skan * This has special _E version because standard _4 square
169689Skan * root would not work (it has to start normally with the
169689Skan * second word and not the first), but as we have to do it
169689Skan * anyway, we optimize it by doing most of the calculations
169689Skan * in two UWtype registers instead of four.
169689Skan */
169689Skan
169689Skan#define _FP_SQRT_MEAT_E(R, S, T, X, q)			\
169689Skan  do {							\
169689Skan    q = (_FP_W_TYPE)1 << (_FP_W_TYPE_SIZE - 1);		\
169689Skan    _FP_FRAC_SRL_4(X, (_FP_WORKBITS));			\
169689Skan    while (q)						\
169689Skan      {							\
169689Skan	T##_f[1] = S##_f[1] + q;			\
169689Skan	if (T##_f[1] <= X##_f[1])			\
169689Skan	  {						\
169689Skan	    S##_f[1] = T##_f[1] + q;			\
169689Skan	    X##_f[1] -= T##_f[1];			\
169689Skan	    R##_f[1] += q;				\
169689Skan	  }						\
169689Skan	_FP_FRAC_SLL_2(X, 1);				\
169689Skan	q >>= 1;					\
169689Skan      }							\
169689Skan    q = (_FP_W_TYPE)1 << (_FP_W_TYPE_SIZE - 1);		\
169689Skan    while (q)						\
169689Skan      {							\
169689Skan	T##_f[0] = S##_f[0] + q;			\
169689Skan	T##_f[1] = S##_f[1];				\
169689Skan	if (T##_f[1] < X##_f[1] || 			\
169689Skan	    (T##_f[1] == X##_f[1] &&			\
169689Skan	     T##_f[0] <= X##_f[0]))			\
169689Skan	  {						\
169689Skan	    S##_f[0] = T##_f[0] + q;			\
169689Skan	    S##_f[1] += (T##_f[0] > S##_f[0]);		\
169689Skan	    _FP_FRAC_DEC_2(X, T);			\
169689Skan	    R##_f[0] += q;				\
169689Skan	  }						\
169689Skan	_FP_FRAC_SLL_2(X, 1);				\
169689Skan	q >>= 1;					\
169689Skan      }							\
169689Skan    _FP_FRAC_SLL_4(R, (_FP_WORKBITS));			\
169689Skan    if (X##_f[0] | X##_f[1])				\
169689Skan      {							\
169689Skan	if (S##_f[1] < X##_f[1] || 			\
169689Skan	    (S##_f[1] == X##_f[1] &&			\
169689Skan	     S##_f[0] < X##_f[0]))			\
169689Skan	  R##_f[0] |= _FP_WORK_ROUND;			\
169689Skan	R##_f[0] |= _FP_WORK_STICKY;			\
169689Skan      }							\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_CMP_E(r,X,Y,un)	_FP_CMP(E,4,r,X,Y,un)
169689Skan#define FP_CMP_EQ_E(r,X,Y)	_FP_CMP_EQ(E,4,r,X,Y)
169689Skan#define FP_CMP_UNORD_E(r,X,Y)	_FP_CMP_UNORD(E,4,r,X,Y)
169689Skan
169689Skan#define FP_TO_INT_E(r,X,rsz,rsg)	_FP_TO_INT(E,4,r,X,rsz,rsg)
169689Skan#define FP_FROM_INT_E(X,r,rs,rt)	_FP_FROM_INT(E,4,X,r,rs,rt)
169689Skan
169689Skan#define _FP_FRAC_HIGH_E(X)	(X##_f[2])
169689Skan#define _FP_FRAC_HIGH_RAW_E(X)	(X##_f[1])
169689Skan
169689Skan#else   /* not _FP_W_TYPE_SIZE < 64 */
169689Skanunion _FP_UNION_E
169689Skan{
169689Skan  XFtype flt;
169689Skan  struct {
169689Skan#if __BYTE_ORDER == __BIG_ENDIAN
171825Skan    _FP_W_TYPE pad  : (_FP_W_TYPE_SIZE - 1 - _FP_EXPBITS_E);
171825Skan    unsigned sign   : 1;
171825Skan    unsigned exp    : _FP_EXPBITS_E;
171825Skan    _FP_W_TYPE frac : _FP_W_TYPE_SIZE;
169689Skan#else
171825Skan    _FP_W_TYPE frac : _FP_W_TYPE_SIZE;
171825Skan    unsigned exp    : _FP_EXPBITS_E;
171825Skan    unsigned sign   : 1;
169689Skan#endif
169689Skan  } bits;
169689Skan};
169689Skan
169689Skan#define FP_DECL_E(X)		_FP_DECL(2,X)
169689Skan
169689Skan#define FP_UNPACK_RAW_E(X, val)					\
169689Skan  do {								\
169689Skan    union _FP_UNION_E _flo; _flo.flt = (val);			\
169689Skan								\
169689Skan    X##_f0 = _flo.bits.frac;					\
169689Skan    X##_f1 = 0;							\
169689Skan    X##_e = _flo.bits.exp;					\
169689Skan    X##_s = _flo.bits.sign;					\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_UNPACK_RAW_EP(X, val)				\
169689Skan  do {								\
169689Skan    union _FP_UNION_E *_flo =					\
169689Skan      (union _FP_UNION_E *)(val);				\
169689Skan								\
169689Skan    X##_f0 = _flo->bits.frac;					\
169689Skan    X##_f1 = 0;							\
169689Skan    X##_e = _flo->bits.exp;					\
169689Skan    X##_s = _flo->bits.sign;					\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_PACK_RAW_E(val, X)					\
169689Skan  do {								\
169689Skan    union _FP_UNION_E _flo;					\
169689Skan								\
169689Skan    if (X##_e) X##_f0 |= _FP_IMPLBIT_E;				\
169689Skan    else X##_f0 &= ~(_FP_IMPLBIT_E);				\
169689Skan    _flo.bits.frac = X##_f0;					\
169689Skan    _flo.bits.exp  = X##_e;					\
169689Skan    _flo.bits.sign = X##_s;					\
169689Skan								\
169689Skan    (val) = _flo.flt;						\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_PACK_RAW_EP(fs, val, X)				\
169689Skan  do {								\
169689Skan    if (!FP_INHIBIT_RESULTS)					\
169689Skan      {								\
169689Skan	union _FP_UNION_E *_flo =				\
169689Skan	  (union _FP_UNION_E *)(val);				\
169689Skan								\
169689Skan	if (X##_e) X##_f0 |= _FP_IMPLBIT_E;			\
169689Skan	else X##_f0 &= ~(_FP_IMPLBIT_E);			\
169689Skan	_flo->bits.frac = X##_f0;				\
169689Skan	_flo->bits.exp  = X##_e;				\
169689Skan	_flo->bits.sign = X##_s;				\
169689Skan      }								\
169689Skan  } while (0)
169689Skan
169689Skan
169689Skan#define FP_UNPACK_E(X,val)		\
169689Skan  do {					\
169689Skan    FP_UNPACK_RAW_E(X,val);		\
169689Skan    _FP_UNPACK_CANONICAL(E,2,X);	\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_UNPACK_EP(X,val)		\
169689Skan  do {					\
169689Skan    FP_UNPACK_RAW_EP(X,val);		\
169689Skan    _FP_UNPACK_CANONICAL(E,2,X);	\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_UNPACK_SEMIRAW_E(X,val)	\
169689Skan  do {					\
171825Skan    FP_UNPACK_RAW_E(X,val);		\
169689Skan    _FP_UNPACK_SEMIRAW(E,2,X);		\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_UNPACK_SEMIRAW_EP(X,val)	\
169689Skan  do {					\
171825Skan    FP_UNPACK_RAW_EP(X,val);		\
169689Skan    _FP_UNPACK_SEMIRAW(E,2,X);		\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_PACK_E(val,X)		\
169689Skan  do {					\
169689Skan    _FP_PACK_CANONICAL(E,2,X);		\
169689Skan    FP_PACK_RAW_E(val,X);		\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_PACK_EP(val,X)		\
169689Skan  do {					\
169689Skan    _FP_PACK_CANONICAL(E,2,X);		\
169689Skan    FP_PACK_RAW_EP(val,X);		\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_PACK_SEMIRAW_E(val,X)	\
169689Skan  do {					\
169689Skan    _FP_PACK_SEMIRAW(E,2,X);		\
171825Skan    FP_PACK_RAW_E(val,X);		\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_PACK_SEMIRAW_EP(val,X)	\
169689Skan  do {					\
169689Skan    _FP_PACK_SEMIRAW(E,2,X);		\
171825Skan    FP_PACK_RAW_EP(val,X);		\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_ISSIGNAN_E(X)	_FP_ISSIGNAN(E,2,X)
169689Skan#define FP_NEG_E(R,X)		_FP_NEG(E,2,R,X)
169689Skan#define FP_ADD_E(R,X,Y)		_FP_ADD(E,2,R,X,Y)
169689Skan#define FP_SUB_E(R,X,Y)		_FP_SUB(E,2,R,X,Y)
169689Skan#define FP_MUL_E(R,X,Y)		_FP_MUL(E,2,R,X,Y)
169689Skan#define FP_DIV_E(R,X,Y)		_FP_DIV(E,2,R,X,Y)
169689Skan#define FP_SQRT_E(R,X)		_FP_SQRT(E,2,R,X)
169689Skan
169689Skan/*
169689Skan * Square root algorithms:
169689Skan * We have just one right now, maybe Newton approximation
169689Skan * should be added for those machines where division is fast.
169689Skan * We optimize it by doing most of the calculations
169689Skan * in one UWtype registers instead of two, although we don't
169689Skan * have to.
169689Skan */
169689Skan#define _FP_SQRT_MEAT_E(R, S, T, X, q)			\
169689Skan  do {							\
169689Skan    q = (_FP_W_TYPE)1 << (_FP_W_TYPE_SIZE - 1);		\
169689Skan    _FP_FRAC_SRL_2(X, (_FP_WORKBITS));			\
169689Skan    while (q)						\
169689Skan      {							\
169689Skan        T##_f0 = S##_f0 + q;				\
169689Skan        if (T##_f0 <= X##_f0)				\
169689Skan          {						\
169689Skan            S##_f0 = T##_f0 + q;			\
169689Skan            X##_f0 -= T##_f0;				\
169689Skan            R##_f0 += q;				\
169689Skan          }						\
169689Skan        _FP_FRAC_SLL_1(X, 1);				\
169689Skan        q >>= 1;					\
169689Skan      }							\
169689Skan    _FP_FRAC_SLL_2(R, (_FP_WORKBITS));			\
169689Skan    if (X##_f0)						\
169689Skan      {							\
169689Skan	if (S##_f0 < X##_f0)				\
169689Skan	  R##_f0 |= _FP_WORK_ROUND;			\
169689Skan	R##_f0 |= _FP_WORK_STICKY;			\
169689Skan      }							\
169689Skan  } while (0)
169689Skan
169689Skan#define FP_CMP_E(r,X,Y,un)	_FP_CMP(E,2,r,X,Y,un)
169689Skan#define FP_CMP_EQ_E(r,X,Y)	_FP_CMP_EQ(E,2,r,X,Y)
169689Skan#define FP_CMP_UNORD_E(r,X,Y)	_FP_CMP_UNORD(E,2,r,X,Y)
169689Skan
169689Skan#define FP_TO_INT_E(r,X,rsz,rsg)	_FP_TO_INT(E,2,r,X,rsz,rsg)
169689Skan#define FP_FROM_INT_E(X,r,rs,rt)	_FP_FROM_INT(E,2,X,r,rs,rt)
169689Skan
169689Skan#define _FP_FRAC_HIGH_E(X)	(X##_f1)
169689Skan#define _FP_FRAC_HIGH_RAW_E(X)	(X##_f0)
169689Skan
169689Skan#endif /* not _FP_W_TYPE_SIZE < 64 */