config/ia64/lib1funcs.asm

169689Skan/* Copyright (C) 2000, 2001, 2003, 2005 Free Software Foundation, Inc.
169689Skan   Contributed by James E. Wilson <wilson@cygnus.com>.
169689Skan
169689Skan   This file is part of GCC.
169689Skan
169689Skan   GCC is free software; you can redistribute it and/or modify
169689Skan   it under the terms of the GNU General Public License as published by
169689Skan   the Free Software Foundation; either version 2, or (at your option)
169689Skan   any later version.
169689Skan
169689Skan   GCC is distributed in the hope that it will be useful,
169689Skan   but WITHOUT ANY WARRANTY; without even the implied warranty of
169689Skan   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
169689Skan   GNU General Public License for more details.
169689Skan
169689Skan   You should have received a copy of the GNU General Public License
169689Skan   along with GCC; see the file COPYING.  If not, write to
169689Skan   the Free Software Foundation, 51 Franklin Street, Fifth Floor,
169689Skan   Boston, MA 02110-1301, USA.  */
169689Skan
169689Skan/* As a special exception, if you link this library with other files,
169689Skan   some of which are compiled with GCC, to produce an executable,
169689Skan   this library does not by itself cause the resulting executable
169689Skan   to be covered by the GNU General Public License.
169689Skan   This exception does not however invalidate any other reasons why
169689Skan   the executable file might be covered by the GNU General Public License.  */
169689Skan
132718Skan#ifdef L__divxf3
90075Sobrien// Compute a 80-bit IEEE double-extended quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// farg0 holds the dividend.  farg1 holds the divisor.
132718Skan//
132718Skan// __divtf3 is an alternate symbol name for backward compatibility.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
132718Skan	.global __divxf3
90075Sobrien	.global __divtf3
132718Skan	.proc __divxf3
132718Skan__divxf3:
90075Sobrien__divtf3:
90075Sobrien	cmp.eq p7, p0 = r0, r0
90075Sobrien	frcpa.s0 f10, p6 = farg0, farg1
90075Sobrien	;;
90075Sobrien(p6)	cmp.ne p7, p0 = r0, r0
90075Sobrien	.pred.rel.mutex p6, p7
90075Sobrien(p6)	fnma.s1 f11 = farg1, f10, f1
90075Sobrien(p6)	fma.s1 f12 = farg0, f10, f0
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f13 = f11, f11, f0
90075Sobrien(p6)	fma.s1 f14 = f11, f11, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f11 = f13, f13, f11
90075Sobrien(p6)	fma.s1 f13 = f14, f10, f10
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f13, f11, f10
90075Sobrien(p6)	fnma.s1 f11 = farg1, f12, farg0
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f11 = f11, f10, f12
90075Sobrien(p6)	fnma.s1 f12 = farg1, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f10
90075Sobrien(p6)	fnma.s1 f12 = farg1, f11, farg0
90075Sobrien	;;
90075Sobrien(p6)	fma.s0 fret0 = f12, f10, f11
90075Sobrien(p7)	mov fret0 = f10
90075Sobrien	br.ret.sptk rp
132718Skan	.endp __divxf3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__divdf3
90075Sobrien// Compute a 64-bit IEEE double quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// farg0 holds the dividend.  farg1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __divdf3
90075Sobrien	.proc __divdf3
90075Sobrien__divdf3:
90075Sobrien	cmp.eq p7, p0 = r0, r0
90075Sobrien	frcpa.s0 f10, p6 = farg0, farg1
90075Sobrien	;;
90075Sobrien(p6)	cmp.ne p7, p0 = r0, r0
90075Sobrien	.pred.rel.mutex p6, p7
90075Sobrien(p6)	fmpy.s1 f11 = farg0, f10
90075Sobrien(p6)	fnma.s1 f12 = farg1, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f11 = f12, f11, f11
90075Sobrien(p6)	fmpy.s1 f13 = f12, f12
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f10
90075Sobrien(p6)	fma.s1 f11 = f13, f11, f11
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f12 = f13, f13
90075Sobrien(p6)	fma.s1 f10 = f13, f10, f10
90075Sobrien	;;
90075Sobrien(p6)	fma.d.s1 f11 = f12, f11, f11
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f10
90075Sobrien	;;
90075Sobrien(p6)	fnma.d.s1 f8 = farg1, f11, farg0
90075Sobrien	;;
90075Sobrien(p6)	fma.d fret0 = f8, f10, f11
90075Sobrien(p7)	mov fret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __divdf3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__divsf3
90075Sobrien// Compute a 32-bit IEEE float quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// farg0 holds the dividend.  farg1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __divsf3
90075Sobrien	.proc __divsf3
90075Sobrien__divsf3:
90075Sobrien	cmp.eq p7, p0 = r0, r0
90075Sobrien	frcpa.s0 f10, p6 = farg0, farg1
90075Sobrien	;;
90075Sobrien(p6)	cmp.ne p7, p0 = r0, r0
90075Sobrien	.pred.rel.mutex p6, p7
90075Sobrien(p6)	fmpy.s1 f8 = farg0, f10
90075Sobrien(p6)	fnma.s1 f9 = farg1, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f8 = f9, f8, f8
90075Sobrien(p6)	fmpy.s1 f9 = f9, f9
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f8 = f9, f8, f8
90075Sobrien(p6)	fmpy.s1 f9 = f9, f9
90075Sobrien	;;
90075Sobrien(p6)	fma.d.s1 f10 = f9, f8, f8
90075Sobrien	;;
90075Sobrien(p6)	fnorm.s.s0 fret0 = f10
90075Sobrien(p7)	mov fret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __divsf3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__divdi3
90075Sobrien// Compute a 64-bit integer quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend.  in1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __divdi3
90075Sobrien	.proc __divdi3
90075Sobrien__divdi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	// Transfer inputs to FP registers.
90075Sobrien	setf.sig f8 = in0
90075Sobrien	setf.sig f9 = in1
169689Skan	// Check divide by zero.
169689Skan	cmp.ne.unc p0,p7=0,in1
90075Sobrien	;;
90075Sobrien	// Convert the inputs to FP, so that they won't be treated as unsigned.
90075Sobrien	fcvt.xf f8 = f8
90075Sobrien	fcvt.xf f9 = f9
169689Skan(p7)	break 1
90075Sobrien	;;
90075Sobrien	// Compute the reciprocal approximation.
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien	// 3 Newton-Raphson iterations.
90075Sobrien(p6)	fnma.s1 f11 = f9, f10, f1
90075Sobrien(p6)	fmpy.s1 f12 = f8, f10
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f13 = f11, f11
90075Sobrien(p6)	fma.s1 f12 = f11, f12, f12
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f11, f10, f10
90075Sobrien(p6)	fma.s1 f11 = f13, f12, f12
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f13, f10, f10
90075Sobrien(p6)	fnma.s1 f12 = f9, f11, f8
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f11
90075Sobrien	;;
90075Sobrien	// Round quotient to an integer.
90075Sobrien	fcvt.fx.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	// Transfer result to GP registers.
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __divdi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__moddi3
90075Sobrien// Compute a 64-bit integer modulus.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend (a).  in1 holds the divisor (b).
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __moddi3
90075Sobrien	.proc __moddi3
90075Sobrien__moddi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	// Transfer inputs to FP registers.
90075Sobrien	setf.sig f14 = in0
90075Sobrien	setf.sig f9 = in1
169689Skan	// Check divide by zero.
169689Skan	cmp.ne.unc p0,p7=0,in1
90075Sobrien	;;
90075Sobrien	// Convert the inputs to FP, so that they won't be treated as unsigned.
90075Sobrien	fcvt.xf f8 = f14
90075Sobrien	fcvt.xf f9 = f9
169689Skan(p7)	break 1
90075Sobrien	;;
90075Sobrien	// Compute the reciprocal approximation.
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien	// 3 Newton-Raphson iterations.
90075Sobrien(p6)	fmpy.s1 f12 = f8, f10
90075Sobrien(p6)	fnma.s1 f11 = f9, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f12 = f11, f12, f12
90075Sobrien(p6)	fmpy.s1 f13 = f11, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f11, f10, f10
90075Sobrien(p6)	fma.s1 f11 = f13, f12, f12
90075Sobrien	;;
90075Sobrien	sub in1 = r0, in1
90075Sobrien(p6)	fma.s1 f10 = f13, f10, f10
90075Sobrien(p6)	fnma.s1 f12 = f9, f11, f8
90075Sobrien	;;
90075Sobrien	setf.sig f9 = in1
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f11
90075Sobrien	;;
90075Sobrien	fcvt.fx.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	// r = q * (-b) + a
90075Sobrien	xma.l f10 = f10, f9, f14
90075Sobrien	;;
90075Sobrien	// Transfer result to GP registers.
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __moddi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__udivdi3
90075Sobrien// Compute a 64-bit unsigned integer quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend.  in1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __udivdi3
90075Sobrien	.proc __udivdi3
90075Sobrien__udivdi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	// Transfer inputs to FP registers.
90075Sobrien	setf.sig f8 = in0
90075Sobrien	setf.sig f9 = in1
169689Skan	// Check divide by zero.
169689Skan	cmp.ne.unc p0,p7=0,in1
90075Sobrien	;;
90075Sobrien	// Convert the inputs to FP, to avoid FP software-assist faults.
90075Sobrien	fcvt.xuf.s1 f8 = f8
90075Sobrien	fcvt.xuf.s1 f9 = f9
169689Skan(p7)	break 1
90075Sobrien	;;
90075Sobrien	// Compute the reciprocal approximation.
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien	// 3 Newton-Raphson iterations.
90075Sobrien(p6)	fnma.s1 f11 = f9, f10, f1
90075Sobrien(p6)	fmpy.s1 f12 = f8, f10
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f13 = f11, f11
90075Sobrien(p6)	fma.s1 f12 = f11, f12, f12
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f11, f10, f10
90075Sobrien(p6)	fma.s1 f11 = f13, f12, f12
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f13, f10, f10
90075Sobrien(p6)	fnma.s1 f12 = f9, f11, f8
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f11
90075Sobrien	;;
90075Sobrien	// Round quotient to an unsigned integer.
90075Sobrien	fcvt.fxu.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	// Transfer result to GP registers.
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __udivdi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__umoddi3
90075Sobrien// Compute a 64-bit unsigned integer modulus.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend (a).  in1 holds the divisor (b).
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __umoddi3
90075Sobrien	.proc __umoddi3
90075Sobrien__umoddi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	// Transfer inputs to FP registers.
90075Sobrien	setf.sig f14 = in0
90075Sobrien	setf.sig f9 = in1
169689Skan	// Check divide by zero.
169689Skan	cmp.ne.unc p0,p7=0,in1
90075Sobrien	;;
90075Sobrien	// Convert the inputs to FP, to avoid FP software assist faults.
90075Sobrien	fcvt.xuf.s1 f8 = f14
90075Sobrien	fcvt.xuf.s1 f9 = f9
169689Skan(p7)	break 1;
90075Sobrien	;;
90075Sobrien	// Compute the reciprocal approximation.
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien	// 3 Newton-Raphson iterations.
90075Sobrien(p6)	fmpy.s1 f12 = f8, f10
90075Sobrien(p6)	fnma.s1 f11 = f9, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f12 = f11, f12, f12
90075Sobrien(p6)	fmpy.s1 f13 = f11, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f11, f10, f10
90075Sobrien(p6)	fma.s1 f11 = f13, f12, f12
90075Sobrien	;;
90075Sobrien	sub in1 = r0, in1
90075Sobrien(p6)	fma.s1 f10 = f13, f10, f10
90075Sobrien(p6)	fnma.s1 f12 = f9, f11, f8
90075Sobrien	;;
90075Sobrien	setf.sig f9 = in1
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f11
90075Sobrien	;;
90075Sobrien	// Round quotient to an unsigned integer.
90075Sobrien	fcvt.fxu.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	// r = q * (-b) + a
90075Sobrien	xma.l f10 = f10, f9, f14
90075Sobrien	;;
90075Sobrien	// Transfer result to GP registers.
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __umoddi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__divsi3
90075Sobrien// Compute a 32-bit integer quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend.  in1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __divsi3
90075Sobrien	.proc __divsi3
90075Sobrien__divsi3:
90075Sobrien	.regstk 2,0,0,0
169689Skan	// Check divide by zero.
169689Skan	cmp.ne.unc p0,p7=0,in1
90075Sobrien	sxt4 in0 = in0
90075Sobrien	sxt4 in1 = in1
90075Sobrien	;;
90075Sobrien	setf.sig f8 = in0
90075Sobrien	setf.sig f9 = in1
169689Skan(p7)	break 1
90075Sobrien	;;
90075Sobrien	mov r2 = 0x0ffdd
90075Sobrien	fcvt.xf f8 = f8
90075Sobrien	fcvt.xf f9 = f9
90075Sobrien	;;
90075Sobrien	setf.exp f11 = r2
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f8 = f8, f10
90075Sobrien(p6)	fnma.s1 f9 = f9, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f8 = f9, f8, f8
90075Sobrien(p6)	fma.s1 f9 = f9, f9, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f9, f8, f8
90075Sobrien	;;
90075Sobrien	fcvt.fx.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __divsi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__modsi3
90075Sobrien// Compute a 32-bit integer modulus.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend.  in1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __modsi3
90075Sobrien	.proc __modsi3
90075Sobrien__modsi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	mov r2 = 0x0ffdd
90075Sobrien	sxt4 in0 = in0
90075Sobrien	sxt4 in1 = in1
90075Sobrien	;;
90075Sobrien	setf.sig f13 = r32
90075Sobrien	setf.sig f9 = r33
169689Skan	// Check divide by zero.
169689Skan	cmp.ne.unc p0,p7=0,in1
90075Sobrien	;;
90075Sobrien	sub in1 = r0, in1
90075Sobrien	fcvt.xf f8 = f13
90075Sobrien	fcvt.xf f9 = f9
90075Sobrien	;;
90075Sobrien	setf.exp f11 = r2
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
169689Skan(p7)	break 1
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f12 = f8, f10
90075Sobrien(p6)	fnma.s1 f10 = f9, f10, f1
90075Sobrien	;;
90075Sobrien	setf.sig f9 = in1
90075Sobrien(p6)	fma.s1 f12 = f10, f12, f12
90075Sobrien(p6)	fma.s1 f10 = f10, f10, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f10, f12, f12
90075Sobrien	;;
90075Sobrien	fcvt.fx.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	xma.l f10 = f10, f9, f13
90075Sobrien	;;
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __modsi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__udivsi3
90075Sobrien// Compute a 32-bit unsigned integer quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend.  in1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __udivsi3
90075Sobrien	.proc __udivsi3
90075Sobrien__udivsi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	mov r2 = 0x0ffdd
90075Sobrien	zxt4 in0 = in0
90075Sobrien	zxt4 in1 = in1
90075Sobrien	;;
90075Sobrien	setf.sig f8 = in0
90075Sobrien	setf.sig f9 = in1
169689Skan	// Check divide by zero.
169689Skan	cmp.ne.unc p0,p7=0,in1
90075Sobrien	;;
90075Sobrien	fcvt.xf f8 = f8
90075Sobrien	fcvt.xf f9 = f9
169689Skan(p7)	break 1
90075Sobrien	;;
90075Sobrien	setf.exp f11 = r2
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f8 = f8, f10
90075Sobrien(p6)	fnma.s1 f9 = f9, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f8 = f9, f8, f8
90075Sobrien(p6)	fma.s1 f9 = f9, f9, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f9, f8, f8
90075Sobrien	;;
90075Sobrien	fcvt.fxu.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __udivsi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__umodsi3
90075Sobrien// Compute a 32-bit unsigned integer modulus.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend.  in1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __umodsi3
90075Sobrien	.proc __umodsi3
90075Sobrien__umodsi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	mov r2 = 0x0ffdd
90075Sobrien	zxt4 in0 = in0
90075Sobrien	zxt4 in1 = in1
90075Sobrien	;;
90075Sobrien	setf.sig f13 = in0
90075Sobrien	setf.sig f9 = in1
169689Skan	// Check divide by zero.
169689Skan	cmp.ne.unc p0,p7=0,in1
90075Sobrien	;;
90075Sobrien	sub in1 = r0, in1
90075Sobrien	fcvt.xf f8 = f13
90075Sobrien	fcvt.xf f9 = f9
90075Sobrien	;;
90075Sobrien	setf.exp f11 = r2
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
169689Skan(p7)	break 1;
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f12 = f8, f10
90075Sobrien(p6)	fnma.s1 f10 = f9, f10, f1
90075Sobrien	;;
90075Sobrien	setf.sig f9 = in1
90075Sobrien(p6)	fma.s1 f12 = f10, f12, f12
90075Sobrien(p6)	fma.s1 f10 = f10, f10, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f10, f12, f12
90075Sobrien	;;
90075Sobrien	fcvt.fxu.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	xma.l f10 = f10, f9, f13
90075Sobrien	;;
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __umodsi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__save_stack_nonlocal
90075Sobrien// Notes on save/restore stack nonlocal: We read ar.bsp but write
90075Sobrien// ar.bspstore.  This is because ar.bsp can be read at all times
90075Sobrien// (independent of the RSE mode) but since it's read-only we need to
90075Sobrien// restore the value via ar.bspstore.  This is OK because
90075Sobrien// ar.bsp==ar.bspstore after executing "flushrs".
90075Sobrien
90075Sobrien// void __ia64_save_stack_nonlocal(void *save_area, void *stack_pointer)
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __ia64_save_stack_nonlocal
90075Sobrien	.proc __ia64_save_stack_nonlocal
90075Sobrien__ia64_save_stack_nonlocal:
90075Sobrien	{ .mmf
90075Sobrien	  alloc r18 = ar.pfs, 2, 0, 0, 0
90075Sobrien	  mov r19 = ar.rsc
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  flushrs
90075Sobrien	  st8 [in0] = in1, 24
90075Sobrien	  and r19 = 0x1c, r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  st8 [in0] = r18, -16
90075Sobrien	  mov ar.rsc = r19
90075Sobrien	  or r19 = 0x3, r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  mov r16 = ar.bsp
90075Sobrien	  mov r17 = ar.rnat
90075Sobrien	  adds r2 = 8, in0
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  st8 [in0] = r16
90075Sobrien	  st8 [r2] = r17
90075Sobrien	}
90075Sobrien	{ .mib
90075Sobrien	  mov ar.rsc = r19
90075Sobrien	  br.ret.sptk.few rp
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	.endp __ia64_save_stack_nonlocal
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__nonlocal_goto
90075Sobrien// void __ia64_nonlocal_goto(void *target_label, void *save_area,
90075Sobrien//			     void *static_chain);
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __ia64_nonlocal_goto
90075Sobrien	.proc __ia64_nonlocal_goto
90075Sobrien__ia64_nonlocal_goto:
90075Sobrien	{ .mmi
90075Sobrien	  alloc r20 = ar.pfs, 3, 0, 0, 0
90075Sobrien	  ld8 r12 = [in1], 8
90075Sobrien	  mov.ret.sptk rp = in0, .L0
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmf
90075Sobrien	  ld8 r16 = [in1], 8
90075Sobrien	  mov r19 = ar.rsc
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  flushrs
90075Sobrien	  ld8 r17 = [in1], 8
90075Sobrien	  and r19 = 0x1c, r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  ld8 r18 = [in1]
90075Sobrien	  mov ar.rsc = r19
90075Sobrien	  or r19 = 0x3, r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  mov ar.bspstore = r16
90075Sobrien	  ;;
90075Sobrien	  mov ar.rnat = r17
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  loadrs
90075Sobrien	  invala
90075Sobrien	  mov r15 = in2
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien.L0:	{ .mib
90075Sobrien	  mov ar.rsc = r19
90075Sobrien	  mov ar.pfs = r18
90075Sobrien	  br.ret.sptk.few rp
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	.endp __ia64_nonlocal_goto
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__restore_stack_nonlocal
90075Sobrien// This is mostly the same as nonlocal_goto above.
90075Sobrien// ??? This has not been tested yet.
90075Sobrien
90075Sobrien// void __ia64_restore_stack_nonlocal(void *save_area)
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __ia64_restore_stack_nonlocal
90075Sobrien	.proc __ia64_restore_stack_nonlocal
90075Sobrien__ia64_restore_stack_nonlocal:
90075Sobrien	{ .mmf
90075Sobrien	  alloc r20 = ar.pfs, 4, 0, 0, 0
90075Sobrien	  ld8 r12 = [in0], 8
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmb
90075Sobrien	  ld8 r16=[in0], 8
90075Sobrien	  mov r19 = ar.rsc
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  flushrs
90075Sobrien	  ld8 r17 = [in0], 8
90075Sobrien	  and r19 = 0x1c, r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmf
90075Sobrien	  ld8 r18 = [in0]
90075Sobrien	  mov ar.rsc = r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  mov ar.bspstore = r16
90075Sobrien	  ;;
90075Sobrien	  mov ar.rnat = r17
90075Sobrien	  or r19 = 0x3, r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmf
90075Sobrien	  loadrs
90075Sobrien	  invala
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien.L0:	{ .mib
90075Sobrien	  mov ar.rsc = r19
90075Sobrien	  mov ar.pfs = r18
90075Sobrien	  br.ret.sptk.few rp
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	.endp __ia64_restore_stack_nonlocal
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__trampoline
90075Sobrien// Implement the nested function trampoline.  This is out of line
90075Sobrien// so that we don't have to bother with flushing the icache, as
90075Sobrien// well as making the on-stack trampoline smaller.
90075Sobrien//
90075Sobrien// The trampoline has the following form:
90075Sobrien//
90075Sobrien//		+-------------------+ >
90075Sobrien//	TRAMP:	| __ia64_trampoline | |
90075Sobrien//		+-------------------+  > fake function descriptor
90075Sobrien//		| TRAMP+16          | |
90075Sobrien//		+-------------------+ >
90075Sobrien//		| target descriptor |
90075Sobrien//		+-------------------+
90075Sobrien//		| static link	    |
90075Sobrien//		+-------------------+
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __ia64_trampoline
90075Sobrien	.proc __ia64_trampoline
90075Sobrien__ia64_trampoline:
90075Sobrien	{ .mmi
90075Sobrien	  ld8 r2 = [r1], 8
90075Sobrien	  ;;
90075Sobrien	  ld8 r15 = [r1]
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  ld8 r3 = [r2], 8
90075Sobrien	  ;;
90075Sobrien	  ld8 r1 = [r2]
90075Sobrien	  mov b6 = r3
90075Sobrien	}
90075Sobrien	{ .bbb
90075Sobrien	  br.sptk.many b6
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	.endp __ia64_trampoline
90075Sobrien#endif
132718Skan
132718Skan// Thunks for backward compatibility.
169689Skan#ifdef L_fixtfdi
132718Skan	.text
132718Skan	.align 16
132718Skan	.global __fixtfti
132718Skan	.proc __fixtfti
132718Skan__fixtfti:
132718Skan	{ .bbb
132718Skan	  br.sptk.many __fixxfti
132718Skan	  ;;
132718Skan	}
132718Skan	.endp __fixtfti
169689Skan#endif
169689Skan#ifdef L_fixunstfdi
132718Skan	.align 16
132718Skan	.global __fixunstfti
132718Skan	.proc __fixunstfti
132718Skan__fixunstfti:
132718Skan	{ .bbb
132718Skan	  br.sptk.many __fixunsxfti
132718Skan	  ;;
132718Skan	}
132718Skan	.endp __fixunstfti
169689Skan#endif
169689Skan#if L_floatditf
132718Skan	.align 16
132718Skan	.global __floattitf
132718Skan	.proc __floattitf
132718Skan__floattitf:
132718Skan	{ .bbb
132718Skan	  br.sptk.many __floattixf
132718Skan	  ;;
132718Skan	}
132718Skan	.endp __floattitf
132718Skan#endif