config/ia64/lib1funcs.asm

132718Skan#ifdef L__divxf3
90075Sobrien// Compute a 80-bit IEEE double-extended quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// farg0 holds the dividend.  farg1 holds the divisor.
132718Skan//
132718Skan// __divtf3 is an alternate symbol name for backward compatibility.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
132718Skan	.global __divxf3
90075Sobrien	.global __divtf3
132718Skan	.proc __divxf3
132718Skan__divxf3:
90075Sobrien__divtf3:
90075Sobrien	cmp.eq p7, p0 = r0, r0
90075Sobrien	frcpa.s0 f10, p6 = farg0, farg1
90075Sobrien	;;
90075Sobrien(p6)	cmp.ne p7, p0 = r0, r0
90075Sobrien	.pred.rel.mutex p6, p7
90075Sobrien(p6)	fnma.s1 f11 = farg1, f10, f1
90075Sobrien(p6)	fma.s1 f12 = farg0, f10, f0
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f13 = f11, f11, f0
90075Sobrien(p6)	fma.s1 f14 = f11, f11, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f11 = f13, f13, f11
90075Sobrien(p6)	fma.s1 f13 = f14, f10, f10
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f13, f11, f10
90075Sobrien(p6)	fnma.s1 f11 = farg1, f12, farg0
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f11 = f11, f10, f12
90075Sobrien(p6)	fnma.s1 f12 = farg1, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f10
90075Sobrien(p6)	fnma.s1 f12 = farg1, f11, farg0
90075Sobrien	;;
90075Sobrien(p6)	fma.s0 fret0 = f12, f10, f11
90075Sobrien(p7)	mov fret0 = f10
90075Sobrien	br.ret.sptk rp
132718Skan	.endp __divxf3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__divdf3
90075Sobrien// Compute a 64-bit IEEE double quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// farg0 holds the dividend.  farg1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __divdf3
90075Sobrien	.proc __divdf3
90075Sobrien__divdf3:
90075Sobrien	cmp.eq p7, p0 = r0, r0
90075Sobrien	frcpa.s0 f10, p6 = farg0, farg1
90075Sobrien	;;
90075Sobrien(p6)	cmp.ne p7, p0 = r0, r0
90075Sobrien	.pred.rel.mutex p6, p7
90075Sobrien(p6)	fmpy.s1 f11 = farg0, f10
90075Sobrien(p6)	fnma.s1 f12 = farg1, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f11 = f12, f11, f11
90075Sobrien(p6)	fmpy.s1 f13 = f12, f12
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f10
90075Sobrien(p6)	fma.s1 f11 = f13, f11, f11
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f12 = f13, f13
90075Sobrien(p6)	fma.s1 f10 = f13, f10, f10
90075Sobrien	;;
90075Sobrien(p6)	fma.d.s1 f11 = f12, f11, f11
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f10
90075Sobrien	;;
90075Sobrien(p6)	fnma.d.s1 f8 = farg1, f11, farg0
90075Sobrien	;;
90075Sobrien(p6)	fma.d fret0 = f8, f10, f11
90075Sobrien(p7)	mov fret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __divdf3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__divsf3
90075Sobrien// Compute a 32-bit IEEE float quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// farg0 holds the dividend.  farg1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __divsf3
90075Sobrien	.proc __divsf3
90075Sobrien__divsf3:
90075Sobrien	cmp.eq p7, p0 = r0, r0
90075Sobrien	frcpa.s0 f10, p6 = farg0, farg1
90075Sobrien	;;
90075Sobrien(p6)	cmp.ne p7, p0 = r0, r0
90075Sobrien	.pred.rel.mutex p6, p7
90075Sobrien(p6)	fmpy.s1 f8 = farg0, f10
90075Sobrien(p6)	fnma.s1 f9 = farg1, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f8 = f9, f8, f8
90075Sobrien(p6)	fmpy.s1 f9 = f9, f9
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f8 = f9, f8, f8
90075Sobrien(p6)	fmpy.s1 f9 = f9, f9
90075Sobrien	;;
90075Sobrien(p6)	fma.d.s1 f10 = f9, f8, f8
90075Sobrien	;;
90075Sobrien(p6)	fnorm.s.s0 fret0 = f10
90075Sobrien(p7)	mov fret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __divsf3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__divdi3
90075Sobrien// Compute a 64-bit integer quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend.  in1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __divdi3
90075Sobrien	.proc __divdi3
90075Sobrien__divdi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	// Transfer inputs to FP registers.
90075Sobrien	setf.sig f8 = in0
90075Sobrien	setf.sig f9 = in1
90075Sobrien	;;
90075Sobrien	// Convert the inputs to FP, so that they won't be treated as unsigned.
90075Sobrien	fcvt.xf f8 = f8
90075Sobrien	fcvt.xf f9 = f9
90075Sobrien	;;
90075Sobrien	// Compute the reciprocal approximation.
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien	// 3 Newton-Raphson iterations.
90075Sobrien(p6)	fnma.s1 f11 = f9, f10, f1
90075Sobrien(p6)	fmpy.s1 f12 = f8, f10
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f13 = f11, f11
90075Sobrien(p6)	fma.s1 f12 = f11, f12, f12
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f11, f10, f10
90075Sobrien(p6)	fma.s1 f11 = f13, f12, f12
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f13, f10, f10
90075Sobrien(p6)	fnma.s1 f12 = f9, f11, f8
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f11
90075Sobrien	;;
90075Sobrien	// Round quotient to an integer.
90075Sobrien	fcvt.fx.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	// Transfer result to GP registers.
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __divdi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__moddi3
90075Sobrien// Compute a 64-bit integer modulus.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend (a).  in1 holds the divisor (b).
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __moddi3
90075Sobrien	.proc __moddi3
90075Sobrien__moddi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	// Transfer inputs to FP registers.
90075Sobrien	setf.sig f14 = in0
90075Sobrien	setf.sig f9 = in1
90075Sobrien	;;
90075Sobrien	// Convert the inputs to FP, so that they won't be treated as unsigned.
90075Sobrien	fcvt.xf f8 = f14
90075Sobrien	fcvt.xf f9 = f9
90075Sobrien	;;
90075Sobrien	// Compute the reciprocal approximation.
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien	// 3 Newton-Raphson iterations.
90075Sobrien(p6)	fmpy.s1 f12 = f8, f10
90075Sobrien(p6)	fnma.s1 f11 = f9, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f12 = f11, f12, f12
90075Sobrien(p6)	fmpy.s1 f13 = f11, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f11, f10, f10
90075Sobrien(p6)	fma.s1 f11 = f13, f12, f12
90075Sobrien	;;
90075Sobrien	sub in1 = r0, in1
90075Sobrien(p6)	fma.s1 f10 = f13, f10, f10
90075Sobrien(p6)	fnma.s1 f12 = f9, f11, f8
90075Sobrien	;;
90075Sobrien	setf.sig f9 = in1
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f11
90075Sobrien	;;
90075Sobrien	fcvt.fx.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	// r = q * (-b) + a
90075Sobrien	xma.l f10 = f10, f9, f14
90075Sobrien	;;
90075Sobrien	// Transfer result to GP registers.
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __moddi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__udivdi3
90075Sobrien// Compute a 64-bit unsigned integer quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend.  in1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __udivdi3
90075Sobrien	.proc __udivdi3
90075Sobrien__udivdi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	// Transfer inputs to FP registers.
90075Sobrien	setf.sig f8 = in0
90075Sobrien	setf.sig f9 = in1
90075Sobrien	;;
90075Sobrien	// Convert the inputs to FP, to avoid FP software-assist faults.
90075Sobrien	fcvt.xuf.s1 f8 = f8
90075Sobrien	fcvt.xuf.s1 f9 = f9
90075Sobrien	;;
90075Sobrien	// Compute the reciprocal approximation.
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien	// 3 Newton-Raphson iterations.
90075Sobrien(p6)	fnma.s1 f11 = f9, f10, f1
90075Sobrien(p6)	fmpy.s1 f12 = f8, f10
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f13 = f11, f11
90075Sobrien(p6)	fma.s1 f12 = f11, f12, f12
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f11, f10, f10
90075Sobrien(p6)	fma.s1 f11 = f13, f12, f12
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f13, f10, f10
90075Sobrien(p6)	fnma.s1 f12 = f9, f11, f8
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f11
90075Sobrien	;;
90075Sobrien	// Round quotient to an unsigned integer.
90075Sobrien	fcvt.fxu.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	// Transfer result to GP registers.
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __udivdi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__umoddi3
90075Sobrien// Compute a 64-bit unsigned integer modulus.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend (a).  in1 holds the divisor (b).
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __umoddi3
90075Sobrien	.proc __umoddi3
90075Sobrien__umoddi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	// Transfer inputs to FP registers.
90075Sobrien	setf.sig f14 = in0
90075Sobrien	setf.sig f9 = in1
90075Sobrien	;;
90075Sobrien	// Convert the inputs to FP, to avoid FP software assist faults.
90075Sobrien	fcvt.xuf.s1 f8 = f14
90075Sobrien	fcvt.xuf.s1 f9 = f9
90075Sobrien	;;
90075Sobrien	// Compute the reciprocal approximation.
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien	// 3 Newton-Raphson iterations.
90075Sobrien(p6)	fmpy.s1 f12 = f8, f10
90075Sobrien(p6)	fnma.s1 f11 = f9, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f12 = f11, f12, f12
90075Sobrien(p6)	fmpy.s1 f13 = f11, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f11, f10, f10
90075Sobrien(p6)	fma.s1 f11 = f13, f12, f12
90075Sobrien	;;
90075Sobrien	sub in1 = r0, in1
90075Sobrien(p6)	fma.s1 f10 = f13, f10, f10
90075Sobrien(p6)	fnma.s1 f12 = f9, f11, f8
90075Sobrien	;;
90075Sobrien	setf.sig f9 = in1
90075Sobrien(p6)	fma.s1 f10 = f12, f10, f11
90075Sobrien	;;
90075Sobrien	// Round quotient to an unsigned integer.
90075Sobrien	fcvt.fxu.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	// r = q * (-b) + a
90075Sobrien	xma.l f10 = f10, f9, f14
90075Sobrien	;;
90075Sobrien	// Transfer result to GP registers.
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __umoddi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__divsi3
90075Sobrien// Compute a 32-bit integer quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend.  in1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __divsi3
90075Sobrien	.proc __divsi3
90075Sobrien__divsi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	sxt4 in0 = in0
90075Sobrien	sxt4 in1 = in1
90075Sobrien	;;
90075Sobrien	setf.sig f8 = in0
90075Sobrien	setf.sig f9 = in1
90075Sobrien	;;
90075Sobrien	mov r2 = 0x0ffdd
90075Sobrien	fcvt.xf f8 = f8
90075Sobrien	fcvt.xf f9 = f9
90075Sobrien	;;
90075Sobrien	setf.exp f11 = r2
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f8 = f8, f10
90075Sobrien(p6)	fnma.s1 f9 = f9, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f8 = f9, f8, f8
90075Sobrien(p6)	fma.s1 f9 = f9, f9, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f9, f8, f8
90075Sobrien	;;
90075Sobrien	fcvt.fx.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __divsi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__modsi3
90075Sobrien// Compute a 32-bit integer modulus.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend.  in1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __modsi3
90075Sobrien	.proc __modsi3
90075Sobrien__modsi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	mov r2 = 0x0ffdd
90075Sobrien	sxt4 in0 = in0
90075Sobrien	sxt4 in1 = in1
90075Sobrien	;;
90075Sobrien	setf.sig f13 = r32
90075Sobrien	setf.sig f9 = r33
90075Sobrien	;;
90075Sobrien	sub in1 = r0, in1
90075Sobrien	fcvt.xf f8 = f13
90075Sobrien	fcvt.xf f9 = f9
90075Sobrien	;;
90075Sobrien	setf.exp f11 = r2
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f12 = f8, f10
90075Sobrien(p6)	fnma.s1 f10 = f9, f10, f1
90075Sobrien	;;
90075Sobrien	setf.sig f9 = in1
90075Sobrien(p6)	fma.s1 f12 = f10, f12, f12
90075Sobrien(p6)	fma.s1 f10 = f10, f10, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f10, f12, f12
90075Sobrien	;;
90075Sobrien	fcvt.fx.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	xma.l f10 = f10, f9, f13
90075Sobrien	;;
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __modsi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__udivsi3
90075Sobrien// Compute a 32-bit unsigned integer quotient.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend.  in1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __udivsi3
90075Sobrien	.proc __udivsi3
90075Sobrien__udivsi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	mov r2 = 0x0ffdd
90075Sobrien	zxt4 in0 = in0
90075Sobrien	zxt4 in1 = in1
90075Sobrien	;;
90075Sobrien	setf.sig f8 = in0
90075Sobrien	setf.sig f9 = in1
90075Sobrien	;;
90075Sobrien	fcvt.xf f8 = f8
90075Sobrien	fcvt.xf f9 = f9
90075Sobrien	;;
90075Sobrien	setf.exp f11 = r2
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f8 = f8, f10
90075Sobrien(p6)	fnma.s1 f9 = f9, f10, f1
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f8 = f9, f8, f8
90075Sobrien(p6)	fma.s1 f9 = f9, f9, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f9, f8, f8
90075Sobrien	;;
90075Sobrien	fcvt.fxu.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __udivsi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__umodsi3
90075Sobrien// Compute a 32-bit unsigned integer modulus.
90075Sobrien//
90075Sobrien// From the Intel IA-64 Optimization Guide, choose the minimum latency
90075Sobrien// alternative.
90075Sobrien//
90075Sobrien// in0 holds the dividend.  in1 holds the divisor.
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __umodsi3
90075Sobrien	.proc __umodsi3
90075Sobrien__umodsi3:
90075Sobrien	.regstk 2,0,0,0
90075Sobrien	mov r2 = 0x0ffdd
90075Sobrien	zxt4 in0 = in0
90075Sobrien	zxt4 in1 = in1
90075Sobrien	;;
90075Sobrien	setf.sig f13 = in0
90075Sobrien	setf.sig f9 = in1
90075Sobrien	;;
90075Sobrien	sub in1 = r0, in1
90075Sobrien	fcvt.xf f8 = f13
90075Sobrien	fcvt.xf f9 = f9
90075Sobrien	;;
90075Sobrien	setf.exp f11 = r2
90075Sobrien	frcpa.s1 f10, p6 = f8, f9
90075Sobrien	;;
90075Sobrien(p6)	fmpy.s1 f12 = f8, f10
90075Sobrien(p6)	fnma.s1 f10 = f9, f10, f1
90075Sobrien	;;
90075Sobrien	setf.sig f9 = in1
90075Sobrien(p6)	fma.s1 f12 = f10, f12, f12
90075Sobrien(p6)	fma.s1 f10 = f10, f10, f11
90075Sobrien	;;
90075Sobrien(p6)	fma.s1 f10 = f10, f12, f12
90075Sobrien	;;
90075Sobrien	fcvt.fxu.trunc.s1 f10 = f10
90075Sobrien	;;
90075Sobrien	xma.l f10 = f10, f9, f13
90075Sobrien	;;
90075Sobrien	getf.sig ret0 = f10
90075Sobrien	br.ret.sptk rp
90075Sobrien	;;
90075Sobrien	.endp __umodsi3
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__save_stack_nonlocal
90075Sobrien// Notes on save/restore stack nonlocal: We read ar.bsp but write
90075Sobrien// ar.bspstore.  This is because ar.bsp can be read at all times
90075Sobrien// (independent of the RSE mode) but since it's read-only we need to
90075Sobrien// restore the value via ar.bspstore.  This is OK because
90075Sobrien// ar.bsp==ar.bspstore after executing "flushrs".
90075Sobrien
90075Sobrien// void __ia64_save_stack_nonlocal(void *save_area, void *stack_pointer)
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __ia64_save_stack_nonlocal
90075Sobrien	.proc __ia64_save_stack_nonlocal
90075Sobrien__ia64_save_stack_nonlocal:
90075Sobrien	{ .mmf
90075Sobrien	  alloc r18 = ar.pfs, 2, 0, 0, 0
90075Sobrien	  mov r19 = ar.rsc
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  flushrs
90075Sobrien	  st8 [in0] = in1, 24
90075Sobrien	  and r19 = 0x1c, r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  st8 [in0] = r18, -16
90075Sobrien	  mov ar.rsc = r19
90075Sobrien	  or r19 = 0x3, r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  mov r16 = ar.bsp
90075Sobrien	  mov r17 = ar.rnat
90075Sobrien	  adds r2 = 8, in0
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  st8 [in0] = r16
90075Sobrien	  st8 [r2] = r17
90075Sobrien	}
90075Sobrien	{ .mib
90075Sobrien	  mov ar.rsc = r19
90075Sobrien	  br.ret.sptk.few rp
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	.endp __ia64_save_stack_nonlocal
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__nonlocal_goto
90075Sobrien// void __ia64_nonlocal_goto(void *target_label, void *save_area,
90075Sobrien//			     void *static_chain);
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __ia64_nonlocal_goto
90075Sobrien	.proc __ia64_nonlocal_goto
90075Sobrien__ia64_nonlocal_goto:
90075Sobrien	{ .mmi
90075Sobrien	  alloc r20 = ar.pfs, 3, 0, 0, 0
90075Sobrien	  ld8 r12 = [in1], 8
90075Sobrien	  mov.ret.sptk rp = in0, .L0
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmf
90075Sobrien	  ld8 r16 = [in1], 8
90075Sobrien	  mov r19 = ar.rsc
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  flushrs
90075Sobrien	  ld8 r17 = [in1], 8
90075Sobrien	  and r19 = 0x1c, r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  ld8 r18 = [in1]
90075Sobrien	  mov ar.rsc = r19
90075Sobrien	  or r19 = 0x3, r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  mov ar.bspstore = r16
90075Sobrien	  ;;
90075Sobrien	  mov ar.rnat = r17
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  loadrs
90075Sobrien	  invala
90075Sobrien	  mov r15 = in2
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien.L0:	{ .mib
90075Sobrien	  mov ar.rsc = r19
90075Sobrien	  mov ar.pfs = r18
90075Sobrien	  br.ret.sptk.few rp
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	.endp __ia64_nonlocal_goto
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__restore_stack_nonlocal
90075Sobrien// This is mostly the same as nonlocal_goto above.
90075Sobrien// ??? This has not been tested yet.
90075Sobrien
90075Sobrien// void __ia64_restore_stack_nonlocal(void *save_area)
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __ia64_restore_stack_nonlocal
90075Sobrien	.proc __ia64_restore_stack_nonlocal
90075Sobrien__ia64_restore_stack_nonlocal:
90075Sobrien	{ .mmf
90075Sobrien	  alloc r20 = ar.pfs, 4, 0, 0, 0
90075Sobrien	  ld8 r12 = [in0], 8
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmb
90075Sobrien	  ld8 r16=[in0], 8
90075Sobrien	  mov r19 = ar.rsc
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  flushrs
90075Sobrien	  ld8 r17 = [in0], 8
90075Sobrien	  and r19 = 0x1c, r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmf
90075Sobrien	  ld8 r18 = [in0]
90075Sobrien	  mov ar.rsc = r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  mov ar.bspstore = r16
90075Sobrien	  ;;
90075Sobrien	  mov ar.rnat = r17
90075Sobrien	  or r19 = 0x3, r19
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	{ .mmf
90075Sobrien	  loadrs
90075Sobrien	  invala
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien.L0:	{ .mib
90075Sobrien	  mov ar.rsc = r19
90075Sobrien	  mov ar.pfs = r18
90075Sobrien	  br.ret.sptk.few rp
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	.endp __ia64_restore_stack_nonlocal
90075Sobrien#endif
90075Sobrien
90075Sobrien#ifdef L__trampoline
90075Sobrien// Implement the nested function trampoline.  This is out of line
90075Sobrien// so that we don't have to bother with flushing the icache, as
90075Sobrien// well as making the on-stack trampoline smaller.
90075Sobrien//
90075Sobrien// The trampoline has the following form:
90075Sobrien//
90075Sobrien//		+-------------------+ >
90075Sobrien//	TRAMP:	| __ia64_trampoline | |
90075Sobrien//		+-------------------+  > fake function descriptor
90075Sobrien//		| TRAMP+16          | |
90075Sobrien//		+-------------------+ >
90075Sobrien//		| target descriptor |
90075Sobrien//		+-------------------+
90075Sobrien//		| static link	    |
90075Sobrien//		+-------------------+
90075Sobrien
90075Sobrien	.text
90075Sobrien	.align 16
90075Sobrien	.global __ia64_trampoline
90075Sobrien	.proc __ia64_trampoline
90075Sobrien__ia64_trampoline:
90075Sobrien	{ .mmi
90075Sobrien	  ld8 r2 = [r1], 8
90075Sobrien	  ;;
90075Sobrien	  ld8 r15 = [r1]
90075Sobrien	}
90075Sobrien	{ .mmi
90075Sobrien	  ld8 r3 = [r2], 8
90075Sobrien	  ;;
90075Sobrien	  ld8 r1 = [r2]
90075Sobrien	  mov b6 = r3
90075Sobrien	}
90075Sobrien	{ .bbb
90075Sobrien	  br.sptk.many b6
90075Sobrien	  ;;
90075Sobrien	}
90075Sobrien	.endp __ia64_trampoline
90075Sobrien#endif
132718Skan
132718Skan#ifdef L__compat
132718Skan// Thunks for backward compatibility.
132718Skan
132718Skan	.text
132718Skan	.align 16
132718Skan	.global __fixtfti
132718Skan	.proc __fixtfti
132718Skan__fixtfti:
132718Skan	{ .bbb
132718Skan	  br.sptk.many __fixxfti
132718Skan	  ;;
132718Skan	}
132718Skan	.endp __fixtfti
132718Skan
132718Skan	.align 16
132718Skan	.global __fixunstfti
132718Skan	.proc __fixunstfti
132718Skan__fixunstfti:
132718Skan	{ .bbb
132718Skan	  br.sptk.many __fixunsxfti
132718Skan	  ;;
132718Skan	}
132718Skan	.endp __fixunstfti
132718Skan
132718Skan	.align 16
132718Skan	.global __floattitf
132718Skan	.proc __floattitf
132718Skan__floattitf:
132718Skan	{ .bbb
132718Skan	  br.sptk.many __floattixf
132718Skan	  ;;
132718Skan	}
132718Skan	.endp __floattitf
132718Skan
132718Skan#endif