builtins/x86_64/floatundixf.S

276789Sdim// This file is dual licensed under the MIT and the University of Illinois Open
276789Sdim// Source Licenses. See LICENSE.TXT for details.
276789Sdim
276789Sdim#include "../assembly.h"
276789Sdim
276789Sdim// long double __floatundixf(du_int a);
276789Sdim
276789Sdim#ifdef __x86_64__
276789Sdim
276789SdimCONST_SECTION
276789Sdim
276789Sdim	.balign 16
276789Sdimtwop64:
276789Sdim	.quad 0x43f0000000000000
276789Sdim
276789Sdim#define REL_ADDR(_a)	(_a)(%rip)
276789Sdim
276789Sdim	.text
276789Sdim
276789Sdim	.balign 4
276789SdimDEFINE_COMPILERRT_FUNCTION(__floatundixf)
276789Sdim	movq	%rdi,	 -8(%rsp)
276789Sdim	fildq	-8(%rsp)
276789Sdim	test	%rdi,		%rdi
276789Sdim	js		1f
276789Sdim	ret
276789Sdim1:	faddl	REL_ADDR(twop64)
276789Sdim	ret
276789SdimEND_COMPILERRT_FUNCTION(__floatundixf)
276789Sdim
276789Sdim#endif // __x86_64__
276789Sdim
276789Sdim
276789Sdim/* Branch-free implementation is ever so slightly slower, but more beautiful.
276789Sdim   It is likely superior for inlining, so I kept it around for future reference.
276789Sdim
276789Sdim#ifdef __x86_64__
276789Sdim
276789SdimCONST_SECTION
276789Sdim
276789Sdim	.balign 4
276789Sdimtwop52:
276789Sdim	.quad 0x4330000000000000
276789Sdimtwop84_plus_twop52_neg:
276789Sdim	.quad 0xc530000000100000
276789Sdimtwop84:
276789Sdim	.quad 0x4530000000000000
276789Sdim
276789Sdim#define REL_ADDR(_a)	(_a)(%rip)
276789Sdim
276789Sdim.text
276789Sdim.balign 4
276789SdimDEFINE_COMPILERRT_FUNCTION(__floatundixf)
276789Sdim	movl	%edi,				%esi			// low 32 bits of input
276789Sdim	shrq	$32,				%rdi			// hi 32 bits of input
276789Sdim	orq		REL_ADDR(twop84),	%rdi			// 2^84 + hi (as a double)
276789Sdim	orq		REL_ADDR(twop52),	%rsi			// 2^52 + lo (as a double)
276789Sdim	movq	%rdi,			 -8(%rsp)
276789Sdim	movq	%rsi,			-16(%rsp)
276789Sdim	fldl	REL_ADDR(twop84_plus_twop52_neg)
276789Sdim	faddl	-8(%rsp)	// hi - 2^52 (as double extended, no rounding occurs)
276789Sdim	faddl	-16(%rsp)	// hi + lo (as double extended)
276789Sdim	ret
276789SdimEND_COMPILERRT_FUNCTION(__floatundixf)
276789Sdim
276789Sdim#endif // __x86_64__
276789Sdim
276789Sdim*/