builtins/x86_64/floatundixf.S

*3cab2bb3Spatrick// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
*3cab2bb3Spatrick// See https://llvm.org/LICENSE.txt for license information.
*3cab2bb3Spatrick// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
*3cab2bb3Spatrick
*3cab2bb3Spatrick#include "../assembly.h"
*3cab2bb3Spatrick
*3cab2bb3Spatrick// long double __floatundixf(du_int a);
*3cab2bb3Spatrick
*3cab2bb3Spatrick#ifdef __x86_64__
*3cab2bb3Spatrick
*3cab2bb3SpatrickCONST_SECTION
*3cab2bb3Spatrick
*3cab2bb3Spatrick	.balign 16
*3cab2bb3Spatricktwop64:
*3cab2bb3Spatrick	.quad 0x43f0000000000000
*3cab2bb3Spatrick
*3cab2bb3Spatrick#define REL_ADDR(_a)	(_a)(%rip)
*3cab2bb3Spatrick
*3cab2bb3Spatrick	.text
*3cab2bb3Spatrick
*3cab2bb3Spatrick	.balign 4
*3cab2bb3SpatrickDEFINE_COMPILERRT_FUNCTION(__floatundixf)
*3cab2bb3Spatrick	movq	%rdi,	 -8(%rsp)
*3cab2bb3Spatrick	fildq	-8(%rsp)
*3cab2bb3Spatrick	test	%rdi,		%rdi
*3cab2bb3Spatrick	js		1f
*3cab2bb3Spatrick	ret
*3cab2bb3Spatrick1:	faddl	REL_ADDR(twop64)
*3cab2bb3Spatrick	ret
*3cab2bb3SpatrickEND_COMPILERRT_FUNCTION(__floatundixf)
*3cab2bb3Spatrick
*3cab2bb3Spatrick#endif // __x86_64__
*3cab2bb3Spatrick
*3cab2bb3Spatrick
*3cab2bb3Spatrick/* Branch-free implementation is ever so slightly slower, but more beautiful.
*3cab2bb3Spatrick   It is likely superior for inlining, so I kept it around for future reference.
*3cab2bb3Spatrick
*3cab2bb3Spatrick#ifdef __x86_64__
*3cab2bb3Spatrick
*3cab2bb3SpatrickCONST_SECTION
*3cab2bb3Spatrick
*3cab2bb3Spatrick	.balign 4
*3cab2bb3Spatricktwop52:
*3cab2bb3Spatrick	.quad 0x4330000000000000
*3cab2bb3Spatricktwop84_plus_twop52_neg:
*3cab2bb3Spatrick	.quad 0xc530000000100000
*3cab2bb3Spatricktwop84:
*3cab2bb3Spatrick	.quad 0x4530000000000000
*3cab2bb3Spatrick
*3cab2bb3Spatrick#define REL_ADDR(_a)	(_a)(%rip)
*3cab2bb3Spatrick
*3cab2bb3Spatrick.text
*3cab2bb3Spatrick.balign 4
*3cab2bb3SpatrickDEFINE_COMPILERRT_FUNCTION(__floatundixf)
*3cab2bb3Spatrick	movl	%edi,				%esi			// low 32 bits of input
*3cab2bb3Spatrick	shrq	$32,				%rdi			// hi 32 bits of input
*3cab2bb3Spatrick	orq		REL_ADDR(twop84),	%rdi			// 2^84 + hi (as a double)
*3cab2bb3Spatrick	orq		REL_ADDR(twop52),	%rsi			// 2^52 + lo (as a double)
*3cab2bb3Spatrick	movq	%rdi,			 -8(%rsp)
*3cab2bb3Spatrick	movq	%rsi,			-16(%rsp)
*3cab2bb3Spatrick	fldl	REL_ADDR(twop84_plus_twop52_neg)
*3cab2bb3Spatrick	faddl	-8(%rsp)	// hi - 2^52 (as double extended, no rounding occurs)
*3cab2bb3Spatrick	faddl	-16(%rsp)	// hi + lo (as double extended)
*3cab2bb3Spatrick	ret
*3cab2bb3SpatrickEND_COMPILERRT_FUNCTION(__floatundixf)
*3cab2bb3Spatrick
*3cab2bb3Spatrick#endif // __x86_64__
*3cab2bb3Spatrick
*3cab2bb3Spatrick*/
*3cab2bb3Spatrick
*3cab2bb3SpatrickNO_EXEC_STACK_DIRECTIVE
*3cab2bb3Spatrick