qemu/fpu/softfloat-parts.c.inc

7c45bad8SRichard Henderson/*
7c45bad8SRichard Henderson * QEMU float support
7c45bad8SRichard Henderson *
7c45bad8SRichard Henderson * The code in this source file is derived from release 2a of the SoftFloat
7c45bad8SRichard Henderson * IEC/IEEE Floating-point Arithmetic Package. Those parts of the code (and
7c45bad8SRichard Henderson * some later contributions) are provided under that license, as detailed below.
7c45bad8SRichard Henderson * It has subsequently been modified by contributors to the QEMU Project,
7c45bad8SRichard Henderson * so some portions are provided under:
7c45bad8SRichard Henderson *  the SoftFloat-2a license
7c45bad8SRichard Henderson *  the BSD license
7c45bad8SRichard Henderson *  GPL-v2-or-later
7c45bad8SRichard Henderson *
7c45bad8SRichard Henderson * Any future contributions to this file after December 1st 2014 will be
7c45bad8SRichard Henderson * taken to be licensed under the Softfloat-2a license unless specifically
7c45bad8SRichard Henderson * indicated otherwise.
7c45bad8SRichard Henderson */
7c45bad8SRichard Henderson
7c45bad8SRichard Hendersonstatic void partsN(return_nan)(FloatPartsN *a, float_status *s)
7c45bad8SRichard Henderson{
7c45bad8SRichard Henderson    switch (a->cls) {
7c45bad8SRichard Henderson    case float_class_snan:
e706d445SRichard Henderson        float_raise(float_flag_invalid | float_flag_invalid_snan, s);
7c45bad8SRichard Henderson        if (s->default_nan_mode) {
7c45bad8SRichard Henderson            parts_default_nan(a, s);
7c45bad8SRichard Henderson        } else {
7c45bad8SRichard Henderson            parts_silence_nan(a, s);
7c45bad8SRichard Henderson        }
7c45bad8SRichard Henderson        break;
7c45bad8SRichard Henderson    case float_class_qnan:
7c45bad8SRichard Henderson        if (s->default_nan_mode) {
7c45bad8SRichard Henderson            parts_default_nan(a, s);
7c45bad8SRichard Henderson        }
7c45bad8SRichard Henderson        break;
7c45bad8SRichard Henderson    default:
7c45bad8SRichard Henderson        g_assert_not_reached();
7c45bad8SRichard Henderson    }
7c45bad8SRichard Henderson}
22c355f4SRichard Henderson
22c355f4SRichard Hendersonstatic FloatPartsN *partsN(pick_nan)(FloatPartsN *a, FloatPartsN *b,
22c355f4SRichard Henderson                                     float_status *s)
22c355f4SRichard Henderson{
22c355f4SRichard Henderson    if (is_snan(a->cls) || is_snan(b->cls)) {
e706d445SRichard Henderson        float_raise(float_flag_invalid | float_flag_invalid_snan, s);
22c355f4SRichard Henderson    }
22c355f4SRichard Henderson
22c355f4SRichard Henderson    if (s->default_nan_mode) {
22c355f4SRichard Henderson        parts_default_nan(a, s);
22c355f4SRichard Henderson    } else {
22c355f4SRichard Henderson        int cmp = frac_cmp(a, b);
22c355f4SRichard Henderson        if (cmp == 0) {
22c355f4SRichard Henderson            cmp = a->sign < b->sign;
22c355f4SRichard Henderson        }
22c355f4SRichard Henderson
22c355f4SRichard Henderson        if (pickNaN(a->cls, b->cls, cmp > 0, s)) {
22c355f4SRichard Henderson            a = b;
22c355f4SRichard Henderson        }
22c355f4SRichard Henderson        if (is_snan(a->cls)) {
22c355f4SRichard Henderson            parts_silence_nan(a, s);
22c355f4SRichard Henderson        }
22c355f4SRichard Henderson    }
22c355f4SRichard Henderson    return a;
22c355f4SRichard Henderson}
979582d0SRichard Henderson
979582d0SRichard Hendersonstatic FloatPartsN *partsN(pick_nan_muladd)(FloatPartsN *a, FloatPartsN *b,
979582d0SRichard Henderson                                            FloatPartsN *c, float_status *s,
979582d0SRichard Henderson                                            int ab_mask, int abc_mask)
979582d0SRichard Henderson{
979582d0SRichard Henderson    int which;
979582d0SRichard Henderson
979582d0SRichard Henderson    if (unlikely(abc_mask & float_cmask_snan)) {
e706d445SRichard Henderson        float_raise(float_flag_invalid | float_flag_invalid_snan, s);
979582d0SRichard Henderson    }
979582d0SRichard Henderson
979582d0SRichard Henderson    which = pickNaNMulAdd(a->cls, b->cls, c->cls,
979582d0SRichard Henderson                          ab_mask == float_cmask_infzero, s);
979582d0SRichard Henderson
979582d0SRichard Henderson    if (s->default_nan_mode || which == 3) {
979582d0SRichard Henderson        /*
979582d0SRichard Henderson         * Note that this check is after pickNaNMulAdd so that function
979582d0SRichard Henderson         * has an opportunity to set the Invalid flag for infzero.
979582d0SRichard Henderson         */
979582d0SRichard Henderson        parts_default_nan(a, s);
979582d0SRichard Henderson        return a;
979582d0SRichard Henderson    }
979582d0SRichard Henderson
979582d0SRichard Henderson    switch (which) {
979582d0SRichard Henderson    case 0:
979582d0SRichard Henderson        break;
979582d0SRichard Henderson    case 1:
979582d0SRichard Henderson        a = b;
979582d0SRichard Henderson        break;
979582d0SRichard Henderson    case 2:
979582d0SRichard Henderson        a = c;
979582d0SRichard Henderson        break;
979582d0SRichard Henderson    default:
979582d0SRichard Henderson        g_assert_not_reached();
979582d0SRichard Henderson    }
979582d0SRichard Henderson    if (is_snan(a->cls)) {
979582d0SRichard Henderson        parts_silence_nan(a, s);
979582d0SRichard Henderson    }
979582d0SRichard Henderson    return a;
979582d0SRichard Henderson}
d46975bcSRichard Henderson
d46975bcSRichard Henderson/*
d46975bcSRichard Henderson * Canonicalize the FloatParts structure.  Determine the class,
d46975bcSRichard Henderson * unbias the exponent, and normalize the fraction.
d46975bcSRichard Henderson */
d46975bcSRichard Hendersonstatic void partsN(canonicalize)(FloatPartsN *p, float_status *status,
d46975bcSRichard Henderson                                 const FloatFmt *fmt)
d46975bcSRichard Henderson{
d46975bcSRichard Henderson    if (unlikely(p->exp == 0)) {
d46975bcSRichard Henderson        if (likely(frac_eqz(p))) {
d46975bcSRichard Henderson            p->cls = float_class_zero;
d46975bcSRichard Henderson        } else if (status->flush_inputs_to_zero) {
d46975bcSRichard Henderson            float_raise(float_flag_input_denormal, status);
d46975bcSRichard Henderson            p->cls = float_class_zero;
d46975bcSRichard Henderson            frac_clear(p);
d46975bcSRichard Henderson        } else {
d46975bcSRichard Henderson            int shift = frac_normalize(p);
d46975bcSRichard Henderson            p->cls = float_class_normal;
72246065SRichard Henderson            p->exp = fmt->frac_shift - fmt->exp_bias
72246065SRichard Henderson                   - shift + !fmt->m68k_denormal;
d46975bcSRichard Henderson        }
d46975bcSRichard Henderson    } else if (likely(p->exp < fmt->exp_max) || fmt->arm_althp) {
d46975bcSRichard Henderson        p->cls = float_class_normal;
d46975bcSRichard Henderson        p->exp -= fmt->exp_bias;
d46975bcSRichard Henderson        frac_shl(p, fmt->frac_shift);
d46975bcSRichard Henderson        p->frac_hi |= DECOMPOSED_IMPLICIT_BIT;
d46975bcSRichard Henderson    } else if (likely(frac_eqz(p))) {
d46975bcSRichard Henderson        p->cls = float_class_inf;
d46975bcSRichard Henderson    } else {
d46975bcSRichard Henderson        frac_shl(p, fmt->frac_shift);
d46975bcSRichard Henderson        p->cls = (parts_is_snan_frac(p->frac_hi, status)
d46975bcSRichard Henderson                  ? float_class_snan : float_class_qnan);
d46975bcSRichard Henderson    }
d46975bcSRichard Henderson}
ee6959f2SRichard Henderson
ee6959f2SRichard Henderson/*
ee6959f2SRichard Henderson * Round and uncanonicalize a floating-point number by parts. There
ee6959f2SRichard Henderson * are FRAC_SHIFT bits that may require rounding at the bottom of the
ee6959f2SRichard Henderson * fraction; these bits will be removed. The exponent will be biased
ee6959f2SRichard Henderson * by EXP_BIAS and must be bounded by [EXP_MAX-1, 0].
ee6959f2SRichard Henderson */
25fdedf0SRichard Hendersonstatic void partsN(uncanon_normal)(FloatPartsN *p, float_status *s,
ee6959f2SRichard Henderson                                   const FloatFmt *fmt)
ee6959f2SRichard Henderson{
ee6959f2SRichard Henderson    const int exp_max = fmt->exp_max;
ee6959f2SRichard Henderson    const int frac_shift = fmt->frac_shift;
ee6959f2SRichard Henderson    const uint64_t round_mask = fmt->round_mask;
d6e1f0cdSRichard Henderson    const uint64_t frac_lsb = round_mask + 1;
d6e1f0cdSRichard Henderson    const uint64_t frac_lsbm1 = round_mask ^ (round_mask >> 1);
d6e1f0cdSRichard Henderson    const uint64_t roundeven_mask = round_mask | frac_lsb;
ee6959f2SRichard Henderson    uint64_t inc;
25fdedf0SRichard Henderson    bool overflow_norm = false;
ee6959f2SRichard Henderson    int exp, flags = 0;
ee6959f2SRichard Henderson
ee6959f2SRichard Henderson    switch (s->float_rounding_mode) {
ee6959f2SRichard Henderson    case float_round_nearest_even:
98b3cff7SRichard Henderson        if (N > 64 && frac_lsb == 0) {
98b3cff7SRichard Henderson            inc = ((p->frac_hi & 1) || (p->frac_lo & round_mask) != frac_lsbm1
98b3cff7SRichard Henderson                   ? frac_lsbm1 : 0);
98b3cff7SRichard Henderson        } else {
98b3cff7SRichard Henderson            inc = ((p->frac_lo & roundeven_mask) != frac_lsbm1
98b3cff7SRichard Henderson                   ? frac_lsbm1 : 0);
98b3cff7SRichard Henderson        }
ee6959f2SRichard Henderson        break;
ee6959f2SRichard Henderson    case float_round_ties_away:
ee6959f2SRichard Henderson        inc = frac_lsbm1;
ee6959f2SRichard Henderson        break;
ee6959f2SRichard Henderson    case float_round_to_zero:
ee6959f2SRichard Henderson        overflow_norm = true;
ee6959f2SRichard Henderson        inc = 0;
ee6959f2SRichard Henderson        break;
ee6959f2SRichard Henderson    case float_round_up:
ee6959f2SRichard Henderson        inc = p->sign ? 0 : round_mask;
ee6959f2SRichard Henderson        overflow_norm = p->sign;
ee6959f2SRichard Henderson        break;
ee6959f2SRichard Henderson    case float_round_down:
ee6959f2SRichard Henderson        inc = p->sign ? round_mask : 0;
ee6959f2SRichard Henderson        overflow_norm = !p->sign;
ee6959f2SRichard Henderson        break;
ee6959f2SRichard Henderson    case float_round_to_odd:
ee6959f2SRichard Henderson        overflow_norm = true;
60c8f726SRichard Henderson        /* fall through */
60c8f726SRichard Henderson    case float_round_to_odd_inf:
98b3cff7SRichard Henderson        if (N > 64 && frac_lsb == 0) {
98b3cff7SRichard Henderson            inc = p->frac_hi & 1 ? 0 : round_mask;
98b3cff7SRichard Henderson        } else {
ee6959f2SRichard Henderson            inc = p->frac_lo & frac_lsb ? 0 : round_mask;
98b3cff7SRichard Henderson        }
ee6959f2SRichard Henderson        break;
ee6959f2SRichard Henderson    default:
ee6959f2SRichard Henderson        g_assert_not_reached();
ee6959f2SRichard Henderson    }
ee6959f2SRichard Henderson
ee6959f2SRichard Henderson    exp = p->exp + fmt->exp_bias;
ee6959f2SRichard Henderson    if (likely(exp > 0)) {
ee6959f2SRichard Henderson        if (p->frac_lo & round_mask) {
ee6959f2SRichard Henderson            flags |= float_flag_inexact;
ee6959f2SRichard Henderson            if (frac_addi(p, p, inc)) {
ee6959f2SRichard Henderson                frac_shr(p, 1);
ee6959f2SRichard Henderson                p->frac_hi |= DECOMPOSED_IMPLICIT_BIT;
ee6959f2SRichard Henderson                exp++;
ee6959f2SRichard Henderson            }
98b3cff7SRichard Henderson            p->frac_lo &= ~round_mask;
ee6959f2SRichard Henderson        }
ee6959f2SRichard Henderson
ee6959f2SRichard Henderson        if (fmt->arm_althp) {
ee6959f2SRichard Henderson            /* ARM Alt HP eschews Inf and NaN for a wider exponent.  */
ee6959f2SRichard Henderson            if (unlikely(exp > exp_max)) {
ee6959f2SRichard Henderson                /* Overflow.  Return the maximum normal.  */
ee6959f2SRichard Henderson                flags = float_flag_invalid;
ee6959f2SRichard Henderson                exp = exp_max;
ee6959f2SRichard Henderson                frac_allones(p);
98b3cff7SRichard Henderson                p->frac_lo &= ~round_mask;
ee6959f2SRichard Henderson            }
ee6959f2SRichard Henderson        } else if (unlikely(exp >= exp_max)) {
c40da5c6SLucas Mateus Castro (alqotel)            flags |= float_flag_overflow;
c40da5c6SLucas Mateus Castro (alqotel)            if (s->rebias_overflow) {
c40da5c6SLucas Mateus Castro (alqotel)                exp -= fmt->exp_re_bias;
c40da5c6SLucas Mateus Castro (alqotel)            } else if (overflow_norm) {
c40da5c6SLucas Mateus Castro (alqotel)                flags |= float_flag_inexact;
ee6959f2SRichard Henderson                exp = exp_max - 1;
ee6959f2SRichard Henderson                frac_allones(p);
98b3cff7SRichard Henderson                p->frac_lo &= ~round_mask;
ee6959f2SRichard Henderson            } else {
c40da5c6SLucas Mateus Castro (alqotel)                flags |= float_flag_inexact;
ee6959f2SRichard Henderson                p->cls = float_class_inf;
ee6959f2SRichard Henderson                exp = exp_max;
ee6959f2SRichard Henderson                frac_clear(p);
ee6959f2SRichard Henderson            }
ee6959f2SRichard Henderson        }
98b3cff7SRichard Henderson        frac_shr(p, frac_shift);
c40da5c6SLucas Mateus Castro (alqotel)    } else if (unlikely(s->rebias_underflow)) {
c40da5c6SLucas Mateus Castro (alqotel)        flags |= float_flag_underflow;
c40da5c6SLucas Mateus Castro (alqotel)        exp += fmt->exp_re_bias;
c40da5c6SLucas Mateus Castro (alqotel)        if (p->frac_lo & round_mask) {
c40da5c6SLucas Mateus Castro (alqotel)            flags |= float_flag_inexact;
c40da5c6SLucas Mateus Castro (alqotel)            if (frac_addi(p, p, inc)) {
c40da5c6SLucas Mateus Castro (alqotel)                frac_shr(p, 1);
c40da5c6SLucas Mateus Castro (alqotel)                p->frac_hi |= DECOMPOSED_IMPLICIT_BIT;
c40da5c6SLucas Mateus Castro (alqotel)                exp++;
c40da5c6SLucas Mateus Castro (alqotel)            }
c40da5c6SLucas Mateus Castro (alqotel)            p->frac_lo &= ~round_mask;
c40da5c6SLucas Mateus Castro (alqotel)        }
c40da5c6SLucas Mateus Castro (alqotel)        frac_shr(p, frac_shift);
ee6959f2SRichard Henderson    } else if (s->flush_to_zero) {
ee6959f2SRichard Henderson        flags |= float_flag_output_denormal;
ee6959f2SRichard Henderson        p->cls = float_class_zero;
ee6959f2SRichard Henderson        exp = 0;
ee6959f2SRichard Henderson        frac_clear(p);
ee6959f2SRichard Henderson    } else {
ee6959f2SRichard Henderson        bool is_tiny = s->tininess_before_rounding || exp < 0;
ee6959f2SRichard Henderson
ee6959f2SRichard Henderson        if (!is_tiny) {
ee6959f2SRichard Henderson            FloatPartsN discard;
ee6959f2SRichard Henderson            is_tiny = !frac_addi(&discard, p, inc);
ee6959f2SRichard Henderson        }
ee6959f2SRichard Henderson
72246065SRichard Henderson        frac_shrjam(p, !fmt->m68k_denormal - exp);
ee6959f2SRichard Henderson
ee6959f2SRichard Henderson        if (p->frac_lo & round_mask) {
ee6959f2SRichard Henderson            /* Need to recompute round-to-even/round-to-odd. */
ee6959f2SRichard Henderson            switch (s->float_rounding_mode) {
ee6959f2SRichard Henderson            case float_round_nearest_even:
98b3cff7SRichard Henderson                if (N > 64 && frac_lsb == 0) {
98b3cff7SRichard Henderson                    inc = ((p->frac_hi & 1) ||
98b3cff7SRichard Henderson                           (p->frac_lo & round_mask) != frac_lsbm1
98b3cff7SRichard Henderson                           ? frac_lsbm1 : 0);
98b3cff7SRichard Henderson                } else {
ee6959f2SRichard Henderson                    inc = ((p->frac_lo & roundeven_mask) != frac_lsbm1
ee6959f2SRichard Henderson                           ? frac_lsbm1 : 0);
98b3cff7SRichard Henderson                }
ee6959f2SRichard Henderson                break;
ee6959f2SRichard Henderson            case float_round_to_odd:
60c8f726SRichard Henderson            case float_round_to_odd_inf:
98b3cff7SRichard Henderson                if (N > 64 && frac_lsb == 0) {
98b3cff7SRichard Henderson                    inc = p->frac_hi & 1 ? 0 : round_mask;
98b3cff7SRichard Henderson                } else {
ee6959f2SRichard Henderson                    inc = p->frac_lo & frac_lsb ? 0 : round_mask;
98b3cff7SRichard Henderson                }
ee6959f2SRichard Henderson                break;
ee6959f2SRichard Henderson            default:
ee6959f2SRichard Henderson                break;
ee6959f2SRichard Henderson            }
ee6959f2SRichard Henderson            flags |= float_flag_inexact;
ee6959f2SRichard Henderson            frac_addi(p, p, inc);
98b3cff7SRichard Henderson            p->frac_lo &= ~round_mask;
ee6959f2SRichard Henderson        }
ee6959f2SRichard Henderson
72246065SRichard Henderson        exp = (p->frac_hi & DECOMPOSED_IMPLICIT_BIT) && !fmt->m68k_denormal;
ee6959f2SRichard Henderson        frac_shr(p, frac_shift);
ee6959f2SRichard Henderson
ee6959f2SRichard Henderson        if (is_tiny && (flags & float_flag_inexact)) {
ee6959f2SRichard Henderson            flags |= float_flag_underflow;
ee6959f2SRichard Henderson        }
ee6959f2SRichard Henderson        if (exp == 0 && frac_eqz(p)) {
ee6959f2SRichard Henderson            p->cls = float_class_zero;
ee6959f2SRichard Henderson        }
ee6959f2SRichard Henderson    }
ee6959f2SRichard Henderson    p->exp = exp;
ee6959f2SRichard Henderson    float_raise(flags, s);
ee6959f2SRichard Henderson}
da10a907SRichard Henderson
25fdedf0SRichard Hendersonstatic void partsN(uncanon)(FloatPartsN *p, float_status *s,
25fdedf0SRichard Henderson                            const FloatFmt *fmt)
25fdedf0SRichard Henderson{
25fdedf0SRichard Henderson    if (likely(p->cls == float_class_normal)) {
25fdedf0SRichard Henderson        parts_uncanon_normal(p, s, fmt);
25fdedf0SRichard Henderson    } else {
25fdedf0SRichard Henderson        switch (p->cls) {
25fdedf0SRichard Henderson        case float_class_zero:
25fdedf0SRichard Henderson            p->exp = 0;
25fdedf0SRichard Henderson            frac_clear(p);
25fdedf0SRichard Henderson            return;
25fdedf0SRichard Henderson        case float_class_inf:
25fdedf0SRichard Henderson            g_assert(!fmt->arm_althp);
25fdedf0SRichard Henderson            p->exp = fmt->exp_max;
25fdedf0SRichard Henderson            frac_clear(p);
25fdedf0SRichard Henderson            return;
25fdedf0SRichard Henderson        case float_class_qnan:
25fdedf0SRichard Henderson        case float_class_snan:
25fdedf0SRichard Henderson            g_assert(!fmt->arm_althp);
25fdedf0SRichard Henderson            p->exp = fmt->exp_max;
25fdedf0SRichard Henderson            frac_shr(p, fmt->frac_shift);
25fdedf0SRichard Henderson            return;
25fdedf0SRichard Henderson        default:
25fdedf0SRichard Henderson            break;
25fdedf0SRichard Henderson        }
25fdedf0SRichard Henderson        g_assert_not_reached();
25fdedf0SRichard Henderson    }
25fdedf0SRichard Henderson}
25fdedf0SRichard Henderson
da10a907SRichard Henderson/*
da10a907SRichard Henderson * Returns the result of adding or subtracting the values of the
da10a907SRichard Henderson * floating-point values `a' and `b'. The operation is performed
da10a907SRichard Henderson * according to the IEC/IEEE Standard for Binary Floating-Point
da10a907SRichard Henderson * Arithmetic.
da10a907SRichard Henderson */
da10a907SRichard Hendersonstatic FloatPartsN *partsN(addsub)(FloatPartsN *a, FloatPartsN *b,
da10a907SRichard Henderson                                   float_status *s, bool subtract)
da10a907SRichard Henderson{
da10a907SRichard Henderson    bool b_sign = b->sign ^ subtract;
da10a907SRichard Henderson    int ab_mask = float_cmask(a->cls) | float_cmask(b->cls);
da10a907SRichard Henderson
da10a907SRichard Henderson    if (a->sign != b_sign) {
da10a907SRichard Henderson        /* Subtraction */
da10a907SRichard Henderson        if (likely(ab_mask == float_cmask_normal)) {
da10a907SRichard Henderson            if (parts_sub_normal(a, b)) {
da10a907SRichard Henderson                return a;
da10a907SRichard Henderson            }
da10a907SRichard Henderson            /* Subtract was exact, fall through to set sign. */
da10a907SRichard Henderson            ab_mask = float_cmask_zero;
da10a907SRichard Henderson        }
da10a907SRichard Henderson
da10a907SRichard Henderson        if (ab_mask == float_cmask_zero) {
da10a907SRichard Henderson            a->sign = s->float_rounding_mode == float_round_down;
da10a907SRichard Henderson            return a;
da10a907SRichard Henderson        }
da10a907SRichard Henderson
da10a907SRichard Henderson        if (unlikely(ab_mask & float_cmask_anynan)) {
da10a907SRichard Henderson            goto p_nan;
da10a907SRichard Henderson        }
da10a907SRichard Henderson
da10a907SRichard Henderson        if (ab_mask & float_cmask_inf) {
da10a907SRichard Henderson            if (a->cls != float_class_inf) {
da10a907SRichard Henderson                /* N - Inf */
da10a907SRichard Henderson                goto return_b;
da10a907SRichard Henderson            }
da10a907SRichard Henderson            if (b->cls != float_class_inf) {
da10a907SRichard Henderson                /* Inf - N */
da10a907SRichard Henderson                return a;
da10a907SRichard Henderson            }
da10a907SRichard Henderson            /* Inf - Inf */
ba11446cSRichard Henderson            float_raise(float_flag_invalid | float_flag_invalid_isi, s);
da10a907SRichard Henderson            parts_default_nan(a, s);
da10a907SRichard Henderson            return a;
da10a907SRichard Henderson        }
da10a907SRichard Henderson    } else {
da10a907SRichard Henderson        /* Addition */
da10a907SRichard Henderson        if (likely(ab_mask == float_cmask_normal)) {
da10a907SRichard Henderson            parts_add_normal(a, b);
da10a907SRichard Henderson            return a;
da10a907SRichard Henderson        }
da10a907SRichard Henderson
da10a907SRichard Henderson        if (ab_mask == float_cmask_zero) {
da10a907SRichard Henderson            return a;
da10a907SRichard Henderson        }
da10a907SRichard Henderson
da10a907SRichard Henderson        if (unlikely(ab_mask & float_cmask_anynan)) {
da10a907SRichard Henderson            goto p_nan;
da10a907SRichard Henderson        }
da10a907SRichard Henderson
da10a907SRichard Henderson        if (ab_mask & float_cmask_inf) {
da10a907SRichard Henderson            a->cls = float_class_inf;
da10a907SRichard Henderson            return a;
da10a907SRichard Henderson        }
da10a907SRichard Henderson    }
da10a907SRichard Henderson
da10a907SRichard Henderson    if (b->cls == float_class_zero) {
da10a907SRichard Henderson        g_assert(a->cls == float_class_normal);
da10a907SRichard Henderson        return a;
da10a907SRichard Henderson    }
da10a907SRichard Henderson
da10a907SRichard Henderson    g_assert(a->cls == float_class_zero);
da10a907SRichard Henderson    g_assert(b->cls == float_class_normal);
da10a907SRichard Henderson return_b:
da10a907SRichard Henderson    b->sign = b_sign;
da10a907SRichard Henderson    return b;
da10a907SRichard Henderson
da10a907SRichard Henderson p_nan:
da10a907SRichard Henderson    return parts_pick_nan(a, b, s);
da10a907SRichard Henderson}
aca84527SRichard Henderson
aca84527SRichard Henderson/*
aca84527SRichard Henderson * Returns the result of multiplying the floating-point values `a' and
aca84527SRichard Henderson * `b'. The operation is performed according to the IEC/IEEE Standard
aca84527SRichard Henderson * for Binary Floating-Point Arithmetic.
aca84527SRichard Henderson */
aca84527SRichard Hendersonstatic FloatPartsN *partsN(mul)(FloatPartsN *a, FloatPartsN *b,
aca84527SRichard Henderson                                float_status *s)
aca84527SRichard Henderson{
aca84527SRichard Henderson    int ab_mask = float_cmask(a->cls) | float_cmask(b->cls);
aca84527SRichard Henderson    bool sign = a->sign ^ b->sign;
aca84527SRichard Henderson
aca84527SRichard Henderson    if (likely(ab_mask == float_cmask_normal)) {
aca84527SRichard Henderson        FloatPartsW tmp;
aca84527SRichard Henderson
aca84527SRichard Henderson        frac_mulw(&tmp, a, b);
aca84527SRichard Henderson        frac_truncjam(a, &tmp);
aca84527SRichard Henderson
aca84527SRichard Henderson        a->exp += b->exp + 1;
aca84527SRichard Henderson        if (!(a->frac_hi & DECOMPOSED_IMPLICIT_BIT)) {
aca84527SRichard Henderson            frac_add(a, a, a);
aca84527SRichard Henderson            a->exp -= 1;
aca84527SRichard Henderson        }
aca84527SRichard Henderson
aca84527SRichard Henderson        a->sign = sign;
aca84527SRichard Henderson        return a;
aca84527SRichard Henderson    }
aca84527SRichard Henderson
aca84527SRichard Henderson    /* Inf * Zero == NaN */
aca84527SRichard Henderson    if (unlikely(ab_mask == float_cmask_infzero)) {
bead3c9bSRichard Henderson        float_raise(float_flag_invalid | float_flag_invalid_imz, s);
aca84527SRichard Henderson        parts_default_nan(a, s);
aca84527SRichard Henderson        return a;
aca84527SRichard Henderson    }
aca84527SRichard Henderson
aca84527SRichard Henderson    if (unlikely(ab_mask & float_cmask_anynan)) {
aca84527SRichard Henderson        return parts_pick_nan(a, b, s);
aca84527SRichard Henderson    }
aca84527SRichard Henderson
aca84527SRichard Henderson    /* Multiply by 0 or Inf */
aca84527SRichard Henderson    if (ab_mask & float_cmask_inf) {
aca84527SRichard Henderson        a->cls = float_class_inf;
aca84527SRichard Henderson        a->sign = sign;
aca84527SRichard Henderson        return a;
aca84527SRichard Henderson    }
aca84527SRichard Henderson
aca84527SRichard Henderson    g_assert(ab_mask & float_cmask_zero);
aca84527SRichard Henderson    a->cls = float_class_zero;
aca84527SRichard Henderson    a->sign = sign;
aca84527SRichard Henderson    return a;
aca84527SRichard Henderson}
dedd123cSRichard Henderson
dedd123cSRichard Henderson/*
dedd123cSRichard Henderson * Returns the result of multiplying the floating-point values `a' and
dedd123cSRichard Henderson * `b' then adding 'c', with no intermediate rounding step after the
dedd123cSRichard Henderson * multiplication. The operation is performed according to the
dedd123cSRichard Henderson * IEC/IEEE Standard for Binary Floating-Point Arithmetic 754-2008.
dedd123cSRichard Henderson * The flags argument allows the caller to select negation of the
dedd123cSRichard Henderson * addend, the intermediate product, or the final result. (The
dedd123cSRichard Henderson * difference between this and having the caller do a separate
dedd123cSRichard Henderson * negation is that negating externally will flip the sign bit on NaNs.)
dedd123cSRichard Henderson *
dedd123cSRichard Henderson * Requires A and C extracted into a double-sized structure to provide the
dedd123cSRichard Henderson * extra space for the widening multiply.
dedd123cSRichard Henderson */
dedd123cSRichard Hendersonstatic FloatPartsN *partsN(muladd)(FloatPartsN *a, FloatPartsN *b,
dedd123cSRichard Henderson                                   FloatPartsN *c, int flags, float_status *s)
dedd123cSRichard Henderson{
dedd123cSRichard Henderson    int ab_mask, abc_mask;
dedd123cSRichard Henderson    FloatPartsW p_widen, c_widen;
dedd123cSRichard Henderson
dedd123cSRichard Henderson    ab_mask = float_cmask(a->cls) | float_cmask(b->cls);
dedd123cSRichard Henderson    abc_mask = float_cmask(c->cls) | ab_mask;
dedd123cSRichard Henderson
dedd123cSRichard Henderson    /*
dedd123cSRichard Henderson     * It is implementation-defined whether the cases of (0,inf,qnan)
dedd123cSRichard Henderson     * and (inf,0,qnan) raise InvalidOperation or not (and what QNaN
dedd123cSRichard Henderson     * they return if they do), so we have to hand this information
dedd123cSRichard Henderson     * off to the target-specific pick-a-NaN routine.
dedd123cSRichard Henderson     */
dedd123cSRichard Henderson    if (unlikely(abc_mask & float_cmask_anynan)) {
dedd123cSRichard Henderson        return parts_pick_nan_muladd(a, b, c, s, ab_mask, abc_mask);
dedd123cSRichard Henderson    }
dedd123cSRichard Henderson
dedd123cSRichard Henderson    if (flags & float_muladd_negate_c) {
dedd123cSRichard Henderson        c->sign ^= 1;
dedd123cSRichard Henderson    }
dedd123cSRichard Henderson
dedd123cSRichard Henderson    /* Compute the sign of the product into A. */
dedd123cSRichard Henderson    a->sign ^= b->sign;
dedd123cSRichard Henderson    if (flags & float_muladd_negate_product) {
dedd123cSRichard Henderson        a->sign ^= 1;
dedd123cSRichard Henderson    }
dedd123cSRichard Henderson
dedd123cSRichard Henderson    if (unlikely(ab_mask != float_cmask_normal)) {
dedd123cSRichard Henderson        if (unlikely(ab_mask == float_cmask_infzero)) {
bead3c9bSRichard Henderson            float_raise(float_flag_invalid | float_flag_invalid_imz, s);
dedd123cSRichard Henderson            goto d_nan;
dedd123cSRichard Henderson        }
dedd123cSRichard Henderson
dedd123cSRichard Henderson        if (ab_mask & float_cmask_inf) {
dedd123cSRichard Henderson            if (c->cls == float_class_inf && a->sign != c->sign) {
ba11446cSRichard Henderson                float_raise(float_flag_invalid | float_flag_invalid_isi, s);
dedd123cSRichard Henderson                goto d_nan;
dedd123cSRichard Henderson            }
dedd123cSRichard Henderson            goto return_inf;
dedd123cSRichard Henderson        }
dedd123cSRichard Henderson
dedd123cSRichard Henderson        g_assert(ab_mask & float_cmask_zero);
dedd123cSRichard Henderson        if (c->cls == float_class_normal) {
dedd123cSRichard Henderson            *a = *c;
dedd123cSRichard Henderson            goto return_normal;
dedd123cSRichard Henderson        }
dedd123cSRichard Henderson        if (c->cls == float_class_zero) {
dedd123cSRichard Henderson            if (a->sign != c->sign) {
dedd123cSRichard Henderson                goto return_sub_zero;
dedd123cSRichard Henderson            }
dedd123cSRichard Henderson            goto return_zero;
dedd123cSRichard Henderson        }
dedd123cSRichard Henderson        g_assert(c->cls == float_class_inf);
dedd123cSRichard Henderson    }
dedd123cSRichard Henderson
dedd123cSRichard Henderson    if (unlikely(c->cls == float_class_inf)) {
dedd123cSRichard Henderson        a->sign = c->sign;
dedd123cSRichard Henderson        goto return_inf;
dedd123cSRichard Henderson    }
dedd123cSRichard Henderson
dedd123cSRichard Henderson    /* Perform the multiplication step. */
dedd123cSRichard Henderson    p_widen.sign = a->sign;
dedd123cSRichard Henderson    p_widen.exp = a->exp + b->exp + 1;
dedd123cSRichard Henderson    frac_mulw(&p_widen, a, b);
dedd123cSRichard Henderson    if (!(p_widen.frac_hi & DECOMPOSED_IMPLICIT_BIT)) {
dedd123cSRichard Henderson        frac_add(&p_widen, &p_widen, &p_widen);
dedd123cSRichard Henderson        p_widen.exp -= 1;
dedd123cSRichard Henderson    }
dedd123cSRichard Henderson
dedd123cSRichard Henderson    /* Perform the addition step. */
dedd123cSRichard Henderson    if (c->cls != float_class_zero) {
dedd123cSRichard Henderson        /* Zero-extend C to less significant bits. */
dedd123cSRichard Henderson        frac_widen(&c_widen, c);
dedd123cSRichard Henderson        c_widen.exp = c->exp;
dedd123cSRichard Henderson
dedd123cSRichard Henderson        if (a->sign == c->sign) {
dedd123cSRichard Henderson            parts_add_normal(&p_widen, &c_widen);
dedd123cSRichard Henderson        } else if (!parts_sub_normal(&p_widen, &c_widen)) {
dedd123cSRichard Henderson            goto return_sub_zero;
dedd123cSRichard Henderson        }
dedd123cSRichard Henderson    }
dedd123cSRichard Henderson
dedd123cSRichard Henderson    /* Narrow with sticky bit, for proper rounding later. */
dedd123cSRichard Henderson    frac_truncjam(a, &p_widen);
dedd123cSRichard Henderson    a->sign = p_widen.sign;
dedd123cSRichard Henderson    a->exp = p_widen.exp;
dedd123cSRichard Henderson
dedd123cSRichard Henderson return_normal:
dedd123cSRichard Henderson    if (flags & float_muladd_halve_result) {
dedd123cSRichard Henderson        a->exp -= 1;
dedd123cSRichard Henderson    }
dedd123cSRichard Henderson finish_sign:
dedd123cSRichard Henderson    if (flags & float_muladd_negate_result) {
dedd123cSRichard Henderson        a->sign ^= 1;
dedd123cSRichard Henderson    }
dedd123cSRichard Henderson    return a;
dedd123cSRichard Henderson
dedd123cSRichard Henderson return_sub_zero:
dedd123cSRichard Henderson    a->sign = s->float_rounding_mode == float_round_down;
dedd123cSRichard Henderson return_zero:
dedd123cSRichard Henderson    a->cls = float_class_zero;
dedd123cSRichard Henderson    goto finish_sign;
dedd123cSRichard Henderson
dedd123cSRichard Henderson return_inf:
dedd123cSRichard Henderson    a->cls = float_class_inf;
dedd123cSRichard Henderson    goto finish_sign;
dedd123cSRichard Henderson
dedd123cSRichard Henderson d_nan:
dedd123cSRichard Henderson    parts_default_nan(a, s);
dedd123cSRichard Henderson    return a;
dedd123cSRichard Henderson}
ec961b81SRichard Henderson
ec961b81SRichard Henderson/*
ec961b81SRichard Henderson * Returns the result of dividing the floating-point value `a' by the
ec961b81SRichard Henderson * corresponding value `b'. The operation is performed according to
ec961b81SRichard Henderson * the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
ec961b81SRichard Henderson */
ec961b81SRichard Hendersonstatic FloatPartsN *partsN(div)(FloatPartsN *a, FloatPartsN *b,
ec961b81SRichard Henderson                                float_status *s)
ec961b81SRichard Henderson{
ec961b81SRichard Henderson    int ab_mask = float_cmask(a->cls) | float_cmask(b->cls);
ec961b81SRichard Henderson    bool sign = a->sign ^ b->sign;
ec961b81SRichard Henderson
ec961b81SRichard Henderson    if (likely(ab_mask == float_cmask_normal)) {
ec961b81SRichard Henderson        a->sign = sign;
ec961b81SRichard Henderson        a->exp -= b->exp + frac_div(a, b);
ec961b81SRichard Henderson        return a;
ec961b81SRichard Henderson    }
ec961b81SRichard Henderson
ec961b81SRichard Henderson    /* 0/0 or Inf/Inf => NaN */
10cc9640SRichard Henderson    if (unlikely(ab_mask == float_cmask_zero)) {
10cc9640SRichard Henderson        float_raise(float_flag_invalid | float_flag_invalid_zdz, s);
10cc9640SRichard Henderson        goto d_nan;
10cc9640SRichard Henderson    }
10cc9640SRichard Henderson    if (unlikely(ab_mask == float_cmask_inf)) {
10cc9640SRichard Henderson        float_raise(float_flag_invalid | float_flag_invalid_idi, s);
10cc9640SRichard Henderson        goto d_nan;
ec961b81SRichard Henderson    }
ec961b81SRichard Henderson
ec961b81SRichard Henderson    /* All the NaN cases */
ec961b81SRichard Henderson    if (unlikely(ab_mask & float_cmask_anynan)) {
ec961b81SRichard Henderson        return parts_pick_nan(a, b, s);
ec961b81SRichard Henderson    }
ec961b81SRichard Henderson
ec961b81SRichard Henderson    a->sign = sign;
ec961b81SRichard Henderson
ec961b81SRichard Henderson    /* Inf / X */
ec961b81SRichard Henderson    if (a->cls == float_class_inf) {
ec961b81SRichard Henderson        return a;
ec961b81SRichard Henderson    }
ec961b81SRichard Henderson
ec961b81SRichard Henderson    /* 0 / X */
ec961b81SRichard Henderson    if (a->cls == float_class_zero) {
ec961b81SRichard Henderson        return a;
ec961b81SRichard Henderson    }
ec961b81SRichard Henderson
ec961b81SRichard Henderson    /* X / Inf */
ec961b81SRichard Henderson    if (b->cls == float_class_inf) {
ec961b81SRichard Henderson        a->cls = float_class_zero;
ec961b81SRichard Henderson        return a;
ec961b81SRichard Henderson    }
ec961b81SRichard Henderson
ec961b81SRichard Henderson    /* X / 0 => Inf */
ec961b81SRichard Henderson    g_assert(b->cls == float_class_zero);
ec961b81SRichard Henderson    float_raise(float_flag_divbyzero, s);
ec961b81SRichard Henderson    a->cls = float_class_inf;
ec961b81SRichard Henderson    return a;
10cc9640SRichard Henderson
10cc9640SRichard Henderson d_nan:
10cc9640SRichard Henderson    parts_default_nan(a, s);
10cc9640SRichard Henderson    return a;
ec961b81SRichard Henderson}
afc34931SRichard Henderson
afc34931SRichard Henderson/*
feaf2e9cSRichard Henderson * Floating point remainder, per IEC/IEEE, or modulus.
feaf2e9cSRichard Henderson */
feaf2e9cSRichard Hendersonstatic FloatPartsN *partsN(modrem)(FloatPartsN *a, FloatPartsN *b,
feaf2e9cSRichard Henderson                                   uint64_t *mod_quot, float_status *s)
feaf2e9cSRichard Henderson{
feaf2e9cSRichard Henderson    int ab_mask = float_cmask(a->cls) | float_cmask(b->cls);
feaf2e9cSRichard Henderson
feaf2e9cSRichard Henderson    if (likely(ab_mask == float_cmask_normal)) {
feaf2e9cSRichard Henderson        frac_modrem(a, b, mod_quot);
feaf2e9cSRichard Henderson        return a;
feaf2e9cSRichard Henderson    }
feaf2e9cSRichard Henderson
feaf2e9cSRichard Henderson    if (mod_quot) {
feaf2e9cSRichard Henderson        *mod_quot = 0;
feaf2e9cSRichard Henderson    }
feaf2e9cSRichard Henderson
feaf2e9cSRichard Henderson    /* All the NaN cases */
feaf2e9cSRichard Henderson    if (unlikely(ab_mask & float_cmask_anynan)) {
feaf2e9cSRichard Henderson        return parts_pick_nan(a, b, s);
feaf2e9cSRichard Henderson    }
feaf2e9cSRichard Henderson
feaf2e9cSRichard Henderson    /* Inf % N; N % 0 */
feaf2e9cSRichard Henderson    if (a->cls == float_class_inf || b->cls == float_class_zero) {
feaf2e9cSRichard Henderson        float_raise(float_flag_invalid, s);
feaf2e9cSRichard Henderson        parts_default_nan(a, s);
feaf2e9cSRichard Henderson        return a;
feaf2e9cSRichard Henderson    }
feaf2e9cSRichard Henderson
feaf2e9cSRichard Henderson    /* N % Inf; 0 % N */
feaf2e9cSRichard Henderson    g_assert(b->cls == float_class_inf || a->cls == float_class_zero);
feaf2e9cSRichard Henderson    return a;
feaf2e9cSRichard Henderson}
feaf2e9cSRichard Henderson
feaf2e9cSRichard Henderson/*
9261b245SRichard Henderson * Square Root
9261b245SRichard Henderson *
9261b245SRichard Henderson * The base algorithm is lifted from
9261b245SRichard Henderson * https://git.musl-libc.org/cgit/musl/tree/src/math/sqrtf.c
9261b245SRichard Henderson * https://git.musl-libc.org/cgit/musl/tree/src/math/sqrt.c
9261b245SRichard Henderson * https://git.musl-libc.org/cgit/musl/tree/src/math/sqrtl.c
9261b245SRichard Henderson * and is thus MIT licenced.
9261b245SRichard Henderson */
9261b245SRichard Hendersonstatic void partsN(sqrt)(FloatPartsN *a, float_status *status,
9261b245SRichard Henderson                         const FloatFmt *fmt)
9261b245SRichard Henderson{
9261b245SRichard Henderson    const uint32_t three32 = 3u << 30;
9261b245SRichard Henderson    const uint64_t three64 = 3ull << 62;
9261b245SRichard Henderson    uint32_t d32, m32, r32, s32, u32;            /* 32-bit computation */
9261b245SRichard Henderson    uint64_t d64, m64, r64, s64, u64;            /* 64-bit computation */
9261b245SRichard Henderson    uint64_t dh, dl, rh, rl, sh, sl, uh, ul;     /* 128-bit computation */
9261b245SRichard Henderson    uint64_t d0h, d0l, d1h, d1l, d2h, d2l;
9261b245SRichard Henderson    uint64_t discard;
9261b245SRichard Henderson    bool exp_odd;
9261b245SRichard Henderson    size_t index;
9261b245SRichard Henderson
9261b245SRichard Henderson    if (unlikely(a->cls != float_class_normal)) {
9261b245SRichard Henderson        switch (a->cls) {
9261b245SRichard Henderson        case float_class_snan:
9261b245SRichard Henderson        case float_class_qnan:
9261b245SRichard Henderson            parts_return_nan(a, status);
9261b245SRichard Henderson            return;
9261b245SRichard Henderson        case float_class_zero:
9261b245SRichard Henderson            return;
9261b245SRichard Henderson        case float_class_inf:
9261b245SRichard Henderson            if (unlikely(a->sign)) {
9261b245SRichard Henderson                goto d_nan;
9261b245SRichard Henderson            }
9261b245SRichard Henderson            return;
9261b245SRichard Henderson        default:
9261b245SRichard Henderson            g_assert_not_reached();
9261b245SRichard Henderson        }
9261b245SRichard Henderson    }
9261b245SRichard Henderson
9261b245SRichard Henderson    if (unlikely(a->sign)) {
9261b245SRichard Henderson        goto d_nan;
9261b245SRichard Henderson    }
9261b245SRichard Henderson
9261b245SRichard Henderson    /*
9261b245SRichard Henderson     * Argument reduction.
9261b245SRichard Henderson     * x = 4^e frac; with integer e, and frac in [1, 4)
9261b245SRichard Henderson     * m = frac fixed point at bit 62, since we're in base 4.
9261b245SRichard Henderson     * If base-2 exponent is odd, exchange that for multiply by 2,
9261b245SRichard Henderson     * which results in no shift.
9261b245SRichard Henderson     */
9261b245SRichard Henderson    exp_odd = a->exp & 1;
9261b245SRichard Henderson    index = extract64(a->frac_hi, 57, 6) | (!exp_odd << 6);
9261b245SRichard Henderson    if (!exp_odd) {
9261b245SRichard Henderson        frac_shr(a, 1);
9261b245SRichard Henderson    }
9261b245SRichard Henderson
9261b245SRichard Henderson    /*
9261b245SRichard Henderson     * Approximate r ~= 1/sqrt(m) and s ~= sqrt(m) when m in [1, 4).
9261b245SRichard Henderson     *
9261b245SRichard Henderson     * Initial estimate:
9261b245SRichard Henderson     * 7-bit lookup table (1-bit exponent and 6-bit significand).
9261b245SRichard Henderson     *
9261b245SRichard Henderson     * The relative error (e = r0*sqrt(m)-1) of a linear estimate
9261b245SRichard Henderson     * (r0 = a*m + b) is |e| < 0.085955 ~ 0x1.6p-4 at best;
9261b245SRichard Henderson     * a table lookup is faster and needs one less iteration.
9261b245SRichard Henderson     * The 7-bit table gives |e| < 0x1.fdp-9.
9261b245SRichard Henderson     *
9261b245SRichard Henderson     * A Newton-Raphson iteration for r is
9261b245SRichard Henderson     *   s = m*r
9261b245SRichard Henderson     *   d = s*r
9261b245SRichard Henderson     *   u = 3 - d
9261b245SRichard Henderson     *   r = r*u/2
9261b245SRichard Henderson     *
9261b245SRichard Henderson     * Fixed point representations:
9261b245SRichard Henderson     *   m, s, d, u, three are all 2.30; r is 0.32
9261b245SRichard Henderson     */
9261b245SRichard Henderson    m64 = a->frac_hi;
9261b245SRichard Henderson    m32 = m64 >> 32;
9261b245SRichard Henderson
9261b245SRichard Henderson    r32 = rsqrt_tab[index] << 16;
9261b245SRichard Henderson    /* |r*sqrt(m) - 1| < 0x1.FDp-9 */
9261b245SRichard Henderson
9261b245SRichard Henderson    s32 = ((uint64_t)m32 * r32) >> 32;
9261b245SRichard Henderson    d32 = ((uint64_t)s32 * r32) >> 32;
9261b245SRichard Henderson    u32 = three32 - d32;
9261b245SRichard Henderson
9261b245SRichard Henderson    if (N == 64) {
9261b245SRichard Henderson        /* float64 or smaller */
9261b245SRichard Henderson
9261b245SRichard Henderson        r32 = ((uint64_t)r32 * u32) >> 31;
9261b245SRichard Henderson        /* |r*sqrt(m) - 1| < 0x1.7Bp-16 */
9261b245SRichard Henderson
9261b245SRichard Henderson        s32 = ((uint64_t)m32 * r32) >> 32;
9261b245SRichard Henderson        d32 = ((uint64_t)s32 * r32) >> 32;
9261b245SRichard Henderson        u32 = three32 - d32;
9261b245SRichard Henderson
9261b245SRichard Henderson        if (fmt->frac_size <= 23) {
9261b245SRichard Henderson            /* float32 or smaller */
9261b245SRichard Henderson
9261b245SRichard Henderson            s32 = ((uint64_t)s32 * u32) >> 32;  /* 3.29 */
9261b245SRichard Henderson            s32 = (s32 - 1) >> 6;               /* 9.23 */
9261b245SRichard Henderson            /* s < sqrt(m) < s + 0x1.08p-23 */
9261b245SRichard Henderson
9261b245SRichard Henderson            /* compute nearest rounded result to 2.23 bits */
9261b245SRichard Henderson            uint32_t d0 = (m32 << 16) - s32 * s32;
9261b245SRichard Henderson            uint32_t d1 = s32 - d0;
9261b245SRichard Henderson            uint32_t d2 = d1 + s32 + 1;
9261b245SRichard Henderson            s32 += d1 >> 31;
9261b245SRichard Henderson            a->frac_hi = (uint64_t)s32 << (64 - 25);
9261b245SRichard Henderson
9261b245SRichard Henderson            /* increment or decrement for inexact */
9261b245SRichard Henderson            if (d2 != 0) {
9261b245SRichard Henderson                a->frac_hi += ((int32_t)(d1 ^ d2) < 0 ? -1 : 1);
9261b245SRichard Henderson            }
9261b245SRichard Henderson            goto done;
9261b245SRichard Henderson        }
9261b245SRichard Henderson
9261b245SRichard Henderson        /* float64 */
9261b245SRichard Henderson
9261b245SRichard Henderson        r64 = (uint64_t)r32 * u32 * 2;
9261b245SRichard Henderson        /* |r*sqrt(m) - 1| < 0x1.37-p29; convert to 64-bit arithmetic */
9261b245SRichard Henderson        mul64To128(m64, r64, &s64, &discard);
9261b245SRichard Henderson        mul64To128(s64, r64, &d64, &discard);
9261b245SRichard Henderson        u64 = three64 - d64;
9261b245SRichard Henderson
9261b245SRichard Henderson        mul64To128(s64, u64, &s64, &discard);  /* 3.61 */
9261b245SRichard Henderson        s64 = (s64 - 2) >> 9;                  /* 12.52 */
9261b245SRichard Henderson
9261b245SRichard Henderson        /* Compute nearest rounded result */
9261b245SRichard Henderson        uint64_t d0 = (m64 << 42) - s64 * s64;
9261b245SRichard Henderson        uint64_t d1 = s64 - d0;
9261b245SRichard Henderson        uint64_t d2 = d1 + s64 + 1;
9261b245SRichard Henderson        s64 += d1 >> 63;
9261b245SRichard Henderson        a->frac_hi = s64 << (64 - 54);
9261b245SRichard Henderson
9261b245SRichard Henderson        /* increment or decrement for inexact */
9261b245SRichard Henderson        if (d2 != 0) {
9261b245SRichard Henderson            a->frac_hi += ((int64_t)(d1 ^ d2) < 0 ? -1 : 1);
9261b245SRichard Henderson        }
9261b245SRichard Henderson        goto done;
9261b245SRichard Henderson    }
9261b245SRichard Henderson
9261b245SRichard Henderson    r64 = (uint64_t)r32 * u32 * 2;
9261b245SRichard Henderson    /* |r*sqrt(m) - 1| < 0x1.7Bp-16; convert to 64-bit arithmetic */
9261b245SRichard Henderson
9261b245SRichard Henderson    mul64To128(m64, r64, &s64, &discard);
9261b245SRichard Henderson    mul64To128(s64, r64, &d64, &discard);
9261b245SRichard Henderson    u64 = three64 - d64;
9261b245SRichard Henderson    mul64To128(u64, r64, &r64, &discard);
9261b245SRichard Henderson    r64 <<= 1;
9261b245SRichard Henderson    /* |r*sqrt(m) - 1| < 0x1.a5p-31 */
9261b245SRichard Henderson
9261b245SRichard Henderson    mul64To128(m64, r64, &s64, &discard);
9261b245SRichard Henderson    mul64To128(s64, r64, &d64, &discard);
9261b245SRichard Henderson    u64 = three64 - d64;
9261b245SRichard Henderson    mul64To128(u64, r64, &rh, &rl);
9261b245SRichard Henderson    add128(rh, rl, rh, rl, &rh, &rl);
9261b245SRichard Henderson    /* |r*sqrt(m) - 1| < 0x1.c001p-59; change to 128-bit arithmetic */
9261b245SRichard Henderson
9261b245SRichard Henderson    mul128To256(a->frac_hi, a->frac_lo, rh, rl, &sh, &sl, &discard, &discard);
9261b245SRichard Henderson    mul128To256(sh, sl, rh, rl, &dh, &dl, &discard, &discard);
9261b245SRichard Henderson    sub128(three64, 0, dh, dl, &uh, &ul);
9261b245SRichard Henderson    mul128To256(uh, ul, sh, sl, &sh, &sl, &discard, &discard);  /* 3.125 */
9261b245SRichard Henderson    /* -0x1p-116 < s - sqrt(m) < 0x3.8001p-125 */
9261b245SRichard Henderson
9261b245SRichard Henderson    sub128(sh, sl, 0, 4, &sh, &sl);
9261b245SRichard Henderson    shift128Right(sh, sl, 13, &sh, &sl);  /* 16.112 */
9261b245SRichard Henderson    /* s < sqrt(m) < s + 1ulp */
9261b245SRichard Henderson
9261b245SRichard Henderson    /* Compute nearest rounded result */
9261b245SRichard Henderson    mul64To128(sl, sl, &d0h, &d0l);
9261b245SRichard Henderson    d0h += 2 * sh * sl;
9261b245SRichard Henderson    sub128(a->frac_lo << 34, 0, d0h, d0l, &d0h, &d0l);
9261b245SRichard Henderson    sub128(sh, sl, d0h, d0l, &d1h, &d1l);
9261b245SRichard Henderson    add128(sh, sl, 0, 1, &d2h, &d2l);
9261b245SRichard Henderson    add128(d2h, d2l, d1h, d1l, &d2h, &d2l);
9261b245SRichard Henderson    add128(sh, sl, 0, d1h >> 63, &sh, &sl);
9261b245SRichard Henderson    shift128Left(sh, sl, 128 - 114, &sh, &sl);
9261b245SRichard Henderson
9261b245SRichard Henderson    /* increment or decrement for inexact */
9261b245SRichard Henderson    if (d2h | d2l) {
9261b245SRichard Henderson        if ((int64_t)(d1h ^ d2h) < 0) {
9261b245SRichard Henderson            sub128(sh, sl, 0, 1, &sh, &sl);
9261b245SRichard Henderson        } else {
9261b245SRichard Henderson            add128(sh, sl, 0, 1, &sh, &sl);
9261b245SRichard Henderson        }
9261b245SRichard Henderson    }
9261b245SRichard Henderson    a->frac_lo = sl;
9261b245SRichard Henderson    a->frac_hi = sh;
9261b245SRichard Henderson
9261b245SRichard Henderson done:
9261b245SRichard Henderson    /* Convert back from base 4 to base 2. */
9261b245SRichard Henderson    a->exp >>= 1;
9261b245SRichard Henderson    if (!(a->frac_hi & DECOMPOSED_IMPLICIT_BIT)) {
9261b245SRichard Henderson        frac_add(a, a, a);
9261b245SRichard Henderson    } else {
9261b245SRichard Henderson        a->exp += 1;
9261b245SRichard Henderson    }
9261b245SRichard Henderson    return;
9261b245SRichard Henderson
9261b245SRichard Henderson d_nan:
f8718aabSRichard Henderson    float_raise(float_flag_invalid | float_flag_invalid_sqrt, status);
9261b245SRichard Henderson    parts_default_nan(a, status);
9261b245SRichard Henderson}
9261b245SRichard Henderson
9261b245SRichard Henderson/*
afc34931SRichard Henderson * Rounds the floating-point value `a' to an integer, and returns the
afc34931SRichard Henderson * result as a floating-point value. The operation is performed
afc34931SRichard Henderson * according to the IEC/IEEE Standard for Binary Floating-Point
afc34931SRichard Henderson * Arithmetic.
afc34931SRichard Henderson *
afc34931SRichard Henderson * parts_round_to_int_normal is an internal helper function for
afc34931SRichard Henderson * normal numbers only, returning true for inexact but not directly
afc34931SRichard Henderson * raising float_flag_inexact.
afc34931SRichard Henderson */
afc34931SRichard Hendersonstatic bool partsN(round_to_int_normal)(FloatPartsN *a, FloatRoundMode rmode,
afc34931SRichard Henderson                                        int scale, int frac_size)
afc34931SRichard Henderson{
afc34931SRichard Henderson    uint64_t frac_lsb, frac_lsbm1, rnd_even_mask, rnd_mask, inc;
afc34931SRichard Henderson    int shift_adj;
afc34931SRichard Henderson
afc34931SRichard Henderson    scale = MIN(MAX(scale, -0x10000), 0x10000);
afc34931SRichard Henderson    a->exp += scale;
afc34931SRichard Henderson
afc34931SRichard Henderson    if (a->exp < 0) {
afc34931SRichard Henderson        bool one;
afc34931SRichard Henderson
afc34931SRichard Henderson        /* All fractional */
afc34931SRichard Henderson        switch (rmode) {
afc34931SRichard Henderson        case float_round_nearest_even:
afc34931SRichard Henderson            one = false;
afc34931SRichard Henderson            if (a->exp == -1) {
afc34931SRichard Henderson                FloatPartsN tmp;
afc34931SRichard Henderson                /* Shift left one, discarding DECOMPOSED_IMPLICIT_BIT */
afc34931SRichard Henderson                frac_add(&tmp, a, a);
afc34931SRichard Henderson                /* Anything remaining means frac > 0.5. */
afc34931SRichard Henderson                one = !frac_eqz(&tmp);
afc34931SRichard Henderson            }
afc34931SRichard Henderson            break;
afc34931SRichard Henderson        case float_round_ties_away:
afc34931SRichard Henderson            one = a->exp == -1;
afc34931SRichard Henderson            break;
afc34931SRichard Henderson        case float_round_to_zero:
afc34931SRichard Henderson            one = false;
afc34931SRichard Henderson            break;
afc34931SRichard Henderson        case float_round_up:
afc34931SRichard Henderson            one = !a->sign;
afc34931SRichard Henderson            break;
afc34931SRichard Henderson        case float_round_down:
afc34931SRichard Henderson            one = a->sign;
afc34931SRichard Henderson            break;
afc34931SRichard Henderson        case float_round_to_odd:
afc34931SRichard Henderson            one = true;
afc34931SRichard Henderson            break;
afc34931SRichard Henderson        default:
afc34931SRichard Henderson            g_assert_not_reached();
afc34931SRichard Henderson        }
afc34931SRichard Henderson
afc34931SRichard Henderson        frac_clear(a);
afc34931SRichard Henderson        a->exp = 0;
afc34931SRichard Henderson        if (one) {
afc34931SRichard Henderson            a->frac_hi = DECOMPOSED_IMPLICIT_BIT;
afc34931SRichard Henderson        } else {
afc34931SRichard Henderson            a->cls = float_class_zero;
afc34931SRichard Henderson        }
afc34931SRichard Henderson        return true;
afc34931SRichard Henderson    }
afc34931SRichard Henderson
afc34931SRichard Henderson    if (a->exp >= frac_size) {
afc34931SRichard Henderson        /* All integral */
afc34931SRichard Henderson        return false;
afc34931SRichard Henderson    }
afc34931SRichard Henderson
afc34931SRichard Henderson    if (N > 64 && a->exp < N - 64) {
afc34931SRichard Henderson        /*
afc34931SRichard Henderson         * Rounding is not in the low word -- shift lsb to bit 2,
afc34931SRichard Henderson         * which leaves room for sticky and rounding bit.
afc34931SRichard Henderson         */
afc34931SRichard Henderson        shift_adj = (N - 1) - (a->exp + 2);
afc34931SRichard Henderson        frac_shrjam(a, shift_adj);
afc34931SRichard Henderson        frac_lsb = 1 << 2;
afc34931SRichard Henderson    } else {
afc34931SRichard Henderson        shift_adj = 0;
afc34931SRichard Henderson        frac_lsb = DECOMPOSED_IMPLICIT_BIT >> (a->exp & 63);
afc34931SRichard Henderson    }
afc34931SRichard Henderson
afc34931SRichard Henderson    frac_lsbm1 = frac_lsb >> 1;
afc34931SRichard Henderson    rnd_mask = frac_lsb - 1;
afc34931SRichard Henderson    rnd_even_mask = rnd_mask | frac_lsb;
afc34931SRichard Henderson
afc34931SRichard Henderson    if (!(a->frac_lo & rnd_mask)) {
afc34931SRichard Henderson        /* Fractional bits already clear, undo the shift above. */
afc34931SRichard Henderson        frac_shl(a, shift_adj);
afc34931SRichard Henderson        return false;
afc34931SRichard Henderson    }
afc34931SRichard Henderson
afc34931SRichard Henderson    switch (rmode) {
afc34931SRichard Henderson    case float_round_nearest_even:
afc34931SRichard Henderson        inc = ((a->frac_lo & rnd_even_mask) != frac_lsbm1 ? frac_lsbm1 : 0);
afc34931SRichard Henderson        break;
afc34931SRichard Henderson    case float_round_ties_away:
afc34931SRichard Henderson        inc = frac_lsbm1;
afc34931SRichard Henderson        break;
afc34931SRichard Henderson    case float_round_to_zero:
afc34931SRichard Henderson        inc = 0;
afc34931SRichard Henderson        break;
afc34931SRichard Henderson    case float_round_up:
afc34931SRichard Henderson        inc = a->sign ? 0 : rnd_mask;
afc34931SRichard Henderson        break;
afc34931SRichard Henderson    case float_round_down:
afc34931SRichard Henderson        inc = a->sign ? rnd_mask : 0;
afc34931SRichard Henderson        break;
afc34931SRichard Henderson    case float_round_to_odd:
afc34931SRichard Henderson        inc = a->frac_lo & frac_lsb ? 0 : rnd_mask;
afc34931SRichard Henderson        break;
afc34931SRichard Henderson    default:
afc34931SRichard Henderson        g_assert_not_reached();
afc34931SRichard Henderson    }
afc34931SRichard Henderson
afc34931SRichard Henderson    if (shift_adj == 0) {
afc34931SRichard Henderson        if (frac_addi(a, a, inc)) {
afc34931SRichard Henderson            frac_shr(a, 1);
afc34931SRichard Henderson            a->frac_hi |= DECOMPOSED_IMPLICIT_BIT;
afc34931SRichard Henderson            a->exp++;
afc34931SRichard Henderson        }
afc34931SRichard Henderson        a->frac_lo &= ~rnd_mask;
afc34931SRichard Henderson    } else {
afc34931SRichard Henderson        frac_addi(a, a, inc);
afc34931SRichard Henderson        a->frac_lo &= ~rnd_mask;
afc34931SRichard Henderson        /* Be careful shifting back, not to overflow */
afc34931SRichard Henderson        frac_shl(a, shift_adj - 1);
afc34931SRichard Henderson        if (a->frac_hi & DECOMPOSED_IMPLICIT_BIT) {
afc34931SRichard Henderson            a->exp++;
afc34931SRichard Henderson        } else {
afc34931SRichard Henderson            frac_add(a, a, a);
afc34931SRichard Henderson        }
afc34931SRichard Henderson    }
afc34931SRichard Henderson    return true;
afc34931SRichard Henderson}
afc34931SRichard Henderson
afc34931SRichard Hendersonstatic void partsN(round_to_int)(FloatPartsN *a, FloatRoundMode rmode,
afc34931SRichard Henderson                                 int scale, float_status *s,
afc34931SRichard Henderson                                 const FloatFmt *fmt)
afc34931SRichard Henderson{
afc34931SRichard Henderson    switch (a->cls) {
afc34931SRichard Henderson    case float_class_qnan:
afc34931SRichard Henderson    case float_class_snan:
afc34931SRichard Henderson        parts_return_nan(a, s);
afc34931SRichard Henderson        break;
afc34931SRichard Henderson    case float_class_zero:
afc34931SRichard Henderson    case float_class_inf:
afc34931SRichard Henderson        break;
afc34931SRichard Henderson    case float_class_normal:
afc34931SRichard Henderson        if (parts_round_to_int_normal(a, rmode, scale, fmt->frac_size)) {
afc34931SRichard Henderson            float_raise(float_flag_inexact, s);
afc34931SRichard Henderson        }
afc34931SRichard Henderson        break;
afc34931SRichard Henderson    default:
afc34931SRichard Henderson        g_assert_not_reached();
afc34931SRichard Henderson    }
afc34931SRichard Henderson}
463b3f0dSRichard Henderson
463b3f0dSRichard Henderson/*
463b3f0dSRichard Henderson * Returns the result of converting the floating-point value `a' to
463b3f0dSRichard Henderson * the two's complement integer format. The conversion is performed
463b3f0dSRichard Henderson * according to the IEC/IEEE Standard for Binary Floating-Point
463b3f0dSRichard Henderson * Arithmetic---which means in particular that the conversion is
463b3f0dSRichard Henderson * rounded according to the current rounding mode. If `a' is a NaN,
463b3f0dSRichard Henderson * the largest positive integer is returned. Otherwise, if the
463b3f0dSRichard Henderson * conversion overflows, the largest integer with the same sign as `a'
463b3f0dSRichard Henderson * is returned.
463b3f0dSRichard Henderson */
463b3f0dSRichard Hendersonstatic int64_t partsN(float_to_sint)(FloatPartsN *p, FloatRoundMode rmode,
463b3f0dSRichard Henderson                                     int scale, int64_t min, int64_t max,
463b3f0dSRichard Henderson                                     float_status *s)
463b3f0dSRichard Henderson{
463b3f0dSRichard Henderson    int flags = 0;
463b3f0dSRichard Henderson    uint64_t r;
463b3f0dSRichard Henderson
463b3f0dSRichard Henderson    switch (p->cls) {
463b3f0dSRichard Henderson    case float_class_snan:
e706d445SRichard Henderson        flags |= float_flag_invalid_snan;
e706d445SRichard Henderson        /* fall through */
463b3f0dSRichard Henderson    case float_class_qnan:
e706d445SRichard Henderson        flags |= float_flag_invalid;
463b3f0dSRichard Henderson        r = max;
463b3f0dSRichard Henderson        break;
463b3f0dSRichard Henderson
463b3f0dSRichard Henderson    case float_class_inf:
81254b02SRichard Henderson        flags = float_flag_invalid | float_flag_invalid_cvti;
463b3f0dSRichard Henderson        r = p->sign ? min : max;
463b3f0dSRichard Henderson        break;
463b3f0dSRichard Henderson
463b3f0dSRichard Henderson    case float_class_zero:
463b3f0dSRichard Henderson        return 0;
463b3f0dSRichard Henderson
463b3f0dSRichard Henderson    case float_class_normal:
463b3f0dSRichard Henderson        /* TODO: N - 2 is frac_size for rounding; could use input fmt. */
463b3f0dSRichard Henderson        if (parts_round_to_int_normal(p, rmode, scale, N - 2)) {
463b3f0dSRichard Henderson            flags = float_flag_inexact;
463b3f0dSRichard Henderson        }
463b3f0dSRichard Henderson
463b3f0dSRichard Henderson        if (p->exp <= DECOMPOSED_BINARY_POINT) {
463b3f0dSRichard Henderson            r = p->frac_hi >> (DECOMPOSED_BINARY_POINT - p->exp);
463b3f0dSRichard Henderson        } else {
463b3f0dSRichard Henderson            r = UINT64_MAX;
463b3f0dSRichard Henderson        }
463b3f0dSRichard Henderson        if (p->sign) {
463b3f0dSRichard Henderson            if (r <= -(uint64_t)min) {
463b3f0dSRichard Henderson                r = -r;
463b3f0dSRichard Henderson            } else {
81254b02SRichard Henderson                flags = float_flag_invalid | float_flag_invalid_cvti;
463b3f0dSRichard Henderson                r = min;
463b3f0dSRichard Henderson            }
463b3f0dSRichard Henderson        } else if (r > max) {
81254b02SRichard Henderson            flags = float_flag_invalid | float_flag_invalid_cvti;
463b3f0dSRichard Henderson            r = max;
4ab4aef0SRichard Henderson        }
4ab4aef0SRichard Henderson        break;
4ab4aef0SRichard Henderson
4ab4aef0SRichard Henderson    default:
4ab4aef0SRichard Henderson        g_assert_not_reached();
4ab4aef0SRichard Henderson    }
4ab4aef0SRichard Henderson
4ab4aef0SRichard Henderson    float_raise(flags, s);
4ab4aef0SRichard Henderson    return r;
4ab4aef0SRichard Henderson}
4ab4aef0SRichard Henderson
4ab4aef0SRichard Henderson/*
4ab4aef0SRichard Henderson *  Returns the result of converting the floating-point value `a' to
4ab4aef0SRichard Henderson *  the unsigned integer format. The conversion is performed according
4ab4aef0SRichard Henderson *  to the IEC/IEEE Standard for Binary Floating-Point
4ab4aef0SRichard Henderson *  Arithmetic---which means in particular that the conversion is
4ab4aef0SRichard Henderson *  rounded according to the current rounding mode. If `a' is a NaN,
4ab4aef0SRichard Henderson *  the largest unsigned integer is returned. Otherwise, if the
4ab4aef0SRichard Henderson *  conversion overflows, the largest unsigned integer is returned. If
4ab4aef0SRichard Henderson *  the 'a' is negative, the result is rounded and zero is returned;
4ab4aef0SRichard Henderson *  values that do not round to zero will raise the inexact exception
4ab4aef0SRichard Henderson *  flag.
4ab4aef0SRichard Henderson */
4ab4aef0SRichard Hendersonstatic uint64_t partsN(float_to_uint)(FloatPartsN *p, FloatRoundMode rmode,
4ab4aef0SRichard Henderson                                      int scale, uint64_t max, float_status *s)
4ab4aef0SRichard Henderson{
4ab4aef0SRichard Henderson    int flags = 0;
4ab4aef0SRichard Henderson    uint64_t r;
4ab4aef0SRichard Henderson
4ab4aef0SRichard Henderson    switch (p->cls) {
4ab4aef0SRichard Henderson    case float_class_snan:
e706d445SRichard Henderson        flags |= float_flag_invalid_snan;
e706d445SRichard Henderson        /* fall through */
4ab4aef0SRichard Henderson    case float_class_qnan:
e706d445SRichard Henderson        flags |= float_flag_invalid;
4ab4aef0SRichard Henderson        r = max;
4ab4aef0SRichard Henderson        break;
4ab4aef0SRichard Henderson
4ab4aef0SRichard Henderson    case float_class_inf:
81254b02SRichard Henderson        flags = float_flag_invalid | float_flag_invalid_cvti;
4ab4aef0SRichard Henderson        r = p->sign ? 0 : max;
4ab4aef0SRichard Henderson        break;
4ab4aef0SRichard Henderson
4ab4aef0SRichard Henderson    case float_class_zero:
4ab4aef0SRichard Henderson        return 0;
4ab4aef0SRichard Henderson
4ab4aef0SRichard Henderson    case float_class_normal:
4ab4aef0SRichard Henderson        /* TODO: N - 2 is frac_size for rounding; could use input fmt. */
4ab4aef0SRichard Henderson        if (parts_round_to_int_normal(p, rmode, scale, N - 2)) {
4ab4aef0SRichard Henderson            flags = float_flag_inexact;
4ab4aef0SRichard Henderson            if (p->cls == float_class_zero) {
4ab4aef0SRichard Henderson                r = 0;
4ab4aef0SRichard Henderson                break;
4ab4aef0SRichard Henderson            }
4ab4aef0SRichard Henderson        }
4ab4aef0SRichard Henderson
4ab4aef0SRichard Henderson        if (p->sign) {
81254b02SRichard Henderson            flags = float_flag_invalid | float_flag_invalid_cvti;
4ab4aef0SRichard Henderson            r = 0;
4ab4aef0SRichard Henderson        } else if (p->exp > DECOMPOSED_BINARY_POINT) {
81254b02SRichard Henderson            flags = float_flag_invalid | float_flag_invalid_cvti;
4ab4aef0SRichard Henderson            r = max;
4ab4aef0SRichard Henderson        } else {
4ab4aef0SRichard Henderson            r = p->frac_hi >> (DECOMPOSED_BINARY_POINT - p->exp);
4ab4aef0SRichard Henderson            if (r > max) {
81254b02SRichard Henderson                flags = float_flag_invalid | float_flag_invalid_cvti;
4ab4aef0SRichard Henderson                r = max;
4ab4aef0SRichard Henderson            }
463b3f0dSRichard Henderson        }
463b3f0dSRichard Henderson        break;
463b3f0dSRichard Henderson
463b3f0dSRichard Henderson    default:
463b3f0dSRichard Henderson        g_assert_not_reached();
463b3f0dSRichard Henderson    }
463b3f0dSRichard Henderson
463b3f0dSRichard Henderson    float_raise(flags, s);
463b3f0dSRichard Henderson    return r;
463b3f0dSRichard Henderson}
e3689519SRichard Henderson
e3689519SRichard Henderson/*
e2041f4dSRichard Henderson * Like partsN(float_to_sint), except do not saturate the result.
e2041f4dSRichard Henderson * Instead, return the rounded unbounded precision two's compliment result,
e2041f4dSRichard Henderson * modulo 2**(bitsm1 + 1).
e2041f4dSRichard Henderson */
e2041f4dSRichard Hendersonstatic int64_t partsN(float_to_sint_modulo)(FloatPartsN *p,
e2041f4dSRichard Henderson                                            FloatRoundMode rmode,
e2041f4dSRichard Henderson                                            int bitsm1, float_status *s)
e2041f4dSRichard Henderson{
e2041f4dSRichard Henderson    int flags = 0;
e2041f4dSRichard Henderson    uint64_t r;
e2041f4dSRichard Henderson    bool overflow = false;
e2041f4dSRichard Henderson
e2041f4dSRichard Henderson    switch (p->cls) {
e2041f4dSRichard Henderson    case float_class_snan:
e2041f4dSRichard Henderson        flags |= float_flag_invalid_snan;
e2041f4dSRichard Henderson        /* fall through */
e2041f4dSRichard Henderson    case float_class_qnan:
e2041f4dSRichard Henderson        flags |= float_flag_invalid;
e2041f4dSRichard Henderson        r = 0;
e2041f4dSRichard Henderson        break;
e2041f4dSRichard Henderson
e2041f4dSRichard Henderson    case float_class_inf:
e2041f4dSRichard Henderson        overflow = true;
e2041f4dSRichard Henderson        r = 0;
e2041f4dSRichard Henderson        break;
e2041f4dSRichard Henderson
e2041f4dSRichard Henderson    case float_class_zero:
e2041f4dSRichard Henderson        return 0;
e2041f4dSRichard Henderson
e2041f4dSRichard Henderson    case float_class_normal:
e2041f4dSRichard Henderson        /* TODO: N - 2 is frac_size for rounding; could use input fmt. */
e2041f4dSRichard Henderson        if (parts_round_to_int_normal(p, rmode, 0, N - 2)) {
e2041f4dSRichard Henderson            flags = float_flag_inexact;
e2041f4dSRichard Henderson        }
e2041f4dSRichard Henderson
e2041f4dSRichard Henderson        if (p->exp <= DECOMPOSED_BINARY_POINT) {
e2041f4dSRichard Henderson            /*
e2041f4dSRichard Henderson             * Because we rounded to integral, and exp < 64,
e2041f4dSRichard Henderson             * we know frac_low is zero.
e2041f4dSRichard Henderson             */
e2041f4dSRichard Henderson            r = p->frac_hi >> (DECOMPOSED_BINARY_POINT - p->exp);
e2041f4dSRichard Henderson            if (p->exp < bitsm1) {
e2041f4dSRichard Henderson                /* Result in range. */
e2041f4dSRichard Henderson            } else if (p->exp == bitsm1) {
e2041f4dSRichard Henderson                /* The only in-range value is INT_MIN. */
e2041f4dSRichard Henderson                overflow = !p->sign || p->frac_hi != DECOMPOSED_IMPLICIT_BIT;
e2041f4dSRichard Henderson            } else {
e2041f4dSRichard Henderson                overflow = true;
e2041f4dSRichard Henderson            }
e2041f4dSRichard Henderson        } else {
e2041f4dSRichard Henderson            /* Overflow, but there might still be bits to return. */
e2041f4dSRichard Henderson            int shl = p->exp - DECOMPOSED_BINARY_POINT;
e2041f4dSRichard Henderson            if (shl < N) {
e2041f4dSRichard Henderson                frac_shl(p, shl);
e2041f4dSRichard Henderson                r = p->frac_hi;
e2041f4dSRichard Henderson            } else {
e2041f4dSRichard Henderson                r = 0;
e2041f4dSRichard Henderson            }
e2041f4dSRichard Henderson            overflow = true;
e2041f4dSRichard Henderson        }
e2041f4dSRichard Henderson
e2041f4dSRichard Henderson        if (p->sign) {
e2041f4dSRichard Henderson            r = -r;
e2041f4dSRichard Henderson        }
e2041f4dSRichard Henderson        break;
e2041f4dSRichard Henderson
e2041f4dSRichard Henderson    default:
e2041f4dSRichard Henderson        g_assert_not_reached();
e2041f4dSRichard Henderson    }
e2041f4dSRichard Henderson
e2041f4dSRichard Henderson    if (overflow) {
e2041f4dSRichard Henderson        flags = float_flag_invalid | float_flag_invalid_cvti;
e2041f4dSRichard Henderson    }
e2041f4dSRichard Henderson    float_raise(flags, s);
e2041f4dSRichard Henderson    return r;
e2041f4dSRichard Henderson}
e2041f4dSRichard Henderson
e2041f4dSRichard Henderson/*
e3689519SRichard Henderson * Integer to float conversions
e3689519SRichard Henderson *
e3689519SRichard Henderson * Returns the result of converting the two's complement integer `a'
e3689519SRichard Henderson * to the floating-point format. The conversion is performed according
e3689519SRichard Henderson * to the IEC/IEEE Standard for Binary Floating-Point Arithmetic.
e3689519SRichard Henderson */
e3689519SRichard Hendersonstatic void partsN(sint_to_float)(FloatPartsN *p, int64_t a,
e3689519SRichard Henderson                                  int scale, float_status *s)
e3689519SRichard Henderson{
e3689519SRichard Henderson    uint64_t f = a;
e3689519SRichard Henderson    int shift;
e3689519SRichard Henderson
e3689519SRichard Henderson    memset(p, 0, sizeof(*p));
e3689519SRichard Henderson
e3689519SRichard Henderson    if (a == 0) {
e3689519SRichard Henderson        p->cls = float_class_zero;
e3689519SRichard Henderson        return;
e3689519SRichard Henderson    }
e3689519SRichard Henderson
e3689519SRichard Henderson    p->cls = float_class_normal;
e3689519SRichard Henderson    if (a < 0) {
e3689519SRichard Henderson        f = -f;
e3689519SRichard Henderson        p->sign = true;
e3689519SRichard Henderson    }
e3689519SRichard Henderson    shift = clz64(f);
e3689519SRichard Henderson    scale = MIN(MAX(scale, -0x10000), 0x10000);
e3689519SRichard Henderson
e3689519SRichard Henderson    p->exp = DECOMPOSED_BINARY_POINT - shift + scale;
e3689519SRichard Henderson    p->frac_hi = f << shift;
e3689519SRichard Henderson}
37c954a1SRichard Henderson
37c954a1SRichard Henderson/*
37c954a1SRichard Henderson * Unsigned Integer to float conversions
37c954a1SRichard Henderson *
37c954a1SRichard Henderson * Returns the result of converting the unsigned integer `a' to the
37c954a1SRichard Henderson * floating-point format. The conversion is performed according to the
37c954a1SRichard Henderson * IEC/IEEE Standard for Binary Floating-Point Arithmetic.
37c954a1SRichard Henderson */
37c954a1SRichard Hendersonstatic void partsN(uint_to_float)(FloatPartsN *p, uint64_t a,
37c954a1SRichard Henderson                                  int scale, float_status *status)
37c954a1SRichard Henderson{
37c954a1SRichard Henderson    memset(p, 0, sizeof(*p));
37c954a1SRichard Henderson
37c954a1SRichard Henderson    if (a == 0) {
37c954a1SRichard Henderson        p->cls = float_class_zero;
37c954a1SRichard Henderson    } else {
37c954a1SRichard Henderson        int shift = clz64(a);
37c954a1SRichard Henderson        scale = MIN(MAX(scale, -0x10000), 0x10000);
37c954a1SRichard Henderson        p->cls = float_class_normal;
37c954a1SRichard Henderson        p->exp = DECOMPOSED_BINARY_POINT - shift + scale;
37c954a1SRichard Henderson        p->frac_hi = a << shift;
37c954a1SRichard Henderson    }
37c954a1SRichard Henderson}
e1c4667aSRichard Henderson
e1c4667aSRichard Henderson/*
e1c4667aSRichard Henderson * Float min/max.
e1c4667aSRichard Henderson */
e1c4667aSRichard Hendersonstatic FloatPartsN *partsN(minmax)(FloatPartsN *a, FloatPartsN *b,
e1c4667aSRichard Henderson                                   float_status *s, int flags)
e1c4667aSRichard Henderson{
e1c4667aSRichard Henderson    int ab_mask = float_cmask(a->cls) | float_cmask(b->cls);
e1c4667aSRichard Henderson    int a_exp, b_exp, cmp;
e1c4667aSRichard Henderson
e1c4667aSRichard Henderson    if (unlikely(ab_mask & float_cmask_anynan)) {
e1c4667aSRichard Henderson        /*
0e903037SChih-Min Chao         * For minNum/maxNum (IEEE 754-2008)
0e903037SChih-Min Chao         * or minimumNumber/maximumNumber (IEEE 754-2019),
0e903037SChih-Min Chao         * if one operand is a QNaN, and the other
e1c4667aSRichard Henderson         * operand is numerical, then return numerical argument.
e1c4667aSRichard Henderson         */
0e903037SChih-Min Chao        if ((flags & (minmax_isnum | minmax_isnumber))
e1c4667aSRichard Henderson            && !(ab_mask & float_cmask_snan)
e1c4667aSRichard Henderson            && (ab_mask & ~float_cmask_qnan)) {
e1c4667aSRichard Henderson            return is_nan(a->cls) ? b : a;
e1c4667aSRichard Henderson        }
0e903037SChih-Min Chao
0e903037SChih-Min Chao        /*
0e903037SChih-Min Chao         * In IEEE 754-2019, minNum, maxNum, minNumMag and maxNumMag
0e903037SChih-Min Chao         * are removed and replaced with minimum, minimumNumber, maximum
0e903037SChih-Min Chao         * and maximumNumber.
0e903037SChih-Min Chao         * minimumNumber/maximumNumber behavior for SNaN is changed to:
0e903037SChih-Min Chao         *   If both operands are NaNs, a QNaN is returned.
0e903037SChih-Min Chao         *   If either operand is a SNaN,
0e903037SChih-Min Chao         *   an invalid operation exception is signaled,
0e903037SChih-Min Chao         *   but unless both operands are NaNs,
0e903037SChih-Min Chao         *   the SNaN is otherwise ignored and not converted to a QNaN.
0e903037SChih-Min Chao         */
0e903037SChih-Min Chao        if ((flags & minmax_isnumber)
0e903037SChih-Min Chao            && (ab_mask & float_cmask_snan)
0e903037SChih-Min Chao            && (ab_mask & ~float_cmask_anynan)) {
0e903037SChih-Min Chao            float_raise(float_flag_invalid, s);
0e903037SChih-Min Chao            return is_nan(a->cls) ? b : a;
0e903037SChih-Min Chao        }
0e903037SChih-Min Chao
e1c4667aSRichard Henderson        return parts_pick_nan(a, b, s);
e1c4667aSRichard Henderson    }
e1c4667aSRichard Henderson
e1c4667aSRichard Henderson    a_exp = a->exp;
e1c4667aSRichard Henderson    b_exp = b->exp;
e1c4667aSRichard Henderson
e1c4667aSRichard Henderson    if (unlikely(ab_mask != float_cmask_normal)) {
e1c4667aSRichard Henderson        switch (a->cls) {
e1c4667aSRichard Henderson        case float_class_normal:
e1c4667aSRichard Henderson            break;
e1c4667aSRichard Henderson        case float_class_inf:
e1c4667aSRichard Henderson            a_exp = INT16_MAX;
e1c4667aSRichard Henderson            break;
e1c4667aSRichard Henderson        case float_class_zero:
e1c4667aSRichard Henderson            a_exp = INT16_MIN;
e1c4667aSRichard Henderson            break;
e1c4667aSRichard Henderson        default:
e1c4667aSRichard Henderson            g_assert_not_reached();
e1c4667aSRichard Henderson            break;
e1c4667aSRichard Henderson        }
e1c4667aSRichard Henderson        switch (b->cls) {
e1c4667aSRichard Henderson        case float_class_normal:
e1c4667aSRichard Henderson            break;
e1c4667aSRichard Henderson        case float_class_inf:
e1c4667aSRichard Henderson            b_exp = INT16_MAX;
e1c4667aSRichard Henderson            break;
e1c4667aSRichard Henderson        case float_class_zero:
e1c4667aSRichard Henderson            b_exp = INT16_MIN;
e1c4667aSRichard Henderson            break;
e1c4667aSRichard Henderson        default:
e1c4667aSRichard Henderson            g_assert_not_reached();
e1c4667aSRichard Henderson            break;
e1c4667aSRichard Henderson        }
e1c4667aSRichard Henderson    }
e1c4667aSRichard Henderson
e1c4667aSRichard Henderson    /* Compare magnitudes. */
e1c4667aSRichard Henderson    cmp = a_exp - b_exp;
e1c4667aSRichard Henderson    if (cmp == 0) {
e1c4667aSRichard Henderson        cmp = frac_cmp(a, b);
e1c4667aSRichard Henderson    }
e1c4667aSRichard Henderson
e1c4667aSRichard Henderson    /*
e1c4667aSRichard Henderson     * Take the sign into account.
e1c4667aSRichard Henderson     * For ismag, only do this if the magnitudes are equal.
e1c4667aSRichard Henderson     */
e1c4667aSRichard Henderson    if (!(flags & minmax_ismag) || cmp == 0) {
e1c4667aSRichard Henderson        if (a->sign != b->sign) {
e1c4667aSRichard Henderson            /* For differing signs, the negative operand is less. */
e1c4667aSRichard Henderson            cmp = a->sign ? -1 : 1;
e1c4667aSRichard Henderson        } else if (a->sign) {
e1c4667aSRichard Henderson            /* For two negative operands, invert the magnitude comparison. */
e1c4667aSRichard Henderson            cmp = -cmp;
e1c4667aSRichard Henderson        }
e1c4667aSRichard Henderson    }
e1c4667aSRichard Henderson
e1c4667aSRichard Henderson    if (flags & minmax_ismin) {
e1c4667aSRichard Henderson        cmp = -cmp;
e1c4667aSRichard Henderson    }
e1c4667aSRichard Henderson    return cmp < 0 ? b : a;
e1c4667aSRichard Henderson}
6eb169b8SRichard Henderson
6eb169b8SRichard Henderson/*
6eb169b8SRichard Henderson * Floating point compare
6eb169b8SRichard Henderson */
6eb169b8SRichard Hendersonstatic FloatRelation partsN(compare)(FloatPartsN *a, FloatPartsN *b,
6eb169b8SRichard Henderson                                     float_status *s, bool is_quiet)
6eb169b8SRichard Henderson{
6eb169b8SRichard Henderson    int ab_mask = float_cmask(a->cls) | float_cmask(b->cls);
6eb169b8SRichard Henderson
6eb169b8SRichard Henderson    if (likely(ab_mask == float_cmask_normal)) {
9343c884SRichard Henderson        FloatRelation cmp;
9343c884SRichard Henderson
6eb169b8SRichard Henderson        if (a->sign != b->sign) {
6eb169b8SRichard Henderson            goto a_sign;
6eb169b8SRichard Henderson        }
9343c884SRichard Henderson        if (a->exp == b->exp) {
6eb169b8SRichard Henderson            cmp = frac_cmp(a, b);
9343c884SRichard Henderson        } else if (a->exp < b->exp) {
9343c884SRichard Henderson            cmp = float_relation_less;
9343c884SRichard Henderson        } else {
9343c884SRichard Henderson            cmp = float_relation_greater;
6eb169b8SRichard Henderson        }
6eb169b8SRichard Henderson        if (a->sign) {
6eb169b8SRichard Henderson            cmp = -cmp;
6eb169b8SRichard Henderson        }
6eb169b8SRichard Henderson        return cmp;
6eb169b8SRichard Henderson    }
6eb169b8SRichard Henderson
6eb169b8SRichard Henderson    if (unlikely(ab_mask & float_cmask_anynan)) {
e706d445SRichard Henderson        if (ab_mask & float_cmask_snan) {
e706d445SRichard Henderson            float_raise(float_flag_invalid | float_flag_invalid_snan, s);
e706d445SRichard Henderson        } else if (!is_quiet) {
6eb169b8SRichard Henderson            float_raise(float_flag_invalid, s);
6eb169b8SRichard Henderson        }
6eb169b8SRichard Henderson        return float_relation_unordered;
6eb169b8SRichard Henderson    }
6eb169b8SRichard Henderson
6eb169b8SRichard Henderson    if (ab_mask & float_cmask_zero) {
6eb169b8SRichard Henderson        if (ab_mask == float_cmask_zero) {
6eb169b8SRichard Henderson            return float_relation_equal;
6eb169b8SRichard Henderson        } else if (a->cls == float_class_zero) {
6eb169b8SRichard Henderson            goto b_sign;
6eb169b8SRichard Henderson        } else {
6eb169b8SRichard Henderson            goto a_sign;
6eb169b8SRichard Henderson        }
6eb169b8SRichard Henderson    }
6eb169b8SRichard Henderson
6eb169b8SRichard Henderson    if (ab_mask == float_cmask_inf) {
6eb169b8SRichard Henderson        if (a->sign == b->sign) {
6eb169b8SRichard Henderson            return float_relation_equal;
6eb169b8SRichard Henderson        }
6eb169b8SRichard Henderson    } else if (b->cls == float_class_inf) {
6eb169b8SRichard Henderson        goto b_sign;
6eb169b8SRichard Henderson    } else {
6eb169b8SRichard Henderson        g_assert(a->cls == float_class_inf);
6eb169b8SRichard Henderson    }
6eb169b8SRichard Henderson
6eb169b8SRichard Henderson a_sign:
6eb169b8SRichard Henderson    return a->sign ? float_relation_less : float_relation_greater;
6eb169b8SRichard Henderson b_sign:
6eb169b8SRichard Henderson    return b->sign ? float_relation_greater : float_relation_less;
6eb169b8SRichard Henderson}
39626b0cSRichard Henderson
39626b0cSRichard Henderson/*
39626b0cSRichard Henderson * Multiply A by 2 raised to the power N.
39626b0cSRichard Henderson */
39626b0cSRichard Hendersonstatic void partsN(scalbn)(FloatPartsN *a, int n, float_status *s)
39626b0cSRichard Henderson{
39626b0cSRichard Henderson    switch (a->cls) {
39626b0cSRichard Henderson    case float_class_snan:
39626b0cSRichard Henderson    case float_class_qnan:
39626b0cSRichard Henderson        parts_return_nan(a, s);
39626b0cSRichard Henderson        break;
39626b0cSRichard Henderson    case float_class_zero:
39626b0cSRichard Henderson    case float_class_inf:
39626b0cSRichard Henderson        break;
39626b0cSRichard Henderson    case float_class_normal:
39626b0cSRichard Henderson        a->exp += MIN(MAX(n, -0x10000), 0x10000);
39626b0cSRichard Henderson        break;
39626b0cSRichard Henderson    default:
39626b0cSRichard Henderson        g_assert_not_reached();
39626b0cSRichard Henderson    }
39626b0cSRichard Henderson}
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson/*
2fa3546cSRichard Henderson * Return log2(A)
2fa3546cSRichard Henderson */
2fa3546cSRichard Hendersonstatic void partsN(log2)(FloatPartsN *a, float_status *s, const FloatFmt *fmt)
2fa3546cSRichard Henderson{
2fa3546cSRichard Henderson    uint64_t a0, a1, r, t, ign;
2fa3546cSRichard Henderson    FloatPartsN f;
2fa3546cSRichard Henderson    int i, n, a_exp, f_exp;
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson    if (unlikely(a->cls != float_class_normal)) {
2fa3546cSRichard Henderson        switch (a->cls) {
2fa3546cSRichard Henderson        case float_class_snan:
2fa3546cSRichard Henderson        case float_class_qnan:
2fa3546cSRichard Henderson            parts_return_nan(a, s);
2fa3546cSRichard Henderson            return;
2fa3546cSRichard Henderson        case float_class_zero:
3cf71969SSong Gao            float_raise(float_flag_divbyzero, s);
2fa3546cSRichard Henderson            /* log2(0) = -inf */
2fa3546cSRichard Henderson            a->cls = float_class_inf;
2fa3546cSRichard Henderson            a->sign = 1;
2fa3546cSRichard Henderson            return;
2fa3546cSRichard Henderson        case float_class_inf:
2fa3546cSRichard Henderson            if (unlikely(a->sign)) {
2fa3546cSRichard Henderson                goto d_nan;
2fa3546cSRichard Henderson            }
2fa3546cSRichard Henderson            return;
2fa3546cSRichard Henderson        default:
2fa3546cSRichard Henderson            break;
2fa3546cSRichard Henderson        }
2fa3546cSRichard Henderson        g_assert_not_reached();
2fa3546cSRichard Henderson    }
2fa3546cSRichard Henderson    if (unlikely(a->sign)) {
2fa3546cSRichard Henderson        goto d_nan;
2fa3546cSRichard Henderson    }
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson    /* TODO: This algorithm looses bits too quickly for float128. */
2fa3546cSRichard Henderson    g_assert(N == 64);
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson    a_exp = a->exp;
2fa3546cSRichard Henderson    f_exp = -1;
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson    r = 0;
2fa3546cSRichard Henderson    t = DECOMPOSED_IMPLICIT_BIT;
2fa3546cSRichard Henderson    a0 = a->frac_hi;
2fa3546cSRichard Henderson    a1 = 0;
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson    n = fmt->frac_size + 2;
2fa3546cSRichard Henderson    if (unlikely(a_exp == -1)) {
2fa3546cSRichard Henderson        /*
2fa3546cSRichard Henderson         * When a_exp == -1, we're computing the log2 of a value [0.5,1.0).
2fa3546cSRichard Henderson         * When the value is very close to 1.0, there are lots of 1's in
2fa3546cSRichard Henderson         * the msb parts of the fraction.  At the end, when we subtract
2fa3546cSRichard Henderson         * this value from -1.0, we can see a catastrophic loss of precision,
2fa3546cSRichard Henderson         * as 0x800..000 - 0x7ff..ffx becomes 0x000..00y, leaving only the
2fa3546cSRichard Henderson         * bits of y in the final result.  To minimize this, compute as many
2fa3546cSRichard Henderson         * digits as we can.
2fa3546cSRichard Henderson         * ??? This case needs another algorithm to avoid this.
2fa3546cSRichard Henderson         */
2fa3546cSRichard Henderson        n = fmt->frac_size * 2 + 2;
2fa3546cSRichard Henderson        /* Don't compute a value overlapping the sticky bit */
2fa3546cSRichard Henderson        n = MIN(n, 62);
2fa3546cSRichard Henderson    }
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson    for (i = 0; i < n; i++) {
2fa3546cSRichard Henderson        if (a1) {
2fa3546cSRichard Henderson            mul128To256(a0, a1, a0, a1, &a0, &a1, &ign, &ign);
2fa3546cSRichard Henderson        } else if (a0 & 0xffffffffull) {
2fa3546cSRichard Henderson            mul64To128(a0, a0, &a0, &a1);
2fa3546cSRichard Henderson        } else if (a0 & ~DECOMPOSED_IMPLICIT_BIT) {
2fa3546cSRichard Henderson            a0 >>= 32;
2fa3546cSRichard Henderson            a0 *= a0;
2fa3546cSRichard Henderson        } else {
2fa3546cSRichard Henderson            goto exact;
2fa3546cSRichard Henderson        }
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson        if (a0 & DECOMPOSED_IMPLICIT_BIT) {
2fa3546cSRichard Henderson            if (unlikely(a_exp == 0 && r == 0)) {
2fa3546cSRichard Henderson                /*
2fa3546cSRichard Henderson                 * When a_exp == 0, we're computing the log2 of a value
2fa3546cSRichard Henderson                 * [1.0,2.0).  When the value is very close to 1.0, there
2fa3546cSRichard Henderson                 * are lots of 0's in the msb parts of the fraction.
2fa3546cSRichard Henderson                 * We need to compute more digits to produce a correct
2fa3546cSRichard Henderson                 * result -- restart at the top of the fraction.
2fa3546cSRichard Henderson                 * ??? This is likely to lose precision quickly, as for
2fa3546cSRichard Henderson                 * float128; we may need another method.
2fa3546cSRichard Henderson                 */
2fa3546cSRichard Henderson                f_exp -= i;
2fa3546cSRichard Henderson                t = r = DECOMPOSED_IMPLICIT_BIT;
2fa3546cSRichard Henderson                i = 0;
2fa3546cSRichard Henderson            } else {
2fa3546cSRichard Henderson                r |= t;
2fa3546cSRichard Henderson            }
2fa3546cSRichard Henderson        } else {
2fa3546cSRichard Henderson            add128(a0, a1, a0, a1, &a0, &a1);
2fa3546cSRichard Henderson        }
2fa3546cSRichard Henderson        t >>= 1;
2fa3546cSRichard Henderson    }
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson    /* Set sticky for inexact. */
2fa3546cSRichard Henderson    r |= (a1 || a0 & ~DECOMPOSED_IMPLICIT_BIT);
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson exact:
2fa3546cSRichard Henderson    parts_sint_to_float(a, a_exp, 0, s);
2fa3546cSRichard Henderson    if (r == 0) {
2fa3546cSRichard Henderson        return;
2fa3546cSRichard Henderson    }
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson    memset(&f, 0, sizeof(f));
2fa3546cSRichard Henderson    f.cls = float_class_normal;
2fa3546cSRichard Henderson    f.frac_hi = r;
2fa3546cSRichard Henderson    f.exp = f_exp - frac_normalize(&f);
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson    if (a_exp < 0) {
2fa3546cSRichard Henderson        parts_sub_normal(a, &f);
2fa3546cSRichard Henderson    } else if (a_exp > 0) {
2fa3546cSRichard Henderson        parts_add_normal(a, &f);
2fa3546cSRichard Henderson    } else {
2fa3546cSRichard Henderson        *a = f;
2fa3546cSRichard Henderson    }
2fa3546cSRichard Henderson    return;
2fa3546cSRichard Henderson
2fa3546cSRichard Henderson d_nan:
2fa3546cSRichard Henderson    float_raise(float_flag_invalid, s);
2fa3546cSRichard Henderson    parts_default_nan(a, s);
2fa3546cSRichard Henderson}