crt/math/sqrt.c

*c2c66affSColin Finck/*
*c2c66affSColin Finck * COPYRIGHT:       BSD - See COPYING.ARM in the top level directory
*c2c66affSColin Finck * PROJECT:         ReactOS CRT library
*c2c66affSColin Finck * PURPOSE:         Portable implementation of sqrt
*c2c66affSColin Finck * PROGRAMMER:      Timo Kreuzer (timo.kreuzer@reactos.org)
*c2c66affSColin Finck */
*c2c66affSColin Finck
*c2c66affSColin Finck#include <math.h>
*c2c66affSColin Finck#include <assert.h>
*c2c66affSColin Finck
*c2c66affSColin Finckdouble
*c2c66affSColin Finck__cdecl
*c2c66affSColin Fincksqrt(
*c2c66affSColin Finck    double x)
*c2c66affSColin Finck{
*c2c66affSColin Finck    const double threehalfs = 1.5;
*c2c66affSColin Finck    const double x2 = x * 0.5;
*c2c66affSColin Finck    long long bits;
*c2c66affSColin Finck    double inv, y;
*c2c66affSColin Finck
*c2c66affSColin Finck    /* Handle special cases */
*c2c66affSColin Finck    if (x == 0.0)
*c2c66affSColin Finck    {
*c2c66affSColin Finck        return x;
*c2c66affSColin Finck    }
*c2c66affSColin Finck    else if (x < 0.0)
*c2c66affSColin Finck    {
*c2c66affSColin Finck        return -NAN;
*c2c66affSColin Finck    }
*c2c66affSColin Finck
*c2c66affSColin Finck    /* Convert into a 64  bit integer */
*c2c66affSColin Finck    bits = *(long long *)&x;
*c2c66affSColin Finck
*c2c66affSColin Finck    /* Check for !finite(x) */
*c2c66affSColin Finck    if ((bits & 0x7ff7ffffffffffffLL) == 0x7ff0000000000000LL)
*c2c66affSColin Finck    {
*c2c66affSColin Finck        return x;
*c2c66affSColin Finck    }
*c2c66affSColin Finck
*c2c66affSColin Finck    /* Step 1: quick approximation of 1/sqrt(x) with bit magic
*c2c66affSColin Finck       See http://en.wikipedia.org/wiki/Fast_inverse_square_root */
*c2c66affSColin Finck    bits = 0x5fe6eb50c7b537a9ll - (bits >> 1);
*c2c66affSColin Finck    inv = *(double*)&bits;
*c2c66affSColin Finck
*c2c66affSColin Finck    /* Step 2: 3 Newton iterations to approximate 1 / sqrt(x) */
*c2c66affSColin Finck    inv = inv * (threehalfs - (x2 * inv * inv));
*c2c66affSColin Finck    inv = inv * (threehalfs - (x2 * inv * inv));
*c2c66affSColin Finck    inv = inv * (threehalfs - (x2 * inv * inv));
*c2c66affSColin Finck
*c2c66affSColin Finck    /* Step 3: 1 additional Heron iteration has shown to maximize the precision.
*c2c66affSColin Finck       Normally the formula would be: y = (y + (x / y)) * 0.5;
*c2c66affSColin Finck       Instead we use the inverse sqrt directly */
*c2c66affSColin Finck    y = ((1 / inv) + (x * inv)) * 0.5;
*c2c66affSColin Finck
*c2c66affSColin Finck    //assert(y == (double)((y + (x / y)) * 0.5));
*c2c66affSColin Finck    /* GCC BUG: While the C-Standard requires that an explicit cast to
*c2c66affSColin Finck       double converts the result of a computation to the appropriate
*c2c66affSColin Finck       64 bit value, our GCC ignores this and uses an 80 bit FPU register
*c2c66affSColin Finck       in an intermediate value, so we need to make sure it is stored in
*c2c66affSColin Finck       a memory location before comparison */
*c2c66affSColin Finck//#if DBG
*c2c66affSColin Finck//    {
*c2c66affSColin Finck//        volatile double y1 = y, y2;
*c2c66affSColin Finck//        y2 = (y + (x / y)) * 0.5;
*c2c66affSColin Finck//        assert(y1 == y2);
*c2c66affSColin Finck//    }
*c2c66affSColin Finck//#endif
*c2c66affSColin Finck
*c2c66affSColin Finck    return y;
*c2c66affSColin Finck}