pl/math/cospi_3u1.c

*5a02ffc3SAndrew Turner/*
*5a02ffc3SAndrew Turner * Double-precision scalar cospi function.
*5a02ffc3SAndrew Turner *
*5a02ffc3SAndrew Turner * Copyright (c) 2023, Arm Limited.
*5a02ffc3SAndrew Turner * SPDX-License-Identifier: MIT OR Apache-2.0 WITH LLVM-exception
*5a02ffc3SAndrew Turner */
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner#include "mathlib.h"
*5a02ffc3SAndrew Turner#include "math_config.h"
*5a02ffc3SAndrew Turner#include "pl_sig.h"
*5a02ffc3SAndrew Turner#include "pl_test.h"
*5a02ffc3SAndrew Turner#include "poly_scalar_f64.h"
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner/* Taylor series coefficents for sin(pi * x).
*5a02ffc3SAndrew Turner   C2 coefficient (orginally ~=5.16771278) has been split into two parts:
*5a02ffc3SAndrew Turner   C2_hi = 4, C2_lo = C2 - C2_hi (~=1.16771278)
*5a02ffc3SAndrew Turner   This change in magnitude reduces floating point rounding errors.
*5a02ffc3SAndrew Turner   C2_hi is then reintroduced after the polynomial approxmation.  */
*5a02ffc3SAndrew Turnerstatic const double poly[]
*5a02ffc3SAndrew Turner    = { 0x1.921fb54442d184p1,  -0x1.2aef39896f94bp0,   0x1.466bc6775ab16p1,
*5a02ffc3SAndrew Turner	-0x1.32d2cce62dc33p-1, 0x1.507834891188ep-4,   -0x1.e30750a28c88ep-8,
*5a02ffc3SAndrew Turner	0x1.e8f48308acda4p-12, -0x1.6fc0032b3c29fp-16, 0x1.af86ae521260bp-21,
*5a02ffc3SAndrew Turner	-0x1.012a9870eeb7dp-25 };
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner#define Shift 0x1.8p+52
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner/* Approximation for scalar double-precision cospi(x).
*5a02ffc3SAndrew Turner   Maximum error: 3.13 ULP:
*5a02ffc3SAndrew Turner   cospi(0x1.160b129300112p-21) got 0x1.fffffffffd16bp-1
*5a02ffc3SAndrew Turner			       want 0x1.fffffffffd16ep-1.  */
*5a02ffc3SAndrew Turnerdouble
*5a02ffc3SAndrew Turnercospi (double x)
*5a02ffc3SAndrew Turner{
*5a02ffc3SAndrew Turner  if (isinf (x))
*5a02ffc3SAndrew Turner    return __math_invalid (x);
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner  double ax = asdouble (asuint64 (x) & ~0x8000000000000000);
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner  /* Edge cases for when cospif should be exactly 1. (Integers)
*5a02ffc3SAndrew Turner     0x1p53 is the limit for single precision to store any decimal places.  */
*5a02ffc3SAndrew Turner  if (ax >= 0x1p53)
*5a02ffc3SAndrew Turner    return 1;
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner  /* If x is an integer, return +- 1, based upon if x is odd.  */
*5a02ffc3SAndrew Turner  uint64_t m = (uint64_t) ax;
*5a02ffc3SAndrew Turner  if (m == ax)
*5a02ffc3SAndrew Turner    return (m & 1) ? -1 : 1;
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner  /* For very small inputs, squaring r causes underflow.
*5a02ffc3SAndrew Turner     Values below this threshold can be approximated via
*5a02ffc3SAndrew Turner     cospi(x) ~= 1.  */
*5a02ffc3SAndrew Turner  if (ax < 0x1p-63)
*5a02ffc3SAndrew Turner    return 1;
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner  /* Any non-integer values >= 0x1x51 will be int +0.5.
*5a02ffc3SAndrew Turner     These values should return exactly 0.  */
*5a02ffc3SAndrew Turner  if (ax >= 0x1p51)
*5a02ffc3SAndrew Turner    return 0;
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner  /* n = rint(|x|).  */
*5a02ffc3SAndrew Turner  double n = ax + Shift;
*5a02ffc3SAndrew Turner  uint64_t sign = asuint64 (n) << 63;
*5a02ffc3SAndrew Turner  n = n - Shift;
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner  /* We know that cospi(x) = sinpi(0.5 - x)
*5a02ffc3SAndrew Turner     range reduction and offset into sinpi range -1/2 .. 1/2
*5a02ffc3SAndrew Turner     r = 0.5 - |x - rint(x)|.  */
*5a02ffc3SAndrew Turner  double r = 0.5 - fabs (ax - n);
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner  /* y = sin(r).  */
*5a02ffc3SAndrew Turner  double r2 = r * r;
*5a02ffc3SAndrew Turner  double y = horner_9_f64 (r2, poly);
*5a02ffc3SAndrew Turner  y = y * r;
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner  /* Reintroduce C2_hi.  */
*5a02ffc3SAndrew Turner  y = fma (-4 * r2, r, y);
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew Turner  /* As all values are reduced to -1/2 .. 1/2, the result of cos(x) always be
*5a02ffc3SAndrew Turner     positive, therefore, the sign must be introduced based upon if x rounds to
*5a02ffc3SAndrew Turner     odd or even.  */
*5a02ffc3SAndrew Turner  return asdouble (asuint64 (y) ^ sign);
*5a02ffc3SAndrew Turner}
*5a02ffc3SAndrew Turner
*5a02ffc3SAndrew TurnerPL_SIG (S, D, 1, cospi, -0.9, 0.9)
*5a02ffc3SAndrew TurnerPL_TEST_ULP (cospi, 2.63)
*5a02ffc3SAndrew TurnerPL_TEST_SYM_INTERVAL (cospi, 0, 0x1p-63, 5000)
*5a02ffc3SAndrew TurnerPL_TEST_SYM_INTERVAL (cospi, 0x1p-63, 0.5, 10000)
*5a02ffc3SAndrew TurnerPL_TEST_SYM_INTERVAL (cospi, 0.5, 0x1p51f, 10000)
*5a02ffc3SAndrew TurnerPL_TEST_SYM_INTERVAL (cospi, 0x1p51f, inf, 10000)