tcg/arm/fcvt.c

*8ec8a55eSAlex Bennée/*
*8ec8a55eSAlex Bennée * Test Floating Point Conversion
*8ec8a55eSAlex Bennée */
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée/* we want additional float type definitions */
*8ec8a55eSAlex Bennée#define __STDC_WANT_IEC_60559_BFP_EXT__
*8ec8a55eSAlex Bennée#define __STDC_WANT_IEC_60559_TYPES_EXT__
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée#include <stdio.h>
*8ec8a55eSAlex Bennée#include <inttypes.h>
*8ec8a55eSAlex Bennée#include <math.h>
*8ec8a55eSAlex Bennée#include <float.h>
*8ec8a55eSAlex Bennée#include <fenv.h>
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée#define ARRAY_SIZE(x) (sizeof(x) / sizeof((x)[0]))
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic char flag_str[256];
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic char *get_flag_state(int flags)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    if (flags) {
*8ec8a55eSAlex Bennée        snprintf(flag_str, sizeof(flag_str), "%s %s %s %s %s",
*8ec8a55eSAlex Bennée                 flags & FE_OVERFLOW ? "OVERFLOW" : "",
*8ec8a55eSAlex Bennée                 flags & FE_UNDERFLOW ? "UNDERFLOW" : "",
*8ec8a55eSAlex Bennée                 flags & FE_DIVBYZERO ? "DIV0" : "",
*8ec8a55eSAlex Bennée                 flags & FE_INEXACT ? "INEXACT" : "",
*8ec8a55eSAlex Bennée                 flags & FE_INVALID ? "INVALID" : "");
*8ec8a55eSAlex Bennée    } else {
*8ec8a55eSAlex Bennée        snprintf(flag_str, sizeof(flag_str), "OK");
*8ec8a55eSAlex Bennée    }
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    return flag_str;
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void print_double_number(int i, double num)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    uint64_t double_as_hex = *(uint64_t *) &num;
*8ec8a55eSAlex Bennée    int flags = fetestexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée    char *fstr = get_flag_state(flags);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("%02d DOUBLE: %02.20e / %#020" PRIx64 " (%#x => %s)\n",
*8ec8a55eSAlex Bennée           i, num, double_as_hex, flags, fstr);
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void print_single_number(int i, float num)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    uint32_t single_as_hex = *(uint32_t *) &num;
*8ec8a55eSAlex Bennée    int flags = fetestexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée    char *fstr = get_flag_state(flags);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("%02d SINGLE: %02.20e / %#010x  (%#x => %s)\n",
*8ec8a55eSAlex Bennée           i, num, single_as_hex, flags, fstr);
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void print_half_number(int i, uint16_t num)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    int flags = fetestexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée    char *fstr = get_flag_state(flags);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("%02d   HALF: %#04x  (%#x => %s)\n",
*8ec8a55eSAlex Bennée           i, num, flags, fstr);
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void print_int64(int i, int64_t num)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    uint64_t int64_as_hex = *(uint64_t *) &num;
*8ec8a55eSAlex Bennée    int flags = fetestexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée    char *fstr = get_flag_state(flags);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("%02d   INT64: %20" PRId64 "/%#020" PRIx64 " (%#x => %s)\n",
*8ec8a55eSAlex Bennée           i, num, int64_as_hex, flags, fstr);
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée#ifndef SNANF
*8ec8a55eSAlex Bennée/* Signaling NaN macros, if supported.  */
*8ec8a55eSAlex Bennée# define SNANF (__builtin_nansf (""))
*8ec8a55eSAlex Bennée# define SNAN (__builtin_nans (""))
*8ec8a55eSAlex Bennée# define SNANL (__builtin_nansl (""))
*8ec8a55eSAlex Bennée#endif
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéefloat single_numbers[] = { -SNANF,
*8ec8a55eSAlex Bennée                           -NAN,
*8ec8a55eSAlex Bennée                           -INFINITY,
*8ec8a55eSAlex Bennée                           -FLT_MAX,
*8ec8a55eSAlex Bennée                           -1.111E+31,
*8ec8a55eSAlex Bennée                           -1.111E+30,
*8ec8a55eSAlex Bennée                           -1.08700982e-12,
*8ec8a55eSAlex Bennée                           -1.78051176e-20,
*8ec8a55eSAlex Bennée                           -FLT_MIN,
*8ec8a55eSAlex Bennée                           0.0,
*8ec8a55eSAlex Bennée                           FLT_MIN,
*8ec8a55eSAlex Bennée                           2.98023224e-08,
*8ec8a55eSAlex Bennée                           5.96046E-8, /* min positive FP16 subnormal */
*8ec8a55eSAlex Bennée                           6.09756E-5, /* max subnormal FP16 */
*8ec8a55eSAlex Bennée                           6.10352E-5, /* min positive normal FP16 */
*8ec8a55eSAlex Bennée                           1.0,
*8ec8a55eSAlex Bennée                           1.0009765625, /* smallest float after 1.0 FP16 */
*8ec8a55eSAlex Bennée                           2.0,
*8ec8a55eSAlex Bennée                           M_E, M_PI,
*8ec8a55eSAlex Bennée                           65503.0,
*8ec8a55eSAlex Bennée                           65504.0, /* max FP16 */
*8ec8a55eSAlex Bennée                           65505.0,
*8ec8a55eSAlex Bennée                           131007.0,
*8ec8a55eSAlex Bennée                           131008.0, /* max AFP */
*8ec8a55eSAlex Bennée                           131009.0,
*8ec8a55eSAlex Bennée                           1.111E+30,
*8ec8a55eSAlex Bennée                           FLT_MAX,
*8ec8a55eSAlex Bennée                           INFINITY,
*8ec8a55eSAlex Bennée                           NAN,
*8ec8a55eSAlex Bennée                           SNANF };
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void convert_single_to_half(void)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    int i;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("Converting single-precision to half-precision\n");
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    for (i = 0; i < ARRAY_SIZE(single_numbers); ++i) {
*8ec8a55eSAlex Bennée        float input = single_numbers[i];
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        feclearexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        print_single_number(i, input);
*8ec8a55eSAlex Bennée#if defined(__arm__)
*8ec8a55eSAlex Bennée        uint32_t output;
*8ec8a55eSAlex Bennée        asm("vcvtb.f16.f32 %0, %1" : "=t" (output) : "x" (input));
*8ec8a55eSAlex Bennée#else
*8ec8a55eSAlex Bennée        uint16_t output;
*8ec8a55eSAlex Bennée        asm("fcvt %h0, %s1" : "=w" (output) : "x" (input));
*8ec8a55eSAlex Bennée#endif
*8ec8a55eSAlex Bennée        print_half_number(i, output);
*8ec8a55eSAlex Bennée    }
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void convert_single_to_double(void)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    int i;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("Converting single-precision to double-precision\n");
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    for (i = 0; i < ARRAY_SIZE(single_numbers); ++i) {
*8ec8a55eSAlex Bennée        float input = single_numbers[i];
*8ec8a55eSAlex Bennée        /* uint64_t output; */
*8ec8a55eSAlex Bennée        double output;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        feclearexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        print_single_number(i, input);
*8ec8a55eSAlex Bennée#if defined(__arm__)
*8ec8a55eSAlex Bennée        asm("vcvt.f64.f32 %P0, %1" : "=w" (output) : "t" (input));
*8ec8a55eSAlex Bennée#else
*8ec8a55eSAlex Bennée        asm("fcvt %d0, %s1" : "=w" (output) : "x" (input));
*8ec8a55eSAlex Bennée#endif
*8ec8a55eSAlex Bennée        print_double_number(i, output);
*8ec8a55eSAlex Bennée    }
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void convert_single_to_integer(void)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    int i;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("Converting single-precision to integer\n");
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    for (i = 0; i < ARRAY_SIZE(single_numbers); ++i) {
*8ec8a55eSAlex Bennée        float input = single_numbers[i];
*8ec8a55eSAlex Bennée        int64_t output;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        feclearexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        print_single_number(i, input);
*8ec8a55eSAlex Bennée#if defined(__arm__)
*8ec8a55eSAlex Bennée        /* asm("vcvt.s32.f32 %s0, %s1" : "=t" (output) : "t" (input)); */
*8ec8a55eSAlex Bennée        output = input;
*8ec8a55eSAlex Bennée#else
*8ec8a55eSAlex Bennée        asm("fcvtzs %0, %s1" : "=r" (output) : "w" (input));
*8ec8a55eSAlex Bennée#endif
*8ec8a55eSAlex Bennée        print_int64(i, output);
*8ec8a55eSAlex Bennée    }
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée/* This allows us to initialise some doubles as pure hex */
*8ec8a55eSAlex Bennéetypedef union {
*8ec8a55eSAlex Bennée    double d;
*8ec8a55eSAlex Bennée    uint64_t h;
*8ec8a55eSAlex Bennée} test_doubles;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéetest_doubles double_numbers[] = {
*8ec8a55eSAlex Bennée    {SNAN},
*8ec8a55eSAlex Bennée    {-NAN},
*8ec8a55eSAlex Bennée    {-INFINITY},
*8ec8a55eSAlex Bennée    {-DBL_MAX},
*8ec8a55eSAlex Bennée    {-FLT_MAX-1.0},
*8ec8a55eSAlex Bennée    {-FLT_MAX},
*8ec8a55eSAlex Bennée    {-1.111E+31},
*8ec8a55eSAlex Bennée    {-1.111E+30}, /* half prec */
*8ec8a55eSAlex Bennée    {-2.0}, {-1.0},
*8ec8a55eSAlex Bennée    {-DBL_MIN},
*8ec8a55eSAlex Bennée    {-FLT_MIN},
*8ec8a55eSAlex Bennée    {0.0},
*8ec8a55eSAlex Bennée    {FLT_MIN},
*8ec8a55eSAlex Bennée    {2.98023224e-08},
*8ec8a55eSAlex Bennée    {5.96046E-8}, /* min positive FP16 subnormal */
*8ec8a55eSAlex Bennée    {6.09756E-5}, /* max subnormal FP16 */
*8ec8a55eSAlex Bennée    {6.10352E-5}, /* min positive normal FP16 */
*8ec8a55eSAlex Bennée    {1.0},
*8ec8a55eSAlex Bennée    {1.0009765625}, /* smallest float after 1.0 FP16 */
*8ec8a55eSAlex Bennée    {DBL_MIN},
*8ec8a55eSAlex Bennée    {1.3789972848607228e-308},
*8ec8a55eSAlex Bennée    {1.4914738736681624e-308},
*8ec8a55eSAlex Bennée    {1.0}, {2.0},
*8ec8a55eSAlex Bennée    {M_E}, {M_PI},
*8ec8a55eSAlex Bennée    {65503.0},
*8ec8a55eSAlex Bennée    {65504.0}, /* max FP16 */
*8ec8a55eSAlex Bennée    {65505.0},
*8ec8a55eSAlex Bennée    {131007.0},
*8ec8a55eSAlex Bennée    {131008.0}, /* max AFP */
*8ec8a55eSAlex Bennée    {131009.0},
*8ec8a55eSAlex Bennée    {.h = 0x41dfffffffc00000 }, /* to int = 0x7fffffff */
*8ec8a55eSAlex Bennée    {FLT_MAX},
*8ec8a55eSAlex Bennée    {FLT_MAX + 1.0},
*8ec8a55eSAlex Bennée    {DBL_MAX},
*8ec8a55eSAlex Bennée    {INFINITY},
*8ec8a55eSAlex Bennée    {NAN},
*8ec8a55eSAlex Bennée    {.h = 0x7ff0000000000001}, /* SNAN */
*8ec8a55eSAlex Bennée    {SNAN},
*8ec8a55eSAlex Bennée};
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void convert_double_to_half(void)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    int i;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("Converting double-precision to half-precision\n");
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    for (i = 0; i < ARRAY_SIZE(double_numbers); ++i) {
*8ec8a55eSAlex Bennée        double input = double_numbers[i].d;
*8ec8a55eSAlex Bennée        uint16_t output;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        feclearexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        print_double_number(i, input);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        /* as we don't have _Float16 support */
*8ec8a55eSAlex Bennée#if defined(__arm__)
*8ec8a55eSAlex Bennée        /* asm("vcvtb.f16.f64 %0, %P1" : "=t" (output) : "x" (input)); */
*8ec8a55eSAlex Bennée        output = input;
*8ec8a55eSAlex Bennée#else
*8ec8a55eSAlex Bennée        asm("fcvt %h0, %d1" : "=w" (output) : "x" (input));
*8ec8a55eSAlex Bennée#endif
*8ec8a55eSAlex Bennée        print_half_number(i, output);
*8ec8a55eSAlex Bennée    }
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void convert_double_to_single(void)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    int i;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("Converting double-precision to single-precision\n");
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    for (i = 0; i < ARRAY_SIZE(double_numbers); ++i) {
*8ec8a55eSAlex Bennée        double input = double_numbers[i].d;
*8ec8a55eSAlex Bennée        uint32_t output;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        feclearexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        print_double_number(i, input);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée#if defined(__arm__)
*8ec8a55eSAlex Bennée        asm("vcvt.f32.f64 %0, %P1" : "=w" (output) : "x" (input));
*8ec8a55eSAlex Bennée#else
*8ec8a55eSAlex Bennée        asm("fcvt %s0, %d1" : "=w" (output) : "x" (input));
*8ec8a55eSAlex Bennée#endif
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        print_single_number(i, output);
*8ec8a55eSAlex Bennée    }
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void convert_double_to_integer(void)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    int i;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("Converting double-precision to integer\n");
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    for (i = 0; i < ARRAY_SIZE(double_numbers); ++i) {
*8ec8a55eSAlex Bennée        double input = double_numbers[i].d;
*8ec8a55eSAlex Bennée        int64_t output;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        feclearexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        print_double_number(i, input);
*8ec8a55eSAlex Bennée#if defined(__arm__)
*8ec8a55eSAlex Bennée        /* asm("vcvt.s32.f32 %s0, %s1" : "=t" (output) : "t" (input)); */
*8ec8a55eSAlex Bennée        output = input;
*8ec8a55eSAlex Bennée#else
*8ec8a55eSAlex Bennée        asm("fcvtzs %0, %d1" : "=r" (output) : "w" (input));
*8ec8a55eSAlex Bennée#endif
*8ec8a55eSAlex Bennée        print_int64(i, output);
*8ec8a55eSAlex Bennée    }
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée/* no handy defines for these numbers */
*8ec8a55eSAlex Bennéeuint16_t half_numbers[] = {
*8ec8a55eSAlex Bennée    0xffff, /* -NaN / AHP -Max */
*8ec8a55eSAlex Bennée    0xfcff, /* -NaN / AHP */
*8ec8a55eSAlex Bennée    0xfc01, /* -NaN / AHP */
*8ec8a55eSAlex Bennée    0xfc00, /* -Inf */
*8ec8a55eSAlex Bennée    0xfbff, /* -Max */
*8ec8a55eSAlex Bennée    0xc000, /* -2 */
*8ec8a55eSAlex Bennée    0xbc00, /* -1 */
*8ec8a55eSAlex Bennée    0x8001, /* -MIN subnormal */
*8ec8a55eSAlex Bennée    0x8000, /* -0 */
*8ec8a55eSAlex Bennée    0x0000, /* +0 */
*8ec8a55eSAlex Bennée    0x0001, /* MIN subnormal */
*8ec8a55eSAlex Bennée    0x3c00, /* 1 */
*8ec8a55eSAlex Bennée    0x7bff, /* Max */
*8ec8a55eSAlex Bennée    0x7c00, /* Inf */
*8ec8a55eSAlex Bennée    0x7c01, /* NaN / AHP */
*8ec8a55eSAlex Bennée    0x7cff, /* NaN / AHP */
*8ec8a55eSAlex Bennée    0x7fff, /* NaN / AHP +Max*/
*8ec8a55eSAlex Bennée};
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void convert_half_to_double(void)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    int i;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("Converting half-precision to double-precision\n");
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    for (i = 0; i < ARRAY_SIZE(half_numbers); ++i) {
*8ec8a55eSAlex Bennée        uint16_t input = half_numbers[i];
*8ec8a55eSAlex Bennée        double output;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        feclearexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        print_half_number(i, input);
*8ec8a55eSAlex Bennée#if defined(__arm__)
*8ec8a55eSAlex Bennée        /* asm("vcvtb.f64.f16 %P0, %1" : "=w" (output) : "t" (input)); */
*8ec8a55eSAlex Bennée        output = input;
*8ec8a55eSAlex Bennée#else
*8ec8a55eSAlex Bennée        asm("fcvt %d0, %h1" : "=w" (output) : "x" (input));
*8ec8a55eSAlex Bennée#endif
*8ec8a55eSAlex Bennée        print_double_number(i, output);
*8ec8a55eSAlex Bennée    }
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void convert_half_to_single(void)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    int i;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("Converting half-precision to single-precision\n");
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    for (i = 0; i < ARRAY_SIZE(half_numbers); ++i) {
*8ec8a55eSAlex Bennée        uint16_t input = half_numbers[i];
*8ec8a55eSAlex Bennée        float output;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        feclearexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        print_half_number(i, input);
*8ec8a55eSAlex Bennée#if defined(__arm__)
*8ec8a55eSAlex Bennée        asm("vcvtb.f32.f16 %0, %1" : "=w" (output) : "x" ((uint32_t)input));
*8ec8a55eSAlex Bennée#else
*8ec8a55eSAlex Bennée        asm("fcvt %s0, %h1" : "=w" (output) : "x" (input));
*8ec8a55eSAlex Bennée#endif
*8ec8a55eSAlex Bennée        print_single_number(i, output);
*8ec8a55eSAlex Bennée    }
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéestatic void convert_half_to_integer(void)
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    int i;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("Converting half-precision to integer\n");
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    for (i = 0; i < ARRAY_SIZE(half_numbers); ++i) {
*8ec8a55eSAlex Bennée        uint16_t input = half_numbers[i];
*8ec8a55eSAlex Bennée        int64_t output;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        feclearexcept(FE_ALL_EXCEPT);
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée        print_half_number(i, input);
*8ec8a55eSAlex Bennée#if defined(__arm__)
*8ec8a55eSAlex Bennée        /* asm("vcvt.s32.f16 %0, %1" : "=t" (output) : "t" (input)); v8.2*/
*8ec8a55eSAlex Bennée        output = input;
*8ec8a55eSAlex Bennée#else
*8ec8a55eSAlex Bennée        asm("fcvt %s0, %h1" : "=w" (output) : "x" (input));
*8ec8a55eSAlex Bennée#endif
*8ec8a55eSAlex Bennée        print_int64(i, output);
*8ec8a55eSAlex Bennée    }
*8ec8a55eSAlex Bennée}
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéetypedef struct {
*8ec8a55eSAlex Bennée    int flag;
*8ec8a55eSAlex Bennée    char *desc;
*8ec8a55eSAlex Bennée} float_mapping;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéefloat_mapping round_flags[] = {
*8ec8a55eSAlex Bennée    { FE_TONEAREST, "to nearest" },
*8ec8a55eSAlex Bennée    { FE_UPWARD, "upwards" },
*8ec8a55eSAlex Bennée    { FE_DOWNWARD, "downwards" },
*8ec8a55eSAlex Bennée    { FE_TOWARDZERO, "to zero" }
*8ec8a55eSAlex Bennée};
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennéeint main(int argc, char *argv[argc])
*8ec8a55eSAlex Bennée{
*8ec8a55eSAlex Bennée    int i;
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("#### Enabling IEEE Half Precision\n");
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    for (i = 0; i < ARRAY_SIZE(round_flags); ++i) {
*8ec8a55eSAlex Bennée        fesetround(round_flags[i].flag);
*8ec8a55eSAlex Bennée        printf("### Rounding %s\n", round_flags[i].desc);
*8ec8a55eSAlex Bennée        convert_single_to_half();
*8ec8a55eSAlex Bennée        convert_single_to_double();
*8ec8a55eSAlex Bennée        convert_double_to_half();
*8ec8a55eSAlex Bennée        convert_double_to_single();
*8ec8a55eSAlex Bennée        convert_half_to_single();
*8ec8a55eSAlex Bennée        convert_half_to_double();
*8ec8a55eSAlex Bennée    }
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    /* convert to integer */
*8ec8a55eSAlex Bennée    convert_single_to_integer();
*8ec8a55eSAlex Bennée    convert_double_to_integer();
*8ec8a55eSAlex Bennée    convert_half_to_integer();
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    /* And now with ARM alternative FP16 */
*8ec8a55eSAlex Bennée#if defined(__arm__)
*8ec8a55eSAlex Bennée    /* See glibc sysdeps/arm/fpu_control.h */
*8ec8a55eSAlex Bennée    asm("mrc p10, 7, r1, cr1, cr0, 0\n\t"
*8ec8a55eSAlex Bennée        "orr r1, r1, %[flags]\n\t"
*8ec8a55eSAlex Bennée        "mcr p10, 7, r1, cr1, cr0, 0\n\t"
*8ec8a55eSAlex Bennée        : /* no output */ : [flags] "n" (1 << 26) : "r1" );
*8ec8a55eSAlex Bennée#else
*8ec8a55eSAlex Bennée    asm("mrs x1, fpcr\n\t"
*8ec8a55eSAlex Bennée        "orr x1, x1, %[flags]\n\t"
*8ec8a55eSAlex Bennée        "msr fpcr, x1\n\t"
*8ec8a55eSAlex Bennée        : /* no output */ : [flags] "n" (1 << 26) : "x1" );
*8ec8a55eSAlex Bennée#endif
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    printf("#### Enabling ARM Alternative Half Precision\n");
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    for (i = 0; i < ARRAY_SIZE(round_flags); ++i) {
*8ec8a55eSAlex Bennée        fesetround(round_flags[i].flag);
*8ec8a55eSAlex Bennée        printf("### Rounding %s\n", round_flags[i].desc);
*8ec8a55eSAlex Bennée        convert_single_to_half();
*8ec8a55eSAlex Bennée        convert_single_to_double();
*8ec8a55eSAlex Bennée        convert_double_to_half();
*8ec8a55eSAlex Bennée        convert_double_to_single();
*8ec8a55eSAlex Bennée        convert_half_to_single();
*8ec8a55eSAlex Bennée        convert_half_to_double();
*8ec8a55eSAlex Bennée    }
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    /* convert to integer */
*8ec8a55eSAlex Bennée    convert_single_to_integer();
*8ec8a55eSAlex Bennée    convert_double_to_integer();
*8ec8a55eSAlex Bennée    convert_half_to_integer();
*8ec8a55eSAlex Bennée
*8ec8a55eSAlex Bennée    return 0;
*8ec8a55eSAlex Bennée}