config/ft32/lib1funcs.S

63d1a8abSmrg# ieee754 sf routines for FT32
63d1a8abSmrg
*ec02198aSmrg/* Copyright (C) 1995-2020 Free Software Foundation, Inc.
63d1a8abSmrg
63d1a8abSmrgThis file is free software; you can redistribute it and/or modify it
63d1a8abSmrgunder the terms of the GNU General Public License as published by the
63d1a8abSmrgFree Software Foundation; either version 3, or (at your option) any
63d1a8abSmrglater version.
63d1a8abSmrg
63d1a8abSmrgThis file is distributed in the hope that it will be useful, but
63d1a8abSmrgWITHOUT ANY WARRANTY; without even the implied warranty of
63d1a8abSmrgMERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
63d1a8abSmrgGeneral Public License for more details.
63d1a8abSmrg
63d1a8abSmrgUnder Section 7 of GPL version 3, you are granted additional
63d1a8abSmrgpermissions described in the GCC Runtime Library Exception, version
63d1a8abSmrg3.1, as published by the Free Software Foundation.
63d1a8abSmrg
63d1a8abSmrgYou should have received a copy of the GNU General Public License and
63d1a8abSmrga copy of the GCC Runtime Library Exception along with this program;
63d1a8abSmrgsee the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
63d1a8abSmrg<http://www.gnu.org/licenses/>.  */
63d1a8abSmrg
63d1a8abSmrg# See http://www.ens-lyon.fr/LIP/Pub/Rapports/PhD/PhD2006/PhD2006-02.pdf
63d1a8abSmrg# for implementation details of all except division which is detailed below
63d1a8abSmrg#
63d1a8abSmrg
63d1a8abSmrg#ifdef L_fp_tools
63d1a8abSmrg// .global __cmpsf2_
63d1a8abSmrgnan:            .long 0x7FFFFFFF    # also abs mask
63d1a8abSmrginf:            .long 0x7F800000
63d1a8abSmrgsign_mask:      .long 0x80000000
63d1a8abSmrgm_mask:         .long 0x007FFFFF
63d1a8abSmrgexp_bias:       .long 127
63d1a8abSmrgedge_case:      .long 0x00FFFFFF
63d1a8abSmrgsmallest_norm:  .long 0x00800000    # implicit bit
63d1a8abSmrghigh_FF:        .long 0xFF000000
63d1a8abSmrghigh_uint:      .long 0xFFFFFFFF
63d1a8abSmrg
63d1a8abSmrgntz_table:
63d1a8abSmrg    .byte   32,0,1,12,2,6,0,13,3,0,7,0,0,0,0,14
63d1a8abSmrg    .byte   10,4,0,0,8,0,0,25,0,0,0,0,0,21,27,15
63d1a8abSmrg    .byte   31,11,5,0,0,0,0,0,9,0,0,24,0,0,20,26
63d1a8abSmrg    .byte   30,0,0,0,0,23,0,19,29,0,22,18,28,17,16,0
63d1a8abSmrg
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg# Supply a few 'missing' instructions
63d1a8abSmrg
63d1a8abSmrg# not
63d1a8abSmrg.macro      not rd,r1
63d1a8abSmrg    xor     \rd,\r1,-1
63d1a8abSmrg.endm
63d1a8abSmrg
63d1a8abSmrg# negate
63d1a8abSmrg.macro      neg x
63d1a8abSmrg    not     \x, \x
63d1a8abSmrg    add     \x, \x, 1
63d1a8abSmrg.endm
63d1a8abSmrg
63d1a8abSmrg# set $cc from the result of "ashl reg,dist"
63d1a8abSmrg.macro  ashlcc reg,dist
63d1a8abSmrg    .long   0x5de04008 | (\reg << 15) | (\dist << 4)
63d1a8abSmrg.endm
63d1a8abSmrg
63d1a8abSmrg
63d1a8abSmrg# converts an unsigned number x to a signed rep based on the bits in sign
63d1a8abSmrg# sign should be 0x00000000 or 0xffffffff.
63d1a8abSmrg.macro      to_signed x, sign
63d1a8abSmrg    add     \x,\x,\sign    # conditionally decrement x
63d1a8abSmrg    xor     \x,\x,\sign    # conditionally complement x
63d1a8abSmrg.endm
63d1a8abSmrg
63d1a8abSmrg
63d1a8abSmrg.macro  ld32    r,v
63d1a8abSmrg    ldk     \r,(\v>>10)
63d1a8abSmrg    ldl     \r,\r,(\v & 1023)
63d1a8abSmrg.endm
63d1a8abSmrg
63d1a8abSmrg# calculate trailing zero count in x, also uses scr.
63d1a8abSmrg# Using Seal's algorithm
63d1a8abSmrg.macro      ntz x, scr
63d1a8abSmrg    not     \scr, \x
63d1a8abSmrg    add     \scr, \scr, 1
63d1a8abSmrg    and     \x, \x, \scr
63d1a8abSmrg    ashl    \scr, \x, 4
63d1a8abSmrg    add     \x, \scr, \x
63d1a8abSmrg    ashl    \scr, \x, 6
63d1a8abSmrg    add     \x, \scr, \x
63d1a8abSmrg    ashl    \scr, \x, 16
63d1a8abSmrg    sub     \x, \scr, \x
63d1a8abSmrg    lshr    \x, \x, 26
63d1a8abSmrg    ldk     \scr, ntz_table
63d1a8abSmrg    add     \x, \x, \scr
63d1a8abSmrg    lpmi.b  \x, \x, 0
63d1a8abSmrg.endm
63d1a8abSmrg
63d1a8abSmrg# calculate leading zero count
63d1a8abSmrg.macro      nlz x, scr
63d1a8abSmrg    flip    \x, \x, 31
63d1a8abSmrg    ntz     \x, \scr
63d1a8abSmrg.endm
63d1a8abSmrg
63d1a8abSmrg
63d1a8abSmrg# Round 26 bit mantissa to nearest
63d1a8abSmrg# | 23 bits frac | G | R | S |
63d1a8abSmrg.macro      round m,  s1, s2
63d1a8abSmrg    ldk     \s1,0xc8
63d1a8abSmrg    and     \s2,\m,7
63d1a8abSmrg    lshr    \s1,\s1,\s2
63d1a8abSmrg    and     \s1,\s1,1
63d1a8abSmrg    lshr    \m,\m,2
63d1a8abSmrg    add     \m,\m,\s1
63d1a8abSmrg.endm
63d1a8abSmrg
63d1a8abSmrg# If NZ, set the LSB of reg
63d1a8abSmrg.macro      sticky reg
63d1a8abSmrg    jmpc    z,1f
63d1a8abSmrg    or      \reg,\reg,1             # set the sticky bit to 1
63d1a8abSmrg1:
63d1a8abSmrg.endm
63d1a8abSmrg
63d1a8abSmrg##########################################################################
63d1a8abSmrg##########################################################################
63d1a8abSmrg## addition & subtraction
63d1a8abSmrg
63d1a8abSmrg#if defined(L_subsf3) || defined(L_addsub_sf)
63d1a8abSmrg.global __subsf3
63d1a8abSmrg__subsf3:
63d1a8abSmrg    # this is subtraction, so we just change the sign of r1
63d1a8abSmrg    lpm     $r2,sign_mask
63d1a8abSmrg    xor     $r1,$r1,$r2
63d1a8abSmrg    jmp     __addsf3
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg#if defined(L_addsf3) || defined(L_addsub_sf)
63d1a8abSmrg.global __addsf3
63d1a8abSmrg__addsf3:
63d1a8abSmrg    # x in $r0, y in $r1, result z in $r0       --||| 100 instructions +/- |||--
63d1a8abSmrg    # unpack e, calc d
63d1a8abSmrg    bextu   $r2,$r0,(8<<5)|23   # ex in r2
63d1a8abSmrg    bextu   $r3,$r1,(8<<5)|23   # ey in r3
63d1a8abSmrg    sub     $r5,$r2,$r3         # d = ex - ey
63d1a8abSmrg
63d1a8abSmrg    # Special values are 0x00 and 0xff in ex and ey.
63d1a8abSmrg    # If (ex&ey) != 0 or (xy|ey)=255 then there may be
63d1a8abSmrg    # a special value.
63d1a8abSmrg    tst     $r2,$r3
63d1a8abSmrg    jmpc    nz,1f
63d1a8abSmrg    jmp     slow
63d1a8abSmrg1:  or      $r4,$r2,$r3
63d1a8abSmrg    cmp     $r4,255
63d1a8abSmrg    jmpc    nz,no_special_vals
63d1a8abSmrgslow:
63d1a8abSmrg    # Check for early exit
63d1a8abSmrg    cmp     $r2,0
63d1a8abSmrg    jmpc    z,test_if_not_255
63d1a8abSmrg    cmp     $r3,0
63d1a8abSmrg    jmpc    nz,no_early_exit
63d1a8abSmrgtest_if_not_255:
63d1a8abSmrg    cmp     $r2,255
63d1a8abSmrg    jmpc    z,no_early_exit
63d1a8abSmrg    cmp     $r3,255
63d1a8abSmrg    jmpc    z,no_early_exit
63d1a8abSmrg    or      $r6,$r2,$r3
63d1a8abSmrg    cmp     $r6,0
63d1a8abSmrg    jmpc    nz,was_not_zero
63d1a8abSmrg    and     $r0,$r0,$r1
63d1a8abSmrg    lpm     $r1,sign_mask
63d1a8abSmrg    and     $r0,$r0,$r1
63d1a8abSmrg    return
63d1a8abSmrgwas_not_zero:
63d1a8abSmrg    cmp     $r2,0
63d1a8abSmrg    jmpc    nz,ret_x
63d1a8abSmrg    move    $r0,$r1
63d1a8abSmrg    return
63d1a8abSmrgret_x:
63d1a8abSmrg    return
63d1a8abSmrgno_early_exit:
63d1a8abSmrg    # setup to test for special values
63d1a8abSmrg    sub     $r6,$r2,1
63d1a8abSmrg    and     $r6,$r6,0xFE
63d1a8abSmrg    sub     $r7,$r3,1
63d1a8abSmrg    and     $r7,$r7,0xFE
63d1a8abSmrg    # test for special values
63d1a8abSmrg    cmp     $r6,$r7
63d1a8abSmrg    jmpc    gte,ex_spec_is_gte
63d1a8abSmrg    move    $r6,$r7
63d1a8abSmrgex_spec_is_gte:
63d1a8abSmrg    cmp     $r6,0xFE
63d1a8abSmrg    jmpc    nz,no_special_vals
63d1a8abSmrg    cmp     $r5,0
63d1a8abSmrg    jmpc    ns,d_gte_0
63d1a8abSmrg    cmp     $r3,0xFF
63d1a8abSmrg    jmpc    z,ret_y
63d1a8abSmrg    cmp     $r2,0
63d1a8abSmrg    jmpc    z,ret_y
63d1a8abSmrgret_y:
63d1a8abSmrg    move    $r0,$r1
63d1a8abSmrg    return
63d1a8abSmrgd_gte_0:
63d1a8abSmrg    cmp     $r5,0
63d1a8abSmrg    jmpc    z,d_is_0
63d1a8abSmrg    cmp     $r2,0xFF
63d1a8abSmrg    jmpc    z,ret_x
63d1a8abSmrg    cmp     $r3,0
63d1a8abSmrg    jmpc    z,ret_x
63d1a8abSmrgd_is_0:
63d1a8abSmrg    cmp     $r2,0xFF
63d1a8abSmrg    jmpc    nz,no_special_vals
63d1a8abSmrg    ashl    $r6,$r0,9           # clear all except x frac
63d1a8abSmrg    ashl    $r7,$r1,9           # clear all except y frac
63d1a8abSmrg    or      $r6,$r6,$r7
63d1a8abSmrg    cmp     $r6,0
63d1a8abSmrg    jmpc    nz,ret_nan
63d1a8abSmrg    lshr    $r4,$r0,31          # sx in r4
63d1a8abSmrg    lshr    $r5,$r1,31          # sy in r4
63d1a8abSmrg    cmp     $r4,$r5
63d1a8abSmrg    jmpc    nz,ret_nan
63d1a8abSmrg    return
63d1a8abSmrgret_nan:
63d1a8abSmrg    lpm     $r0,nan
63d1a8abSmrg    return
63d1a8abSmrgno_special_vals:
63d1a8abSmrg    ldk     $r8,(1<<10)|(9<<5)|26   # setup implicit bit and mask for e
63d1a8abSmrg    #----------------------
63d1a8abSmrg    ashr    $r4,$r0,31              # sx in r4
63d1a8abSmrg    ashl    $r0,$r0,3               # shift mx 3 for GRS bits
63d1a8abSmrg    bins    $r0,$r0,$r8             # clear sx, ex and add implicit bit mx
63d1a8abSmrg    # change mx to signed mantissa
63d1a8abSmrg    to_signed $r0,$r4
63d1a8abSmrg    #----------------------
63d1a8abSmrg    ashr    $r4,$r1,31              # sy in r4
63d1a8abSmrg    ashl    $r1,$r1,3               # shift my 3 for GRS bits
63d1a8abSmrg    bins    $r1,$r1,$r8             # clear sy, ey and add implicit bit my
63d1a8abSmrg    # change my to signed mantissa
63d1a8abSmrg    to_signed $r1,$r4
63d1a8abSmrg    #----------------------
63d1a8abSmrg    # test if we swap ms based on d sign
63d1a8abSmrg    cmp     $r5,0
63d1a8abSmrg    jmpc    gte,noswap
63d1a8abSmrg    # swap mx & my
63d1a8abSmrg    xor     $r0,$r0,$r1
63d1a8abSmrg    xor     $r1,$r0,$r1
63d1a8abSmrg    xor     $r0,$r0,$r1
63d1a8abSmrg    # d positive means that ex>=ey, so ez = ex
63d1a8abSmrg    # d negative means that ey>ex, so ez = ey
63d1a8abSmrg    move    $r2,$r3
63d1a8abSmrg    # |d|
63d1a8abSmrg    neg     $r5
63d1a8abSmrgnoswap:
63d1a8abSmrg                                    # now $r2 = ez = max(ex,ey)
63d1a8abSmrg    cmp     $r5,26                  # max necessary alignment shift is 26
63d1a8abSmrg    jmpc    lt,under_26
63d1a8abSmrg    ldk     $r5,26
63d1a8abSmrgunder_26:
63d1a8abSmrg    ldk     $r7,-1
63d1a8abSmrg    ashl    $r7,$r7,$r5             # create inverse of mask for test of S bit value in discarded my
63d1a8abSmrg    not     $r7,$r7
63d1a8abSmrg    tst     $r1,$r7                 # determine value of sticky bit
63d1a8abSmrg    # shift my >> |d|
63d1a8abSmrg    ashr    $r1,$r1,$r5
63d1a8abSmrg    sticky  $r1
63d1a8abSmrg
63d1a8abSmrg    # add ms
63d1a8abSmrg    add     $r0,$r0,$r1
63d1a8abSmrg
63d1a8abSmrg    # $r4 = sign(mx), mx = |mx|
63d1a8abSmrg    ashr    $r4,$r0,31
63d1a8abSmrg    xor     $r0,$r0,$r4
63d1a8abSmrg    sub     $r0,$r0,$r4
63d1a8abSmrg
63d1a8abSmrg    # realign mantissa using leading zero count
63d1a8abSmrg    flip    $r7,$r0,31
63d1a8abSmrg    ntz     $r7,$r8
63d1a8abSmrg    ashl    $r0,$r0,$r7
63d1a8abSmrg    btst    $r0,(6<<5)|0            # test low bits for sticky again
63d1a8abSmrg    lshr    $r0,$r0,6
63d1a8abSmrg    sticky  $r0
63d1a8abSmrg
63d1a8abSmrg    # update exponent
63d1a8abSmrg    add     $r2,$r2,5
63d1a8abSmrg    sub     $r2,$r2,$r7
63d1a8abSmrg
63d1a8abSmrg    # Round to nearest
63d1a8abSmrg    round   $r0,$r7,$r6
63d1a8abSmrg
63d1a8abSmrg    # detect_exp_update
63d1a8abSmrg    lshr    $r6,$r0,24
63d1a8abSmrg    add     $r2,$r2,$r6
63d1a8abSmrg
63d1a8abSmrg    # final tests
63d1a8abSmrg    # mz == 0? if so, we just bail with a +0
63d1a8abSmrg    cmp     $r0,0
63d1a8abSmrg    jmpc    nz,msum_not_zero
63d1a8abSmrg    ldk     $r0,0
63d1a8abSmrg    return
63d1a8abSmrgmsum_not_zero:
63d1a8abSmrg    # Combined check that (1 <= ez <= 254)
63d1a8abSmrg    sub     $r3,$r2,1
63d1a8abSmrg    cmp     $r3,254
63d1a8abSmrg    jmpc    b,no_special_ret
63d1a8abSmrg    # underflow?
63d1a8abSmrg    cmp     $r2,0
63d1a8abSmrg    jmpc    gt,no_under
63d1a8abSmrg    ldk     $r0,0
63d1a8abSmrg    jmp     pack_sz
63d1a8abSmrgno_under:
63d1a8abSmrg    # overflow?
63d1a8abSmrg    cmp     $r2,255
63d1a8abSmrg    jmpc    lt,no_special_ret
63d1a8abSmrg    ldk     $r0,0x7F8
63d1a8abSmrg    ashl    $r0,$r0,20
63d1a8abSmrg    jmp     pack_sz
63d1a8abSmrgno_special_ret:
63d1a8abSmrg    # Pack ez
63d1a8abSmrg    ldl     $r2,$r2,(8<<5)|23
63d1a8abSmrg    bins    $r0,$r0,$r2             # width = 8, pos = 23 pack ez
63d1a8abSmrg    # Pack sz
63d1a8abSmrgpack_sz:
63d1a8abSmrg    ldl     $r4,$r4,(1<<5)|31
63d1a8abSmrg    bins    $r0,$r0,$r4             # width = 1, pos = 31 set sz to sy
63d1a8abSmrg    return
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg##########################################################################
63d1a8abSmrg##########################################################################
63d1a8abSmrg## multiplication
63d1a8abSmrg
63d1a8abSmrg#ifdef  L_mulsf3
63d1a8abSmrg.global __mulsf3
63d1a8abSmrg__mulsf3:
63d1a8abSmrg    # x in $r0, y in $r1, result z in $r0       --||| 61 instructions +/- |||--
63d1a8abSmrg
63d1a8abSmrg    # unpack e
63d1a8abSmrg    bextu   $r2,$r0,(8<<5)|23   # ex in r2
63d1a8abSmrg    bextu   $r3,$r1,(8<<5)|23   # ey in r3
63d1a8abSmrg    # calc result sign
63d1a8abSmrg    xor     $r4,$r0,$r1
63d1a8abSmrg    lpm     $r5,sign_mask
63d1a8abSmrg    and     $r4,$r4,$r5         # sz in r4
63d1a8abSmrg
63d1a8abSmrg    # unpack m add implicit bit
63d1a8abSmrg    ldk     $r5,(1<<10)|(9<<5)|23   # setup implicit bit and mask for e
63d1a8abSmrg    #----------------------
63d1a8abSmrg    bins    $r0,$r0,$r5             # clear sx, ex and add implicit bit mx
63d1a8abSmrg
63d1a8abSmrg    sub     $r6,$r2,1
63d1a8abSmrg    cmp     $r6,254
63d1a8abSmrg    jmpc    b,1f
63d1a8abSmrg    jmp     slow_mul
63d1a8abSmrg1:  sub     $r6,$r3,1
63d1a8abSmrg    cmp     $r6,254
63d1a8abSmrg    jmpc    b,no_special_vals_mul
63d1a8abSmrg
63d1a8abSmrgslow_mul:
63d1a8abSmrg    # Check for early exit
63d1a8abSmrg    cmp     $r2,0
63d1a8abSmrg    jmpc    z,op_is_zero
63d1a8abSmrg    cmp     $r3,0
63d1a8abSmrg    jmpc    nz,no_early_exit_mul
63d1a8abSmrgop_is_zero:
63d1a8abSmrg    cmp     $r2,255
63d1a8abSmrg    jmpc    z,no_early_exit_mul
63d1a8abSmrg    cmp     $r3,255
63d1a8abSmrg    jmpc    z,no_early_exit_mul
63d1a8abSmrg    move    $r0,$r4
63d1a8abSmrg    return
63d1a8abSmrgno_early_exit_mul:
63d1a8abSmrg    # setup to test for special values
63d1a8abSmrg    sub     $r6,$r2,1
63d1a8abSmrg    and     $r6,$r6,0xFE
63d1a8abSmrg    sub     $r7,$r3,1
63d1a8abSmrg    and     $r7,$r7,0xFE
63d1a8abSmrg    # test for special values
63d1a8abSmrg    cmp     $r6,$r7
63d1a8abSmrg    jmpc    gte,ex_spec_is_gte_ey_mul
63d1a8abSmrg    move    $r6,$r7
63d1a8abSmrgex_spec_is_gte_ey_mul:
63d1a8abSmrg    cmp     $r6,0xFE
63d1a8abSmrg    jmpc    nz,no_special_vals_mul
63d1a8abSmrg    cmp     $r2,0xFF
63d1a8abSmrg    jmpc    nz,ex_not_FF_mul
63d1a8abSmrg    ashl    $r6,$r0,9
63d1a8abSmrg    cmp     $r6,0
63d1a8abSmrg    jmpc    nz,ret_nan
63d1a8abSmrg    cmp     $r3,0
63d1a8abSmrg    jmpc    z,ret_nan
63d1a8abSmrg    ashl    $r6,$r1,1
63d1a8abSmrg    lpm     $r7,high_FF
63d1a8abSmrg    cmp     $r6,$r7
63d1a8abSmrg    jmpc    a,ret_nan
63d1a8abSmrg    cmp     $r6,0
63d1a8abSmrg    jmpc    z,ret_nan
63d1a8abSmrg    # infinity
63d1a8abSmrg    lpm     $r0,inf
63d1a8abSmrg    or      $r0,$r0,$r4
63d1a8abSmrg    return
63d1a8abSmrgex_not_FF_mul:
63d1a8abSmrg    cmp     $r2,0
63d1a8abSmrg    jmpc    nz,no_nan_mul
63d1a8abSmrg    cmp     $r3,0xFF
63d1a8abSmrg    jmpc    nz,no_nan_mul
63d1a8abSmrg    jmp     ret_nan
63d1a8abSmrgno_nan_mul:
63d1a8abSmrg    lpm     $r0,nan
63d1a8abSmrg    and     $r0,$r0,$r1
63d1a8abSmrg    or      $r0,$r0,$r4
63d1a8abSmrg    return
63d1a8abSmrg
63d1a8abSmrgret_nan:
63d1a8abSmrg    lpm     $r0,nan
63d1a8abSmrg    return
63d1a8abSmrg
63d1a8abSmrgno_special_vals_mul:
63d1a8abSmrg    bins    $r1,$r1,$r5         # clear sy, ey and add implicit bit my
63d1a8abSmrg    # calc ez
63d1a8abSmrg    add     $r3,$r2,$r3
63d1a8abSmrg    sub     $r3,$r3,127         # ez in r3
63d1a8abSmrg
63d1a8abSmrg    # (r1,r2) = R0 * R1
63d1a8abSmrg    mul     $r2,$r0,$r1
63d1a8abSmrg    muluh   $r1,$r0,$r1
63d1a8abSmrg
63d1a8abSmrg    btst    $r1,(1<<5)|15       # XXX use jmpx
63d1a8abSmrg    jmpc    z,mul_z0
63d1a8abSmrg
63d1a8abSmrg    # mz is 1X.XX...X
63d1a8abSmrg    # 48-bit product is in (r1,r2). The low 22 bits of r2
63d1a8abSmrg    # are discarded.
63d1a8abSmrg    lshr    $r0,$r2,22
63d1a8abSmrg    ashl    $r1,$r1,10
63d1a8abSmrg    or      $r0,$r0,$r1         # r0 = (r1,r2) >> 22
63d1a8abSmrg    ashlcc  2,10
63d1a8abSmrg    sticky  $r0
63d1a8abSmrg    add     $r3,$r3,1           # bump exponent
63d1a8abSmrg
63d1a8abSmrg    # Round to nearest
63d1a8abSmrg    round   $r0, $r1, $r2
63d1a8abSmrg    lshr    $r6,$r0,24
63d1a8abSmrg    add     $r3,$r3,$r6
63d1a8abSmrg
63d1a8abSmrg    sub     $r6,$r3,1
63d1a8abSmrg    cmp     $r6,254
63d1a8abSmrg    jmpc    b,no_special_ret_mul
63d1a8abSmrg
63d1a8abSmrgspecial_ret_mul:
63d1a8abSmrg    # When the final exponent <= 0, result is flushed to 0 except
63d1a8abSmrg    # for the border case 0x00FFFFFF which is promoted to next higher
63d1a8abSmrg    # FP no., that is, the smallest "normalized" number.
63d1a8abSmrg    cmp     $r3,0
63d1a8abSmrg    jmpc    gt,exp_normal
63d1a8abSmrg    # Pack ez
63d1a8abSmrg    ldl     $r3,$r3,(8<<5)|23
63d1a8abSmrg    bins    $r0,$r0,$r3 # width = 8, pos = 23 pack ez
63d1a8abSmrg    lpm     $r2,edge_case
63d1a8abSmrg    cmp     $r0,$r2
63d1a8abSmrg    jmpc    nz,no_edge_case
63d1a8abSmrg    lpm     $r0,smallest_norm
63d1a8abSmrg    jmp     pack_sz_mul
63d1a8abSmrgno_edge_case:
63d1a8abSmrg    ldk     $r0,0
63d1a8abSmrg    jmp     pack_sz_mul
63d1a8abSmrgexp_normal:
63d1a8abSmrg    # overflow?
63d1a8abSmrg    cmp     $r3,255
63d1a8abSmrg    jmpc    lt,no_special_ret_mul
63d1a8abSmrg    ldk     $r0,0x7F8
63d1a8abSmrg    ashl    $r0,$r0,20
63d1a8abSmrg    jmp     pack_sz_mul
63d1a8abSmrgno_special_ret_mul:
63d1a8abSmrg    # Pack ez
63d1a8abSmrg    ldl     $r3,$r3,(8<<5)|23
63d1a8abSmrg    bins    $r0,$r0,$r3 # width = 8, pos = 23 pack ez
63d1a8abSmrg    # Pack sz
63d1a8abSmrgpack_sz_mul:
63d1a8abSmrg    or    $r0,$r0,$r4
63d1a8abSmrg    return
63d1a8abSmrg
63d1a8abSmrgmul_z0:
63d1a8abSmrg    # mz is 0X.XX...X
63d1a8abSmrg    # 48-bit product is in (r1,r2). The low 21 bits of r2
63d1a8abSmrg    # are discarded.
63d1a8abSmrg    lshr    $r0,$r2,21
63d1a8abSmrg    ashl    $r1,$r1,11
63d1a8abSmrg    or      $r0,$r0,$r1         # r0 = (r1,r2) >> 22
63d1a8abSmrg    ashlcc  2,11
63d1a8abSmrg    sticky  $r0
63d1a8abSmrg    # Round to nearest
63d1a8abSmrg    round   $r0, $r1, $r2
63d1a8abSmrg    lshr    $r6,$r0,24
63d1a8abSmrg    add     $r3,$r3,$r6
63d1a8abSmrg
63d1a8abSmrg    sub     $r6,$r3,1
63d1a8abSmrg    cmp     $r6,254
63d1a8abSmrg    jmpc    b,no_special_ret_mul
63d1a8abSmrg    jmp     special_ret_mul
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg##########################################################################
63d1a8abSmrg##########################################################################
63d1a8abSmrg## division
63d1a8abSmrg
63d1a8abSmrg## See http://perso.ens-lyon.fr/gilles.villard/BIBLIOGRAPHIE/PDF/arith19.pdf
63d1a8abSmrg## for implementation details
63d1a8abSmrg
63d1a8abSmrg
63d1a8abSmrg
63d1a8abSmrg
63d1a8abSmrg#ifdef  L_divsf3
63d1a8abSmrgdc_1: .long             0xffffe7d7
63d1a8abSmrgdc_2: .long             0xffffffe8
63d1a8abSmrgdc_3: .long             0xffbad86f
63d1a8abSmrgdc_4: .long             0xfffbece7
63d1a8abSmrgdc_5: .long             0xf3672b51
63d1a8abSmrgdc_6: .long             0xfd9d3a3e
63d1a8abSmrgdc_7: .long             0x9a3c4390
63d1a8abSmrgdc_8: .long             0xd4d2ce9b
63d1a8abSmrgdc_9: .long             0x1bba92b3
63d1a8abSmrgdc_10: .long            0x525a1a8b
63d1a8abSmrgdc_11: .long            0x0452b1bf
63d1a8abSmrgdc_12: .long            0xFFFFFFC0
63d1a8abSmrgspec_val_test:  .long   0x7F7FFFFF
63d1a8abSmrg
63d1a8abSmrg.global __divsf3
63d1a8abSmrg__divsf3:
63d1a8abSmrg    push    $r13
63d1a8abSmrg    # x in $r0, y in $r1, result z in $r0       --||| 73 instructions +/- |||-
63d1a8abSmrg    bextu   $r10,$r0,(8<<5)|23   # ex in r2
63d1a8abSmrg    bextu   $r11,$r1,(8<<5)|23   # ey in r3
63d1a8abSmrg    lpm     $r6, m_mask
63d1a8abSmrg    and     $r2, $r0, $r6        # mx
63d1a8abSmrg    and     $r3, $r1, $r6        # my
63d1a8abSmrg    cmp     $r2,$r3
63d1a8abSmrg    bextu   $r2,$r30,(1<<5)|4   # c = Tx >= T;
63d1a8abSmrg    ashl    $r3,$r3,9           # T = X << 9;
63d1a8abSmrg    lpm     $r13, sign_mask
63d1a8abSmrg    ashl    $r4,$r0,8           # X8 = X << 8;
63d1a8abSmrg    or      $r4,$r4,$r13        # Mx = X8 | 0x80000000;
63d1a8abSmrg    lshr    $r5,$r4,$r2         # S = Mx >> c;
63d1a8abSmrg    # calc D
63d1a8abSmrg    sub     $r2, $r11, $r2
63d1a8abSmrg    add     $r12, $r10, 125
63d1a8abSmrg    sub     $r2, $r12, $r2      # int D = (Ex + 125) - (Ey - c);
63d1a8abSmrg    # calc result sign
63d1a8abSmrg    xor     $r12,$r0,$r1
63d1a8abSmrg    and     $r12,$r12,$r13      # Sr = ( X ˆ Y ) & 0x80000000;
63d1a8abSmrg    # check early exit
63d1a8abSmrg    cmp     $r10, 0
63d1a8abSmrg    jmpc    nz, no_early_ret_dev
63d1a8abSmrg    cmp     $r11, 0
63d1a8abSmrg    jmpc    z, no_early_ret_dev
63d1a8abSmrg    cmp     $r11, 255
63d1a8abSmrg    jmpc    z, no_early_ret_dev
63d1a8abSmrg    move    $r0, $r12
63d1a8abSmrg    pop     $r13
63d1a8abSmrg    return
63d1a8abSmrgno_early_ret_dev:
63d1a8abSmrg # setup to test for special values
63d1a8abSmrg    sub     $r8,$r10,1
63d1a8abSmrg    and     $r8,$r8,0xFE
63d1a8abSmrg    sub     $r9,$r11,1
63d1a8abSmrg    and     $r9,$r9,0xFE
63d1a8abSmrg    # test for special values
63d1a8abSmrg    cmp     $r8, $r9
63d1a8abSmrg    jmpc    gte, absXm1_gte_absYm1
63d1a8abSmrg    move    $r8, $r9
63d1a8abSmrgabsXm1_gte_absYm1:
63d1a8abSmrg    cmp     $r8, 0xFE
63d1a8abSmrg    jmpc    nz, no_spec_ret_div
63d1a8abSmrg    cmp     $r10, 0xFF
63d1a8abSmrg    jmpc    nz, ex_not_FF_div
63d1a8abSmrg    lpm     $r6, m_mask
63d1a8abSmrg    and     $r2, $r0, $r6        # mx
63d1a8abSmrg    cmp     $r2, 0
63d1a8abSmrg    jmpc    nz, ret_nan_div
63d1a8abSmrg    cmp     $r11, 0xFF
63d1a8abSmrg    jmpc    z, ret_nan_div
63d1a8abSmrg    jmp     ret_inf_div
63d1a8abSmrgex_not_FF_div:
63d1a8abSmrg    cmp     $r11, 0xFF
63d1a8abSmrg    jmpc    nz, ey_not_FF_div
63d1a8abSmrg    ashl    $r13, $r1, 9
63d1a8abSmrg    cmp     $r13, 0
63d1a8abSmrg    jmpc    nz, ret_nan_div
63d1a8abSmrg    move    $r0, $r12
63d1a8abSmrg    pop     $r13
63d1a8abSmrg    return
63d1a8abSmrgey_not_FF_div:
63d1a8abSmrg    or      $r10, $r10, $r11
63d1a8abSmrg    cmp     $r10, 0
63d1a8abSmrg    jmpc    z, ret_nan_div
63d1a8abSmrgret_inf_div:
63d1a8abSmrg    lpm     $r6, inf
63d1a8abSmrg    move    $r0, $r6
63d1a8abSmrg    or      $r0, $r0, $r12
63d1a8abSmrg    pop     $r13
63d1a8abSmrg    return
63d1a8abSmrgret_nan_div:
63d1a8abSmrg    lpm     $r0, nan
63d1a8abSmrg    pop     $r13
63d1a8abSmrg    return
63d1a8abSmrg
63d1a8abSmrgno_spec_ret_div:
63d1a8abSmrg# check for overflow
63d1a8abSmrg    ldk     $r6, 0xFE
63d1a8abSmrg    cmp     $r2, $r6
63d1a8abSmrg    jmpc    lt, no_overflow_div
63d1a8abSmrg    lpm     $r6, inf
63d1a8abSmrg    or      $r0, $r12, $r6
63d1a8abSmrg    pop     $r13
63d1a8abSmrg    return
63d1a8abSmrgno_overflow_div:
63d1a8abSmrg# check for underflow
63d1a8abSmrg    cmp     $r2, 0
63d1a8abSmrg    jmpc    ns, no_underflow_div
63d1a8abSmrg    xnor    $r6, $r6, $r6       # -1
63d1a8abSmrg    cmp     $r2, $r6
63d1a8abSmrg    jmpc    nz, ret_sr_div
63d1a8abSmrg    ldk     $r7, 0xFF
63d1a8abSmrg    xor     $r6, $r6, $r7       # 0xFF ^ -1 = 0xFFFFFF00
63d1a8abSmrg    cmp     $r4, $r6
63d1a8abSmrg    jmpc    nz, ret_sr_div
63d1a8abSmrg    lpm     $r6, sign_mask
63d1a8abSmrg    cmp     $r4, $r6
63d1a8abSmrg    jmpc    nz, ret_sr_div
63d1a8abSmrg    lshr    $r0, $r6, 8
63d1a8abSmrg    or      $r0, $r0, $r12
63d1a8abSmrg    pop     $r13
63d1a8abSmrg    return
63d1a8abSmrgret_sr_div:
63d1a8abSmrg    move    $r0, $r12
63d1a8abSmrg    pop     $r13
63d1a8abSmrg    return
63d1a8abSmrgno_underflow_div:
63d1a8abSmrg    lpm     $r6, dc_1
63d1a8abSmrg    muluh   $r7, $r3, $r6       # i0 = mul( T , 0xffffe7d7 );
63d1a8abSmrg    lpm     $r6, dc_2
63d1a8abSmrg    sub     $r7, $r6, $r7       # i1 = 0xffffffe8 - i0;
63d1a8abSmrg    muluh   $r7, $r5, $r7       # i2 = mul( S , i1 );
63d1a8abSmrg    add     $r7, $r7, 0x20      # i3 = 0x00000020 + i2;
63d1a8abSmrg    muluh   $r8, $r3, $r3       # i4 = mul( T , T );
63d1a8abSmrg    muluh   $r9, $r5, $r8       # i5 = mul( S , i4 );
63d1a8abSmrg    lpm     $r6, dc_3
63d1a8abSmrg    muluh   $r10, $r3, $r6      # i6 = mul( T , 0xffbad86f );
63d1a8abSmrg    lpm     $r6, dc_4
63d1a8abSmrg    sub     $r10, $r6, $r10     # i7 = 0xfffbece7 - i6;
63d1a8abSmrg    muluh   $r10, $r9, $r10     # i8 = mul( i5 , i7 );
63d1a8abSmrg    add     $r7, $r7, $r10      # i9 = i3 + i8;
63d1a8abSmrg    muluh   $r9, $r8, $r9       # i10 = mul( i4 , i5 );
63d1a8abSmrg    lpm     $r6, dc_5
63d1a8abSmrg    muluh   $r10, $r3, $r6      # i11 = mul( T , 0xf3672b51 );
63d1a8abSmrg    lpm     $r6, dc_6
63d1a8abSmrg    sub     $r10, $r6, $r10     # i12 = 0xfd9d3a3e - i11;
63d1a8abSmrg    lpm     $r6, dc_7
63d1a8abSmrg    muluh   $r11, $r3, $r6      # i13 = mul( T , 0x9a3c4390 );
63d1a8abSmrg    lpm     $r6, dc_8
63d1a8abSmrg    sub     $r11, $r6, $r11     # i14 = 0xd4d2ce9b - i13
63d1a8abSmrg    muluh   $r11, $r8, $r11     # i15 = mul( i4 , i14 );
63d1a8abSmrg    add     $r10, $r10, $r11    # i16 = i12 + i15;
63d1a8abSmrg    muluh   $r10, $r9, $r10     # i17 = mul( i10 , i16 )
63d1a8abSmrg    add     $r7, $r7, $r10      # i18 = i9 + i17;
63d1a8abSmrg    muluh   $r10, $r8, $r8      # i19 = mul( i4 , i4 );
63d1a8abSmrg    lpm     $r6, dc_9
63d1a8abSmrg    muluh   $r11, $r3, $r6      # i20 = mul( T , 0x1bba92b3 );
63d1a8abSmrg    lpm     $r6, dc_10
63d1a8abSmrg    sub     $r11, $r6, $r11     # i21 = 0x525a1a8b - i20;
63d1a8abSmrg    lpm     $r6, dc_11
63d1a8abSmrg    muluh   $r8, $r8, $r6       # i22 = mul( i4 , 0x0452b1bf );
63d1a8abSmrg    add     $r8, $r11, $r8      # i23 = i21 + i22;
63d1a8abSmrg    muluh   $r8, $r10, $r8      # i24 = mul( i19 , i23 );
63d1a8abSmrg    muluh   $r8, $r9, $r8       # i25 = mul( i10 , i24 );
63d1a8abSmrg    add     $r3, $r7, $r8       # V = i18 + i25;
63d1a8abSmrg# W = V & 0xFFFFFFC0;
63d1a8abSmrg    lpm     $r6, dc_12
63d1a8abSmrg    and     $r3, $r3, $r6   # W
63d1a8abSmrg# round and pack final values
63d1a8abSmrg    ashl    $r0, $r2, 23        # pack D
63d1a8abSmrg    or      $r0, $r0, $r12      # pack Sr
63d1a8abSmrg    ashl    $r12, $r1, 8
63d1a8abSmrg    or      $r12, $r12, $r13    # My
63d1a8abSmrg    muluh   $r10, $r3, $r12
63d1a8abSmrg    lshr    $r11, $r5, 1
63d1a8abSmrg    cmp     $r10, $r11
63d1a8abSmrg    jmpc    gte, div_ret_1
63d1a8abSmrg    add     $r3, $r3, 0x40
63d1a8abSmrgdiv_ret_1:
63d1a8abSmrg    lshr    $r3, $r3, 7
63d1a8abSmrg    add     $r0, $r0, $r3
63d1a8abSmrg    pop     $r13
63d1a8abSmrg    return
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg##########################################################################
63d1a8abSmrg##########################################################################
63d1a8abSmrg## Negate
63d1a8abSmrg
63d1a8abSmrg#ifdef L_negsf
63d1a8abSmrg.global __negsf
63d1a8abSmrg__negsf:
63d1a8abSmrg    lpm     $r1, sign_mask
63d1a8abSmrg    xor     $r0, $r0, $r1
63d1a8abSmrg    return
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg##########################################################################
63d1a8abSmrg##########################################################################
63d1a8abSmrg## float to int & unsigned int
63d1a8abSmrg
63d1a8abSmrg#ifdef L_fixsfsi
63d1a8abSmrg.global __fixsfsi
63d1a8abSmrg__fixsfsi: # 20 instructions
63d1a8abSmrg    bextu   $r1,$r0,(8<<5)|23   # e in r1
63d1a8abSmrg    lshr    $r2,$r0,31          # s in r2
63d1a8abSmrg    lpm     $r3, m_mask
63d1a8abSmrg    and     $r0,$r0,$r3         # m in r0
63d1a8abSmrg    # test nan
63d1a8abSmrg    cmp     $r1,0xFF
63d1a8abSmrg    jmpc    nz, int_not_nan
63d1a8abSmrg    cmp     $r0,0
63d1a8abSmrg    jmpc    z, int_not_nan
63d1a8abSmrg    ldk     $r0,0
63d1a8abSmrg    return
63d1a8abSmrgint_not_nan:
63d1a8abSmrg    # test edges
63d1a8abSmrg    cmp     $r1, 127
63d1a8abSmrg    jmpc    gte, int_not_zero   # lower limit
63d1a8abSmrg    ldk     $r0,0
63d1a8abSmrg    return
63d1a8abSmrgint_not_zero:
63d1a8abSmrg    cmp     $r1, 158
63d1a8abSmrg    jmpc    lt, int_not_max    # upper limit
63d1a8abSmrg    lpm     $r0, nan
63d1a8abSmrg    cmp     $r2, 0
63d1a8abSmrg    jmpc    z, int_positive
63d1a8abSmrg    xnor    $r0, $r0, 0
63d1a8abSmrg    return
63d1a8abSmrgint_not_max:
63d1a8abSmrg    lpm     $r3, smallest_norm
63d1a8abSmrg    or      $r0, $r0, $r3       # set implicit bit
63d1a8abSmrg    sub     $r1, $r1, 150
63d1a8abSmrg    cmp     $r1, 0
63d1a8abSmrg    jmpc    s, shift_right
63d1a8abSmrg    ashl    $r0, $r0, $r1
63d1a8abSmrg    jmp     set_int_sign
63d1a8abSmrgshift_right:
63d1a8abSmrg    xnor    $r1, $r1, 0
63d1a8abSmrg    add     $r1, $r1, 1
63d1a8abSmrg    lshr    $r0, $r0, $r1
63d1a8abSmrgset_int_sign:
63d1a8abSmrg    cmp     $r2, 0
63d1a8abSmrg    jmpc    z, int_positive
63d1a8abSmrg    xnor    $r0, $r0, 0
63d1a8abSmrg    add     $r0, $r0, 1
63d1a8abSmrgint_positive:
63d1a8abSmrg    return
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg#ifdef L_fixunssfsi
63d1a8abSmrg.global __fixunssfsi
63d1a8abSmrg__fixunssfsi: # 19 instructions
63d1a8abSmrg    lshr    $r2, $r0, 31          # s in r2
63d1a8abSmrg    cmp     $r2, 0
63d1a8abSmrg    jmpc    z, uint_not_neg
63d1a8abSmrg    ldk     $r0, 0
63d1a8abSmrg    return
63d1a8abSmrguint_not_neg:
63d1a8abSmrg    bextu   $r1, $r0, (8<<5)|23   # e in r1
63d1a8abSmrg    sub     $r1, $r1, 127
63d1a8abSmrg    lpm     $r3, m_mask
63d1a8abSmrg    and     $r0, $r0, $r3         # m in r0
63d1a8abSmrg    # test nan
63d1a8abSmrg    cmp     $r1, 0xFF
63d1a8abSmrg    jmpc    nz, uint_not_nan
63d1a8abSmrg    cmp     $r0, 0
63d1a8abSmrg    jmpc    z, uint_not_nan
63d1a8abSmrg    ldk     $r0, 0
63d1a8abSmrg    return
63d1a8abSmrguint_not_nan:
63d1a8abSmrg    # test edges
63d1a8abSmrg    cmp     $r1, 0
63d1a8abSmrg    jmpc    ns, uint_not_zero   # lower limit
63d1a8abSmrg    ldk     $r0, 0
63d1a8abSmrg    return
63d1a8abSmrguint_not_zero:
63d1a8abSmrg    lpm     $r3, smallest_norm
63d1a8abSmrg    or      $r0, $r0, $r3       # set implicit bit
63d1a8abSmrg    cmp     $r1, 23
63d1a8abSmrg    jmpc    lt, shift_uint_right
63d1a8abSmrg    sub     $r1, $r1, 23
63d1a8abSmrg    ashl    $r0, $r0, $r1
63d1a8abSmrg    return
63d1a8abSmrgshift_uint_right:
63d1a8abSmrg    ldk     $r3, 23
63d1a8abSmrg    sub     $r1, $r3, $r1
63d1a8abSmrg    lshr    $r0, $r0, $r1
63d1a8abSmrg    return
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg##########################################################################
63d1a8abSmrg##########################################################################
63d1a8abSmrg## int & unsigned int to float
63d1a8abSmrg
63d1a8abSmrg
63d1a8abSmrg.macro  i2f x, s1, s2, s3, lbl
63d1a8abSmrg    move    \s1, \x
63d1a8abSmrg    nlz     \s1, \s2
63d1a8abSmrg    cmp     \s1, 8
63d1a8abSmrg    jmpc    s, float_round\lbl
63d1a8abSmrg    sub     \s2, \s1, 8
63d1a8abSmrg    ashl    \x, \x, \s2
63d1a8abSmrg    jmp     float_no_round\lbl
63d1a8abSmrgfloat_round\lbl:
63d1a8abSmrg    cmp     \s1, 6
63d1a8abSmrg    jmpc    s, float_shift_right\lbl
63d1a8abSmrg    sub     \s2, \s1, 6
63d1a8abSmrg    ashl    \x, \x, \s2
63d1a8abSmrg    jmp     float_round_and_pack\lbl
63d1a8abSmrgfloat_shift_right\lbl:
63d1a8abSmrg    ldk     \s2, 6
63d1a8abSmrg    sub     \s2, \s2, \s1
63d1a8abSmrg    xnor    \s3, \s3 ,\s3           # 0xFFFFFFFF
63d1a8abSmrg    ashl    \s3, \s3 ,\s2           # create inverse of mask for test of S bit value in discarded my
63d1a8abSmrg    xnor    \s3, \s3 ,0             # NOT
63d1a8abSmrg    tst     \x, \s3                # determine value of sticky bit
63d1a8abSmrg    lshr    \x, \x, \s2
63d1a8abSmrg    jmpc    z,float_round_and_pack\lbl
63d1a8abSmrg    or      \x, \x, 1               # set the sticky bit to 1
63d1a8abSmrgfloat_round_and_pack\lbl:
63d1a8abSmrg    bextu   \s2, \x, (1<<5)|2      # extract low bit of m
63d1a8abSmrg    or      \x, \x, \s2           # or p into r
63d1a8abSmrg    add     \x, \x, 1
63d1a8abSmrg    lshr    \x, \x, 2
63d1a8abSmrg    btst    \x, (1<<5)|24          # test for carry from round
63d1a8abSmrg    jmpc    z, float_no_round\lbl
63d1a8abSmrg    sub     \s1, \s1, 1             # inc e for carry (actually dec nlz)
63d1a8abSmrg    lshr    \x, \x, 1
63d1a8abSmrgfloat_no_round\lbl:
63d1a8abSmrg    ldk     \s2, 158
63d1a8abSmrg    sub     \s1, \s2, \s1
63d1a8abSmrg    # Pack e
63d1a8abSmrg    ldl     \s1, \s1, (8<<5)|23
63d1a8abSmrg    bins    \x, \x, \s1
63d1a8abSmrg.endm
63d1a8abSmrg
63d1a8abSmrg
63d1a8abSmrg#ifdef L_floatsisf
63d1a8abSmrg.global __floatsisf
63d1a8abSmrg__floatsisf:                       # 32 instructions
63d1a8abSmrg    cmp     $r0, 0
63d1a8abSmrg    jmpc    nz, float_not_zero
63d1a8abSmrg    return
63d1a8abSmrgfloat_not_zero:
63d1a8abSmrg    ashr    $r1, $r0, 31            # s in r1
63d1a8abSmrg    xor     $r0, $r0, $r1           # cond neg
63d1a8abSmrg    sub     $r0, $r0, $r1
63d1a8abSmrg    i2f     $r0, $r2, $r3, $r4, 1
63d1a8abSmrg    ldl     $r1, $r1, (1<<5)|31
63d1a8abSmrg    bins    $r0, $r0, $r1
63d1a8abSmrg    return
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg#ifdef L_floatunsisf
63d1a8abSmrg.global __floatunsisf
63d1a8abSmrg__floatunsisf:                        # 26 instructions
63d1a8abSmrg    cmp     $r0, 0
63d1a8abSmrg    jmpc    nz, float_not_zero2
63d1a8abSmrg    return
63d1a8abSmrgfloat_not_zero2:
63d1a8abSmrg    i2f     $r0, $r1, $r2, $r3, 2
63d1a8abSmrg    return
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg#if 0
63d1a8abSmrg##########################################################################
63d1a8abSmrg##########################################################################
63d1a8abSmrg## float compare
63d1a8abSmrg
63d1a8abSmrg
63d1a8abSmrg__cmpsf2_:
63d1a8abSmrg    # calc abs vals
63d1a8abSmrg    lpm     $r3, nan                # also abs mask
63d1a8abSmrg    and     $r2, $r0, $r3
63d1a8abSmrg    and     $r3, $r1, $r3
63d1a8abSmrg    # test if either abs is nan
63d1a8abSmrg    lpm     $r4, inf
63d1a8abSmrg    cmp     $r2, $r4
63d1a8abSmrg    jmpc    gt, cmp_is_gt
63d1a8abSmrg    cmp     $r3, $r4
63d1a8abSmrg    jmpc    gt, cmp_is_gt
63d1a8abSmrg    # test if both are 0
63d1a8abSmrg    or      $r2, $r2, $r3
63d1a8abSmrg    cmp     $r2, 0
63d1a8abSmrg    jmpc    z, cmp_is_eq
63d1a8abSmrg    # test if eq
63d1a8abSmrg    cmp     $r0, $r1
63d1a8abSmrg    jmpc    z, cmp_is_eq
63d1a8abSmrg    # -- if either is pos
63d1a8abSmrg    and     $r2, $r0, $r1
63d1a8abSmrg    cmp     $r2, 0
63d1a8abSmrg    jmpc    s, cmp_both_neg
63d1a8abSmrg    cmp     $r0, $r1
63d1a8abSmrg    jmpc    gt, cmp_is_gt
63d1a8abSmrg    # r0 < r1
63d1a8abSmrg    lpm     $r0, high_uint
63d1a8abSmrg    return
63d1a8abSmrgcmp_both_neg:
63d1a8abSmrg    cmp     $r0, $r1
63d1a8abSmrg    jmpc    lt, cmp_is_gt
63d1a8abSmrg    # r0 < r1
63d1a8abSmrg    lpm     $r0, high_uint
63d1a8abSmrg    return
63d1a8abSmrgcmp_is_gt:
63d1a8abSmrg    ldk     $r0, 1
63d1a8abSmrg    return
63d1a8abSmrgcmp_is_eq:
63d1a8abSmrg    ldk     $r0, 0
63d1a8abSmrg    return
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg#ifdef  L_udivsi3
63d1a8abSmrg.global __udivsi3
63d1a8abSmrg__udivsi3:
63d1a8abSmrg	# $r0 is dividend
63d1a8abSmrg	# $r1 is divisor
63d1a8abSmrg	ldk	$r2,0
63d1a8abSmrg	push	$r28
63d1a8abSmrg	ldk	$r28,-32
63d1a8abSmrg0:
63d1a8abSmrg	lshr	$r3,$r0,31	# Shift $r2:$r0 left one
63d1a8abSmrg	ashl	$r0,$r0,1
63d1a8abSmrg	ashl	$r2,$r2,1
63d1a8abSmrg	or	$r2,$r2,$r3
63d1a8abSmrg	cmp	$r2,$r1
63d1a8abSmrg	jmpc	b,1f
63d1a8abSmrg2:
63d1a8abSmrg	sub	$r2,$r2,$r1
63d1a8abSmrg	add	$r0,$r0,1
63d1a8abSmrg1:
63d1a8abSmrg	add	$r28,$r28,1
63d1a8abSmrg	jmpx	31,$r28,1,0b
63d1a8abSmrg	pop	$r28
63d1a8abSmrg	# $r0: quotient
63d1a8abSmrg	# $r2: remainder
63d1a8abSmrg	return
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg#ifdef	L_umodsi3
63d1a8abSmrg.global	__umodsi3
63d1a8abSmrg__umodsi3:
63d1a8abSmrg	call	__udivsi3
63d1a8abSmrg	move	$r0,$r2
63d1a8abSmrg	return
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg#ifdef	L_divsi3
63d1a8abSmrg.global	__divsi3
63d1a8abSmrg__divsi3:
63d1a8abSmrg	xor	$r5,$r0,$r1	# $r5 is sign of result
63d1a8abSmrg	ashr	$r2,$r0,31	# $r0 = abs($r0)
63d1a8abSmrg	xor	$r0,$r0,$r2
63d1a8abSmrg	sub	$r0,$r0,$r2
63d1a8abSmrg	ashr	$r2,$r1,31	# $r1 = abs($r1)
63d1a8abSmrg	xor	$r1,$r1,$r2
63d1a8abSmrg	sub	$r1,$r1,$r2
63d1a8abSmrg	call	__udivsi3
63d1a8abSmrg	ashr	$r5,$r5,31
63d1a8abSmrg	xor	$r0,$r0,$r5
63d1a8abSmrg	sub	$r0,$r0,$r5
63d1a8abSmrg	return
63d1a8abSmrg
63d1a8abSmrg#endif
63d1a8abSmrg
63d1a8abSmrg#ifdef	L_modsi3
63d1a8abSmrg.global	__modsi3
63d1a8abSmrg__modsi3:
63d1a8abSmrg	move	$r5,$r0		# $r5 is sign of result
63d1a8abSmrg	ashr	$r2,$r0,31	# $r0 = abs($r0)
63d1a8abSmrg	xor	$r0,$r0,$r2
63d1a8abSmrg	sub	$r0,$r0,$r2
63d1a8abSmrg	ashr	$r2,$r1,31	# $r1 = abs($r1)
63d1a8abSmrg	xor	$r1,$r1,$r2
63d1a8abSmrg	sub	$r1,$r1,$r2
63d1a8abSmrg	call	__umodsi3
63d1a8abSmrg	ashr	$r5,$r5,31
63d1a8abSmrg	xor	$r0,$r0,$r5
63d1a8abSmrg	sub	$r0,$r0,$r5
63d1a8abSmrg	return
63d1a8abSmrg#endif