1! 2! This Source Code Form is subject to the terms of the Mozilla Public 3! License, v. 2.0. If a copy of the MPL was not distributed with this 4! file, You can obtain one at http://mozilla.org/MPL/2.0/. 5 6 .section ".text",#alloc,#execinstr 7 .file "montmulf.c" 8 9 .section ".rodata",#alloc 10 .global TwoTo16 11 .align 8 12! 13! CONSTANT POOL 14! 15 .global TwoTo16 16TwoTo16: 17 .word 1089470464 18 .word 0 19 .type TwoTo16,#object 20 .size TwoTo16,8 21 .global TwoToMinus16 22! 23! CONSTANT POOL 24! 25 .global TwoToMinus16 26TwoToMinus16: 27 .word 1055916032 28 .word 0 29 .type TwoToMinus16,#object 30 .size TwoToMinus16,8 31 .global Zero 32! 33! CONSTANT POOL 34! 35 .global Zero 36Zero: 37 .word 0 38 .word 0 39 .type Zero,#object 40 .size Zero,8 41 .global TwoTo32 42! 43! CONSTANT POOL 44! 45 .global TwoTo32 46TwoTo32: 47 .word 1106247680 48 .word 0 49 .type TwoTo32,#object 50 .size TwoTo32,8 51 .global TwoToMinus32 52! 53! CONSTANT POOL 54! 55 .global TwoToMinus32 56TwoToMinus32: 57 .word 1039138816 58 .word 0 59 .type TwoToMinus32,#object 60 .size TwoToMinus32,8 61 62 .section ".text",#alloc,#execinstr 63/* 000000 0 */ .align 4 64! 65! SUBROUTINE conv_d16_to_i32 66! 67! OFFSET SOURCE LINE LABEL INSTRUCTION 68 69 .global conv_d16_to_i32 70 conv_d16_to_i32: 71/* 000000 */ save %sp,-128,%sp 72! FILE montmulf.c 73 74! 36 !#define RF_INLINE_MACROS 75! 38 !static const double TwoTo16=65536.0; 76! 39 !static const double TwoToMinus16=1.0/65536.0; 77! 40 !static const double Zero=0.0; 78! 41 !static const double TwoTo32=65536.0*65536.0; 79! 42 !static const double TwoToMinus32=1.0/(65536.0*65536.0); 80! 44 !#ifdef RF_INLINE_MACROS 81! 46 !double upper32(double); 82! 47 !double lower32(double, double); 83! 48 !double mod(double, double, double); 84! 50 !void i16_to_d16_and_d32x4(const double * /*1/(2^16)*/, 85! 51 ! const double * /* 2^16*/, 86! 52 ! const double * /* 0 */, 87! 53 ! double * /*result16*/, 88! 54 ! double * /* result32 */, 89! 55 ! float * /*source - should be unsigned int* 90! 56 ! converted to float* */); 91! 58 !#else 92! 60 !static double upper32(double x) 93! 61 !{ 94! 62 ! return floor(x*TwoToMinus32); 95! 63 !} 96! 65 !static double lower32(double x, double y) 97! 66 !{ 98! 67 ! return x-TwoTo32*floor(x*TwoToMinus32); 99! 68 !} 100! 70 !static double mod(double x, double oneoverm, double m) 101! 71 !{ 102! 72 ! return x-m*floor(x*oneoverm); 103! 73 !} 104! 75 !#endif 105! 78 !static void cleanup(double *dt, int from, int tlen) 106! 79 !{ 107! 80 ! int i; 108! 81 ! double tmp,tmp1,x,x1; 109! 83 ! tmp=tmp1=Zero; 110! 84 ! /* original code ** 111! 85 ! for(i=2*from;i<2*tlen-2;i++) 112! 86 ! { 113! 87 ! x=dt[i]; 114! 88 ! dt[i]=lower32(x,Zero)+tmp1; 115! 89 ! tmp1=tmp; 116! 90 ! tmp=upper32(x); 117! 91 ! } 118! 92 ! dt[tlen-2]+=tmp1; 119! 93 ! dt[tlen-1]+=tmp; 120! 94 ! **end original code ***/ 121! 95 ! /* new code ***/ 122! 96 ! for(i=2*from;i<2*tlen;i+=2) 123! 97 ! { 124! 98 ! x=dt[i]; 125! 99 ! x1=dt[i+1]; 126! 100 ! dt[i]=lower32(x,Zero)+tmp; 127! 101 ! dt[i+1]=lower32(x1,Zero)+tmp1; 128! 102 ! tmp=upper32(x); 129! 103 ! tmp1=upper32(x1); 130! 104 ! } 131! 105 ! /** end new code **/ 132! 106 !} 133! 109 !void conv_d16_to_i32(unsigned int *i32, double *d16, long long *tmp, int ilen) 134! 110 !{ 135! 111 !int i; 136! 112 !long long t, t1, a, b, c, d; 137! 114 ! t1=0; 138! 115 ! a=(long long)d16[0]; 139 140/* 0x0004 115 */ ldd [%i1],%f0 141/* 0x0008 110 */ or %g0,%i1,%o0 142 143! 116 ! b=(long long)d16[1]; 144! 117 ! for(i=0; i<ilen-1; i++) 145 146/* 0x000c 117 */ sub %i3,1,%g2 147/* 0x0010 */ cmp %g2,0 148/* 0x0014 114 */ or %g0,0,%o4 149/* 0x0018 115 */ fdtox %f0,%f0 150/* 0x001c */ std %f0,[%sp+120] 151/* 0x0020 117 */ or %g0,0,%o7 152/* 0x0024 110 */ or %g0,%i3,%o1 153/* 0x0028 */ sub %i3,2,%o2 154/* 0x002c 116 */ ldd [%o0+8],%f0 155/* 0x0030 110 */ sethi %hi(0xfc00),%o1 156/* 0x0034 */ add %o2,1,%g3 157/* 0x0038 */ add %o1,1023,%o1 158/* 0x003c */ or %g0,%i0,%o5 159/* 0x0040 116 */ fdtox %f0,%f0 160/* 0x0044 */ std %f0,[%sp+112] 161/* 0x0048 */ ldx [%sp+112],%g1 162/* 0x004c 115 */ ldx [%sp+120],%g4 163/* 0x0050 117 */ ble,pt %icc,.L900000117 164/* 0x0054 */ sethi %hi(0xfc00),%g2 165/* 0x0058 110 */ or %g0,-1,%g2 166/* 0x005c 117 */ cmp %g3,3 167/* 0x0060 110 */ srl %g2,0,%o3 168/* 0x0064 117 */ bl,pn %icc,.L77000134 169/* 0x0068 */ or %g0,%o0,%g2 170 171! 118 ! { 172! 119 ! c=(long long)d16[2*i+2]; 173 174/* 0x006c 119 */ ldd [%o0+16],%f0 175 176! 120 ! t1+=a&0xffffffff; 177! 121 ! t=(a>>32); 178! 122 ! d=(long long)d16[2*i+3]; 179! 123 ! t1+=(b&0xffff)<<16; 180! 124 ! t+=(b>>16)+(t1>>32); 181! 125 ! i32[i]=t1&0xffffffff; 182! 126 ! t1=t; 183! 127 ! a=c; 184! 128 ! b=d; 185 186/* 0x0070 128 */ add %o0,16,%g2 187/* 0x0074 123 */ and %g1,%o1,%o0 188/* 0x0078 */ sllx %o0,16,%g3 189/* 0x007c 120 */ and %g4,%o3,%o0 190/* 0x0080 117 */ add %o0,%g3,%o4 191/* 0x0084 119 */ fdtox %f0,%f0 192/* 0x0088 */ std %f0,[%sp+104] 193/* 0x008c 125 */ and %o4,%o3,%g5 194/* 0x0090 122 */ ldd [%g2+8],%f2 195/* 0x0094 128 */ add %o5,4,%o5 196/* 0x0098 124 */ srax %o4,32,%o4 197/* 0x009c */ stx %o4,[%sp+112] 198/* 0x00a0 122 */ fdtox %f2,%f0 199/* 0x00a4 */ std %f0,[%sp+96] 200/* 0x00a8 124 */ srax %g1,16,%o0 201/* 0x00ac */ ldx [%sp+112],%o7 202/* 0x00b0 121 */ srax %g4,32,%o4 203/* 0x00b4 124 */ add %o0,%o7,%g4 204/* 0x00b8 128 */ or %g0,1,%o7 205/* 0x00bc 119 */ ldx [%sp+104],%g3 206/* 0x00c0 124 */ add %o4,%g4,%o4 207/* 0x00c4 122 */ ldx [%sp+96],%g1 208/* 0x00c8 125 */ st %g5,[%o5-4] 209/* 0x00cc 127 */ or %g0,%g3,%g4 210 .L900000112: 211/* 0x00d0 119 */ ldd [%g2+16],%f0 212/* 0x00d4 128 */ add %o7,1,%o7 213/* 0x00d8 */ add %o5,4,%o5 214/* 0x00dc */ cmp %o7,%o2 215/* 0x00e0 */ add %g2,16,%g2 216/* 0x00e4 119 */ fdtox %f0,%f0 217/* 0x00e8 */ std %f0,[%sp+104] 218/* 0x00ec 122 */ ldd [%g2+8],%f0 219/* 0x00f0 */ fdtox %f0,%f0 220/* 0x00f4 */ std %f0,[%sp+96] 221/* 0x00f8 123 */ and %g1,%o1,%g3 222/* 0x00fc */ sllx %g3,16,%g5 223/* 0x0100 120 */ and %g4,%o3,%g3 224/* 0x0104 117 */ add %g3,%g5,%g3 225/* 0x0108 124 */ srax %g1,16,%g1 226/* 0x010c 117 */ add %g3,%o4,%g3 227/* 0x0110 124 */ srax %g3,32,%o4 228/* 0x0114 */ stx %o4,[%sp+112] 229/* 0x0118 119 */ ldx [%sp+104],%g5 230/* 0x011c 121 */ srax %g4,32,%o4 231/* 0x0120 124 */ ldx [%sp+112],%g4 232/* 0x0124 */ add %g1,%g4,%g4 233/* 0x0128 122 */ ldx [%sp+96],%g1 234/* 0x012c 124 */ add %o4,%g4,%o4 235/* 0x0130 125 */ and %g3,%o3,%g3 236/* 0x0134 127 */ or %g0,%g5,%g4 237/* 0x0138 128 */ ble,pt %icc,.L900000112 238/* 0x013c */ st %g3,[%o5-4] 239 .L900000115: 240/* 0x0140 128 */ ba .L900000117 241/* 0x0144 */ sethi %hi(0xfc00),%g2 242 .L77000134: 243/* 0x0148 119 */ ldd [%g2+16],%f0 244 .L900000116: 245/* 0x014c 120 */ and %g4,%o3,%o0 246/* 0x0150 123 */ and %g1,%o1,%g3 247/* 0x0154 119 */ fdtox %f0,%f0 248/* 0x0158 120 */ add %o4,%o0,%o0 249/* 0x015c 119 */ std %f0,[%sp+104] 250/* 0x0160 128 */ add %o7,1,%o7 251/* 0x0164 123 */ sllx %g3,16,%o4 252/* 0x0168 122 */ ldd [%g2+24],%f2 253/* 0x016c 128 */ add %g2,16,%g2 254/* 0x0170 123 */ add %o0,%o4,%o0 255/* 0x0174 128 */ cmp %o7,%o2 256/* 0x0178 125 */ and %o0,%o3,%g3 257/* 0x017c 122 */ fdtox %f2,%f0 258/* 0x0180 */ std %f0,[%sp+96] 259/* 0x0184 124 */ srax %o0,32,%o0 260/* 0x0188 */ stx %o0,[%sp+112] 261/* 0x018c 121 */ srax %g4,32,%o4 262/* 0x0190 122 */ ldx [%sp+96],%o0 263/* 0x0194 124 */ srax %g1,16,%g5 264/* 0x0198 */ ldx [%sp+112],%g4 265/* 0x019c 119 */ ldx [%sp+104],%g1 266/* 0x01a0 125 */ st %g3,[%o5] 267/* 0x01a4 124 */ add %g5,%g4,%g4 268/* 0x01a8 128 */ add %o5,4,%o5 269/* 0x01ac 124 */ add %o4,%g4,%o4 270/* 0x01b0 127 */ or %g0,%g1,%g4 271/* 0x01b4 128 */ or %g0,%o0,%g1 272/* 0x01b8 */ ble,a,pt %icc,.L900000116 273/* 0x01bc */ ldd [%g2+16],%f0 274 .L77000127: 275 276! 129 ! } 277! 130 ! t1+=a&0xffffffff; 278! 131 ! t=(a>>32); 279! 132 ! t1+=(b&0xffff)<<16; 280! 133 ! i32[i]=t1&0xffffffff; 281 282/* 0x01c0 133 */ sethi %hi(0xfc00),%g2 283 .L900000117: 284/* 0x01c4 133 */ or %g0,-1,%g3 285/* 0x01c8 */ add %g2,1023,%g2 286/* 0x01cc */ srl %g3,0,%g3 287/* 0x01d0 */ and %g1,%g2,%g2 288/* 0x01d4 */ and %g4,%g3,%g4 289/* 0x01d8 */ sllx %g2,16,%g2 290/* 0x01dc */ add %o4,%g4,%g4 291/* 0x01e0 */ add %g4,%g2,%g2 292/* 0x01e4 */ sll %o7,2,%g4 293/* 0x01e8 */ and %g2,%g3,%g2 294/* 0x01ec */ st %g2,[%i0+%g4] 295/* 0x01f0 */ ret ! Result = 296/* 0x01f4 */ restore %g0,%g0,%g0 297/* 0x01f8 0 */ .type conv_d16_to_i32,2 298/* 0x01f8 */ .size conv_d16_to_i32,(.-conv_d16_to_i32) 299 300 .section ".text",#alloc,#execinstr 301/* 000000 0 */ .align 8 302! 303! CONSTANT POOL 304! 305 .L_const_seg_900000201: 306/* 000000 0 */ .word 1127219200,0 307/* 0x0008 0 */ .align 4 308/* 0x0008 */ .skip 16 309! 310! SUBROUTINE conv_i32_to_d32 311! 312! OFFSET SOURCE LINE LABEL INSTRUCTION 313 314 .global conv_i32_to_d32 315 conv_i32_to_d32: 316/* 000000 */ or %g0,%o7,%g2 317 318! 135 !} 319! 137 !void conv_i32_to_d32(double *d32, unsigned int *i32, int len) 320! 138 !{ 321! 139 !int i; 322! 141 !#pragma pipeloop(0) 323! 142 ! for(i=0;i<len;i++) d32[i]=(double)(i32[i]); 324 325/* 0x0004 142 */ cmp %o2,0 326 .L900000210: 327/* 0x0008 */ call .+8 328/* 0x000c */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g4 329/* 0x0010 142 */ or %g0,0,%o5 330/* 0x0014 138 */ add %g4,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g4 331/* 0x0018 */ or %g0,%o0,%g5 332/* 0x001c */ add %g4,%o7,%g1 333/* 0x0020 142 */ ble,pt %icc,.L77000140 334/* 0x0024 */ or %g0,%g2,%o7 335/* 0x0028 */ sethi %hi(.L_const_seg_900000201),%g2 336/* 0x002c 138 */ or %g0,%o1,%g4 337/* 0x0030 142 */ add %g2,%lo(.L_const_seg_900000201),%g2 338/* 0x0034 */ sub %o2,1,%g3 339/* 0x0038 */ ld [%g1+%g2],%g2 340/* 0x003c */ cmp %o2,9 341/* 0x0040 */ bl,pn %icc,.L77000144 342/* 0x0044 */ ldd [%g2],%f8 343/* 0x0048 */ add %o1,16,%g4 344/* 0x004c */ sub %o2,5,%g1 345/* 0x0050 */ ld [%o1],%f7 346/* 0x0054 */ or %g0,4,%o5 347/* 0x0058 */ ld [%o1+4],%f5 348/* 0x005c */ ld [%o1+8],%f3 349/* 0x0060 */ fmovs %f8,%f6 350/* 0x0064 */ ld [%o1+12],%f1 351 .L900000205: 352/* 0x0068 */ ld [%g4],%f11 353/* 0x006c */ add %o5,5,%o5 354/* 0x0070 */ add %g4,20,%g4 355/* 0x0074 */ fsubd %f6,%f8,%f6 356/* 0x0078 */ std %f6,[%g5] 357/* 0x007c */ cmp %o5,%g1 358/* 0x0080 */ add %g5,40,%g5 359/* 0x0084 */ fmovs %f8,%f4 360/* 0x0088 */ ld [%g4-16],%f7 361/* 0x008c */ fsubd %f4,%f8,%f12 362/* 0x0090 */ fmovs %f8,%f2 363/* 0x0094 */ std %f12,[%g5-32] 364/* 0x0098 */ ld [%g4-12],%f5 365/* 0x009c */ fsubd %f2,%f8,%f12 366/* 0x00a0 */ fmovs %f8,%f0 367/* 0x00a4 */ std %f12,[%g5-24] 368/* 0x00a8 */ ld [%g4-8],%f3 369/* 0x00ac */ fsubd %f0,%f8,%f12 370/* 0x00b0 */ fmovs %f8,%f10 371/* 0x00b4 */ std %f12,[%g5-16] 372/* 0x00b8 */ ld [%g4-4],%f1 373/* 0x00bc */ fsubd %f10,%f8,%f10 374/* 0x00c0 */ fmovs %f8,%f6 375/* 0x00c4 */ ble,pt %icc,.L900000205 376/* 0x00c8 */ std %f10,[%g5-8] 377 .L900000208: 378/* 0x00cc */ fmovs %f8,%f4 379/* 0x00d0 */ add %g5,32,%g5 380/* 0x00d4 */ cmp %o5,%g3 381/* 0x00d8 */ fmovs %f8,%f2 382/* 0x00dc */ fmovs %f8,%f0 383/* 0x00e0 */ fsubd %f6,%f8,%f6 384/* 0x00e4 */ std %f6,[%g5-32] 385/* 0x00e8 */ fsubd %f4,%f8,%f4 386/* 0x00ec */ std %f4,[%g5-24] 387/* 0x00f0 */ fsubd %f2,%f8,%f2 388/* 0x00f4 */ std %f2,[%g5-16] 389/* 0x00f8 */ fsubd %f0,%f8,%f0 390/* 0x00fc */ bg,pn %icc,.L77000140 391/* 0x0100 */ std %f0,[%g5-8] 392 .L77000144: 393/* 0x0104 */ ld [%g4],%f1 394 .L900000211: 395/* 0x0108 */ ldd [%g2],%f8 396/* 0x010c */ add %o5,1,%o5 397/* 0x0110 */ add %g4,4,%g4 398/* 0x0114 */ cmp %o5,%g3 399/* 0x0118 */ fmovs %f8,%f0 400/* 0x011c */ fsubd %f0,%f8,%f0 401/* 0x0120 */ std %f0,[%g5] 402/* 0x0124 */ add %g5,8,%g5 403/* 0x0128 */ ble,a,pt %icc,.L900000211 404/* 0x012c */ ld [%g4],%f1 405 .L77000140: 406/* 0x0130 */ retl ! Result = 407/* 0x0134 */ nop 408/* 0x0138 0 */ .type conv_i32_to_d32,2 409/* 0x0138 */ .size conv_i32_to_d32,(.-conv_i32_to_d32) 410 411 .section ".text",#alloc,#execinstr 412/* 000000 0 */ .align 8 413! 414! CONSTANT POOL 415! 416 .L_const_seg_900000301: 417/* 000000 0 */ .word 1127219200,0 418/* 0x0008 0 */ .align 4 419! 420! SUBROUTINE conv_i32_to_d16 421! 422! OFFSET SOURCE LINE LABEL INSTRUCTION 423 424 .global conv_i32_to_d16 425 conv_i32_to_d16: 426/* 000000 */ save %sp,-104,%sp 427/* 0x0004 */ or %g0,%i2,%o0 428 429! 143 !} 430! 146 !void conv_i32_to_d16(double *d16, unsigned int *i32, int len) 431! 147 !{ 432! 148 !int i; 433! 149 !unsigned int a; 434! 151 !#pragma pipeloop(0) 435! 152 ! for(i=0;i<len;i++) 436! 153 ! { 437! 154 ! a=i32[i]; 438! 155 ! d16[2*i]=(double)(a&0xffff); 439! 156 ! d16[2*i+1]=(double)(a>>16); 440 441/* 0x0008 156 */ sethi %hi(.L_const_seg_900000301),%g2 442 .L900000310: 443/* 0x000c */ call .+8 444/* 0x0010 */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3 445/* 0x0014 152 */ cmp %o0,0 446/* 0x0018 147 */ add %g3,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3 447/* 0x001c 152 */ ble,pt %icc,.L77000150 448/* 0x0020 */ add %g3,%o7,%o2 449/* 0x0024 */ sub %i2,1,%o5 450/* 0x0028 156 */ add %g2,%lo(.L_const_seg_900000301),%o1 451/* 0x002c 152 */ sethi %hi(0xfc00),%o0 452/* 0x0030 */ ld [%o2+%o1],%o3 453/* 0x0034 */ add %o5,1,%g2 454/* 0x0038 */ or %g0,0,%g1 455/* 0x003c */ cmp %g2,3 456/* 0x0040 */ or %g0,%i1,%o7 457/* 0x0044 */ add %o0,1023,%o4 458/* 0x0048 */ or %g0,%i0,%g3 459/* 0x004c */ bl,pn %icc,.L77000154 460/* 0x0050 */ add %o7,4,%o0 461/* 0x0054 155 */ ldd [%o3],%f0 462/* 0x0058 156 */ or %g0,1,%g1 463/* 0x005c 154 */ ld [%o0-4],%o1 464/* 0x0060 0 */ or %g0,%o0,%o7 465/* 0x0064 155 */ and %o1,%o4,%o0 466 .L900000306: 467/* 0x0068 155 */ st %o0,[%sp+96] 468/* 0x006c 156 */ add %g1,1,%g1 469/* 0x0070 */ add %g3,16,%g3 470/* 0x0074 */ cmp %g1,%o5 471/* 0x0078 */ add %o7,4,%o7 472/* 0x007c 155 */ ld [%sp+96],%f3 473/* 0x0080 */ fmovs %f0,%f2 474/* 0x0084 */ fsubd %f2,%f0,%f2 475/* 0x0088 156 */ srl %o1,16,%o0 476/* 0x008c 155 */ std %f2,[%g3-16] 477/* 0x0090 156 */ st %o0,[%sp+92] 478/* 0x0094 */ ld [%sp+92],%f3 479/* 0x0098 154 */ ld [%o7-4],%o1 480/* 0x009c 156 */ fmovs %f0,%f2 481/* 0x00a0 */ fsubd %f2,%f0,%f2 482/* 0x00a4 155 */ and %o1,%o4,%o0 483/* 0x00a8 156 */ ble,pt %icc,.L900000306 484/* 0x00ac */ std %f2,[%g3-8] 485 .L900000309: 486/* 0x00b0 155 */ st %o0,[%sp+96] 487/* 0x00b4 */ fmovs %f0,%f2 488/* 0x00b8 156 */ add %g3,16,%g3 489/* 0x00bc */ srl %o1,16,%o0 490/* 0x00c0 155 */ ld [%sp+96],%f3 491/* 0x00c4 */ fsubd %f2,%f0,%f2 492/* 0x00c8 */ std %f2,[%g3-16] 493/* 0x00cc 156 */ st %o0,[%sp+92] 494/* 0x00d0 */ fmovs %f0,%f2 495/* 0x00d4 */ ld [%sp+92],%f3 496/* 0x00d8 */ fsubd %f2,%f0,%f0 497/* 0x00dc */ std %f0,[%g3-8] 498/* 0x00e0 */ ret ! Result = 499/* 0x00e4 */ restore %g0,%g0,%g0 500 .L77000154: 501/* 0x00e8 154 */ ld [%o7],%o0 502 .L900000311: 503/* 0x00ec 155 */ and %o0,%o4,%o1 504/* 0x00f0 */ st %o1,[%sp+96] 505/* 0x00f4 156 */ add %g1,1,%g1 506/* 0x00f8 155 */ ldd [%o3],%f0 507/* 0x00fc 156 */ srl %o0,16,%o0 508/* 0x0100 */ add %o7,4,%o7 509/* 0x0104 */ cmp %g1,%o5 510/* 0x0108 155 */ fmovs %f0,%f2 511/* 0x010c */ ld [%sp+96],%f3 512/* 0x0110 */ fsubd %f2,%f0,%f2 513/* 0x0114 */ std %f2,[%g3] 514/* 0x0118 156 */ st %o0,[%sp+92] 515/* 0x011c */ fmovs %f0,%f2 516/* 0x0120 */ ld [%sp+92],%f3 517/* 0x0124 */ fsubd %f2,%f0,%f0 518/* 0x0128 */ std %f0,[%g3+8] 519/* 0x012c */ add %g3,16,%g3 520/* 0x0130 */ ble,a,pt %icc,.L900000311 521/* 0x0134 */ ld [%o7],%o0 522 .L77000150: 523/* 0x0138 */ ret ! Result = 524/* 0x013c */ restore %g0,%g0,%g0 525/* 0x0140 0 */ .type conv_i32_to_d16,2 526/* 0x0140 */ .size conv_i32_to_d16,(.-conv_i32_to_d16) 527 528 .section ".text",#alloc,#execinstr 529/* 000000 0 */ .align 8 530! 531! CONSTANT POOL 532! 533 .L_const_seg_900000401: 534/* 000000 0 */ .word 1127219200,0 535/* 0x0008 0 */ .align 4 536/* 0x0008 */ .skip 16 537! 538! SUBROUTINE conv_i32_to_d32_and_d16 539! 540! OFFSET SOURCE LINE LABEL INSTRUCTION 541 542 .global conv_i32_to_d32_and_d16 543 conv_i32_to_d32_and_d16: 544/* 000000 */ save %sp,-120,%sp 545 .L900000415: 546/* 0x0004 */ call .+8 547/* 0x0008 */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000415-.)),%g4 548 549! 157 ! } 550! 158 !} 551! 161 !void conv_i32_to_d32_and_d16(double *d32, double *d16, 552! 162 ! unsigned int *i32, int len) 553! 163 !{ 554! 164 !int i = 0; 555! 165 !unsigned int a; 556! 167 !#pragma pipeloop(0) 557! 168 !#ifdef RF_INLINE_MACROS 558! 169 ! for(;i<len-3;i+=4) 559 560/* 0x000c 169 */ sub %i3,3,%g2 561/* 0x0010 */ cmp %g2,0 562/* 0x0014 163 */ add %g4,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000415-.)),%g4 563 564! 170 ! { 565! 171 ! i16_to_d16_and_d32x4(&TwoToMinus16, &TwoTo16, &Zero, 566! 172 ! &(d16[2*i]), &(d32[i]), (float *)(&(i32[i]))); 567 568/* 0x0018 172 */ sethi %hi(Zero),%g2 569/* 0x001c 163 */ add %g4,%o7,%o4 570/* 0x0020 172 */ add %g2,%lo(Zero),%g2 571/* 0x0024 */ sethi %hi(TwoToMinus16),%g3 572/* 0x0028 */ ld [%o4+%g2],%o1 573/* 0x002c */ sethi %hi(TwoTo16),%g4 574/* 0x0030 */ add %g3,%lo(TwoToMinus16),%g2 575/* 0x0034 */ ld [%o4+%g2],%o3 576/* 0x0038 164 */ or %g0,0,%g5 577/* 0x003c 172 */ add %g4,%lo(TwoTo16),%g3 578/* 0x0040 */ ld [%o4+%g3],%o2 579/* 0x0044 163 */ or %g0,%i0,%i4 580/* 0x0048 169 */ or %g0,%i2,%o7 581/* 0x004c */ ble,pt %icc,.L900000418 582/* 0x0050 */ cmp %g5,%i3 583/* 0x0054 172 */ stx %o7,[%sp+104] 584/* 0x0058 169 */ sub %i3,4,%o5 585/* 0x005c */ or %g0,0,%g4 586/* 0x0060 */ or %g0,0,%g1 587 .L900000417: 588/* 0x0064 */ ldd [%o1],%f2 589/* 0x0068 172 */ add %i4,%g4,%g2 590/* 0x006c */ add %i1,%g1,%g3 591/* 0x0070 */ ldd [%o3],%f0 592/* 0x0074 */ add %g5,4,%g5 593/* 0x0078 */ fmovd %f2,%f14 594/* 0x007c */ ld [%o7],%f15 595/* 0x0080 */ cmp %g5,%o5 596/* 0x0084 */ fmovd %f2,%f10 597/* 0x0088 */ ld [%o7+4],%f11 598/* 0x008c */ add %o7,16,%o7 599/* 0x0090 */ ldx [%sp+104],%o0 600/* 0x0094 */ fmovd %f2,%f6 601/* 0x0098 */ stx %o7,[%sp+112] 602/* 0x009c */ fxtod %f14,%f14 603/* 0x00a0 */ ld [%o0+8],%f7 604/* 0x00a4 */ fxtod %f10,%f10 605/* 0x00a8 */ ld [%o0+12],%f3 606/* 0x00ac */ fxtod %f6,%f6 607/* 0x00b0 */ ldd [%o2],%f16 608/* 0x00b4 */ fmuld %f0,%f14,%f12 609/* 0x00b8 */ fxtod %f2,%f2 610/* 0x00bc */ fmuld %f0,%f10,%f8 611/* 0x00c0 */ std %f14,[%i4+%g4] 612/* 0x00c4 */ ldx [%sp+112],%o7 613/* 0x00c8 */ add %g4,32,%g4 614/* 0x00cc */ fmuld %f0,%f6,%f4 615/* 0x00d0 */ fdtox %f12,%f12 616/* 0x00d4 */ std %f10,[%g2+8] 617/* 0x00d8 */ fmuld %f0,%f2,%f0 618/* 0x00dc */ fdtox %f8,%f8 619/* 0x00e0 */ std %f6,[%g2+16] 620/* 0x00e4 */ std %f2,[%g2+24] 621/* 0x00e8 */ fdtox %f4,%f4 622/* 0x00ec */ fdtox %f0,%f0 623/* 0x00f0 */ fxtod %f12,%f12 624/* 0x00f4 */ std %f12,[%g3+8] 625/* 0x00f8 */ fxtod %f8,%f8 626/* 0x00fc */ std %f8,[%g3+24] 627/* 0x0100 */ fxtod %f4,%f4 628/* 0x0104 */ std %f4,[%g3+40] 629/* 0x0108 */ fxtod %f0,%f0 630/* 0x010c */ std %f0,[%g3+56] 631/* 0x0110 */ fmuld %f12,%f16,%f12 632/* 0x0114 */ fmuld %f8,%f16,%f8 633/* 0x0118 */ fmuld %f4,%f16,%f4 634/* 0x011c */ fsubd %f14,%f12,%f12 635/* 0x0120 */ std %f12,[%i1+%g1] 636/* 0x0124 */ fmuld %f0,%f16,%f0 637/* 0x0128 */ fsubd %f10,%f8,%f8 638/* 0x012c */ std %f8,[%g3+16] 639/* 0x0130 */ add %g1,64,%g1 640/* 0x0134 */ fsubd %f6,%f4,%f4 641/* 0x0138 */ std %f4,[%g3+32] 642/* 0x013c */ fsubd %f2,%f0,%f0 643/* 0x0140 */ std %f0,[%g3+48] 644/* 0x0144 */ ble,a,pt %icc,.L900000417 645/* 0x0148 */ stx %o7,[%sp+104] 646 .L77000159: 647 648! 173 ! } 649! 174 !#endif 650! 175 ! for(;i<len;i++) 651 652/* 0x014c 175 */ cmp %g5,%i3 653 .L900000418: 654/* 0x0150 175 */ bge,pt %icc,.L77000164 655/* 0x0154 */ nop 656 657! 176 ! { 658! 177 ! a=i32[i]; 659! 178 ! d32[i]=(double)(i32[i]); 660! 179 ! d16[2*i]=(double)(a&0xffff); 661! 180 ! d16[2*i+1]=(double)(a>>16); 662 663/* 0x0158 180 */ sethi %hi(.L_const_seg_900000401),%g2 664/* 0x015c */ add %g2,%lo(.L_const_seg_900000401),%o1 665/* 0x0160 175 */ sethi %hi(0xfc00),%o0 666/* 0x0164 */ ld [%o4+%o1],%o2 667/* 0x0168 */ sll %g5,2,%o3 668/* 0x016c */ sub %i3,%g5,%g3 669/* 0x0170 */ sll %g5,3,%g2 670/* 0x0174 */ add %o0,1023,%o4 671/* 0x0178 178 */ ldd [%o2],%f0 672/* 0x017c */ add %i2,%o3,%o0 673/* 0x0180 175 */ cmp %g3,3 674/* 0x0184 */ add %i4,%g2,%o3 675/* 0x0188 */ sub %i3,1,%o1 676/* 0x018c */ sll %g5,4,%g4 677/* 0x0190 */ bl,pn %icc,.L77000161 678/* 0x0194 */ add %i1,%g4,%o5 679/* 0x0198 178 */ ld [%o0],%f3 680/* 0x019c 180 */ add %o3,8,%o3 681/* 0x01a0 177 */ ld [%o0],%o7 682/* 0x01a4 180 */ add %o5,16,%o5 683/* 0x01a8 */ add %g5,1,%g5 684/* 0x01ac 178 */ fmovs %f0,%f2 685/* 0x01b0 180 */ add %o0,4,%o0 686/* 0x01b4 179 */ and %o7,%o4,%g1 687/* 0x01b8 178 */ fsubd %f2,%f0,%f2 688/* 0x01bc */ std %f2,[%o3-8] 689/* 0x01c0 180 */ srl %o7,16,%o7 690/* 0x01c4 179 */ st %g1,[%sp+96] 691/* 0x01c8 */ fmovs %f0,%f2 692/* 0x01cc */ ld [%sp+96],%f3 693/* 0x01d0 */ fsubd %f2,%f0,%f2 694/* 0x01d4 */ std %f2,[%o5-16] 695/* 0x01d8 180 */ st %o7,[%sp+92] 696/* 0x01dc */ fmovs %f0,%f2 697/* 0x01e0 */ ld [%sp+92],%f3 698/* 0x01e4 */ fsubd %f2,%f0,%f2 699/* 0x01e8 */ std %f2,[%o5-8] 700 .L900000411: 701/* 0x01ec 178 */ ld [%o0],%f3 702/* 0x01f0 180 */ add %g5,2,%g5 703/* 0x01f4 */ add %o5,32,%o5 704/* 0x01f8 177 */ ld [%o0],%o7 705/* 0x01fc 180 */ cmp %g5,%o1 706/* 0x0200 */ add %o3,16,%o3 707/* 0x0204 178 */ fmovs %f0,%f2 708/* 0x0208 */ fsubd %f2,%f0,%f2 709/* 0x020c */ std %f2,[%o3-16] 710/* 0x0210 179 */ and %o7,%o4,%g1 711/* 0x0214 */ st %g1,[%sp+96] 712/* 0x0218 */ ld [%sp+96],%f3 713/* 0x021c */ fmovs %f0,%f2 714/* 0x0220 */ fsubd %f2,%f0,%f2 715/* 0x0224 180 */ srl %o7,16,%o7 716/* 0x0228 179 */ std %f2,[%o5-32] 717/* 0x022c 180 */ st %o7,[%sp+92] 718/* 0x0230 */ ld [%sp+92],%f3 719/* 0x0234 */ fmovs %f0,%f2 720/* 0x0238 */ fsubd %f2,%f0,%f2 721/* 0x023c */ std %f2,[%o5-24] 722/* 0x0240 */ add %o0,4,%o0 723/* 0x0244 178 */ ld [%o0],%f3 724/* 0x0248 177 */ ld [%o0],%o7 725/* 0x024c 178 */ fmovs %f0,%f2 726/* 0x0250 */ fsubd %f2,%f0,%f2 727/* 0x0254 */ std %f2,[%o3-8] 728/* 0x0258 179 */ and %o7,%o4,%g1 729/* 0x025c */ st %g1,[%sp+96] 730/* 0x0260 */ ld [%sp+96],%f3 731/* 0x0264 */ fmovs %f0,%f2 732/* 0x0268 */ fsubd %f2,%f0,%f2 733/* 0x026c 180 */ srl %o7,16,%o7 734/* 0x0270 179 */ std %f2,[%o5-16] 735/* 0x0274 180 */ st %o7,[%sp+92] 736/* 0x0278 */ ld [%sp+92],%f3 737/* 0x027c */ fmovs %f0,%f2 738/* 0x0280 */ fsubd %f2,%f0,%f2 739/* 0x0284 */ std %f2,[%o5-8] 740/* 0x0288 */ bl,pt %icc,.L900000411 741/* 0x028c */ add %o0,4,%o0 742 .L900000414: 743/* 0x0290 180 */ cmp %g5,%i3 744/* 0x0294 */ bge,pn %icc,.L77000164 745/* 0x0298 */ nop 746 .L77000161: 747/* 0x029c 178 */ ld [%o0],%f3 748 .L900000416: 749/* 0x02a0 178 */ ldd [%o2],%f0 750/* 0x02a4 180 */ add %g5,1,%g5 751/* 0x02a8 177 */ ld [%o0],%o1 752/* 0x02ac 180 */ add %o0,4,%o0 753/* 0x02b0 */ cmp %g5,%i3 754/* 0x02b4 178 */ fmovs %f0,%f2 755/* 0x02b8 179 */ and %o1,%o4,%o7 756/* 0x02bc 178 */ fsubd %f2,%f0,%f2 757/* 0x02c0 */ std %f2,[%o3] 758/* 0x02c4 180 */ srl %o1,16,%o1 759/* 0x02c8 179 */ st %o7,[%sp+96] 760/* 0x02cc 180 */ add %o3,8,%o3 761/* 0x02d0 179 */ fmovs %f0,%f2 762/* 0x02d4 */ ld [%sp+96],%f3 763/* 0x02d8 */ fsubd %f2,%f0,%f2 764/* 0x02dc */ std %f2,[%o5] 765/* 0x02e0 180 */ st %o1,[%sp+92] 766/* 0x02e4 */ fmovs %f0,%f2 767/* 0x02e8 */ ld [%sp+92],%f3 768/* 0x02ec */ fsubd %f2,%f0,%f0 769/* 0x02f0 */ std %f0,[%o5+8] 770/* 0x02f4 */ add %o5,16,%o5 771/* 0x02f8 */ bl,a,pt %icc,.L900000416 772/* 0x02fc */ ld [%o0],%f3 773 .L77000164: 774/* 0x0300 */ ret ! Result = 775/* 0x0304 */ restore %g0,%g0,%g0 776/* 0x0308 0 */ .type conv_i32_to_d32_and_d16,2 777/* 0x0308 */ .size conv_i32_to_d32_and_d16,(.-conv_i32_to_d32_and_d16) 778 779 .section ".text",#alloc,#execinstr 780/* 000000 0 */ .align 4 781! 782! SUBROUTINE adjust_montf_result 783! 784! OFFSET SOURCE LINE LABEL INSTRUCTION 785 786 .global adjust_montf_result 787 adjust_montf_result: 788/* 000000 */ or %g0,%o2,%g5 789 790! 181 ! } 791! 182 !} 792! 185 !void adjust_montf_result(unsigned int *i32, unsigned int *nint, int len) 793! 186 !{ 794! 187 !long long acc; 795! 188 !int i; 796! 190 ! if(i32[len]>0) i=-1; 797 798/* 0x0004 190 */ or %g0,-1,%g4 799/* 0x0008 */ sll %o2,2,%g1 800/* 0x000c */ ld [%o0+%g1],%g1 801/* 0x0010 */ cmp %g1,0 802/* 0x0014 */ bleu,pn %icc,.L77000175 803/* 0x0018 */ or %g0,%o1,%o3 804/* 0x001c */ ba .L900000511 805/* 0x0020 */ cmp %g4,0 806 .L77000175: 807 808! 191 ! else 809! 192 ! { 810! 193 ! for(i=len-1; i>=0; i--) 811 812/* 0x0024 193 */ sub %o2,1,%g4 813/* 0x0028 */ sll %g4,2,%g1 814/* 0x002c */ cmp %g4,0 815/* 0x0030 */ bl,pt %icc,.L900000511 816/* 0x0034 */ cmp %g4,0 817/* 0x0038 */ add %o1,%g1,%g2 818 819! 194 ! { 820! 195 ! if(i32[i]!=nint[i]) break; 821 822/* 0x003c 195 */ ld [%g2],%o5 823/* 0x0040 193 */ add %o0,%g1,%g3 824 .L900000510: 825/* 0x0044 195 */ ld [%g3],%o2 826/* 0x0048 */ sub %g4,1,%g1 827/* 0x004c */ sub %g2,4,%g2 828/* 0x0050 */ sub %g3,4,%g3 829/* 0x0054 */ cmp %o2,%o5 830/* 0x0058 */ bne,pn %icc,.L77000182 831/* 0x005c */ nop 832/* 0x0060 0 */ or %g0,%g1,%g4 833/* 0x0064 195 */ cmp %g1,0 834/* 0x0068 */ bge,a,pt %icc,.L900000510 835/* 0x006c */ ld [%g2],%o5 836 .L77000182: 837 838! 196 ! } 839! 197 ! } 840! 198 ! if((i<0)||(i32[i]>nint[i])) 841 842/* 0x0070 198 */ cmp %g4,0 843 .L900000511: 844/* 0x0074 198 */ bl,pn %icc,.L77000198 845/* 0x0078 */ sll %g4,2,%g2 846/* 0x007c */ ld [%o1+%g2],%g1 847/* 0x0080 */ ld [%o0+%g2],%g2 848/* 0x0084 */ cmp %g2,%g1 849/* 0x0088 */ bleu,pt %icc,.L77000191 850/* 0x008c */ nop 851 .L77000198: 852 853! 199 ! { 854! 200 ! acc=0; 855! 201 ! for(i=0;i<len;i++) 856 857/* 0x0090 201 */ cmp %g5,0 858/* 0x0094 */ ble,pt %icc,.L77000191 859/* 0x0098 */ nop 860/* 0x009c */ or %g0,%g5,%g1 861/* 0x00a0 198 */ or %g0,-1,%g2 862/* 0x00a4 */ srl %g2,0,%g3 863/* 0x00a8 */ sub %g5,1,%g4 864/* 0x00ac 200 */ or %g0,0,%g5 865/* 0x00b0 201 */ or %g0,0,%o5 866/* 0x00b4 198 */ or %g0,%o0,%o4 867/* 0x00b8 */ cmp %g1,3 868/* 0x00bc 201 */ bl,pn %icc,.L77000199 869/* 0x00c0 */ add %o0,8,%g1 870/* 0x00c4 */ add %o1,4,%g2 871 872! 202 ! { 873! 203 ! acc=acc+(unsigned long long)(i32[i])-(unsigned long long)(nint[i]); 874 875/* 0x00c8 203 */ ld [%o0],%o2 876/* 0x00cc */ ld [%o1],%o1 877/* 0x00d0 0 */ or %g0,%g1,%o4 878/* 0x00d4 */ or %g0,%g2,%o3 879/* 0x00d8 203 */ ld [%o0+4],%g1 880 881! 204 ! i32[i]=acc&0xffffffff; 882! 205 ! acc=acc>>32; 883 884/* 0x00dc 205 */ or %g0,2,%o5 885/* 0x00e0 201 */ sub %o2,%o1,%o2 886/* 0x00e4 */ or %g0,%o2,%g5 887/* 0x00e8 204 */ and %o2,%g3,%o2 888/* 0x00ec */ st %o2,[%o0] 889/* 0x00f0 205 */ srax %g5,32,%g5 890 .L900000505: 891/* 0x00f4 203 */ ld [%o3],%o2 892/* 0x00f8 205 */ add %o5,1,%o5 893/* 0x00fc */ add %o3,4,%o3 894/* 0x0100 */ cmp %o5,%g4 895/* 0x0104 */ add %o4,4,%o4 896/* 0x0108 201 */ sub %g1,%o2,%g1 897/* 0x010c */ add %g1,%g5,%g5 898/* 0x0110 204 */ and %g5,%g3,%o2 899/* 0x0114 203 */ ld [%o4-4],%g1 900/* 0x0118 204 */ st %o2,[%o4-8] 901/* 0x011c 205 */ ble,pt %icc,.L900000505 902/* 0x0120 */ srax %g5,32,%g5 903 .L900000508: 904/* 0x0124 203 */ ld [%o3],%g2 905/* 0x0128 201 */ sub %g1,%g2,%g1 906/* 0x012c */ add %g1,%g5,%g1 907/* 0x0130 204 */ and %g1,%g3,%g2 908/* 0x0134 */ retl ! Result = 909/* 0x0138 */ st %g2,[%o4-4] 910 .L77000199: 911/* 0x013c 203 */ ld [%o4],%g1 912 .L900000509: 913/* 0x0140 203 */ ld [%o3],%g2 914/* 0x0144 */ add %g5,%g1,%g1 915/* 0x0148 205 */ add %o5,1,%o5 916/* 0x014c */ add %o3,4,%o3 917/* 0x0150 */ cmp %o5,%g4 918/* 0x0154 203 */ sub %g1,%g2,%g1 919/* 0x0158 204 */ and %g1,%g3,%g2 920/* 0x015c */ st %g2,[%o4] 921/* 0x0160 205 */ add %o4,4,%o4 922/* 0x0164 */ srax %g1,32,%g5 923/* 0x0168 */ ble,a,pt %icc,.L900000509 924/* 0x016c */ ld [%o4],%g1 925 .L77000191: 926/* 0x0170 */ retl ! Result = 927/* 0x0174 */ nop 928/* 0x0178 0 */ .type adjust_montf_result,2 929/* 0x0178 */ .size adjust_montf_result,(.-adjust_montf_result) 930 931 .section ".text",#alloc,#execinstr 932/* 000000 0 */ .align 4 933/* 000000 */ .skip 16 934! 935! SUBROUTINE mont_mulf_noconv 936! 937! OFFSET SOURCE LINE LABEL INSTRUCTION 938 939 .global mont_mulf_noconv 940 mont_mulf_noconv: 941/* 000000 */ save %sp,-144,%sp 942 .L900000646: 943/* 0x0004 */ call .+8 944/* 0x0008 */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000646-.)),%g5 945 946! 206 ! } 947! 207 ! } 948! 208 !} 949! 213 !/* 950! 214 !** the lengths of the input arrays should be at least the following: 951! 215 !** result[nlen+1], dm1[nlen], dm2[2*nlen+1], dt[4*nlen+2], dn[nlen], nint[nlen] 952! 216 !** all of them should be different from one another 953! 217 !** 954! 218 !*/ 955! 219 !void mont_mulf_noconv(unsigned int *result, 956! 220 ! double *dm1, double *dm2, double *dt, 957! 221 ! double *dn, unsigned int *nint, 958! 222 ! int nlen, double dn0) 959! 223 !{ 960! 224 ! int i, j, jj; 961! 225 ! int tmp; 962! 226 ! double digit, m2j, nextm2j, a, b; 963! 227 ! double *dptmp, *pdm1, *pdm2, *pdn, *pdtj, pdn_0, pdm1_0; 964! 229 ! pdm1=&(dm1[0]); 965! 230 ! pdm2=&(dm2[0]); 966! 231 ! pdn=&(dn[0]); 967! 232 ! pdm2[2*nlen]=Zero; 968 969/* 0x000c 232 */ ld [%fp+92],%o1 970/* 0x0010 */ sethi %hi(Zero),%g2 971/* 0x0014 223 */ ldd [%fp+96],%f2 972/* 0x0018 */ add %g5,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000646-.)),%g5 973/* 0x001c 232 */ add %g2,%lo(Zero),%g2 974/* 0x0020 223 */ st %i0,[%fp+68] 975/* 0x0024 */ add %g5,%o7,%o3 976 977! 234 ! if (nlen!=16) 978! 235 ! { 979! 236 ! for(i=0;i<4*nlen+2;i++) dt[i]=Zero; 980! 238 ! a=dt[0]=pdm1[0]*pdm2[0]; 981! 239 ! digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16); 982 983/* 0x0028 239 */ sethi %hi(TwoToMinus16),%g3 984/* 0x002c 232 */ ld [%o3+%g2],%l0 985/* 0x0030 239 */ sethi %hi(TwoTo16),%g4 986/* 0x0034 223 */ or %g0,%i2,%o2 987/* 0x0038 */ fmovd %f2,%f16 988/* 0x003c */ st %i5,[%fp+88] 989/* 0x0040 239 */ add %g3,%lo(TwoToMinus16),%g2 990/* 0x0044 223 */ or %g0,%i1,%i2 991/* 0x0048 232 */ ldd [%l0],%f0 992/* 0x004c 239 */ add %g4,%lo(TwoTo16),%g3 993/* 0x0050 223 */ or %g0,%i3,%o0 994/* 0x0054 232 */ sll %o1,4,%g4 995/* 0x0058 239 */ ld [%o3+%g2],%g5 996/* 0x005c 223 */ or %g0,%i3,%i1 997/* 0x0060 239 */ ld [%o3+%g3],%g1 998/* 0x0064 232 */ or %g0,%o1,%i0 999/* 0x0068 */ or %g0,%o2,%i3 1000/* 0x006c 234 */ cmp %o1,16 1001/* 0x0070 */ be,pn %icc,.L77000279 1002/* 0x0074 */ std %f0,[%o2+%g4] 1003/* 0x0078 236 */ sll %o1,2,%g2 1004/* 0x007c */ or %g0,%o0,%o3 1005/* 0x0080 232 */ sll %o1,1,%o1 1006/* 0x0084 236 */ add %g2,2,%o2 1007/* 0x0088 */ cmp %o2,0 1008/* 0x008c */ ble,a,pt %icc,.L900000660 1009/* 0x0090 */ ldd [%i2],%f0 1010 1011! 241 ! pdtj=&(dt[0]); 1012! 242 ! for(j=jj=0;j<2*nlen;j++,jj++,pdtj++) 1013! 243 ! { 1014! 244 ! m2j=pdm2[j]; 1015! 245 ! a=pdtj[0]+pdn[0]*digit; 1016! 246 ! b=pdtj[1]+pdm1[0]*pdm2[j+1]+a*TwoToMinus16; 1017! 247 ! pdtj[1]=b; 1018! 249 !#pragma pipeloop(0) 1019! 250 ! for(i=1;i<nlen;i++) 1020! 251 ! { 1021! 252 ! pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit; 1022! 253 ! } 1023! 254 ! if((jj==30)) {cleanup(dt,j/2+1,2*nlen+1); jj=0;} 1024! 255 ! 1025! 256 ! digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16); 1026! 257 ! } 1027! 258 ! } 1028! 259 ! else 1029! 260 ! { 1030! 261 ! a=dt[0]=pdm1[0]*pdm2[0]; 1031! 263 ! dt[65]= dt[64]= dt[63]= dt[62]= dt[61]= dt[60]= 1032! 264 ! dt[59]= dt[58]= dt[57]= dt[56]= dt[55]= dt[54]= 1033! 265 ! dt[53]= dt[52]= dt[51]= dt[50]= dt[49]= dt[48]= 1034! 266 ! dt[47]= dt[46]= dt[45]= dt[44]= dt[43]= dt[42]= 1035! 267 ! dt[41]= dt[40]= dt[39]= dt[38]= dt[37]= dt[36]= 1036! 268 ! dt[35]= dt[34]= dt[33]= dt[32]= dt[31]= dt[30]= 1037! 269 ! dt[29]= dt[28]= dt[27]= dt[26]= dt[25]= dt[24]= 1038! 270 ! dt[23]= dt[22]= dt[21]= dt[20]= dt[19]= dt[18]= 1039! 271 ! dt[17]= dt[16]= dt[15]= dt[14]= dt[13]= dt[12]= 1040! 272 ! dt[11]= dt[10]= dt[ 9]= dt[ 8]= dt[ 7]= dt[ 6]= 1041! 273 ! dt[ 5]= dt[ 4]= dt[ 3]= dt[ 2]= dt[ 1]=Zero; 1042! 275 ! pdn_0=pdn[0]; 1043! 276 ! pdm1_0=pdm1[0]; 1044! 278 ! digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16); 1045! 279 ! pdtj=&(dt[0]); 1046! 281 ! for(j=0;j<32;j++,pdtj++) 1047 1048/* 0x0094 281 */ add %g2,2,%o0 1049/* 0x0098 236 */ add %g2,1,%o2 1050/* 0x009c 281 */ cmp %o0,3 1051/* 0x00a0 */ bl,pn %icc,.L77000280 1052/* 0x00a4 */ or %g0,1,%o0 1053/* 0x00a8 */ add %o3,8,%o3 1054/* 0x00ac */ or %g0,1,%o4 1055/* 0x00b0 */ std %f0,[%o3-8] 1056 .L900000630: 1057/* 0x00b4 */ std %f0,[%o3] 1058/* 0x00b8 */ add %o4,2,%o4 1059/* 0x00bc */ add %o3,16,%o3 1060/* 0x00c0 */ cmp %o4,%g2 1061/* 0x00c4 */ ble,pt %icc,.L900000630 1062/* 0x00c8 */ std %f0,[%o3-8] 1063 .L900000633: 1064/* 0x00cc */ cmp %o4,%o2 1065/* 0x00d0 */ bg,pn %icc,.L77000285 1066/* 0x00d4 */ add %o4,1,%o0 1067 .L77000280: 1068/* 0x00d8 */ std %f0,[%o3] 1069 .L900000659: 1070/* 0x00dc */ ldd [%l0],%f0 1071/* 0x00e0 */ cmp %o0,%o2 1072/* 0x00e4 */ add %o3,8,%o3 1073/* 0x00e8 */ add %o0,1,%o0 1074/* 0x00ec */ ble,a,pt %icc,.L900000659 1075/* 0x00f0 */ std %f0,[%o3] 1076 .L77000285: 1077/* 0x00f4 238 */ ldd [%i2],%f0 1078 .L900000660: 1079/* 0x00f8 238 */ ldd [%i3],%f2 1080/* 0x00fc */ add %o1,1,%o2 1081/* 0x0100 242 */ cmp %o1,0 1082/* 0x0104 */ sll %o2,1,%o0 1083/* 0x0108 */ sub %o1,1,%o1 1084/* 0x010c 238 */ fmuld %f0,%f2,%f0 1085/* 0x0110 */ std %f0,[%i1] 1086/* 0x0114 0 */ or %g0,0,%l1 1087/* 0x0118 */ ldd [%l0],%f6 1088/* 0x011c */ or %g0,0,%g4 1089/* 0x0120 */ or %g0,%o2,%i5 1090/* 0x0124 */ ldd [%g5],%f2 1091/* 0x0128 */ or %g0,%o1,%g3 1092/* 0x012c */ or %g0,%o0,%o3 1093/* 0x0130 */ fdtox %f0,%f0 1094/* 0x0134 */ ldd [%g1],%f4 1095/* 0x0138 246 */ add %i3,8,%o4 1096/* 0x013c */ or %g0,0,%l2 1097/* 0x0140 */ or %g0,%i1,%o5 1098/* 0x0144 */ sub %i0,1,%o7 1099/* 0x0148 */ fmovs %f6,%f0 1100/* 0x014c */ fxtod %f0,%f0 1101/* 0x0150 239 */ fmuld %f0,%f16,%f0 1102/* 0x0154 */ fmuld %f0,%f2,%f2 1103/* 0x0158 */ fdtox %f2,%f2 1104/* 0x015c */ fxtod %f2,%f2 1105/* 0x0160 */ fmuld %f2,%f4,%f2 1106/* 0x0164 */ fsubd %f0,%f2,%f22 1107/* 0x0168 242 */ ble,pt %icc,.L900000653 1108/* 0x016c */ sll %i0,4,%g2 1109/* 0x0170 246 */ ldd [%i4],%f0 1110 .L900000654: 1111/* 0x0174 246 */ fmuld %f0,%f22,%f8 1112/* 0x0178 */ ldd [%i2],%f0 1113/* 0x017c 250 */ cmp %i0,1 1114/* 0x0180 246 */ ldd [%o4+%l2],%f6 1115/* 0x0184 */ add %i2,8,%o0 1116/* 0x0188 250 */ or %g0,1,%o1 1117/* 0x018c 246 */ ldd [%o5],%f2 1118/* 0x0190 */ add %o5,16,%l3 1119/* 0x0194 */ fmuld %f0,%f6,%f6 1120/* 0x0198 */ ldd [%g5],%f4 1121/* 0x019c */ faddd %f2,%f8,%f2 1122/* 0x01a0 */ ldd [%o5+8],%f0 1123/* 0x01a4 244 */ ldd [%i3+%l2],%f20 1124/* 0x01a8 246 */ faddd %f0,%f6,%f0 1125/* 0x01ac */ fmuld %f2,%f4,%f2 1126/* 0x01b0 */ faddd %f0,%f2,%f18 1127/* 0x01b4 247 */ std %f18,[%o5+8] 1128/* 0x01b8 250 */ ble,pt %icc,.L900000658 1129/* 0x01bc */ srl %g4,31,%g2 1130/* 0x01c0 */ cmp %o7,7 1131/* 0x01c4 246 */ add %i4,8,%g2 1132/* 0x01c8 250 */ bl,pn %icc,.L77000284 1133/* 0x01cc */ add %g2,24,%o2 1134/* 0x01d0 252 */ ldd [%o0+24],%f12 1135/* 0x01d4 */ add %o5,48,%l3 1136/* 0x01d8 */ ldd [%o0],%f2 1137/* 0x01dc 0 */ or %g0,%o2,%g2 1138/* 0x01e0 250 */ sub %o7,2,%o2 1139/* 0x01e4 252 */ ldd [%g2-24],%f0 1140/* 0x01e8 */ or %g0,5,%o1 1141/* 0x01ec */ ldd [%o0+8],%f6 1142/* 0x01f0 */ fmuld %f2,%f20,%f2 1143/* 0x01f4 */ ldd [%o0+16],%f14 1144/* 0x01f8 */ fmuld %f0,%f22,%f4 1145/* 0x01fc */ add %o0,32,%o0 1146/* 0x0200 */ ldd [%g2-16],%f8 1147/* 0x0204 */ fmuld %f6,%f20,%f10 1148/* 0x0208 */ ldd [%o5+16],%f0 1149/* 0x020c */ ldd [%g2-8],%f6 1150/* 0x0210 */ faddd %f2,%f4,%f4 1151/* 0x0214 */ ldd [%o5+32],%f2 1152 .L900000642: 1153/* 0x0218 252 */ ldd [%g2],%f24 1154/* 0x021c */ add %o1,3,%o1 1155/* 0x0220 */ add %g2,24,%g2 1156/* 0x0224 */ fmuld %f8,%f22,%f8 1157/* 0x0228 */ ldd [%l3],%f28 1158/* 0x022c */ cmp %o1,%o2 1159/* 0x0230 */ add %o0,24,%o0 1160/* 0x0234 */ ldd [%o0-24],%f26 1161/* 0x0238 */ faddd %f0,%f4,%f0 1162/* 0x023c */ add %l3,48,%l3 1163/* 0x0240 */ faddd %f10,%f8,%f10 1164/* 0x0244 */ fmuld %f14,%f20,%f4 1165/* 0x0248 */ std %f0,[%l3-80] 1166/* 0x024c */ ldd [%g2-16],%f8 1167/* 0x0250 */ fmuld %f6,%f22,%f6 1168/* 0x0254 */ ldd [%l3-32],%f0 1169/* 0x0258 */ ldd [%o0-16],%f14 1170/* 0x025c */ faddd %f2,%f10,%f2 1171/* 0x0260 */ faddd %f4,%f6,%f10 1172/* 0x0264 */ fmuld %f12,%f20,%f4 1173/* 0x0268 */ std %f2,[%l3-64] 1174/* 0x026c */ ldd [%g2-8],%f6 1175/* 0x0270 */ fmuld %f24,%f22,%f24 1176/* 0x0274 */ ldd [%l3-16],%f2 1177/* 0x0278 */ ldd [%o0-8],%f12 1178/* 0x027c */ faddd %f28,%f10,%f10 1179/* 0x0280 */ std %f10,[%l3-48] 1180/* 0x0284 */ fmuld %f26,%f20,%f10 1181/* 0x0288 */ ble,pt %icc,.L900000642 1182/* 0x028c */ faddd %f4,%f24,%f4 1183 .L900000645: 1184/* 0x0290 252 */ fmuld %f8,%f22,%f28 1185/* 0x0294 */ ldd [%g2],%f24 1186/* 0x0298 */ faddd %f0,%f4,%f26 1187/* 0x029c */ fmuld %f12,%f20,%f8 1188/* 0x02a0 */ add %l3,32,%l3 1189/* 0x02a4 */ cmp %o1,%o7 1190/* 0x02a8 */ fmuld %f14,%f20,%f14 1191/* 0x02ac */ ldd [%l3-32],%f4 1192/* 0x02b0 */ add %g2,8,%g2 1193/* 0x02b4 */ faddd %f10,%f28,%f12 1194/* 0x02b8 */ fmuld %f6,%f22,%f6 1195/* 0x02bc */ ldd [%l3-16],%f0 1196/* 0x02c0 */ fmuld %f24,%f22,%f10 1197/* 0x02c4 */ std %f26,[%l3-64] 1198/* 0x02c8 */ faddd %f2,%f12,%f2 1199/* 0x02cc */ std %f2,[%l3-48] 1200/* 0x02d0 */ faddd %f14,%f6,%f6 1201/* 0x02d4 */ faddd %f8,%f10,%f2 1202/* 0x02d8 */ faddd %f4,%f6,%f4 1203/* 0x02dc */ std %f4,[%l3-32] 1204/* 0x02e0 */ faddd %f0,%f2,%f0 1205/* 0x02e4 */ bg,pn %icc,.L77000213 1206/* 0x02e8 */ std %f0,[%l3-16] 1207 .L77000284: 1208/* 0x02ec 252 */ ldd [%o0],%f0 1209 .L900000657: 1210/* 0x02f0 252 */ ldd [%g2],%f4 1211/* 0x02f4 */ fmuld %f0,%f20,%f2 1212/* 0x02f8 */ add %o1,1,%o1 1213/* 0x02fc */ ldd [%l3],%f0 1214/* 0x0300 */ add %o0,8,%o0 1215/* 0x0304 */ add %g2,8,%g2 1216/* 0x0308 */ fmuld %f4,%f22,%f4 1217/* 0x030c */ cmp %o1,%o7 1218/* 0x0310 */ faddd %f2,%f4,%f2 1219/* 0x0314 */ faddd %f0,%f2,%f0 1220/* 0x0318 */ std %f0,[%l3] 1221/* 0x031c */ add %l3,16,%l3 1222/* 0x0320 */ ble,a,pt %icc,.L900000657 1223/* 0x0324 */ ldd [%o0],%f0 1224 .L77000213: 1225/* 0x0328 */ srl %g4,31,%g2 1226 .L900000658: 1227/* 0x032c 254 */ cmp %l1,30 1228/* 0x0330 */ bne,a,pt %icc,.L900000656 1229/* 0x0334 */ fdtox %f18,%f0 1230/* 0x0338 */ add %g4,%g2,%g2 1231/* 0x033c */ sra %g2,1,%o0 1232/* 0x0340 281 */ ldd [%l0],%f0 1233/* 0x0344 */ sll %i5,1,%o2 1234/* 0x0348 */ add %o0,1,%g2 1235/* 0x034c */ sll %g2,1,%o0 1236/* 0x0350 254 */ sub %o2,1,%o2 1237/* 0x0354 281 */ fmovd %f0,%f2 1238/* 0x0358 */ sll %g2,4,%o1 1239/* 0x035c */ cmp %o0,%o3 1240/* 0x0360 */ bge,pt %icc,.L77000215 1241/* 0x0364 */ or %g0,0,%l1 1242/* 0x0368 254 */ add %i1,%o1,%o1 1243/* 0x036c 281 */ ldd [%o1],%f6 1244 .L900000655: 1245/* 0x0370 */ fdtox %f6,%f10 1246/* 0x0374 */ ldd [%o1+8],%f4 1247/* 0x0378 */ add %o0,2,%o0 1248/* 0x037c */ ldd [%l0],%f12 1249/* 0x0380 */ fdtox %f6,%f6 1250/* 0x0384 */ cmp %o0,%o2 1251/* 0x0388 */ fdtox %f4,%f8 1252/* 0x038c */ fdtox %f4,%f4 1253/* 0x0390 */ fmovs %f12,%f10 1254/* 0x0394 */ fmovs %f12,%f8 1255/* 0x0398 */ fxtod %f10,%f10 1256/* 0x039c */ fxtod %f8,%f8 1257/* 0x03a0 */ faddd %f10,%f2,%f2 1258/* 0x03a4 */ std %f2,[%o1] 1259/* 0x03a8 */ faddd %f8,%f0,%f0 1260/* 0x03ac */ std %f0,[%o1+8] 1261/* 0x03b0 */ add %o1,16,%o1 1262/* 0x03b4 */ fitod %f6,%f2 1263/* 0x03b8 */ fitod %f4,%f0 1264/* 0x03bc */ ble,a,pt %icc,.L900000655 1265/* 0x03c0 */ ldd [%o1],%f6 1266 .L77000233: 1267/* 0x03c4 */ or %g0,0,%l1 1268 .L77000215: 1269/* 0x03c8 */ fdtox %f18,%f0 1270 .L900000656: 1271/* 0x03cc */ ldd [%l0],%f6 1272/* 0x03d0 256 */ add %g4,1,%g4 1273/* 0x03d4 */ add %l2,8,%l2 1274/* 0x03d8 */ ldd [%g5],%f2 1275/* 0x03dc */ add %l1,1,%l1 1276/* 0x03e0 */ add %o5,8,%o5 1277/* 0x03e4 */ fmovs %f6,%f0 1278/* 0x03e8 */ ldd [%g1],%f4 1279/* 0x03ec */ cmp %g4,%g3 1280/* 0x03f0 */ fxtod %f0,%f0 1281/* 0x03f4 */ fmuld %f0,%f16,%f0 1282/* 0x03f8 */ fmuld %f0,%f2,%f2 1283/* 0x03fc */ fdtox %f2,%f2 1284/* 0x0400 */ fxtod %f2,%f2 1285/* 0x0404 */ fmuld %f2,%f4,%f2 1286/* 0x0408 */ fsubd %f0,%f2,%f22 1287/* 0x040c */ ble,a,pt %icc,.L900000654 1288/* 0x0410 */ ldd [%i4],%f0 1289 .L900000629: 1290/* 0x0414 256 */ ba .L900000653 1291/* 0x0418 */ sll %i0,4,%g2 1292 .L77000279: 1293/* 0x041c 261 */ ldd [%o2],%f6 1294/* 0x0420 279 */ or %g0,%o0,%o4 1295/* 0x0424 281 */ or %g0,0,%o3 1296/* 0x0428 261 */ ldd [%i2],%f4 1297/* 0x042c 273 */ std %f0,[%o0+8] 1298/* 0x0430 */ std %f0,[%o0+16] 1299/* 0x0434 261 */ fmuld %f4,%f6,%f4 1300/* 0x0438 */ std %f4,[%o0] 1301/* 0x043c 273 */ std %f0,[%o0+24] 1302/* 0x0440 */ std %f0,[%o0+32] 1303/* 0x0444 */ fdtox %f4,%f4 1304/* 0x0448 */ std %f0,[%o0+40] 1305/* 0x044c */ std %f0,[%o0+48] 1306/* 0x0450 */ std %f0,[%o0+56] 1307/* 0x0454 */ std %f0,[%o0+64] 1308/* 0x0458 */ std %f0,[%o0+72] 1309/* 0x045c */ std %f0,[%o0+80] 1310/* 0x0460 */ std %f0,[%o0+88] 1311/* 0x0464 */ std %f0,[%o0+96] 1312/* 0x0468 */ std %f0,[%o0+104] 1313/* 0x046c */ std %f0,[%o0+112] 1314/* 0x0470 */ std %f0,[%o0+120] 1315/* 0x0474 */ std %f0,[%o0+128] 1316/* 0x0478 */ std %f0,[%o0+136] 1317/* 0x047c */ std %f0,[%o0+144] 1318/* 0x0480 */ std %f0,[%o0+152] 1319/* 0x0484 */ std %f0,[%o0+160] 1320/* 0x0488 */ std %f0,[%o0+168] 1321/* 0x048c */ fmovs %f0,%f4 1322/* 0x0490 */ std %f0,[%o0+176] 1323/* 0x0494 281 */ or %g0,0,%o1 1324/* 0x0498 273 */ std %f0,[%o0+184] 1325/* 0x049c */ fxtod %f4,%f4 1326/* 0x04a0 */ std %f0,[%o0+192] 1327/* 0x04a4 */ std %f0,[%o0+200] 1328/* 0x04a8 */ std %f0,[%o0+208] 1329/* 0x04ac 278 */ fmuld %f4,%f2,%f2 1330/* 0x04b0 273 */ std %f0,[%o0+216] 1331/* 0x04b4 */ std %f0,[%o0+224] 1332/* 0x04b8 */ std %f0,[%o0+232] 1333/* 0x04bc */ std %f0,[%o0+240] 1334/* 0x04c0 */ std %f0,[%o0+248] 1335/* 0x04c4 */ std %f0,[%o0+256] 1336/* 0x04c8 */ std %f0,[%o0+264] 1337/* 0x04cc */ std %f0,[%o0+272] 1338/* 0x04d0 */ std %f0,[%o0+280] 1339/* 0x04d4 */ std %f0,[%o0+288] 1340/* 0x04d8 */ std %f0,[%o0+296] 1341/* 0x04dc */ std %f0,[%o0+304] 1342/* 0x04e0 */ std %f0,[%o0+312] 1343/* 0x04e4 */ std %f0,[%o0+320] 1344/* 0x04e8 */ std %f0,[%o0+328] 1345/* 0x04ec */ std %f0,[%o0+336] 1346/* 0x04f0 */ std %f0,[%o0+344] 1347/* 0x04f4 */ std %f0,[%o0+352] 1348/* 0x04f8 */ std %f0,[%o0+360] 1349/* 0x04fc */ std %f0,[%o0+368] 1350/* 0x0500 */ std %f0,[%o0+376] 1351/* 0x0504 */ std %f0,[%o0+384] 1352/* 0x0508 */ std %f0,[%o0+392] 1353/* 0x050c */ std %f0,[%o0+400] 1354/* 0x0510 */ std %f0,[%o0+408] 1355/* 0x0514 */ std %f0,[%o0+416] 1356/* 0x0518 */ std %f0,[%o0+424] 1357/* 0x051c */ std %f0,[%o0+432] 1358/* 0x0520 */ std %f0,[%o0+440] 1359/* 0x0524 */ std %f0,[%o0+448] 1360/* 0x0528 */ std %f0,[%o0+456] 1361/* 0x052c */ std %f0,[%o0+464] 1362/* 0x0530 */ std %f0,[%o0+472] 1363/* 0x0534 */ std %f0,[%o0+480] 1364/* 0x0538 */ std %f0,[%o0+488] 1365/* 0x053c */ std %f0,[%o0+496] 1366/* 0x0540 */ std %f0,[%o0+504] 1367/* 0x0544 */ std %f0,[%o0+512] 1368/* 0x0548 */ std %f0,[%o0+520] 1369/* 0x054c */ ldd [%g5],%f0 1370/* 0x0550 */ ldd [%g1],%f8 1371/* 0x0554 */ fmuld %f2,%f0,%f6 1372/* 0x0558 275 */ ldd [%i4],%f4 1373/* 0x055c 276 */ ldd [%i2],%f0 1374/* 0x0560 */ fdtox %f6,%f6 1375/* 0x0564 */ fxtod %f6,%f6 1376/* 0x0568 */ fmuld %f6,%f8,%f6 1377/* 0x056c */ fsubd %f2,%f6,%f2 1378/* 0x0570 286 */ fmuld %f4,%f2,%f12 1379 1380! 282 ! { 1381! 284 ! m2j=pdm2[j]; 1382! 285 ! a=pdtj[0]+pdn_0*digit; 1383! 286 ! b=pdtj[1]+pdm1_0*pdm2[j+1]+a*TwoToMinus16; 1384 1385! 287 ! pdtj[1]=b; 1386! 289 ! /**** this loop will be fully unrolled: 1387! 290 ! for(i=1;i<16;i++) 1388! 291 ! { 1389! 292 ! pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit; 1390! 293 ! } 1391! 294 ! *************************************/ 1392! 295 ! pdtj[2]+=pdm1[1]*m2j+pdn[1]*digit; 1393! 296 ! pdtj[4]+=pdm1[2]*m2j+pdn[2]*digit; 1394! 297 ! pdtj[6]+=pdm1[3]*m2j+pdn[3]*digit; 1395! 298 ! pdtj[8]+=pdm1[4]*m2j+pdn[4]*digit; 1396! 299 ! pdtj[10]+=pdm1[5]*m2j+pdn[5]*digit; 1397! 300 ! pdtj[12]+=pdm1[6]*m2j+pdn[6]*digit; 1398! 301 ! pdtj[14]+=pdm1[7]*m2j+pdn[7]*digit; 1399! 302 ! pdtj[16]+=pdm1[8]*m2j+pdn[8]*digit; 1400! 303 ! pdtj[18]+=pdm1[9]*m2j+pdn[9]*digit; 1401! 304 ! pdtj[20]+=pdm1[10]*m2j+pdn[10]*digit; 1402! 305 ! pdtj[22]+=pdm1[11]*m2j+pdn[11]*digit; 1403! 306 ! pdtj[24]+=pdm1[12]*m2j+pdn[12]*digit; 1404! 307 ! pdtj[26]+=pdm1[13]*m2j+pdn[13]*digit; 1405! 308 ! pdtj[28]+=pdm1[14]*m2j+pdn[14]*digit; 1406! 309 ! pdtj[30]+=pdm1[15]*m2j+pdn[15]*digit; 1407! 310 ! /* no need for cleenup, cannot overflow */ 1408! 311 ! digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16); 1409 1410 fmovd %f2,%f0 ! hand modified 1411 fmovd %f16,%f18 ! hand modified 1412 ldd [%i4],%f2 1413 ldd [%o4],%f8 1414 ldd [%i2],%f10 1415 ldd [%g5],%f14 ! hand modified 1416 ldd [%g1],%f16 ! hand modified 1417 ldd [%i3],%f24 1418 1419 ldd [%i2+8],%f26 1420 ldd [%i2+16],%f40 1421 ldd [%i2+48],%f46 1422 ldd [%i2+56],%f30 1423 ldd [%i2+64],%f54 1424 ldd [%i2+104],%f34 1425 ldd [%i2+112],%f58 1426 1427 ldd [%i4+8],%f28 1428 ldd [%i4+104],%f38 1429 ldd [%i4+112],%f60 1430 1431 .L99999999: !1 1432 ldd [%i2+24],%f32 1433 fmuld %f0,%f2,%f4 !2 1434 ldd [%i4+24],%f36 1435 fmuld %f26,%f24,%f20 !3 1436 ldd [%i2+40],%f42 1437 fmuld %f28,%f0,%f22 !4 1438 ldd [%i4+40],%f44 1439 fmuld %f32,%f24,%f32 !5 1440 ldd [%i3+8],%f6 1441 faddd %f4,%f8,%f4 1442 fmuld %f36,%f0,%f36 !6 1443 add %i3,8,%i3 1444 ldd [%i4+56],%f50 1445 fmuld %f42,%f24,%f42 !7 1446 ldd [%i2+72],%f52 1447 faddd %f20,%f22,%f20 1448 fmuld %f44,%f0,%f44 !8 1449 ldd [%o4+16],%f22 1450 fmuld %f10,%f6,%f12 !9 1451 ldd [%i4+72],%f56 1452 faddd %f32,%f36,%f32 1453 fmuld %f14,%f4,%f4 !10 1454 ldd [%o4+48],%f36 1455 fmuld %f30,%f24,%f48 !11 1456 ldd [%o4+8],%f8 1457 faddd %f20,%f22,%f20 1458 fmuld %f50,%f0,%f50 !12 1459 std %f20,[%o4+16] 1460 faddd %f42,%f44,%f42 1461 fmuld %f52,%f24,%f52 !13 1462 ldd [%o4+80],%f44 1463 faddd %f4,%f12,%f4 1464 fmuld %f56,%f0,%f56 !14 1465 ldd [%i2+88],%f20 1466 faddd %f32,%f36,%f32 !15 1467 ldd [%i4+88],%f22 1468 faddd %f48,%f50,%f48 !16 1469 ldd [%o4+112],%f50 1470 faddd %f52,%f56,%f52 !17 1471 ldd [%o4+144],%f56 1472 faddd %f4,%f8,%f8 1473 fmuld %f20,%f24,%f20 !18 1474 std %f32,[%o4+48] 1475 faddd %f42,%f44,%f42 1476 fmuld %f22,%f0,%f22 !19 1477 std %f42,[%o4+80] 1478 faddd %f48,%f50,%f48 1479 fmuld %f34,%f24,%f32 !20 1480 std %f48,[%o4+112] 1481 faddd %f52,%f56,%f52 1482 fmuld %f38,%f0,%f36 !21 1483 ldd [%i2+120],%f42 1484 fdtox %f8,%f4 !22 1485 std %f52,[%o4+144] 1486 faddd %f20,%f22,%f20 !23 1487 ldd [%i4+120],%f44 !24 1488 ldd [%o4+176],%f22 1489 faddd %f32,%f36,%f32 1490 fmuld %f42,%f24,%f42 !25 1491 ldd [%i4+16],%f50 1492 fmovs %f17,%f4 !26 1493 ldd [%i2+32],%f52 1494 fmuld %f44,%f0,%f44 !27 1495 ldd [%i4+32],%f56 1496 fmuld %f40,%f24,%f48 !28 1497 ldd [%o4+208],%f36 1498 faddd %f20,%f22,%f20 1499 fmuld %f50,%f0,%f50 !29 1500 std %f20,[%o4+176] 1501 fxtod %f4,%f4 1502 fmuld %f52,%f24,%f52 !30 1503 ldd [%i4+48],%f22 1504 faddd %f42,%f44,%f42 1505 fmuld %f56,%f0,%f56 !31 1506 ldd [%o4+240],%f44 1507 faddd %f32,%f36,%f32 !32 1508 std %f32,[%o4+208] 1509 faddd %f48,%f50,%f48 1510 fmuld %f46,%f24,%f20 !33 1511 ldd [%o4+32],%f50 1512 fmuld %f4,%f18,%f12 !34 1513 ldd [%i4+64],%f36 1514 faddd %f52,%f56,%f52 1515 fmuld %f22,%f0,%f22 !35 1516 ldd [%o4+64],%f56 1517 faddd %f42,%f44,%f42 !36 1518 std %f42,[%o4+240] 1519 faddd %f48,%f50,%f48 1520 fmuld %f54,%f24,%f32 !37 1521 std %f48,[%o4+32] 1522 fmuld %f12,%f14,%f4 !38 1523 ldd [%i2+80],%f42 1524 faddd %f52,%f56,%f56 ! yes, tmp52! 1525 fmuld %f36,%f0,%f36 !39 1526 ldd [%i4+80],%f44 1527 faddd %f20,%f22,%f20 !40 1528 ldd [%i2+96],%f48 1529 fmuld %f58,%f24,%f52 !41 1530 ldd [%i4+96],%f50 1531 fdtox %f4,%f4 1532 fmuld %f42,%f24,%f42 !42 1533 std %f56,[%o4+64] ! yes, tmp52! 1534 faddd %f32,%f36,%f32 1535 fmuld %f44,%f0,%f44 !43 1536 ldd [%o4+96],%f22 1537 fmuld %f48,%f24,%f48 !44 1538 ldd [%o4+128],%f36 1539 fmovd %f6,%f24 1540 fmuld %f50,%f0,%f50 !45 1541 fxtod %f4,%f4 1542 fmuld %f60,%f0,%f56 !46 1543 add %o4,8,%o4 1544 faddd %f42,%f44,%f42 !47 1545 ldd [%o4+160-8],%f44 1546 faddd %f20,%f22,%f20 !48 1547 std %f20,[%o4+96-8] 1548 faddd %f48,%f50,%f48 !49 1549 ldd [%o4+192-8],%f50 1550 faddd %f52,%f56,%f52 1551 fmuld %f4,%f16,%f4 !50 1552 ldd [%o4+224-8],%f56 1553 faddd %f32,%f36,%f32 !51 1554 std %f32,[%o4+128-8] 1555 faddd %f42,%f44,%f42 !52 1556 add %o3,1,%o3 1557 std %f42,[%o4+160-8] 1558 faddd %f48,%f50,%f48 !53 1559 cmp %o3,31 1560 std %f48,[%o4+192-8] 1561 fsubd %f12,%f4,%f0 !54 1562 faddd %f52,%f56,%f52 1563 ble,pt %icc,.L99999999 1564 std %f52,[%o4+224-8] !55 1565 std %f8,[%o4] 1566 1567! 312 ! } 1568! 313 ! } 1569! 315 ! conv_d16_to_i32(result,dt+2*nlen,(long long *)dt,nlen+1); 1570 1571/* 0x07c8 315 */ sll %i0,4,%g2 1572 .L900000653: 1573/* 0x07cc 315 */ add %i1,%g2,%i1 1574/* 0x07d0 242 */ ld [%fp+68],%o0 1575/* 0x07d4 315 */ or %g0,0,%o4 1576/* 0x07d8 */ ldd [%i1],%f0 1577/* 0x07dc */ or %g0,0,%g5 1578/* 0x07e0 */ cmp %i0,0 1579/* 0x07e4 242 */ or %g0,%o0,%o3 1580/* 0x07e8 311 */ sub %i0,1,%g1 1581/* 0x07ec 315 */ fdtox %f0,%f0 1582/* 0x07f0 */ std %f0,[%sp+120] 1583/* 0x07f4 311 */ sethi %hi(0xfc00),%o1 1584/* 0x07f8 */ add %g1,1,%g3 1585/* 0x07fc */ or %g0,%o0,%g4 1586/* 0x0800 315 */ ldd [%i1+8],%f0 1587/* 0x0804 */ add %o1,1023,%o1 1588/* 0x0808 */ fdtox %f0,%f0 1589/* 0x080c */ std %f0,[%sp+112] 1590/* 0x0810 */ ldx [%sp+112],%o5 1591/* 0x0814 */ ldx [%sp+120],%o7 1592/* 0x0818 */ ble,pt %icc,.L900000651 1593/* 0x081c */ sethi %hi(0xfc00),%g2 1594/* 0x0820 311 */ or %g0,-1,%g2 1595/* 0x0824 315 */ cmp %g3,3 1596/* 0x0828 311 */ srl %g2,0,%o2 1597/* 0x082c 315 */ bl,pn %icc,.L77000287 1598/* 0x0830 */ or %g0,%i1,%g2 1599/* 0x0834 */ ldd [%i1+16],%f0 1600/* 0x0838 */ and %o5,%o1,%o0 1601/* 0x083c */ add %i1,16,%g2 1602/* 0x0840 */ sllx %o0,16,%g3 1603/* 0x0844 */ and %o7,%o2,%o0 1604/* 0x0848 */ fdtox %f0,%f0 1605/* 0x084c */ std %f0,[%sp+104] 1606/* 0x0850 */ add %o0,%g3,%o4 1607/* 0x0854 */ ldd [%i1+24],%f2 1608/* 0x0858 */ srax %o5,16,%o0 1609/* 0x085c */ add %o3,4,%g4 1610/* 0x0860 */ stx %o0,[%sp+128] 1611/* 0x0864 */ and %o4,%o2,%o0 1612/* 0x0868 */ stx %o0,[%sp+112] 1613/* 0x086c */ srax %o4,32,%o0 1614/* 0x0870 */ fdtox %f2,%f0 1615/* 0x0874 */ stx %o0,[%sp+136] 1616/* 0x0878 */ srax %o7,32,%o4 1617/* 0x087c */ std %f0,[%sp+96] 1618/* 0x0880 */ ldx [%sp+128],%g5 1619/* 0x0884 */ ldx [%sp+136],%o7 1620/* 0x0888 */ ldx [%sp+104],%g3 1621/* 0x088c */ add %g5,%o7,%o0 1622/* 0x0890 */ or %g0,1,%g5 1623/* 0x0894 */ ldx [%sp+112],%o7 1624/* 0x0898 */ add %o4,%o0,%o4 1625/* 0x089c */ ldx [%sp+96],%o5 1626/* 0x08a0 */ st %o7,[%o3] 1627/* 0x08a4 */ or %g0,%g3,%o7 1628 .L900000634: 1629/* 0x08a8 */ ldd [%g2+16],%f0 1630/* 0x08ac */ add %g5,1,%g5 1631/* 0x08b0 */ add %g4,4,%g4 1632/* 0x08b4 */ cmp %g5,%g1 1633/* 0x08b8 */ add %g2,16,%g2 1634/* 0x08bc */ fdtox %f0,%f0 1635/* 0x08c0 */ std %f0,[%sp+104] 1636/* 0x08c4 */ ldd [%g2+8],%f0 1637/* 0x08c8 */ fdtox %f0,%f0 1638/* 0x08cc */ std %f0,[%sp+96] 1639/* 0x08d0 */ and %o5,%o1,%g3 1640/* 0x08d4 */ sllx %g3,16,%g3 1641/* 0x08d8 */ stx %g3,[%sp+120] 1642/* 0x08dc */ and %o7,%o2,%g3 1643/* 0x08e0 */ stx %o7,[%sp+128] 1644/* 0x08e4 */ ldx [%sp+120],%o7 1645/* 0x08e8 */ add %g3,%o7,%g3 1646/* 0x08ec */ ldx [%sp+128],%o7 1647/* 0x08f0 */ srax %o5,16,%o5 1648/* 0x08f4 */ add %g3,%o4,%g3 1649/* 0x08f8 */ srax %g3,32,%o4 1650/* 0x08fc */ stx %o4,[%sp+112] 1651/* 0x0900 */ srax %o7,32,%o4 1652/* 0x0904 */ ldx [%sp+112],%o7 1653/* 0x0908 */ add %o5,%o7,%o7 1654/* 0x090c */ ldx [%sp+96],%o5 1655/* 0x0910 */ add %o4,%o7,%o4 1656/* 0x0914 */ and %g3,%o2,%g3 1657/* 0x0918 */ ldx [%sp+104],%o7 1658/* 0x091c */ ble,pt %icc,.L900000634 1659/* 0x0920 */ st %g3,[%g4-4] 1660 .L900000637: 1661/* 0x0924 */ ba .L900000651 1662/* 0x0928 */ sethi %hi(0xfc00),%g2 1663 .L77000287: 1664/* 0x092c */ ldd [%g2+16],%f0 1665 .L900000650: 1666/* 0x0930 */ and %o7,%o2,%o0 1667/* 0x0934 */ and %o5,%o1,%g3 1668/* 0x0938 */ fdtox %f0,%f0 1669/* 0x093c */ add %o4,%o0,%o0 1670/* 0x0940 */ std %f0,[%sp+104] 1671/* 0x0944 */ add %g5,1,%g5 1672/* 0x0948 */ sllx %g3,16,%o4 1673/* 0x094c */ ldd [%g2+24],%f2 1674/* 0x0950 */ add %g2,16,%g2 1675/* 0x0954 */ add %o0,%o4,%o4 1676/* 0x0958 */ cmp %g5,%g1 1677/* 0x095c */ srax %o5,16,%o0 1678/* 0x0960 */ stx %o0,[%sp+112] 1679/* 0x0964 */ and %o4,%o2,%g3 1680/* 0x0968 */ srax %o4,32,%o5 1681/* 0x096c */ fdtox %f2,%f0 1682/* 0x0970 */ std %f0,[%sp+96] 1683/* 0x0974 */ srax %o7,32,%o4 1684/* 0x0978 */ ldx [%sp+112],%o7 1685/* 0x097c */ add %o7,%o5,%o7 1686/* 0x0980 */ ldx [%sp+104],%o5 1687/* 0x0984 */ add %o4,%o7,%o4 1688/* 0x0988 */ ldx [%sp+96],%o0 1689/* 0x098c */ st %g3,[%g4] 1690/* 0x0990 */ or %g0,%o5,%o7 1691/* 0x0994 */ add %g4,4,%g4 1692/* 0x0998 */ or %g0,%o0,%o5 1693/* 0x099c */ ble,a,pt %icc,.L900000650 1694/* 0x09a0 */ ldd [%g2+16],%f0 1695 .L77000236: 1696/* 0x09a4 */ sethi %hi(0xfc00),%g2 1697 .L900000651: 1698/* 0x09a8 */ or %g0,-1,%o0 1699/* 0x09ac */ add %g2,1023,%g2 1700/* 0x09b0 */ ld [%fp+88],%o1 1701/* 0x09b4 */ srl %o0,0,%g3 1702/* 0x09b8 */ and %o5,%g2,%g2 1703/* 0x09bc */ and %o7,%g3,%g4 1704 1705! 317 ! adjust_montf_result(result,nint,nlen); 1706 1707/* 0x09c0 317 */ or %g0,-1,%o5 1708/* 0x09c4 311 */ sllx %g2,16,%g2 1709/* 0x09c8 */ add %o4,%g4,%g4 1710/* 0x09cc */ add %g4,%g2,%g2 1711/* 0x09d0 */ sll %g5,2,%g4 1712/* 0x09d4 */ and %g2,%g3,%g2 1713/* 0x09d8 */ st %g2,[%o3+%g4] 1714/* 0x09dc 317 */ sll %i0,2,%g2 1715/* 0x09e0 */ ld [%o3+%g2],%g2 1716/* 0x09e4 */ cmp %g2,0 1717/* 0x09e8 */ bleu,pn %icc,.L77000241 1718/* 0x09ec */ or %g0,%o1,%o2 1719/* 0x09f0 */ ba .L900000649 1720/* 0x09f4 */ cmp %o5,0 1721 .L77000241: 1722/* 0x09f8 */ sub %i0,1,%o5 1723/* 0x09fc */ sll %o5,2,%g2 1724/* 0x0a00 */ cmp %o5,0 1725/* 0x0a04 */ bl,pt %icc,.L900000649 1726/* 0x0a08 */ cmp %o5,0 1727/* 0x0a0c */ add %o1,%g2,%o1 1728/* 0x0a10 */ add %o3,%g2,%o4 1729/* 0x0a14 */ ld [%o1],%g2 1730 .L900000648: 1731/* 0x0a18 */ ld [%o4],%g3 1732/* 0x0a1c */ sub %o5,1,%o0 1733/* 0x0a20 */ sub %o1,4,%o1 1734/* 0x0a24 */ sub %o4,4,%o4 1735/* 0x0a28 */ cmp %g3,%g2 1736/* 0x0a2c */ bne,pn %icc,.L77000244 1737/* 0x0a30 */ nop 1738/* 0x0a34 0 */ or %g0,%o0,%o5 1739/* 0x0a38 317 */ cmp %o0,0 1740/* 0x0a3c */ bge,a,pt %icc,.L900000648 1741/* 0x0a40 */ ld [%o1],%g2 1742 .L77000244: 1743/* 0x0a44 */ cmp %o5,0 1744 .L900000649: 1745/* 0x0a48 */ bl,pn %icc,.L77000288 1746/* 0x0a4c */ sll %o5,2,%g2 1747/* 0x0a50 */ ld [%o2+%g2],%g3 1748/* 0x0a54 */ ld [%o3+%g2],%g2 1749/* 0x0a58 */ cmp %g2,%g3 1750/* 0x0a5c */ bleu,pt %icc,.L77000224 1751/* 0x0a60 */ nop 1752 .L77000288: 1753/* 0x0a64 */ cmp %i0,0 1754/* 0x0a68 */ ble,pt %icc,.L77000224 1755/* 0x0a6c */ nop 1756/* 0x0a70 317 */ sub %i0,1,%o7 1757/* 0x0a74 */ or %g0,-1,%g2 1758/* 0x0a78 */ srl %g2,0,%o4 1759/* 0x0a7c */ add %o7,1,%o0 1760/* 0x0a80 315 */ or %g0,0,%o5 1761/* 0x0a84 */ or %g0,0,%g1 1762/* 0x0a88 */ cmp %o0,3 1763/* 0x0a8c */ bl,pn %icc,.L77000289 1764/* 0x0a90 */ add %o3,8,%o1 1765/* 0x0a94 */ add %o2,4,%o0 1766/* 0x0a98 */ ld [%o1-8],%g2 1767/* 0x0a9c 0 */ or %g0,%o1,%o3 1768/* 0x0aa0 315 */ ld [%o0-4],%g3 1769/* 0x0aa4 0 */ or %g0,%o0,%o2 1770/* 0x0aa8 315 */ or %g0,2,%g1 1771/* 0x0aac */ ld [%o3-4],%o0 1772/* 0x0ab0 */ sub %g2,%g3,%g2 1773/* 0x0ab4 */ or %g0,%g2,%o5 1774/* 0x0ab8 */ and %g2,%o4,%g2 1775/* 0x0abc */ st %g2,[%o3-8] 1776/* 0x0ac0 */ srax %o5,32,%o5 1777 .L900000638: 1778/* 0x0ac4 */ ld [%o2],%g2 1779/* 0x0ac8 */ add %g1,1,%g1 1780/* 0x0acc */ add %o2,4,%o2 1781/* 0x0ad0 */ cmp %g1,%o7 1782/* 0x0ad4 */ add %o3,4,%o3 1783/* 0x0ad8 */ sub %o0,%g2,%o0 1784/* 0x0adc */ add %o0,%o5,%o5 1785/* 0x0ae0 */ and %o5,%o4,%g2 1786/* 0x0ae4 */ ld [%o3-4],%o0 1787/* 0x0ae8 */ st %g2,[%o3-8] 1788/* 0x0aec */ ble,pt %icc,.L900000638 1789/* 0x0af0 */ srax %o5,32,%o5 1790 .L900000641: 1791/* 0x0af4 */ ld [%o2],%o1 1792/* 0x0af8 */ sub %o0,%o1,%o0 1793/* 0x0afc */ add %o0,%o5,%o0 1794/* 0x0b00 */ and %o0,%o4,%o1 1795/* 0x0b04 */ st %o1,[%o3-4] 1796/* 0x0b08 */ ret ! Result = 1797/* 0x0b0c */ restore %g0,%g0,%g0 1798 .L77000289: 1799/* 0x0b10 */ ld [%o3],%o0 1800 .L900000647: 1801/* 0x0b14 */ ld [%o2],%o1 1802/* 0x0b18 */ add %o5,%o0,%o0 1803/* 0x0b1c */ add %g1,1,%g1 1804/* 0x0b20 */ add %o2,4,%o2 1805/* 0x0b24 */ cmp %g1,%o7 1806/* 0x0b28 */ sub %o0,%o1,%o0 1807/* 0x0b2c */ and %o0,%o4,%o1 1808/* 0x0b30 */ st %o1,[%o3] 1809/* 0x0b34 */ add %o3,4,%o3 1810/* 0x0b38 */ srax %o0,32,%o5 1811/* 0x0b3c */ ble,a,pt %icc,.L900000647 1812/* 0x0b40 */ ld [%o3],%o0 1813 .L77000224: 1814/* 0x0b44 */ ret ! Result = 1815/* 0x0b48 */ restore %g0,%g0,%g0 1816/* 0x0b4c 0 */ .type mont_mulf_noconv,2 1817/* 0x0b4c */ .size mont_mulf_noconv,(.-mont_mulf_noconv) 1818 1819