1!
2! This Source Code Form is subject to the terms of the Mozilla Public
3! License, v. 2.0. If a copy of the MPL was not distributed with this
4! file, You can obtain one at http://mozilla.org/MPL/2.0/.
5
6	.section	".text",#alloc,#execinstr
7	.file	"montmulf.c"
8
9	.section	".rodata",#alloc
10	.global	TwoTo16
11	.align	8
12!
13! CONSTANT POOL
14!
15	.global TwoTo16
16TwoTo16:
17	.word	1089470464
18	.word	0
19	.type	TwoTo16,#object
20	.size	TwoTo16,8
21	.global	TwoToMinus16
22!
23! CONSTANT POOL
24!
25	.global TwoToMinus16
26TwoToMinus16:
27	.word	1055916032
28	.word	0
29	.type	TwoToMinus16,#object
30	.size	TwoToMinus16,8
31	.global	Zero
32!
33! CONSTANT POOL
34!
35	.global Zero
36Zero:
37	.word	0
38	.word	0
39	.type	Zero,#object
40	.size	Zero,8
41	.global	TwoTo32
42!
43! CONSTANT POOL
44!
45	.global TwoTo32
46TwoTo32:
47	.word	1106247680
48	.word	0
49	.type	TwoTo32,#object
50	.size	TwoTo32,8
51	.global	TwoToMinus32
52!
53! CONSTANT POOL
54!
55	.global TwoToMinus32
56TwoToMinus32:
57	.word	1039138816
58	.word	0
59	.type	TwoToMinus32,#object
60	.size	TwoToMinus32,8
61
62	.section	".text",#alloc,#execinstr
63/* 000000	   0 */		.align	4
64!
65! SUBROUTINE conv_d16_to_i32
66!
67! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
68
69                       	.global conv_d16_to_i32
70                       conv_d16_to_i32:
71/* 000000	     */		save	%sp,-128,%sp
72! FILE montmulf.c
73
74!   36		      !#define RF_INLINE_MACROS
75!   38		      !static const double TwoTo16=65536.0;
76!   39		      !static const double TwoToMinus16=1.0/65536.0;
77!   40		      !static const double Zero=0.0;
78!   41		      !static const double TwoTo32=65536.0*65536.0;
79!   42		      !static const double TwoToMinus32=1.0/(65536.0*65536.0);
80!   44		      !#ifdef RF_INLINE_MACROS
81!   46		      !double upper32(double);
82!   47		      !double lower32(double, double);
83!   48		      !double mod(double, double, double);
84!   50		      !void i16_to_d16_and_d32x4(const double * /*1/(2^16)*/,
85!   51		      !			  const double * /* 2^16*/,
86!   52		      !			  const double * /* 0 */,
87!   53		      !			  double *       /*result16*/,
88!   54		      !			  double *       /* result32 */,
89!   55		      !			  float *  /*source - should be unsigned int*
90!   56		      !		          	       converted to float* */);
91!   58		      !#else
92!   60		      !static double upper32(double x)
93!   61		      !{
94!   62		      !  return floor(x*TwoToMinus32);
95!   63		      !}
96!   65		      !static double lower32(double x, double y)
97!   66		      !{
98!   67		      !  return x-TwoTo32*floor(x*TwoToMinus32);
99!   68		      !}
100!   70		      !static double mod(double x, double oneoverm, double m)
101!   71		      !{
102!   72		      !  return x-m*floor(x*oneoverm);
103!   73		      !}
104!   75		      !#endif
105!   78		      !static void cleanup(double *dt, int from, int tlen)
106!   79		      !{
107!   80		      ! int i;
108!   81		      ! double tmp,tmp1,x,x1;
109!   83		      ! tmp=tmp1=Zero;
110!   84		      ! /* original code **
111!   85		      ! for(i=2*from;i<2*tlen-2;i++)
112!   86		      !   {
113!   87		      !     x=dt[i];
114!   88		      !     dt[i]=lower32(x,Zero)+tmp1;
115!   89		      !     tmp1=tmp;
116!   90		      !     tmp=upper32(x);
117!   91		      !   }
118!   92		      ! dt[tlen-2]+=tmp1;
119!   93		      ! dt[tlen-1]+=tmp;
120!   94		      ! **end original code ***/
121!   95		      ! /* new code ***/
122!   96		      ! for(i=2*from;i<2*tlen;i+=2)
123!   97		      !   {
124!   98		      !     x=dt[i];
125!   99		      !     x1=dt[i+1];
126!  100		      !     dt[i]=lower32(x,Zero)+tmp;
127!  101		      !     dt[i+1]=lower32(x1,Zero)+tmp1;
128!  102		      !     tmp=upper32(x);
129!  103		      !     tmp1=upper32(x1);
130!  104		      !   }
131!  105		      !  /** end new code **/
132!  106		      !}
133!  109		      !void conv_d16_to_i32(unsigned int *i32, double *d16, long long *tmp, int ilen)
134!  110		      !{
135!  111		      !int i;
136!  112		      !long long t, t1, a, b, c, d;
137!  114		      ! t1=0;
138!  115		      ! a=(long long)d16[0];
139
140/* 0x0004	 115 */		ldd	[%i1],%f0
141/* 0x0008	 110 */		or	%g0,%i1,%o0
142
143!  116		      ! b=(long long)d16[1];
144!  117		      ! for(i=0; i<ilen-1; i++)
145
146/* 0x000c	 117 */		sub	%i3,1,%g2
147/* 0x0010	     */		cmp	%g2,0
148/* 0x0014	 114 */		or	%g0,0,%o4
149/* 0x0018	 115 */		fdtox	%f0,%f0
150/* 0x001c	     */		std	%f0,[%sp+120]
151/* 0x0020	 117 */		or	%g0,0,%o7
152/* 0x0024	 110 */		or	%g0,%i3,%o1
153/* 0x0028	     */		sub	%i3,2,%o2
154/* 0x002c	 116 */		ldd	[%o0+8],%f0
155/* 0x0030	 110 */		sethi	%hi(0xfc00),%o1
156/* 0x0034	     */		add	%o2,1,%g3
157/* 0x0038	     */		add	%o1,1023,%o1
158/* 0x003c	     */		or	%g0,%i0,%o5
159/* 0x0040	 116 */		fdtox	%f0,%f0
160/* 0x0044	     */		std	%f0,[%sp+112]
161/* 0x0048	     */		ldx	[%sp+112],%g1
162/* 0x004c	 115 */		ldx	[%sp+120],%g4
163/* 0x0050	 117 */		ble,pt	%icc,.L900000117
164/* 0x0054	     */		sethi	%hi(0xfc00),%g2
165/* 0x0058	 110 */		or	%g0,-1,%g2
166/* 0x005c	 117 */		cmp	%g3,3
167/* 0x0060	 110 */		srl	%g2,0,%o3
168/* 0x0064	 117 */		bl,pn	%icc,.L77000134
169/* 0x0068	     */		or	%g0,%o0,%g2
170
171!  118		      !   {
172!  119		      !     c=(long long)d16[2*i+2];
173
174/* 0x006c	 119 */		ldd	[%o0+16],%f0
175
176!  120		      !     t1+=a&0xffffffff;
177!  121		      !     t=(a>>32);
178!  122		      !     d=(long long)d16[2*i+3];
179!  123		      !     t1+=(b&0xffff)<<16;
180!  124		      !     t+=(b>>16)+(t1>>32);
181!  125		      !     i32[i]=t1&0xffffffff;
182!  126		      !     t1=t;
183!  127		      !     a=c;
184!  128		      !     b=d;
185
186/* 0x0070	 128 */		add	%o0,16,%g2
187/* 0x0074	 123 */		and	%g1,%o1,%o0
188/* 0x0078	     */		sllx	%o0,16,%g3
189/* 0x007c	 120 */		and	%g4,%o3,%o0
190/* 0x0080	 117 */		add	%o0,%g3,%o4
191/* 0x0084	 119 */		fdtox	%f0,%f0
192/* 0x0088	     */		std	%f0,[%sp+104]
193/* 0x008c	 125 */		and	%o4,%o3,%g5
194/* 0x0090	 122 */		ldd	[%g2+8],%f2
195/* 0x0094	 128 */		add	%o5,4,%o5
196/* 0x0098	 124 */		srax	%o4,32,%o4
197/* 0x009c	     */		stx	%o4,[%sp+112]
198/* 0x00a0	 122 */		fdtox	%f2,%f0
199/* 0x00a4	     */		std	%f0,[%sp+96]
200/* 0x00a8	 124 */		srax	%g1,16,%o0
201/* 0x00ac	     */		ldx	[%sp+112],%o7
202/* 0x00b0	 121 */		srax	%g4,32,%o4
203/* 0x00b4	 124 */		add	%o0,%o7,%g4
204/* 0x00b8	 128 */		or	%g0,1,%o7
205/* 0x00bc	 119 */		ldx	[%sp+104],%g3
206/* 0x00c0	 124 */		add	%o4,%g4,%o4
207/* 0x00c4	 122 */		ldx	[%sp+96],%g1
208/* 0x00c8	 125 */		st	%g5,[%o5-4]
209/* 0x00cc	 127 */		or	%g0,%g3,%g4
210                       .L900000112:
211/* 0x00d0	 119 */		ldd	[%g2+16],%f0
212/* 0x00d4	 128 */		add	%o7,1,%o7
213/* 0x00d8	     */		add	%o5,4,%o5
214/* 0x00dc	     */		cmp	%o7,%o2
215/* 0x00e0	     */		add	%g2,16,%g2
216/* 0x00e4	 119 */		fdtox	%f0,%f0
217/* 0x00e8	     */		std	%f0,[%sp+104]
218/* 0x00ec	 122 */		ldd	[%g2+8],%f0
219/* 0x00f0	     */		fdtox	%f0,%f0
220/* 0x00f4	     */		std	%f0,[%sp+96]
221/* 0x00f8	 123 */		and	%g1,%o1,%g3
222/* 0x00fc	     */		sllx	%g3,16,%g5
223/* 0x0100	 120 */		and	%g4,%o3,%g3
224/* 0x0104	 117 */		add	%g3,%g5,%g3
225/* 0x0108	 124 */		srax	%g1,16,%g1
226/* 0x010c	 117 */		add	%g3,%o4,%g3
227/* 0x0110	 124 */		srax	%g3,32,%o4
228/* 0x0114	     */		stx	%o4,[%sp+112]
229/* 0x0118	 119 */		ldx	[%sp+104],%g5
230/* 0x011c	 121 */		srax	%g4,32,%o4
231/* 0x0120	 124 */		ldx	[%sp+112],%g4
232/* 0x0124	     */		add	%g1,%g4,%g4
233/* 0x0128	 122 */		ldx	[%sp+96],%g1
234/* 0x012c	 124 */		add	%o4,%g4,%o4
235/* 0x0130	 125 */		and	%g3,%o3,%g3
236/* 0x0134	 127 */		or	%g0,%g5,%g4
237/* 0x0138	 128 */		ble,pt	%icc,.L900000112
238/* 0x013c	     */		st	%g3,[%o5-4]
239                       .L900000115:
240/* 0x0140	 128 */		ba	.L900000117
241/* 0x0144	     */		sethi	%hi(0xfc00),%g2
242                       .L77000134:
243/* 0x0148	 119 */		ldd	[%g2+16],%f0
244                       .L900000116:
245/* 0x014c	 120 */		and	%g4,%o3,%o0
246/* 0x0150	 123 */		and	%g1,%o1,%g3
247/* 0x0154	 119 */		fdtox	%f0,%f0
248/* 0x0158	 120 */		add	%o4,%o0,%o0
249/* 0x015c	 119 */		std	%f0,[%sp+104]
250/* 0x0160	 128 */		add	%o7,1,%o7
251/* 0x0164	 123 */		sllx	%g3,16,%o4
252/* 0x0168	 122 */		ldd	[%g2+24],%f2
253/* 0x016c	 128 */		add	%g2,16,%g2
254/* 0x0170	 123 */		add	%o0,%o4,%o0
255/* 0x0174	 128 */		cmp	%o7,%o2
256/* 0x0178	 125 */		and	%o0,%o3,%g3
257/* 0x017c	 122 */		fdtox	%f2,%f0
258/* 0x0180	     */		std	%f0,[%sp+96]
259/* 0x0184	 124 */		srax	%o0,32,%o0
260/* 0x0188	     */		stx	%o0,[%sp+112]
261/* 0x018c	 121 */		srax	%g4,32,%o4
262/* 0x0190	 122 */		ldx	[%sp+96],%o0
263/* 0x0194	 124 */		srax	%g1,16,%g5
264/* 0x0198	     */		ldx	[%sp+112],%g4
265/* 0x019c	 119 */		ldx	[%sp+104],%g1
266/* 0x01a0	 125 */		st	%g3,[%o5]
267/* 0x01a4	 124 */		add	%g5,%g4,%g4
268/* 0x01a8	 128 */		add	%o5,4,%o5
269/* 0x01ac	 124 */		add	%o4,%g4,%o4
270/* 0x01b0	 127 */		or	%g0,%g1,%g4
271/* 0x01b4	 128 */		or	%g0,%o0,%g1
272/* 0x01b8	     */		ble,a,pt	%icc,.L900000116
273/* 0x01bc	     */		ldd	[%g2+16],%f0
274                       .L77000127:
275
276!  129		      !   }
277!  130		      !     t1+=a&0xffffffff;
278!  131		      !     t=(a>>32);
279!  132		      !     t1+=(b&0xffff)<<16;
280!  133		      !     i32[i]=t1&0xffffffff;
281
282/* 0x01c0	 133 */		sethi	%hi(0xfc00),%g2
283                       .L900000117:
284/* 0x01c4	 133 */		or	%g0,-1,%g3
285/* 0x01c8	     */		add	%g2,1023,%g2
286/* 0x01cc	     */		srl	%g3,0,%g3
287/* 0x01d0	     */		and	%g1,%g2,%g2
288/* 0x01d4	     */		and	%g4,%g3,%g4
289/* 0x01d8	     */		sllx	%g2,16,%g2
290/* 0x01dc	     */		add	%o4,%g4,%g4
291/* 0x01e0	     */		add	%g4,%g2,%g2
292/* 0x01e4	     */		sll	%o7,2,%g4
293/* 0x01e8	     */		and	%g2,%g3,%g2
294/* 0x01ec	     */		st	%g2,[%i0+%g4]
295/* 0x01f0	     */		ret	! Result =
296/* 0x01f4	     */		restore	%g0,%g0,%g0
297/* 0x01f8	   0 */		.type	conv_d16_to_i32,2
298/* 0x01f8	     */		.size	conv_d16_to_i32,(.-conv_d16_to_i32)
299
300	.section	".text",#alloc,#execinstr
301/* 000000	   0 */		.align	8
302!
303! CONSTANT POOL
304!
305                       .L_const_seg_900000201:
306/* 000000	   0 */		.word	1127219200,0
307/* 0x0008	   0 */		.align	4
308/* 0x0008	     */		.skip	16
309!
310! SUBROUTINE conv_i32_to_d32
311!
312! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
313
314                       	.global conv_i32_to_d32
315                       conv_i32_to_d32:
316/* 000000	     */		or	%g0,%o7,%g2
317
318!  135		      !}
319!  137		      !void conv_i32_to_d32(double *d32, unsigned int *i32, int len)
320!  138		      !{
321!  139		      !int i;
322!  141		      !#pragma pipeloop(0)
323!  142		      ! for(i=0;i<len;i++) d32[i]=(double)(i32[i]);
324
325/* 0x0004	 142 */		cmp	%o2,0
326                       .L900000210:
327/* 0x0008	     */		call	.+8
328/* 0x000c	     */		sethi	/*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g4
329/* 0x0010	 142 */		or	%g0,0,%o5
330/* 0x0014	 138 */		add	%g4,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g4
331/* 0x0018	     */		or	%g0,%o0,%g5
332/* 0x001c	     */		add	%g4,%o7,%g1
333/* 0x0020	 142 */		ble,pt	%icc,.L77000140
334/* 0x0024	     */		or	%g0,%g2,%o7
335/* 0x0028	     */		sethi	%hi(.L_const_seg_900000201),%g2
336/* 0x002c	 138 */		or	%g0,%o1,%g4
337/* 0x0030	 142 */		add	%g2,%lo(.L_const_seg_900000201),%g2
338/* 0x0034	     */		sub	%o2,1,%g3
339/* 0x0038	     */		ld	[%g1+%g2],%g2
340/* 0x003c	     */		cmp	%o2,9
341/* 0x0040	     */		bl,pn	%icc,.L77000144
342/* 0x0044	     */		ldd	[%g2],%f8
343/* 0x0048	     */		add	%o1,16,%g4
344/* 0x004c	     */		sub	%o2,5,%g1
345/* 0x0050	     */		ld	[%o1],%f7
346/* 0x0054	     */		or	%g0,4,%o5
347/* 0x0058	     */		ld	[%o1+4],%f5
348/* 0x005c	     */		ld	[%o1+8],%f3
349/* 0x0060	     */		fmovs	%f8,%f6
350/* 0x0064	     */		ld	[%o1+12],%f1
351                       .L900000205:
352/* 0x0068	     */		ld	[%g4],%f11
353/* 0x006c	     */		add	%o5,5,%o5
354/* 0x0070	     */		add	%g4,20,%g4
355/* 0x0074	     */		fsubd	%f6,%f8,%f6
356/* 0x0078	     */		std	%f6,[%g5]
357/* 0x007c	     */		cmp	%o5,%g1
358/* 0x0080	     */		add	%g5,40,%g5
359/* 0x0084	     */		fmovs	%f8,%f4
360/* 0x0088	     */		ld	[%g4-16],%f7
361/* 0x008c	     */		fsubd	%f4,%f8,%f12
362/* 0x0090	     */		fmovs	%f8,%f2
363/* 0x0094	     */		std	%f12,[%g5-32]
364/* 0x0098	     */		ld	[%g4-12],%f5
365/* 0x009c	     */		fsubd	%f2,%f8,%f12
366/* 0x00a0	     */		fmovs	%f8,%f0
367/* 0x00a4	     */		std	%f12,[%g5-24]
368/* 0x00a8	     */		ld	[%g4-8],%f3
369/* 0x00ac	     */		fsubd	%f0,%f8,%f12
370/* 0x00b0	     */		fmovs	%f8,%f10
371/* 0x00b4	     */		std	%f12,[%g5-16]
372/* 0x00b8	     */		ld	[%g4-4],%f1
373/* 0x00bc	     */		fsubd	%f10,%f8,%f10
374/* 0x00c0	     */		fmovs	%f8,%f6
375/* 0x00c4	     */		ble,pt	%icc,.L900000205
376/* 0x00c8	     */		std	%f10,[%g5-8]
377                       .L900000208:
378/* 0x00cc	     */		fmovs	%f8,%f4
379/* 0x00d0	     */		add	%g5,32,%g5
380/* 0x00d4	     */		cmp	%o5,%g3
381/* 0x00d8	     */		fmovs	%f8,%f2
382/* 0x00dc	     */		fmovs	%f8,%f0
383/* 0x00e0	     */		fsubd	%f6,%f8,%f6
384/* 0x00e4	     */		std	%f6,[%g5-32]
385/* 0x00e8	     */		fsubd	%f4,%f8,%f4
386/* 0x00ec	     */		std	%f4,[%g5-24]
387/* 0x00f0	     */		fsubd	%f2,%f8,%f2
388/* 0x00f4	     */		std	%f2,[%g5-16]
389/* 0x00f8	     */		fsubd	%f0,%f8,%f0
390/* 0x00fc	     */		bg,pn	%icc,.L77000140
391/* 0x0100	     */		std	%f0,[%g5-8]
392                       .L77000144:
393/* 0x0104	     */		ld	[%g4],%f1
394                       .L900000211:
395/* 0x0108	     */		ldd	[%g2],%f8
396/* 0x010c	     */		add	%o5,1,%o5
397/* 0x0110	     */		add	%g4,4,%g4
398/* 0x0114	     */		cmp	%o5,%g3
399/* 0x0118	     */		fmovs	%f8,%f0
400/* 0x011c	     */		fsubd	%f0,%f8,%f0
401/* 0x0120	     */		std	%f0,[%g5]
402/* 0x0124	     */		add	%g5,8,%g5
403/* 0x0128	     */		ble,a,pt	%icc,.L900000211
404/* 0x012c	     */		ld	[%g4],%f1
405                       .L77000140:
406/* 0x0130	     */		retl	! Result =
407/* 0x0134	     */		nop
408/* 0x0138	   0 */		.type	conv_i32_to_d32,2
409/* 0x0138	     */		.size	conv_i32_to_d32,(.-conv_i32_to_d32)
410
411	.section	".text",#alloc,#execinstr
412/* 000000	   0 */		.align	8
413!
414! CONSTANT POOL
415!
416                       .L_const_seg_900000301:
417/* 000000	   0 */		.word	1127219200,0
418/* 0x0008	   0 */		.align	4
419!
420! SUBROUTINE conv_i32_to_d16
421!
422! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
423
424                       	.global conv_i32_to_d16
425                       conv_i32_to_d16:
426/* 000000	     */		save	%sp,-104,%sp
427/* 0x0004	     */		or	%g0,%i2,%o0
428
429!  143		      !}
430!  146		      !void conv_i32_to_d16(double *d16, unsigned int *i32, int len)
431!  147		      !{
432!  148		      !int i;
433!  149		      !unsigned int a;
434!  151		      !#pragma pipeloop(0)
435!  152		      ! for(i=0;i<len;i++)
436!  153		      !   {
437!  154		      !     a=i32[i];
438!  155		      !     d16[2*i]=(double)(a&0xffff);
439!  156		      !     d16[2*i+1]=(double)(a>>16);
440
441/* 0x0008	 156 */		sethi	%hi(.L_const_seg_900000301),%g2
442                       .L900000310:
443/* 0x000c	     */		call	.+8
444/* 0x0010	     */		sethi	/*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3
445/* 0x0014	 152 */		cmp	%o0,0
446/* 0x0018	 147 */		add	%g3,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3
447/* 0x001c	 152 */		ble,pt	%icc,.L77000150
448/* 0x0020	     */		add	%g3,%o7,%o2
449/* 0x0024	     */		sub	%i2,1,%o5
450/* 0x0028	 156 */		add	%g2,%lo(.L_const_seg_900000301),%o1
451/* 0x002c	 152 */		sethi	%hi(0xfc00),%o0
452/* 0x0030	     */		ld	[%o2+%o1],%o3
453/* 0x0034	     */		add	%o5,1,%g2
454/* 0x0038	     */		or	%g0,0,%g1
455/* 0x003c	     */		cmp	%g2,3
456/* 0x0040	     */		or	%g0,%i1,%o7
457/* 0x0044	     */		add	%o0,1023,%o4
458/* 0x0048	     */		or	%g0,%i0,%g3
459/* 0x004c	     */		bl,pn	%icc,.L77000154
460/* 0x0050	     */		add	%o7,4,%o0
461/* 0x0054	 155 */		ldd	[%o3],%f0
462/* 0x0058	 156 */		or	%g0,1,%g1
463/* 0x005c	 154 */		ld	[%o0-4],%o1
464/* 0x0060	   0 */		or	%g0,%o0,%o7
465/* 0x0064	 155 */		and	%o1,%o4,%o0
466                       .L900000306:
467/* 0x0068	 155 */		st	%o0,[%sp+96]
468/* 0x006c	 156 */		add	%g1,1,%g1
469/* 0x0070	     */		add	%g3,16,%g3
470/* 0x0074	     */		cmp	%g1,%o5
471/* 0x0078	     */		add	%o7,4,%o7
472/* 0x007c	 155 */		ld	[%sp+96],%f3
473/* 0x0080	     */		fmovs	%f0,%f2
474/* 0x0084	     */		fsubd	%f2,%f0,%f2
475/* 0x0088	 156 */		srl	%o1,16,%o0
476/* 0x008c	 155 */		std	%f2,[%g3-16]
477/* 0x0090	 156 */		st	%o0,[%sp+92]
478/* 0x0094	     */		ld	[%sp+92],%f3
479/* 0x0098	 154 */		ld	[%o7-4],%o1
480/* 0x009c	 156 */		fmovs	%f0,%f2
481/* 0x00a0	     */		fsubd	%f2,%f0,%f2
482/* 0x00a4	 155 */		and	%o1,%o4,%o0
483/* 0x00a8	 156 */		ble,pt	%icc,.L900000306
484/* 0x00ac	     */		std	%f2,[%g3-8]
485                       .L900000309:
486/* 0x00b0	 155 */		st	%o0,[%sp+96]
487/* 0x00b4	     */		fmovs	%f0,%f2
488/* 0x00b8	 156 */		add	%g3,16,%g3
489/* 0x00bc	     */		srl	%o1,16,%o0
490/* 0x00c0	 155 */		ld	[%sp+96],%f3
491/* 0x00c4	     */		fsubd	%f2,%f0,%f2
492/* 0x00c8	     */		std	%f2,[%g3-16]
493/* 0x00cc	 156 */		st	%o0,[%sp+92]
494/* 0x00d0	     */		fmovs	%f0,%f2
495/* 0x00d4	     */		ld	[%sp+92],%f3
496/* 0x00d8	     */		fsubd	%f2,%f0,%f0
497/* 0x00dc	     */		std	%f0,[%g3-8]
498/* 0x00e0	     */		ret	! Result =
499/* 0x00e4	     */		restore	%g0,%g0,%g0
500                       .L77000154:
501/* 0x00e8	 154 */		ld	[%o7],%o0
502                       .L900000311:
503/* 0x00ec	 155 */		and	%o0,%o4,%o1
504/* 0x00f0	     */		st	%o1,[%sp+96]
505/* 0x00f4	 156 */		add	%g1,1,%g1
506/* 0x00f8	 155 */		ldd	[%o3],%f0
507/* 0x00fc	 156 */		srl	%o0,16,%o0
508/* 0x0100	     */		add	%o7,4,%o7
509/* 0x0104	     */		cmp	%g1,%o5
510/* 0x0108	 155 */		fmovs	%f0,%f2
511/* 0x010c	     */		ld	[%sp+96],%f3
512/* 0x0110	     */		fsubd	%f2,%f0,%f2
513/* 0x0114	     */		std	%f2,[%g3]
514/* 0x0118	 156 */		st	%o0,[%sp+92]
515/* 0x011c	     */		fmovs	%f0,%f2
516/* 0x0120	     */		ld	[%sp+92],%f3
517/* 0x0124	     */		fsubd	%f2,%f0,%f0
518/* 0x0128	     */		std	%f0,[%g3+8]
519/* 0x012c	     */		add	%g3,16,%g3
520/* 0x0130	     */		ble,a,pt	%icc,.L900000311
521/* 0x0134	     */		ld	[%o7],%o0
522                       .L77000150:
523/* 0x0138	     */		ret	! Result =
524/* 0x013c	     */		restore	%g0,%g0,%g0
525/* 0x0140	   0 */		.type	conv_i32_to_d16,2
526/* 0x0140	     */		.size	conv_i32_to_d16,(.-conv_i32_to_d16)
527
528	.section	".text",#alloc,#execinstr
529/* 000000	   0 */		.align	8
530!
531! CONSTANT POOL
532!
533                       .L_const_seg_900000401:
534/* 000000	   0 */		.word	1127219200,0
535/* 0x0008	   0 */		.align	4
536/* 0x0008	     */		.skip	16
537!
538! SUBROUTINE conv_i32_to_d32_and_d16
539!
540! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
541
542                       	.global conv_i32_to_d32_and_d16
543                       conv_i32_to_d32_and_d16:
544/* 000000	     */		save	%sp,-120,%sp
545                       .L900000415:
546/* 0x0004	     */		call	.+8
547/* 0x0008	     */		sethi	/*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000415-.)),%g4
548
549!  157		      !   }
550!  158		      !}
551!  161		      !void conv_i32_to_d32_and_d16(double *d32, double *d16,
552!  162		      !			     unsigned int *i32, int len)
553!  163		      !{
554!  164		      !int i = 0;
555!  165		      !unsigned int a;
556!  167		      !#pragma pipeloop(0)
557!  168		      !#ifdef RF_INLINE_MACROS
558!  169		      ! for(;i<len-3;i+=4)
559
560/* 0x000c	 169 */		sub	%i3,3,%g2
561/* 0x0010	     */		cmp	%g2,0
562/* 0x0014	 163 */		add	%g4,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000415-.)),%g4
563
564!  170		      !   {
565!  171		      !     i16_to_d16_and_d32x4(&TwoToMinus16, &TwoTo16, &Zero,
566!  172		      !			  &(d16[2*i]), &(d32[i]), (float *)(&(i32[i])));
567
568/* 0x0018	 172 */		sethi	%hi(Zero),%g2
569/* 0x001c	 163 */		add	%g4,%o7,%o4
570/* 0x0020	 172 */		add	%g2,%lo(Zero),%g2
571/* 0x0024	     */		sethi	%hi(TwoToMinus16),%g3
572/* 0x0028	     */		ld	[%o4+%g2],%o1
573/* 0x002c	     */		sethi	%hi(TwoTo16),%g4
574/* 0x0030	     */		add	%g3,%lo(TwoToMinus16),%g2
575/* 0x0034	     */		ld	[%o4+%g2],%o3
576/* 0x0038	 164 */		or	%g0,0,%g5
577/* 0x003c	 172 */		add	%g4,%lo(TwoTo16),%g3
578/* 0x0040	     */		ld	[%o4+%g3],%o2
579/* 0x0044	 163 */		or	%g0,%i0,%i4
580/* 0x0048	 169 */		or	%g0,%i2,%o7
581/* 0x004c	     */		ble,pt	%icc,.L900000418
582/* 0x0050	     */		cmp	%g5,%i3
583/* 0x0054	 172 */		stx	%o7,[%sp+104]
584/* 0x0058	 169 */		sub	%i3,4,%o5
585/* 0x005c	     */		or	%g0,0,%g4
586/* 0x0060	     */		or	%g0,0,%g1
587                       .L900000417:
588/* 0x0064	     */		ldd	[%o1],%f2
589/* 0x0068	 172 */		add	%i4,%g4,%g2
590/* 0x006c	     */		add	%i1,%g1,%g3
591/* 0x0070	     */		ldd	[%o3],%f0
592/* 0x0074	     */		add	%g5,4,%g5
593/* 0x0078	     */		fmovd	%f2,%f14
594/* 0x007c	     */		ld	[%o7],%f15
595/* 0x0080	     */		cmp	%g5,%o5
596/* 0x0084	     */		fmovd	%f2,%f10
597/* 0x0088	     */		ld	[%o7+4],%f11
598/* 0x008c	     */		add	%o7,16,%o7
599/* 0x0090	     */		ldx	[%sp+104],%o0
600/* 0x0094	     */		fmovd	%f2,%f6
601/* 0x0098	     */		stx	%o7,[%sp+112]
602/* 0x009c	     */		fxtod	%f14,%f14
603/* 0x00a0	     */		ld	[%o0+8],%f7
604/* 0x00a4	     */		fxtod	%f10,%f10
605/* 0x00a8	     */		ld	[%o0+12],%f3
606/* 0x00ac	     */		fxtod	%f6,%f6
607/* 0x00b0	     */		ldd	[%o2],%f16
608/* 0x00b4	     */		fmuld	%f0,%f14,%f12
609/* 0x00b8	     */		fxtod	%f2,%f2
610/* 0x00bc	     */		fmuld	%f0,%f10,%f8
611/* 0x00c0	     */		std	%f14,[%i4+%g4]
612/* 0x00c4	     */		ldx	[%sp+112],%o7
613/* 0x00c8	     */		add	%g4,32,%g4
614/* 0x00cc	     */		fmuld	%f0,%f6,%f4
615/* 0x00d0	     */		fdtox	%f12,%f12
616/* 0x00d4	     */		std	%f10,[%g2+8]
617/* 0x00d8	     */		fmuld	%f0,%f2,%f0
618/* 0x00dc	     */		fdtox	%f8,%f8
619/* 0x00e0	     */		std	%f6,[%g2+16]
620/* 0x00e4	     */		std	%f2,[%g2+24]
621/* 0x00e8	     */		fdtox	%f4,%f4
622/* 0x00ec	     */		fdtox	%f0,%f0
623/* 0x00f0	     */		fxtod	%f12,%f12
624/* 0x00f4	     */		std	%f12,[%g3+8]
625/* 0x00f8	     */		fxtod	%f8,%f8
626/* 0x00fc	     */		std	%f8,[%g3+24]
627/* 0x0100	     */		fxtod	%f4,%f4
628/* 0x0104	     */		std	%f4,[%g3+40]
629/* 0x0108	     */		fxtod	%f0,%f0
630/* 0x010c	     */		std	%f0,[%g3+56]
631/* 0x0110	     */		fmuld	%f12,%f16,%f12
632/* 0x0114	     */		fmuld	%f8,%f16,%f8
633/* 0x0118	     */		fmuld	%f4,%f16,%f4
634/* 0x011c	     */		fsubd	%f14,%f12,%f12
635/* 0x0120	     */		std	%f12,[%i1+%g1]
636/* 0x0124	     */		fmuld	%f0,%f16,%f0
637/* 0x0128	     */		fsubd	%f10,%f8,%f8
638/* 0x012c	     */		std	%f8,[%g3+16]
639/* 0x0130	     */		add	%g1,64,%g1
640/* 0x0134	     */		fsubd	%f6,%f4,%f4
641/* 0x0138	     */		std	%f4,[%g3+32]
642/* 0x013c	     */		fsubd	%f2,%f0,%f0
643/* 0x0140	     */		std	%f0,[%g3+48]
644/* 0x0144	     */		ble,a,pt	%icc,.L900000417
645/* 0x0148	     */		stx	%o7,[%sp+104]
646                       .L77000159:
647
648!  173		      !   }
649!  174		      !#endif
650!  175		      ! for(;i<len;i++)
651
652/* 0x014c	 175 */		cmp	%g5,%i3
653                       .L900000418:
654/* 0x0150	 175 */		bge,pt	%icc,.L77000164
655/* 0x0154	     */		nop
656
657!  176		      !   {
658!  177		      !     a=i32[i];
659!  178		      !     d32[i]=(double)(i32[i]);
660!  179		      !     d16[2*i]=(double)(a&0xffff);
661!  180		      !     d16[2*i+1]=(double)(a>>16);
662
663/* 0x0158	 180 */		sethi	%hi(.L_const_seg_900000401),%g2
664/* 0x015c	     */		add	%g2,%lo(.L_const_seg_900000401),%o1
665/* 0x0160	 175 */		sethi	%hi(0xfc00),%o0
666/* 0x0164	     */		ld	[%o4+%o1],%o2
667/* 0x0168	     */		sll	%g5,2,%o3
668/* 0x016c	     */		sub	%i3,%g5,%g3
669/* 0x0170	     */		sll	%g5,3,%g2
670/* 0x0174	     */		add	%o0,1023,%o4
671/* 0x0178	 178 */		ldd	[%o2],%f0
672/* 0x017c	     */		add	%i2,%o3,%o0
673/* 0x0180	 175 */		cmp	%g3,3
674/* 0x0184	     */		add	%i4,%g2,%o3
675/* 0x0188	     */		sub	%i3,1,%o1
676/* 0x018c	     */		sll	%g5,4,%g4
677/* 0x0190	     */		bl,pn	%icc,.L77000161
678/* 0x0194	     */		add	%i1,%g4,%o5
679/* 0x0198	 178 */		ld	[%o0],%f3
680/* 0x019c	 180 */		add	%o3,8,%o3
681/* 0x01a0	 177 */		ld	[%o0],%o7
682/* 0x01a4	 180 */		add	%o5,16,%o5
683/* 0x01a8	     */		add	%g5,1,%g5
684/* 0x01ac	 178 */		fmovs	%f0,%f2
685/* 0x01b0	 180 */		add	%o0,4,%o0
686/* 0x01b4	 179 */		and	%o7,%o4,%g1
687/* 0x01b8	 178 */		fsubd	%f2,%f0,%f2
688/* 0x01bc	     */		std	%f2,[%o3-8]
689/* 0x01c0	 180 */		srl	%o7,16,%o7
690/* 0x01c4	 179 */		st	%g1,[%sp+96]
691/* 0x01c8	     */		fmovs	%f0,%f2
692/* 0x01cc	     */		ld	[%sp+96],%f3
693/* 0x01d0	     */		fsubd	%f2,%f0,%f2
694/* 0x01d4	     */		std	%f2,[%o5-16]
695/* 0x01d8	 180 */		st	%o7,[%sp+92]
696/* 0x01dc	     */		fmovs	%f0,%f2
697/* 0x01e0	     */		ld	[%sp+92],%f3
698/* 0x01e4	     */		fsubd	%f2,%f0,%f2
699/* 0x01e8	     */		std	%f2,[%o5-8]
700                       .L900000411:
701/* 0x01ec	 178 */		ld	[%o0],%f3
702/* 0x01f0	 180 */		add	%g5,2,%g5
703/* 0x01f4	     */		add	%o5,32,%o5
704/* 0x01f8	 177 */		ld	[%o0],%o7
705/* 0x01fc	 180 */		cmp	%g5,%o1
706/* 0x0200	     */		add	%o3,16,%o3
707/* 0x0204	 178 */		fmovs	%f0,%f2
708/* 0x0208	     */		fsubd	%f2,%f0,%f2
709/* 0x020c	     */		std	%f2,[%o3-16]
710/* 0x0210	 179 */		and	%o7,%o4,%g1
711/* 0x0214	     */		st	%g1,[%sp+96]
712/* 0x0218	     */		ld	[%sp+96],%f3
713/* 0x021c	     */		fmovs	%f0,%f2
714/* 0x0220	     */		fsubd	%f2,%f0,%f2
715/* 0x0224	 180 */		srl	%o7,16,%o7
716/* 0x0228	 179 */		std	%f2,[%o5-32]
717/* 0x022c	 180 */		st	%o7,[%sp+92]
718/* 0x0230	     */		ld	[%sp+92],%f3
719/* 0x0234	     */		fmovs	%f0,%f2
720/* 0x0238	     */		fsubd	%f2,%f0,%f2
721/* 0x023c	     */		std	%f2,[%o5-24]
722/* 0x0240	     */		add	%o0,4,%o0
723/* 0x0244	 178 */		ld	[%o0],%f3
724/* 0x0248	 177 */		ld	[%o0],%o7
725/* 0x024c	 178 */		fmovs	%f0,%f2
726/* 0x0250	     */		fsubd	%f2,%f0,%f2
727/* 0x0254	     */		std	%f2,[%o3-8]
728/* 0x0258	 179 */		and	%o7,%o4,%g1
729/* 0x025c	     */		st	%g1,[%sp+96]
730/* 0x0260	     */		ld	[%sp+96],%f3
731/* 0x0264	     */		fmovs	%f0,%f2
732/* 0x0268	     */		fsubd	%f2,%f0,%f2
733/* 0x026c	 180 */		srl	%o7,16,%o7
734/* 0x0270	 179 */		std	%f2,[%o5-16]
735/* 0x0274	 180 */		st	%o7,[%sp+92]
736/* 0x0278	     */		ld	[%sp+92],%f3
737/* 0x027c	     */		fmovs	%f0,%f2
738/* 0x0280	     */		fsubd	%f2,%f0,%f2
739/* 0x0284	     */		std	%f2,[%o5-8]
740/* 0x0288	     */		bl,pt	%icc,.L900000411
741/* 0x028c	     */		add	%o0,4,%o0
742                       .L900000414:
743/* 0x0290	 180 */		cmp	%g5,%i3
744/* 0x0294	     */		bge,pn	%icc,.L77000164
745/* 0x0298	     */		nop
746                       .L77000161:
747/* 0x029c	 178 */		ld	[%o0],%f3
748                       .L900000416:
749/* 0x02a0	 178 */		ldd	[%o2],%f0
750/* 0x02a4	 180 */		add	%g5,1,%g5
751/* 0x02a8	 177 */		ld	[%o0],%o1
752/* 0x02ac	 180 */		add	%o0,4,%o0
753/* 0x02b0	     */		cmp	%g5,%i3
754/* 0x02b4	 178 */		fmovs	%f0,%f2
755/* 0x02b8	 179 */		and	%o1,%o4,%o7
756/* 0x02bc	 178 */		fsubd	%f2,%f0,%f2
757/* 0x02c0	     */		std	%f2,[%o3]
758/* 0x02c4	 180 */		srl	%o1,16,%o1
759/* 0x02c8	 179 */		st	%o7,[%sp+96]
760/* 0x02cc	 180 */		add	%o3,8,%o3
761/* 0x02d0	 179 */		fmovs	%f0,%f2
762/* 0x02d4	     */		ld	[%sp+96],%f3
763/* 0x02d8	     */		fsubd	%f2,%f0,%f2
764/* 0x02dc	     */		std	%f2,[%o5]
765/* 0x02e0	 180 */		st	%o1,[%sp+92]
766/* 0x02e4	     */		fmovs	%f0,%f2
767/* 0x02e8	     */		ld	[%sp+92],%f3
768/* 0x02ec	     */		fsubd	%f2,%f0,%f0
769/* 0x02f0	     */		std	%f0,[%o5+8]
770/* 0x02f4	     */		add	%o5,16,%o5
771/* 0x02f8	     */		bl,a,pt	%icc,.L900000416
772/* 0x02fc	     */		ld	[%o0],%f3
773                       .L77000164:
774/* 0x0300	     */		ret	! Result =
775/* 0x0304	     */		restore	%g0,%g0,%g0
776/* 0x0308	   0 */		.type	conv_i32_to_d32_and_d16,2
777/* 0x0308	     */		.size	conv_i32_to_d32_and_d16,(.-conv_i32_to_d32_and_d16)
778
779	.section	".text",#alloc,#execinstr
780/* 000000	   0 */		.align	4
781!
782! SUBROUTINE adjust_montf_result
783!
784! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
785
786                       	.global adjust_montf_result
787                       adjust_montf_result:
788/* 000000	     */		or	%g0,%o2,%g5
789
790!  181		      !   }
791!  182		      !}
792!  185		      !void adjust_montf_result(unsigned int *i32, unsigned int *nint, int len)
793!  186		      !{
794!  187		      !long long acc;
795!  188		      !int i;
796!  190		      ! if(i32[len]>0) i=-1;
797
798/* 0x0004	 190 */		or	%g0,-1,%g4
799/* 0x0008	     */		sll	%o2,2,%g1
800/* 0x000c	     */		ld	[%o0+%g1],%g1
801/* 0x0010	     */		cmp	%g1,0
802/* 0x0014	     */		bleu,pn	%icc,.L77000175
803/* 0x0018	     */		or	%g0,%o1,%o3
804/* 0x001c	     */		ba	.L900000511
805/* 0x0020	     */		cmp	%g4,0
806                       .L77000175:
807
808!  191		      ! else
809!  192		      !   {
810!  193		      !     for(i=len-1; i>=0; i--)
811
812/* 0x0024	 193 */		sub	%o2,1,%g4
813/* 0x0028	     */		sll	%g4,2,%g1
814/* 0x002c	     */		cmp	%g4,0
815/* 0x0030	     */		bl,pt	%icc,.L900000511
816/* 0x0034	     */		cmp	%g4,0
817/* 0x0038	     */		add	%o1,%g1,%g2
818
819!  194		      !       {
820!  195		      !	 if(i32[i]!=nint[i]) break;
821
822/* 0x003c	 195 */		ld	[%g2],%o5
823/* 0x0040	 193 */		add	%o0,%g1,%g3
824                       .L900000510:
825/* 0x0044	 195 */		ld	[%g3],%o2
826/* 0x0048	     */		sub	%g4,1,%g1
827/* 0x004c	     */		sub	%g2,4,%g2
828/* 0x0050	     */		sub	%g3,4,%g3
829/* 0x0054	     */		cmp	%o2,%o5
830/* 0x0058	     */		bne,pn	%icc,.L77000182
831/* 0x005c	     */		nop
832/* 0x0060	   0 */		or	%g0,%g1,%g4
833/* 0x0064	 195 */		cmp	%g1,0
834/* 0x0068	     */		bge,a,pt	%icc,.L900000510
835/* 0x006c	     */		ld	[%g2],%o5
836                       .L77000182:
837
838!  196		      !       }
839!  197		      !   }
840!  198		      ! if((i<0)||(i32[i]>nint[i]))
841
842/* 0x0070	 198 */		cmp	%g4,0
843                       .L900000511:
844/* 0x0074	 198 */		bl,pn	%icc,.L77000198
845/* 0x0078	     */		sll	%g4,2,%g2
846/* 0x007c	     */		ld	[%o1+%g2],%g1
847/* 0x0080	     */		ld	[%o0+%g2],%g2
848/* 0x0084	     */		cmp	%g2,%g1
849/* 0x0088	     */		bleu,pt	%icc,.L77000191
850/* 0x008c	     */		nop
851                       .L77000198:
852
853!  199		      !   {
854!  200		      !     acc=0;
855!  201		      !     for(i=0;i<len;i++)
856
857/* 0x0090	 201 */		cmp	%g5,0
858/* 0x0094	     */		ble,pt	%icc,.L77000191
859/* 0x0098	     */		nop
860/* 0x009c	     */		or	%g0,%g5,%g1
861/* 0x00a0	 198 */		or	%g0,-1,%g2
862/* 0x00a4	     */		srl	%g2,0,%g3
863/* 0x00a8	     */		sub	%g5,1,%g4
864/* 0x00ac	 200 */		or	%g0,0,%g5
865/* 0x00b0	 201 */		or	%g0,0,%o5
866/* 0x00b4	 198 */		or	%g0,%o0,%o4
867/* 0x00b8	     */		cmp	%g1,3
868/* 0x00bc	 201 */		bl,pn	%icc,.L77000199
869/* 0x00c0	     */		add	%o0,8,%g1
870/* 0x00c4	     */		add	%o1,4,%g2
871
872!  202		      !       {
873!  203		      !	 acc=acc+(unsigned long long)(i32[i])-(unsigned long long)(nint[i]);
874
875/* 0x00c8	 203 */		ld	[%o0],%o2
876/* 0x00cc	     */		ld	[%o1],%o1
877/* 0x00d0	   0 */		or	%g0,%g1,%o4
878/* 0x00d4	     */		or	%g0,%g2,%o3
879/* 0x00d8	 203 */		ld	[%o0+4],%g1
880
881!  204		      !	 i32[i]=acc&0xffffffff;
882!  205		      !	 acc=acc>>32;
883
884/* 0x00dc	 205 */		or	%g0,2,%o5
885/* 0x00e0	 201 */		sub	%o2,%o1,%o2
886/* 0x00e4	     */		or	%g0,%o2,%g5
887/* 0x00e8	 204 */		and	%o2,%g3,%o2
888/* 0x00ec	     */		st	%o2,[%o0]
889/* 0x00f0	 205 */		srax	%g5,32,%g5
890                       .L900000505:
891/* 0x00f4	 203 */		ld	[%o3],%o2
892/* 0x00f8	 205 */		add	%o5,1,%o5
893/* 0x00fc	     */		add	%o3,4,%o3
894/* 0x0100	     */		cmp	%o5,%g4
895/* 0x0104	     */		add	%o4,4,%o4
896/* 0x0108	 201 */		sub	%g1,%o2,%g1
897/* 0x010c	     */		add	%g1,%g5,%g5
898/* 0x0110	 204 */		and	%g5,%g3,%o2
899/* 0x0114	 203 */		ld	[%o4-4],%g1
900/* 0x0118	 204 */		st	%o2,[%o4-8]
901/* 0x011c	 205 */		ble,pt	%icc,.L900000505
902/* 0x0120	     */		srax	%g5,32,%g5
903                       .L900000508:
904/* 0x0124	 203 */		ld	[%o3],%g2
905/* 0x0128	 201 */		sub	%g1,%g2,%g1
906/* 0x012c	     */		add	%g1,%g5,%g1
907/* 0x0130	 204 */		and	%g1,%g3,%g2
908/* 0x0134	     */		retl	! Result =
909/* 0x0138	     */		st	%g2,[%o4-4]
910                       .L77000199:
911/* 0x013c	 203 */		ld	[%o4],%g1
912                       .L900000509:
913/* 0x0140	 203 */		ld	[%o3],%g2
914/* 0x0144	     */		add	%g5,%g1,%g1
915/* 0x0148	 205 */		add	%o5,1,%o5
916/* 0x014c	     */		add	%o3,4,%o3
917/* 0x0150	     */		cmp	%o5,%g4
918/* 0x0154	 203 */		sub	%g1,%g2,%g1
919/* 0x0158	 204 */		and	%g1,%g3,%g2
920/* 0x015c	     */		st	%g2,[%o4]
921/* 0x0160	 205 */		add	%o4,4,%o4
922/* 0x0164	     */		srax	%g1,32,%g5
923/* 0x0168	     */		ble,a,pt	%icc,.L900000509
924/* 0x016c	     */		ld	[%o4],%g1
925                       .L77000191:
926/* 0x0170	     */		retl	! Result =
927/* 0x0174	     */		nop
928/* 0x0178	   0 */		.type	adjust_montf_result,2
929/* 0x0178	     */		.size	adjust_montf_result,(.-adjust_montf_result)
930
931	.section	".text",#alloc,#execinstr
932/* 000000	   0 */		.align	4
933/* 000000	     */		.skip	16
934!
935! SUBROUTINE mont_mulf_noconv
936!
937! OFFSET    SOURCE LINE	LABEL	INSTRUCTION
938
939                       	.global mont_mulf_noconv
940                       mont_mulf_noconv:
941/* 000000	     */		save	%sp,-144,%sp
942                       .L900000646:
943/* 0x0004	     */		call	.+8
944/* 0x0008	     */		sethi	/*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000646-.)),%g5
945
946!  206		      !       }
947!  207		      !   }
948!  208		      !}
949!  213		      !/*
950!  214		      !** the lengths of the input arrays should be at least the following:
951!  215		      !** result[nlen+1], dm1[nlen], dm2[2*nlen+1], dt[4*nlen+2], dn[nlen], nint[nlen]
952!  216		      !** all of them should be different from one another
953!  217		      !**
954!  218		      !*/
955!  219		      !void mont_mulf_noconv(unsigned int *result,
956!  220		      !		     double *dm1, double *dm2, double *dt,
957!  221		      !		     double *dn, unsigned int *nint,
958!  222		      !		     int nlen, double dn0)
959!  223		      !{
960!  224		      ! int i, j, jj;
961!  225		      ! int tmp;
962!  226		      ! double digit, m2j, nextm2j, a, b;
963!  227		      ! double *dptmp, *pdm1, *pdm2, *pdn, *pdtj, pdn_0, pdm1_0;
964!  229		      ! pdm1=&(dm1[0]);
965!  230		      ! pdm2=&(dm2[0]);
966!  231		      ! pdn=&(dn[0]);
967!  232		      ! pdm2[2*nlen]=Zero;
968
969/* 0x000c	 232 */		ld	[%fp+92],%o1
970/* 0x0010	     */		sethi	%hi(Zero),%g2
971/* 0x0014	 223 */		ldd	[%fp+96],%f2
972/* 0x0018	     */		add	%g5,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000646-.)),%g5
973/* 0x001c	 232 */		add	%g2,%lo(Zero),%g2
974/* 0x0020	 223 */		st	%i0,[%fp+68]
975/* 0x0024	     */		add	%g5,%o7,%o3
976
977!  234		      ! if (nlen!=16)
978!  235		      !   {
979!  236		      !     for(i=0;i<4*nlen+2;i++) dt[i]=Zero;
980!  238		      !     a=dt[0]=pdm1[0]*pdm2[0];
981!  239		      !     digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16);
982
983/* 0x0028	 239 */		sethi	%hi(TwoToMinus16),%g3
984/* 0x002c	 232 */		ld	[%o3+%g2],%l0
985/* 0x0030	 239 */		sethi	%hi(TwoTo16),%g4
986/* 0x0034	 223 */		or	%g0,%i2,%o2
987/* 0x0038	     */		fmovd	%f2,%f16
988/* 0x003c	     */		st	%i5,[%fp+88]
989/* 0x0040	 239 */		add	%g3,%lo(TwoToMinus16),%g2
990/* 0x0044	 223 */		or	%g0,%i1,%i2
991/* 0x0048	 232 */		ldd	[%l0],%f0
992/* 0x004c	 239 */		add	%g4,%lo(TwoTo16),%g3
993/* 0x0050	 223 */		or	%g0,%i3,%o0
994/* 0x0054	 232 */		sll	%o1,4,%g4
995/* 0x0058	 239 */		ld	[%o3+%g2],%g5
996/* 0x005c	 223 */		or	%g0,%i3,%i1
997/* 0x0060	 239 */		ld	[%o3+%g3],%g1
998/* 0x0064	 232 */		or	%g0,%o1,%i0
999/* 0x0068	     */		or	%g0,%o2,%i3
1000/* 0x006c	 234 */		cmp	%o1,16
1001/* 0x0070	     */		be,pn	%icc,.L77000279
1002/* 0x0074	     */		std	%f0,[%o2+%g4]
1003/* 0x0078	 236 */		sll	%o1,2,%g2
1004/* 0x007c	     */		or	%g0,%o0,%o3
1005/* 0x0080	 232 */		sll	%o1,1,%o1
1006/* 0x0084	 236 */		add	%g2,2,%o2
1007/* 0x0088	     */		cmp	%o2,0
1008/* 0x008c	     */		ble,a,pt	%icc,.L900000660
1009/* 0x0090	     */		ldd	[%i2],%f0
1010
1011!  241		      !     pdtj=&(dt[0]);
1012!  242		      !     for(j=jj=0;j<2*nlen;j++,jj++,pdtj++)
1013!  243		      !       {
1014!  244		      !	 m2j=pdm2[j];
1015!  245		      !	 a=pdtj[0]+pdn[0]*digit;
1016!  246		      !	 b=pdtj[1]+pdm1[0]*pdm2[j+1]+a*TwoToMinus16;
1017!  247		      !	 pdtj[1]=b;
1018!  249		      !#pragma pipeloop(0)
1019!  250		      !	 for(i=1;i<nlen;i++)
1020!  251		      !	   {
1021!  252		      !	     pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit;
1022!  253		      !	   }
1023!  254		      ! 	 if((jj==30)) {cleanup(dt,j/2+1,2*nlen+1); jj=0;}
1024!  255		      !
1025!  256		      !	 digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16);
1026!  257		      !       }
1027!  258		      !   }
1028!  259		      ! else
1029!  260		      !   {
1030!  261		      !     a=dt[0]=pdm1[0]*pdm2[0];
1031!  263		      !     dt[65]=     dt[64]=     dt[63]=     dt[62]=     dt[61]=     dt[60]=
1032!  264		      !     dt[59]=     dt[58]=     dt[57]=     dt[56]=     dt[55]=     dt[54]=
1033!  265		      !     dt[53]=     dt[52]=     dt[51]=     dt[50]=     dt[49]=     dt[48]=
1034!  266		      !     dt[47]=     dt[46]=     dt[45]=     dt[44]=     dt[43]=     dt[42]=
1035!  267		      !     dt[41]=     dt[40]=     dt[39]=     dt[38]=     dt[37]=     dt[36]=
1036!  268		      !     dt[35]=     dt[34]=     dt[33]=     dt[32]=     dt[31]=     dt[30]=
1037!  269		      !     dt[29]=     dt[28]=     dt[27]=     dt[26]=     dt[25]=     dt[24]=
1038!  270		      !     dt[23]=     dt[22]=     dt[21]=     dt[20]=     dt[19]=     dt[18]=
1039!  271		      !     dt[17]=     dt[16]=     dt[15]=     dt[14]=     dt[13]=     dt[12]=
1040!  272		      !     dt[11]=     dt[10]=     dt[ 9]=     dt[ 8]=     dt[ 7]=     dt[ 6]=
1041!  273		      !     dt[ 5]=     dt[ 4]=     dt[ 3]=     dt[ 2]=     dt[ 1]=Zero;
1042!  275		      !     pdn_0=pdn[0];
1043!  276		      !     pdm1_0=pdm1[0];
1044!  278		      !     digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16);
1045!  279		      !     pdtj=&(dt[0]);
1046!  281		      !     for(j=0;j<32;j++,pdtj++)
1047
1048/* 0x0094	 281 */		add	%g2,2,%o0
1049/* 0x0098	 236 */		add	%g2,1,%o2
1050/* 0x009c	 281 */		cmp	%o0,3
1051/* 0x00a0	     */		bl,pn	%icc,.L77000280
1052/* 0x00a4	     */		or	%g0,1,%o0
1053/* 0x00a8	     */		add	%o3,8,%o3
1054/* 0x00ac	     */		or	%g0,1,%o4
1055/* 0x00b0	     */		std	%f0,[%o3-8]
1056                       .L900000630:
1057/* 0x00b4	     */		std	%f0,[%o3]
1058/* 0x00b8	     */		add	%o4,2,%o4
1059/* 0x00bc	     */		add	%o3,16,%o3
1060/* 0x00c0	     */		cmp	%o4,%g2
1061/* 0x00c4	     */		ble,pt	%icc,.L900000630
1062/* 0x00c8	     */		std	%f0,[%o3-8]
1063                       .L900000633:
1064/* 0x00cc	     */		cmp	%o4,%o2
1065/* 0x00d0	     */		bg,pn	%icc,.L77000285
1066/* 0x00d4	     */		add	%o4,1,%o0
1067                       .L77000280:
1068/* 0x00d8	     */		std	%f0,[%o3]
1069                       .L900000659:
1070/* 0x00dc	     */		ldd	[%l0],%f0
1071/* 0x00e0	     */		cmp	%o0,%o2
1072/* 0x00e4	     */		add	%o3,8,%o3
1073/* 0x00e8	     */		add	%o0,1,%o0
1074/* 0x00ec	     */		ble,a,pt	%icc,.L900000659
1075/* 0x00f0	     */		std	%f0,[%o3]
1076                       .L77000285:
1077/* 0x00f4	 238 */		ldd	[%i2],%f0
1078                       .L900000660:
1079/* 0x00f8	 238 */		ldd	[%i3],%f2
1080/* 0x00fc	     */		add	%o1,1,%o2
1081/* 0x0100	 242 */		cmp	%o1,0
1082/* 0x0104	     */		sll	%o2,1,%o0
1083/* 0x0108	     */		sub	%o1,1,%o1
1084/* 0x010c	 238 */		fmuld	%f0,%f2,%f0
1085/* 0x0110	     */		std	%f0,[%i1]
1086/* 0x0114	   0 */		or	%g0,0,%l1
1087/* 0x0118	     */		ldd	[%l0],%f6
1088/* 0x011c	     */		or	%g0,0,%g4
1089/* 0x0120	     */		or	%g0,%o2,%i5
1090/* 0x0124	     */		ldd	[%g5],%f2
1091/* 0x0128	     */		or	%g0,%o1,%g3
1092/* 0x012c	     */		or	%g0,%o0,%o3
1093/* 0x0130	     */		fdtox	%f0,%f0
1094/* 0x0134	     */		ldd	[%g1],%f4
1095/* 0x0138	 246 */		add	%i3,8,%o4
1096/* 0x013c	     */		or	%g0,0,%l2
1097/* 0x0140	     */		or	%g0,%i1,%o5
1098/* 0x0144	     */		sub	%i0,1,%o7
1099/* 0x0148	     */		fmovs	%f6,%f0
1100/* 0x014c	     */		fxtod	%f0,%f0
1101/* 0x0150	 239 */		fmuld	%f0,%f16,%f0
1102/* 0x0154	     */		fmuld	%f0,%f2,%f2
1103/* 0x0158	     */		fdtox	%f2,%f2
1104/* 0x015c	     */		fxtod	%f2,%f2
1105/* 0x0160	     */		fmuld	%f2,%f4,%f2
1106/* 0x0164	     */		fsubd	%f0,%f2,%f22
1107/* 0x0168	 242 */		ble,pt	%icc,.L900000653
1108/* 0x016c	     */		sll	%i0,4,%g2
1109/* 0x0170	 246 */		ldd	[%i4],%f0
1110                       .L900000654:
1111/* 0x0174	 246 */		fmuld	%f0,%f22,%f8
1112/* 0x0178	     */		ldd	[%i2],%f0
1113/* 0x017c	 250 */		cmp	%i0,1
1114/* 0x0180	 246 */		ldd	[%o4+%l2],%f6
1115/* 0x0184	     */		add	%i2,8,%o0
1116/* 0x0188	 250 */		or	%g0,1,%o1
1117/* 0x018c	 246 */		ldd	[%o5],%f2
1118/* 0x0190	     */		add	%o5,16,%l3
1119/* 0x0194	     */		fmuld	%f0,%f6,%f6
1120/* 0x0198	     */		ldd	[%g5],%f4
1121/* 0x019c	     */		faddd	%f2,%f8,%f2
1122/* 0x01a0	     */		ldd	[%o5+8],%f0
1123/* 0x01a4	 244 */		ldd	[%i3+%l2],%f20
1124/* 0x01a8	 246 */		faddd	%f0,%f6,%f0
1125/* 0x01ac	     */		fmuld	%f2,%f4,%f2
1126/* 0x01b0	     */		faddd	%f0,%f2,%f18
1127/* 0x01b4	 247 */		std	%f18,[%o5+8]
1128/* 0x01b8	 250 */		ble,pt	%icc,.L900000658
1129/* 0x01bc	     */		srl	%g4,31,%g2
1130/* 0x01c0	     */		cmp	%o7,7
1131/* 0x01c4	 246 */		add	%i4,8,%g2
1132/* 0x01c8	 250 */		bl,pn	%icc,.L77000284
1133/* 0x01cc	     */		add	%g2,24,%o2
1134/* 0x01d0	 252 */		ldd	[%o0+24],%f12
1135/* 0x01d4	     */		add	%o5,48,%l3
1136/* 0x01d8	     */		ldd	[%o0],%f2
1137/* 0x01dc	   0 */		or	%g0,%o2,%g2
1138/* 0x01e0	 250 */		sub	%o7,2,%o2
1139/* 0x01e4	 252 */		ldd	[%g2-24],%f0
1140/* 0x01e8	     */		or	%g0,5,%o1
1141/* 0x01ec	     */		ldd	[%o0+8],%f6
1142/* 0x01f0	     */		fmuld	%f2,%f20,%f2
1143/* 0x01f4	     */		ldd	[%o0+16],%f14
1144/* 0x01f8	     */		fmuld	%f0,%f22,%f4
1145/* 0x01fc	     */		add	%o0,32,%o0
1146/* 0x0200	     */		ldd	[%g2-16],%f8
1147/* 0x0204	     */		fmuld	%f6,%f20,%f10
1148/* 0x0208	     */		ldd	[%o5+16],%f0
1149/* 0x020c	     */		ldd	[%g2-8],%f6
1150/* 0x0210	     */		faddd	%f2,%f4,%f4
1151/* 0x0214	     */		ldd	[%o5+32],%f2
1152                       .L900000642:
1153/* 0x0218	 252 */		ldd	[%g2],%f24
1154/* 0x021c	     */		add	%o1,3,%o1
1155/* 0x0220	     */		add	%g2,24,%g2
1156/* 0x0224	     */		fmuld	%f8,%f22,%f8
1157/* 0x0228	     */		ldd	[%l3],%f28
1158/* 0x022c	     */		cmp	%o1,%o2
1159/* 0x0230	     */		add	%o0,24,%o0
1160/* 0x0234	     */		ldd	[%o0-24],%f26
1161/* 0x0238	     */		faddd	%f0,%f4,%f0
1162/* 0x023c	     */		add	%l3,48,%l3
1163/* 0x0240	     */		faddd	%f10,%f8,%f10
1164/* 0x0244	     */		fmuld	%f14,%f20,%f4
1165/* 0x0248	     */		std	%f0,[%l3-80]
1166/* 0x024c	     */		ldd	[%g2-16],%f8
1167/* 0x0250	     */		fmuld	%f6,%f22,%f6
1168/* 0x0254	     */		ldd	[%l3-32],%f0
1169/* 0x0258	     */		ldd	[%o0-16],%f14
1170/* 0x025c	     */		faddd	%f2,%f10,%f2
1171/* 0x0260	     */		faddd	%f4,%f6,%f10
1172/* 0x0264	     */		fmuld	%f12,%f20,%f4
1173/* 0x0268	     */		std	%f2,[%l3-64]
1174/* 0x026c	     */		ldd	[%g2-8],%f6
1175/* 0x0270	     */		fmuld	%f24,%f22,%f24
1176/* 0x0274	     */		ldd	[%l3-16],%f2
1177/* 0x0278	     */		ldd	[%o0-8],%f12
1178/* 0x027c	     */		faddd	%f28,%f10,%f10
1179/* 0x0280	     */		std	%f10,[%l3-48]
1180/* 0x0284	     */		fmuld	%f26,%f20,%f10
1181/* 0x0288	     */		ble,pt	%icc,.L900000642
1182/* 0x028c	     */		faddd	%f4,%f24,%f4
1183                       .L900000645:
1184/* 0x0290	 252 */		fmuld	%f8,%f22,%f28
1185/* 0x0294	     */		ldd	[%g2],%f24
1186/* 0x0298	     */		faddd	%f0,%f4,%f26
1187/* 0x029c	     */		fmuld	%f12,%f20,%f8
1188/* 0x02a0	     */		add	%l3,32,%l3
1189/* 0x02a4	     */		cmp	%o1,%o7
1190/* 0x02a8	     */		fmuld	%f14,%f20,%f14
1191/* 0x02ac	     */		ldd	[%l3-32],%f4
1192/* 0x02b0	     */		add	%g2,8,%g2
1193/* 0x02b4	     */		faddd	%f10,%f28,%f12
1194/* 0x02b8	     */		fmuld	%f6,%f22,%f6
1195/* 0x02bc	     */		ldd	[%l3-16],%f0
1196/* 0x02c0	     */		fmuld	%f24,%f22,%f10
1197/* 0x02c4	     */		std	%f26,[%l3-64]
1198/* 0x02c8	     */		faddd	%f2,%f12,%f2
1199/* 0x02cc	     */		std	%f2,[%l3-48]
1200/* 0x02d0	     */		faddd	%f14,%f6,%f6
1201/* 0x02d4	     */		faddd	%f8,%f10,%f2
1202/* 0x02d8	     */		faddd	%f4,%f6,%f4
1203/* 0x02dc	     */		std	%f4,[%l3-32]
1204/* 0x02e0	     */		faddd	%f0,%f2,%f0
1205/* 0x02e4	     */		bg,pn	%icc,.L77000213
1206/* 0x02e8	     */		std	%f0,[%l3-16]
1207                       .L77000284:
1208/* 0x02ec	 252 */		ldd	[%o0],%f0
1209                       .L900000657:
1210/* 0x02f0	 252 */		ldd	[%g2],%f4
1211/* 0x02f4	     */		fmuld	%f0,%f20,%f2
1212/* 0x02f8	     */		add	%o1,1,%o1
1213/* 0x02fc	     */		ldd	[%l3],%f0
1214/* 0x0300	     */		add	%o0,8,%o0
1215/* 0x0304	     */		add	%g2,8,%g2
1216/* 0x0308	     */		fmuld	%f4,%f22,%f4
1217/* 0x030c	     */		cmp	%o1,%o7
1218/* 0x0310	     */		faddd	%f2,%f4,%f2
1219/* 0x0314	     */		faddd	%f0,%f2,%f0
1220/* 0x0318	     */		std	%f0,[%l3]
1221/* 0x031c	     */		add	%l3,16,%l3
1222/* 0x0320	     */		ble,a,pt	%icc,.L900000657
1223/* 0x0324	     */		ldd	[%o0],%f0
1224                       .L77000213:
1225/* 0x0328	     */		srl	%g4,31,%g2
1226                       .L900000658:
1227/* 0x032c	 254 */		cmp	%l1,30
1228/* 0x0330	     */		bne,a,pt	%icc,.L900000656
1229/* 0x0334	     */		fdtox	%f18,%f0
1230/* 0x0338	     */		add	%g4,%g2,%g2
1231/* 0x033c	     */		sra	%g2,1,%o0
1232/* 0x0340	 281 */		ldd	[%l0],%f0
1233/* 0x0344	     */		sll	%i5,1,%o2
1234/* 0x0348	     */		add	%o0,1,%g2
1235/* 0x034c	     */		sll	%g2,1,%o0
1236/* 0x0350	 254 */		sub	%o2,1,%o2
1237/* 0x0354	 281 */		fmovd	%f0,%f2
1238/* 0x0358	     */		sll	%g2,4,%o1
1239/* 0x035c	     */		cmp	%o0,%o3
1240/* 0x0360	     */		bge,pt	%icc,.L77000215
1241/* 0x0364	     */		or	%g0,0,%l1
1242/* 0x0368	 254 */		add	%i1,%o1,%o1
1243/* 0x036c	 281 */		ldd	[%o1],%f6
1244                       .L900000655:
1245/* 0x0370	     */		fdtox	%f6,%f10
1246/* 0x0374	     */		ldd	[%o1+8],%f4
1247/* 0x0378	     */		add	%o0,2,%o0
1248/* 0x037c	     */		ldd	[%l0],%f12
1249/* 0x0380	     */		fdtox	%f6,%f6
1250/* 0x0384	     */		cmp	%o0,%o2
1251/* 0x0388	     */		fdtox	%f4,%f8
1252/* 0x038c	     */		fdtox	%f4,%f4
1253/* 0x0390	     */		fmovs	%f12,%f10
1254/* 0x0394	     */		fmovs	%f12,%f8
1255/* 0x0398	     */		fxtod	%f10,%f10
1256/* 0x039c	     */		fxtod	%f8,%f8
1257/* 0x03a0	     */		faddd	%f10,%f2,%f2
1258/* 0x03a4	     */		std	%f2,[%o1]
1259/* 0x03a8	     */		faddd	%f8,%f0,%f0
1260/* 0x03ac	     */		std	%f0,[%o1+8]
1261/* 0x03b0	     */		add	%o1,16,%o1
1262/* 0x03b4	     */		fitod	%f6,%f2
1263/* 0x03b8	     */		fitod	%f4,%f0
1264/* 0x03bc	     */		ble,a,pt	%icc,.L900000655
1265/* 0x03c0	     */		ldd	[%o1],%f6
1266                       .L77000233:
1267/* 0x03c4	     */		or	%g0,0,%l1
1268                       .L77000215:
1269/* 0x03c8	     */		fdtox	%f18,%f0
1270                       .L900000656:
1271/* 0x03cc	     */		ldd	[%l0],%f6
1272/* 0x03d0	 256 */		add	%g4,1,%g4
1273/* 0x03d4	     */		add	%l2,8,%l2
1274/* 0x03d8	     */		ldd	[%g5],%f2
1275/* 0x03dc	     */		add	%l1,1,%l1
1276/* 0x03e0	     */		add	%o5,8,%o5
1277/* 0x03e4	     */		fmovs	%f6,%f0
1278/* 0x03e8	     */		ldd	[%g1],%f4
1279/* 0x03ec	     */		cmp	%g4,%g3
1280/* 0x03f0	     */		fxtod	%f0,%f0
1281/* 0x03f4	     */		fmuld	%f0,%f16,%f0
1282/* 0x03f8	     */		fmuld	%f0,%f2,%f2
1283/* 0x03fc	     */		fdtox	%f2,%f2
1284/* 0x0400	     */		fxtod	%f2,%f2
1285/* 0x0404	     */		fmuld	%f2,%f4,%f2
1286/* 0x0408	     */		fsubd	%f0,%f2,%f22
1287/* 0x040c	     */		ble,a,pt	%icc,.L900000654
1288/* 0x0410	     */		ldd	[%i4],%f0
1289                       .L900000629:
1290/* 0x0414	 256 */		ba	.L900000653
1291/* 0x0418	     */		sll	%i0,4,%g2
1292                       .L77000279:
1293/* 0x041c	 261 */		ldd	[%o2],%f6
1294/* 0x0420	 279 */		or	%g0,%o0,%o4
1295/* 0x0424	 281 */		or	%g0,0,%o3
1296/* 0x0428	 261 */		ldd	[%i2],%f4
1297/* 0x042c	 273 */		std	%f0,[%o0+8]
1298/* 0x0430	     */		std	%f0,[%o0+16]
1299/* 0x0434	 261 */		fmuld	%f4,%f6,%f4
1300/* 0x0438	     */		std	%f4,[%o0]
1301/* 0x043c	 273 */		std	%f0,[%o0+24]
1302/* 0x0440	     */		std	%f0,[%o0+32]
1303/* 0x0444	     */		fdtox	%f4,%f4
1304/* 0x0448	     */		std	%f0,[%o0+40]
1305/* 0x044c	     */		std	%f0,[%o0+48]
1306/* 0x0450	     */		std	%f0,[%o0+56]
1307/* 0x0454	     */		std	%f0,[%o0+64]
1308/* 0x0458	     */		std	%f0,[%o0+72]
1309/* 0x045c	     */		std	%f0,[%o0+80]
1310/* 0x0460	     */		std	%f0,[%o0+88]
1311/* 0x0464	     */		std	%f0,[%o0+96]
1312/* 0x0468	     */		std	%f0,[%o0+104]
1313/* 0x046c	     */		std	%f0,[%o0+112]
1314/* 0x0470	     */		std	%f0,[%o0+120]
1315/* 0x0474	     */		std	%f0,[%o0+128]
1316/* 0x0478	     */		std	%f0,[%o0+136]
1317/* 0x047c	     */		std	%f0,[%o0+144]
1318/* 0x0480	     */		std	%f0,[%o0+152]
1319/* 0x0484	     */		std	%f0,[%o0+160]
1320/* 0x0488	     */		std	%f0,[%o0+168]
1321/* 0x048c	     */		fmovs	%f0,%f4
1322/* 0x0490	     */		std	%f0,[%o0+176]
1323/* 0x0494	 281 */		or	%g0,0,%o1
1324/* 0x0498	 273 */		std	%f0,[%o0+184]
1325/* 0x049c	     */		fxtod	%f4,%f4
1326/* 0x04a0	     */		std	%f0,[%o0+192]
1327/* 0x04a4	     */		std	%f0,[%o0+200]
1328/* 0x04a8	     */		std	%f0,[%o0+208]
1329/* 0x04ac	 278 */		fmuld	%f4,%f2,%f2
1330/* 0x04b0	 273 */		std	%f0,[%o0+216]
1331/* 0x04b4	     */		std	%f0,[%o0+224]
1332/* 0x04b8	     */		std	%f0,[%o0+232]
1333/* 0x04bc	     */		std	%f0,[%o0+240]
1334/* 0x04c0	     */		std	%f0,[%o0+248]
1335/* 0x04c4	     */		std	%f0,[%o0+256]
1336/* 0x04c8	     */		std	%f0,[%o0+264]
1337/* 0x04cc	     */		std	%f0,[%o0+272]
1338/* 0x04d0	     */		std	%f0,[%o0+280]
1339/* 0x04d4	     */		std	%f0,[%o0+288]
1340/* 0x04d8	     */		std	%f0,[%o0+296]
1341/* 0x04dc	     */		std	%f0,[%o0+304]
1342/* 0x04e0	     */		std	%f0,[%o0+312]
1343/* 0x04e4	     */		std	%f0,[%o0+320]
1344/* 0x04e8	     */		std	%f0,[%o0+328]
1345/* 0x04ec	     */		std	%f0,[%o0+336]
1346/* 0x04f0	     */		std	%f0,[%o0+344]
1347/* 0x04f4	     */		std	%f0,[%o0+352]
1348/* 0x04f8	     */		std	%f0,[%o0+360]
1349/* 0x04fc	     */		std	%f0,[%o0+368]
1350/* 0x0500	     */		std	%f0,[%o0+376]
1351/* 0x0504	     */		std	%f0,[%o0+384]
1352/* 0x0508	     */		std	%f0,[%o0+392]
1353/* 0x050c	     */		std	%f0,[%o0+400]
1354/* 0x0510	     */		std	%f0,[%o0+408]
1355/* 0x0514	     */		std	%f0,[%o0+416]
1356/* 0x0518	     */		std	%f0,[%o0+424]
1357/* 0x051c	     */		std	%f0,[%o0+432]
1358/* 0x0520	     */		std	%f0,[%o0+440]
1359/* 0x0524	     */		std	%f0,[%o0+448]
1360/* 0x0528	     */		std	%f0,[%o0+456]
1361/* 0x052c	     */		std	%f0,[%o0+464]
1362/* 0x0530	     */		std	%f0,[%o0+472]
1363/* 0x0534	     */		std	%f0,[%o0+480]
1364/* 0x0538	     */		std	%f0,[%o0+488]
1365/* 0x053c	     */		std	%f0,[%o0+496]
1366/* 0x0540	     */		std	%f0,[%o0+504]
1367/* 0x0544	     */		std	%f0,[%o0+512]
1368/* 0x0548	     */		std	%f0,[%o0+520]
1369/* 0x054c	     */		ldd	[%g5],%f0
1370/* 0x0550	     */		ldd	[%g1],%f8
1371/* 0x0554	     */		fmuld	%f2,%f0,%f6
1372/* 0x0558	 275 */		ldd	[%i4],%f4
1373/* 0x055c	 276 */		ldd	[%i2],%f0
1374/* 0x0560	     */		fdtox	%f6,%f6
1375/* 0x0564	     */		fxtod	%f6,%f6
1376/* 0x0568	     */		fmuld	%f6,%f8,%f6
1377/* 0x056c	     */		fsubd	%f2,%f6,%f2
1378/* 0x0570	 286 */		fmuld	%f4,%f2,%f12
1379
1380!  282		      !       {
1381!  284		      !	 m2j=pdm2[j];
1382!  285		      !	 a=pdtj[0]+pdn_0*digit;
1383!  286		      !	 b=pdtj[1]+pdm1_0*pdm2[j+1]+a*TwoToMinus16;
1384
1385!  287		      !	 pdtj[1]=b;
1386!  289		      !	 /**** this loop will be fully unrolled:
1387!  290		      !	 for(i=1;i<16;i++)
1388!  291		      !	   {
1389!  292		      !	     pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit;
1390!  293		      !	   }
1391!  294		      !	 *************************************/
1392!  295		      !	     pdtj[2]+=pdm1[1]*m2j+pdn[1]*digit;
1393!  296		      !	     pdtj[4]+=pdm1[2]*m2j+pdn[2]*digit;
1394!  297		      !	     pdtj[6]+=pdm1[3]*m2j+pdn[3]*digit;
1395!  298		      !	     pdtj[8]+=pdm1[4]*m2j+pdn[4]*digit;
1396!  299		      !	     pdtj[10]+=pdm1[5]*m2j+pdn[5]*digit;
1397!  300		      !	     pdtj[12]+=pdm1[6]*m2j+pdn[6]*digit;
1398!  301		      !	     pdtj[14]+=pdm1[7]*m2j+pdn[7]*digit;
1399!  302		      !	     pdtj[16]+=pdm1[8]*m2j+pdn[8]*digit;
1400!  303		      !	     pdtj[18]+=pdm1[9]*m2j+pdn[9]*digit;
1401!  304		      !	     pdtj[20]+=pdm1[10]*m2j+pdn[10]*digit;
1402!  305		      !	     pdtj[22]+=pdm1[11]*m2j+pdn[11]*digit;
1403!  306		      !	     pdtj[24]+=pdm1[12]*m2j+pdn[12]*digit;
1404!  307		      !	     pdtj[26]+=pdm1[13]*m2j+pdn[13]*digit;
1405!  308		      !	     pdtj[28]+=pdm1[14]*m2j+pdn[14]*digit;
1406!  309		      !	     pdtj[30]+=pdm1[15]*m2j+pdn[15]*digit;
1407!  310		      !	 /* no need for cleenup, cannot overflow */
1408!  311		      !	 digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16);
1409
1410	fmovd %f2,%f0		! hand modified
1411	fmovd %f16,%f18			! hand modified
1412	ldd [%i4],%f2
1413	ldd [%o4],%f8
1414	ldd [%i2],%f10
1415	ldd [%g5],%f14		! hand modified
1416	ldd [%g1],%f16		! hand modified
1417	ldd [%i3],%f24
1418
1419	ldd [%i2+8],%f26
1420	ldd [%i2+16],%f40
1421	ldd [%i2+48],%f46
1422	ldd [%i2+56],%f30
1423	ldd [%i2+64],%f54
1424	ldd [%i2+104],%f34
1425	ldd [%i2+112],%f58
1426
1427	ldd [%i4+8],%f28
1428	ldd [%i4+104],%f38
1429	ldd [%i4+112],%f60
1430
1431	.L99999999: 			!1
1432	ldd	[%i2+24],%f32
1433	fmuld	%f0,%f2,%f4 	!2
1434	ldd	[%i4+24],%f36
1435	fmuld	%f26,%f24,%f20 	!3
1436	ldd	[%i2+40],%f42
1437	fmuld	%f28,%f0,%f22 	!4
1438	ldd	[%i4+40],%f44
1439	fmuld	%f32,%f24,%f32 	!5
1440	ldd	[%i3+8],%f6
1441	faddd	%f4,%f8,%f4
1442	fmuld	%f36,%f0,%f36 	!6
1443	add	%i3,8,%i3
1444	ldd	[%i4+56],%f50
1445	fmuld	%f42,%f24,%f42 	!7
1446	ldd	[%i2+72],%f52
1447	faddd	%f20,%f22,%f20
1448	fmuld	%f44,%f0,%f44 	!8
1449	ldd	[%o4+16],%f22
1450	fmuld	%f10,%f6,%f12 	!9
1451	ldd	[%i4+72],%f56
1452	faddd	%f32,%f36,%f32
1453	fmuld	%f14,%f4,%f4 !10
1454	ldd	[%o4+48],%f36
1455	fmuld	%f30,%f24,%f48 	!11
1456	ldd	[%o4+8],%f8
1457	faddd	%f20,%f22,%f20
1458	fmuld	%f50,%f0,%f50	!12
1459	std	%f20,[%o4+16]
1460	faddd	%f42,%f44,%f42
1461	fmuld	%f52,%f24,%f52 	!13
1462	ldd	[%o4+80],%f44
1463	faddd	%f4,%f12,%f4
1464	fmuld	%f56,%f0,%f56 	!14
1465	ldd	[%i2+88],%f20
1466	faddd	%f32,%f36,%f32 	!15
1467	ldd	[%i4+88],%f22
1468	faddd	%f48,%f50,%f48 	!16
1469	ldd	[%o4+112],%f50
1470	faddd	%f52,%f56,%f52 	!17
1471	ldd	[%o4+144],%f56
1472	faddd	%f4,%f8,%f8
1473	fmuld	%f20,%f24,%f20 	!18
1474	std	%f32,[%o4+48]
1475	faddd	%f42,%f44,%f42
1476	fmuld	%f22,%f0,%f22 	!19
1477	std	%f42,[%o4+80]
1478	faddd	%f48,%f50,%f48
1479	fmuld	%f34,%f24,%f32 	!20
1480	std	%f48,[%o4+112]
1481	faddd	%f52,%f56,%f52
1482	fmuld	%f38,%f0,%f36 	!21
1483	ldd	[%i2+120],%f42
1484	fdtox	%f8,%f4 		!22
1485	std	%f52,[%o4+144]
1486	faddd	%f20,%f22,%f20 	!23
1487	ldd	[%i4+120],%f44 	!24
1488	ldd	[%o4+176],%f22
1489	faddd	%f32,%f36,%f32
1490	fmuld	%f42,%f24,%f42 	!25
1491	ldd	[%i4+16],%f50
1492	fmovs	%f17,%f4 	!26
1493	ldd	[%i2+32],%f52
1494	fmuld	%f44,%f0,%f44 	!27
1495	ldd	[%i4+32],%f56
1496	fmuld	%f40,%f24,%f48 	!28
1497	ldd	[%o4+208],%f36
1498	faddd	%f20,%f22,%f20
1499	fmuld	%f50,%f0,%f50 	!29
1500	std	%f20,[%o4+176]
1501	fxtod	%f4,%f4
1502	fmuld	%f52,%f24,%f52 	!30
1503	ldd	[%i4+48],%f22
1504	faddd	%f42,%f44,%f42
1505	fmuld	%f56,%f0,%f56 	!31
1506	ldd	[%o4+240],%f44
1507	faddd	%f32,%f36,%f32 	!32
1508	std	%f32,[%o4+208]
1509	faddd	%f48,%f50,%f48
1510	fmuld	%f46,%f24,%f20 	!33
1511	ldd	[%o4+32],%f50
1512	fmuld	%f4,%f18,%f12 	!34
1513	ldd	[%i4+64],%f36
1514	faddd	%f52,%f56,%f52
1515	fmuld	%f22,%f0,%f22 	!35
1516	ldd	[%o4+64],%f56
1517	faddd	%f42,%f44,%f42 	!36
1518	std	%f42,[%o4+240]
1519	faddd	%f48,%f50,%f48
1520	fmuld	%f54,%f24,%f32 	!37
1521	std	%f48,[%o4+32]
1522	fmuld	%f12,%f14,%f4 !38
1523	ldd	[%i2+80],%f42
1524	faddd	%f52,%f56,%f56	! yes, tmp52!
1525	fmuld	%f36,%f0,%f36 	!39
1526	ldd	[%i4+80],%f44
1527	faddd	%f20,%f22,%f20 	!40
1528	ldd	[%i2+96],%f48
1529	fmuld	%f58,%f24,%f52 	!41
1530	ldd	[%i4+96],%f50
1531	fdtox	%f4,%f4
1532	fmuld	%f42,%f24,%f42 	!42
1533	std	%f56,[%o4+64]	! yes, tmp52!
1534	faddd	%f32,%f36,%f32
1535	fmuld	%f44,%f0,%f44 	!43
1536	ldd	[%o4+96],%f22
1537	fmuld	%f48,%f24,%f48 	!44
1538	ldd	[%o4+128],%f36
1539	fmovd	%f6,%f24
1540	fmuld	%f50,%f0,%f50 	!45
1541	fxtod	%f4,%f4
1542	fmuld	%f60,%f0,%f56 	!46
1543	add	%o4,8,%o4
1544	faddd	%f42,%f44,%f42 	!47
1545	ldd	[%o4+160-8],%f44
1546	faddd	%f20,%f22,%f20 	!48
1547	std	%f20,[%o4+96-8]
1548	faddd	%f48,%f50,%f48 	!49
1549	ldd	[%o4+192-8],%f50
1550	faddd	%f52,%f56,%f52
1551	fmuld	%f4,%f16,%f4 	!50
1552	ldd	[%o4+224-8],%f56
1553	faddd	%f32,%f36,%f32 	!51
1554	std	%f32,[%o4+128-8]
1555	faddd	%f42,%f44,%f42 	!52
1556	add	%o3,1,%o3
1557	std	%f42,[%o4+160-8]
1558	faddd	%f48,%f50,%f48 	!53
1559	cmp	%o3,31
1560	std	%f48,[%o4+192-8]
1561	fsubd	%f12,%f4,%f0 	!54
1562	faddd	%f52,%f56,%f52
1563	ble,pt	%icc,.L99999999
1564	std	%f52,[%o4+224-8] 	!55
1565	std %f8,[%o4]
1566
1567!  312		      !       }
1568!  313		      !   }
1569!  315		      ! conv_d16_to_i32(result,dt+2*nlen,(long long *)dt,nlen+1);
1570
1571/* 0x07c8	 315 */		sll	%i0,4,%g2
1572                       .L900000653:
1573/* 0x07cc	 315 */		add	%i1,%g2,%i1
1574/* 0x07d0	 242 */		ld	[%fp+68],%o0
1575/* 0x07d4	 315 */		or	%g0,0,%o4
1576/* 0x07d8	     */		ldd	[%i1],%f0
1577/* 0x07dc	     */		or	%g0,0,%g5
1578/* 0x07e0	     */		cmp	%i0,0
1579/* 0x07e4	 242 */		or	%g0,%o0,%o3
1580/* 0x07e8	 311 */		sub	%i0,1,%g1
1581/* 0x07ec	 315 */		fdtox	%f0,%f0
1582/* 0x07f0	     */		std	%f0,[%sp+120]
1583/* 0x07f4	 311 */		sethi	%hi(0xfc00),%o1
1584/* 0x07f8	     */		add	%g1,1,%g3
1585/* 0x07fc	     */		or	%g0,%o0,%g4
1586/* 0x0800	 315 */		ldd	[%i1+8],%f0
1587/* 0x0804	     */		add	%o1,1023,%o1
1588/* 0x0808	     */		fdtox	%f0,%f0
1589/* 0x080c	     */		std	%f0,[%sp+112]
1590/* 0x0810	     */		ldx	[%sp+112],%o5
1591/* 0x0814	     */		ldx	[%sp+120],%o7
1592/* 0x0818	     */		ble,pt	%icc,.L900000651
1593/* 0x081c	     */		sethi	%hi(0xfc00),%g2
1594/* 0x0820	 311 */		or	%g0,-1,%g2
1595/* 0x0824	 315 */		cmp	%g3,3
1596/* 0x0828	 311 */		srl	%g2,0,%o2
1597/* 0x082c	 315 */		bl,pn	%icc,.L77000287
1598/* 0x0830	     */		or	%g0,%i1,%g2
1599/* 0x0834	     */		ldd	[%i1+16],%f0
1600/* 0x0838	     */		and	%o5,%o1,%o0
1601/* 0x083c	     */		add	%i1,16,%g2
1602/* 0x0840	     */		sllx	%o0,16,%g3
1603/* 0x0844	     */		and	%o7,%o2,%o0
1604/* 0x0848	     */		fdtox	%f0,%f0
1605/* 0x084c	     */		std	%f0,[%sp+104]
1606/* 0x0850	     */		add	%o0,%g3,%o4
1607/* 0x0854	     */		ldd	[%i1+24],%f2
1608/* 0x0858	     */		srax	%o5,16,%o0
1609/* 0x085c	     */		add	%o3,4,%g4
1610/* 0x0860	     */		stx	%o0,[%sp+128]
1611/* 0x0864	     */		and	%o4,%o2,%o0
1612/* 0x0868	     */		stx	%o0,[%sp+112]
1613/* 0x086c	     */		srax	%o4,32,%o0
1614/* 0x0870	     */		fdtox	%f2,%f0
1615/* 0x0874	     */		stx	%o0,[%sp+136]
1616/* 0x0878	     */		srax	%o7,32,%o4
1617/* 0x087c	     */		std	%f0,[%sp+96]
1618/* 0x0880	     */		ldx	[%sp+128],%g5
1619/* 0x0884	     */		ldx	[%sp+136],%o7
1620/* 0x0888	     */		ldx	[%sp+104],%g3
1621/* 0x088c	     */		add	%g5,%o7,%o0
1622/* 0x0890	     */		or	%g0,1,%g5
1623/* 0x0894	     */		ldx	[%sp+112],%o7
1624/* 0x0898	     */		add	%o4,%o0,%o4
1625/* 0x089c	     */		ldx	[%sp+96],%o5
1626/* 0x08a0	     */		st	%o7,[%o3]
1627/* 0x08a4	     */		or	%g0,%g3,%o7
1628                       .L900000634:
1629/* 0x08a8	     */		ldd	[%g2+16],%f0
1630/* 0x08ac	     */		add	%g5,1,%g5
1631/* 0x08b0	     */		add	%g4,4,%g4
1632/* 0x08b4	     */		cmp	%g5,%g1
1633/* 0x08b8	     */		add	%g2,16,%g2
1634/* 0x08bc	     */		fdtox	%f0,%f0
1635/* 0x08c0	     */		std	%f0,[%sp+104]
1636/* 0x08c4	     */		ldd	[%g2+8],%f0
1637/* 0x08c8	     */		fdtox	%f0,%f0
1638/* 0x08cc	     */		std	%f0,[%sp+96]
1639/* 0x08d0	     */		and	%o5,%o1,%g3
1640/* 0x08d4	     */		sllx	%g3,16,%g3
1641/* 0x08d8	     */		stx	%g3,[%sp+120]
1642/* 0x08dc	     */		and	%o7,%o2,%g3
1643/* 0x08e0	     */		stx	%o7,[%sp+128]
1644/* 0x08e4	     */		ldx	[%sp+120],%o7
1645/* 0x08e8	     */		add	%g3,%o7,%g3
1646/* 0x08ec	     */		ldx	[%sp+128],%o7
1647/* 0x08f0	     */		srax	%o5,16,%o5
1648/* 0x08f4	     */		add	%g3,%o4,%g3
1649/* 0x08f8	     */		srax	%g3,32,%o4
1650/* 0x08fc	     */		stx	%o4,[%sp+112]
1651/* 0x0900	     */		srax	%o7,32,%o4
1652/* 0x0904	     */		ldx	[%sp+112],%o7
1653/* 0x0908	     */		add	%o5,%o7,%o7
1654/* 0x090c	     */		ldx	[%sp+96],%o5
1655/* 0x0910	     */		add	%o4,%o7,%o4
1656/* 0x0914	     */		and	%g3,%o2,%g3
1657/* 0x0918	     */		ldx	[%sp+104],%o7
1658/* 0x091c	     */		ble,pt	%icc,.L900000634
1659/* 0x0920	     */		st	%g3,[%g4-4]
1660                       .L900000637:
1661/* 0x0924	     */		ba	.L900000651
1662/* 0x0928	     */		sethi	%hi(0xfc00),%g2
1663                       .L77000287:
1664/* 0x092c	     */		ldd	[%g2+16],%f0
1665                       .L900000650:
1666/* 0x0930	     */		and	%o7,%o2,%o0
1667/* 0x0934	     */		and	%o5,%o1,%g3
1668/* 0x0938	     */		fdtox	%f0,%f0
1669/* 0x093c	     */		add	%o4,%o0,%o0
1670/* 0x0940	     */		std	%f0,[%sp+104]
1671/* 0x0944	     */		add	%g5,1,%g5
1672/* 0x0948	     */		sllx	%g3,16,%o4
1673/* 0x094c	     */		ldd	[%g2+24],%f2
1674/* 0x0950	     */		add	%g2,16,%g2
1675/* 0x0954	     */		add	%o0,%o4,%o4
1676/* 0x0958	     */		cmp	%g5,%g1
1677/* 0x095c	     */		srax	%o5,16,%o0
1678/* 0x0960	     */		stx	%o0,[%sp+112]
1679/* 0x0964	     */		and	%o4,%o2,%g3
1680/* 0x0968	     */		srax	%o4,32,%o5
1681/* 0x096c	     */		fdtox	%f2,%f0
1682/* 0x0970	     */		std	%f0,[%sp+96]
1683/* 0x0974	     */		srax	%o7,32,%o4
1684/* 0x0978	     */		ldx	[%sp+112],%o7
1685/* 0x097c	     */		add	%o7,%o5,%o7
1686/* 0x0980	     */		ldx	[%sp+104],%o5
1687/* 0x0984	     */		add	%o4,%o7,%o4
1688/* 0x0988	     */		ldx	[%sp+96],%o0
1689/* 0x098c	     */		st	%g3,[%g4]
1690/* 0x0990	     */		or	%g0,%o5,%o7
1691/* 0x0994	     */		add	%g4,4,%g4
1692/* 0x0998	     */		or	%g0,%o0,%o5
1693/* 0x099c	     */		ble,a,pt	%icc,.L900000650
1694/* 0x09a0	     */		ldd	[%g2+16],%f0
1695                       .L77000236:
1696/* 0x09a4	     */		sethi	%hi(0xfc00),%g2
1697                       .L900000651:
1698/* 0x09a8	     */		or	%g0,-1,%o0
1699/* 0x09ac	     */		add	%g2,1023,%g2
1700/* 0x09b0	     */		ld	[%fp+88],%o1
1701/* 0x09b4	     */		srl	%o0,0,%g3
1702/* 0x09b8	     */		and	%o5,%g2,%g2
1703/* 0x09bc	     */		and	%o7,%g3,%g4
1704
1705!  317		      ! adjust_montf_result(result,nint,nlen);
1706
1707/* 0x09c0	 317 */		or	%g0,-1,%o5
1708/* 0x09c4	 311 */		sllx	%g2,16,%g2
1709/* 0x09c8	     */		add	%o4,%g4,%g4
1710/* 0x09cc	     */		add	%g4,%g2,%g2
1711/* 0x09d0	     */		sll	%g5,2,%g4
1712/* 0x09d4	     */		and	%g2,%g3,%g2
1713/* 0x09d8	     */		st	%g2,[%o3+%g4]
1714/* 0x09dc	 317 */		sll	%i0,2,%g2
1715/* 0x09e0	     */		ld	[%o3+%g2],%g2
1716/* 0x09e4	     */		cmp	%g2,0
1717/* 0x09e8	     */		bleu,pn	%icc,.L77000241
1718/* 0x09ec	     */		or	%g0,%o1,%o2
1719/* 0x09f0	     */		ba	.L900000649
1720/* 0x09f4	     */		cmp	%o5,0
1721                       .L77000241:
1722/* 0x09f8	     */		sub	%i0,1,%o5
1723/* 0x09fc	     */		sll	%o5,2,%g2
1724/* 0x0a00	     */		cmp	%o5,0
1725/* 0x0a04	     */		bl,pt	%icc,.L900000649
1726/* 0x0a08	     */		cmp	%o5,0
1727/* 0x0a0c	     */		add	%o1,%g2,%o1
1728/* 0x0a10	     */		add	%o3,%g2,%o4
1729/* 0x0a14	     */		ld	[%o1],%g2
1730                       .L900000648:
1731/* 0x0a18	     */		ld	[%o4],%g3
1732/* 0x0a1c	     */		sub	%o5,1,%o0
1733/* 0x0a20	     */		sub	%o1,4,%o1
1734/* 0x0a24	     */		sub	%o4,4,%o4
1735/* 0x0a28	     */		cmp	%g3,%g2
1736/* 0x0a2c	     */		bne,pn	%icc,.L77000244
1737/* 0x0a30	     */		nop
1738/* 0x0a34	   0 */		or	%g0,%o0,%o5
1739/* 0x0a38	 317 */		cmp	%o0,0
1740/* 0x0a3c	     */		bge,a,pt	%icc,.L900000648
1741/* 0x0a40	     */		ld	[%o1],%g2
1742                       .L77000244:
1743/* 0x0a44	     */		cmp	%o5,0
1744                       .L900000649:
1745/* 0x0a48	     */		bl,pn	%icc,.L77000288
1746/* 0x0a4c	     */		sll	%o5,2,%g2
1747/* 0x0a50	     */		ld	[%o2+%g2],%g3
1748/* 0x0a54	     */		ld	[%o3+%g2],%g2
1749/* 0x0a58	     */		cmp	%g2,%g3
1750/* 0x0a5c	     */		bleu,pt	%icc,.L77000224
1751/* 0x0a60	     */		nop
1752                       .L77000288:
1753/* 0x0a64	     */		cmp	%i0,0
1754/* 0x0a68	     */		ble,pt	%icc,.L77000224
1755/* 0x0a6c	     */		nop
1756/* 0x0a70	 317 */		sub	%i0,1,%o7
1757/* 0x0a74	     */		or	%g0,-1,%g2
1758/* 0x0a78	     */		srl	%g2,0,%o4
1759/* 0x0a7c	     */		add	%o7,1,%o0
1760/* 0x0a80	 315 */		or	%g0,0,%o5
1761/* 0x0a84	     */		or	%g0,0,%g1
1762/* 0x0a88	     */		cmp	%o0,3
1763/* 0x0a8c	     */		bl,pn	%icc,.L77000289
1764/* 0x0a90	     */		add	%o3,8,%o1
1765/* 0x0a94	     */		add	%o2,4,%o0
1766/* 0x0a98	     */		ld	[%o1-8],%g2
1767/* 0x0a9c	   0 */		or	%g0,%o1,%o3
1768/* 0x0aa0	 315 */		ld	[%o0-4],%g3
1769/* 0x0aa4	   0 */		or	%g0,%o0,%o2
1770/* 0x0aa8	 315 */		or	%g0,2,%g1
1771/* 0x0aac	     */		ld	[%o3-4],%o0
1772/* 0x0ab0	     */		sub	%g2,%g3,%g2
1773/* 0x0ab4	     */		or	%g0,%g2,%o5
1774/* 0x0ab8	     */		and	%g2,%o4,%g2
1775/* 0x0abc	     */		st	%g2,[%o3-8]
1776/* 0x0ac0	     */		srax	%o5,32,%o5
1777                       .L900000638:
1778/* 0x0ac4	     */		ld	[%o2],%g2
1779/* 0x0ac8	     */		add	%g1,1,%g1
1780/* 0x0acc	     */		add	%o2,4,%o2
1781/* 0x0ad0	     */		cmp	%g1,%o7
1782/* 0x0ad4	     */		add	%o3,4,%o3
1783/* 0x0ad8	     */		sub	%o0,%g2,%o0
1784/* 0x0adc	     */		add	%o0,%o5,%o5
1785/* 0x0ae0	     */		and	%o5,%o4,%g2
1786/* 0x0ae4	     */		ld	[%o3-4],%o0
1787/* 0x0ae8	     */		st	%g2,[%o3-8]
1788/* 0x0aec	     */		ble,pt	%icc,.L900000638
1789/* 0x0af0	     */		srax	%o5,32,%o5
1790                       .L900000641:
1791/* 0x0af4	     */		ld	[%o2],%o1
1792/* 0x0af8	     */		sub	%o0,%o1,%o0
1793/* 0x0afc	     */		add	%o0,%o5,%o0
1794/* 0x0b00	     */		and	%o0,%o4,%o1
1795/* 0x0b04	     */		st	%o1,[%o3-4]
1796/* 0x0b08	     */		ret	! Result =
1797/* 0x0b0c	     */		restore	%g0,%g0,%g0
1798                       .L77000289:
1799/* 0x0b10	     */		ld	[%o3],%o0
1800                       .L900000647:
1801/* 0x0b14	     */		ld	[%o2],%o1
1802/* 0x0b18	     */		add	%o5,%o0,%o0
1803/* 0x0b1c	     */		add	%g1,1,%g1
1804/* 0x0b20	     */		add	%o2,4,%o2
1805/* 0x0b24	     */		cmp	%g1,%o7
1806/* 0x0b28	     */		sub	%o0,%o1,%o0
1807/* 0x0b2c	     */		and	%o0,%o4,%o1
1808/* 0x0b30	     */		st	%o1,[%o3]
1809/* 0x0b34	     */		add	%o3,4,%o3
1810/* 0x0b38	     */		srax	%o0,32,%o5
1811/* 0x0b3c	     */		ble,a,pt	%icc,.L900000647
1812/* 0x0b40	     */		ld	[%o3],%o0
1813                       .L77000224:
1814/* 0x0b44	     */		ret	! Result =
1815/* 0x0b48	     */		restore	%g0,%g0,%g0
1816/* 0x0b4c	   0 */		.type	mont_mulf_noconv,2
1817/* 0x0b4c	     */		.size	mont_mulf_noconv,(.-mont_mulf_noconv)
1818
1819