Merge from vendor branch HEIMDAL:
[dragonfly.git] / contrib / gcc-3.4 / gcc / calls.c
1 /* Convert function calls to rtl insns, for GNU C compiler.
2    Copyright (C) 1989, 1992, 1993, 1994, 1995, 1996, 1997, 1998,
3    1999, 2000, 2001, 2002, 2003, 2004 Free Software Foundation, Inc.
4
5 This file is part of GCC.
6
7 GCC is free software; you can redistribute it and/or modify it under
8 the terms of the GNU General Public License as published by the Free
9 Software Foundation; either version 2, or (at your option) any later
10 version.
11
12 GCC is distributed in the hope that it will be useful, but WITHOUT ANY
13 WARRANTY; without even the implied warranty of MERCHANTABILITY or
14 FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
15 for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with GCC; see the file COPYING.  If not, write to the Free
19 Software Foundation, 59 Temple Place - Suite 330, Boston, MA
20 02111-1307, USA.  */
21
22 #include "config.h"
23 #include "system.h"
24 #include "coretypes.h"
25 #include "tm.h"
26 #include "rtl.h"
27 #include "tree.h"
28 #include "flags.h"
29 #include "expr.h"
30 #include "optabs.h"
31 #include "libfuncs.h"
32 #include "function.h"
33 #include "regs.h"
34 #include "toplev.h"
35 #include "output.h"
36 #include "tm_p.h"
37 #include "timevar.h"
38 #include "sbitmap.h"
39 #include "langhooks.h"
40 #include "target.h"
41 #include "cgraph.h"
42 #include "except.h"
43
44 /* Like PREFERRED_STACK_BOUNDARY but in units of bytes, not bits.  */
45 #define STACK_BYTES (PREFERRED_STACK_BOUNDARY / BITS_PER_UNIT)
46
47 /* Data structure and subroutines used within expand_call.  */
48
49 struct arg_data
50 {
51   /* Tree node for this argument.  */
52   tree tree_value;
53   /* Mode for value; TYPE_MODE unless promoted.  */
54   enum machine_mode mode;
55   /* Current RTL value for argument, or 0 if it isn't precomputed.  */
56   rtx value;
57   /* Initially-compute RTL value for argument; only for const functions.  */
58   rtx initial_value;
59   /* Register to pass this argument in, 0 if passed on stack, or an
60      PARALLEL if the arg is to be copied into multiple non-contiguous
61      registers.  */
62   rtx reg;
63   /* Register to pass this argument in when generating tail call sequence.
64      This is not the same register as for normal calls on machines with
65      register windows.  */
66   rtx tail_call_reg;
67   /* If REG was promoted from the actual mode of the argument expression,
68      indicates whether the promotion is sign- or zero-extended.  */
69   int unsignedp;
70   /* Number of registers to use.  0 means put the whole arg in registers.
71      Also 0 if not passed in registers.  */
72   int partial;
73   /* Nonzero if argument must be passed on stack.
74      Note that some arguments may be passed on the stack
75      even though pass_on_stack is zero, just because FUNCTION_ARG says so.
76      pass_on_stack identifies arguments that *cannot* go in registers.  */
77   int pass_on_stack;
78   /* Some fields packaged up for locate_and_pad_parm.  */
79   struct locate_and_pad_arg_data locate;
80   /* Location on the stack at which parameter should be stored.  The store
81      has already been done if STACK == VALUE.  */
82   rtx stack;
83   /* Location on the stack of the start of this argument slot.  This can
84      differ from STACK if this arg pads downward.  This location is known
85      to be aligned to FUNCTION_ARG_BOUNDARY.  */
86   rtx stack_slot;
87   /* Place that this stack area has been saved, if needed.  */
88   rtx save_area;
89   /* If an argument's alignment does not permit direct copying into registers,
90      copy in smaller-sized pieces into pseudos.  These are stored in a
91      block pointed to by this field.  The next field says how many
92      word-sized pseudos we made.  */
93   rtx *aligned_regs;
94   int n_aligned_regs;
95 };
96
97 /* A vector of one char per byte of stack space.  A byte if nonzero if
98    the corresponding stack location has been used.
99    This vector is used to prevent a function call within an argument from
100    clobbering any stack already set up.  */
101 static char *stack_usage_map;
102
103 /* Size of STACK_USAGE_MAP.  */
104 static int highest_outgoing_arg_in_use;
105
106 /* A bitmap of virtual-incoming stack space.  Bit is set if the corresponding
107    stack location's tail call argument has been already stored into the stack.
108    This bitmap is used to prevent sibling call optimization if function tries
109    to use parent's incoming argument slots when they have been already
110    overwritten with tail call arguments.  */
111 static sbitmap stored_args_map;
112
113 /* stack_arg_under_construction is nonzero when an argument may be
114    initialized with a constructor call (including a C function that
115    returns a BLKmode struct) and expand_call must take special action
116    to make sure the object being constructed does not overlap the
117    argument list for the constructor call.  */
118 int stack_arg_under_construction;
119
120 static int calls_function (tree, int);
121 static int calls_function_1 (tree, int);
122
123 static void emit_call_1 (rtx, tree, tree, HOST_WIDE_INT, HOST_WIDE_INT,
124                          HOST_WIDE_INT, rtx, rtx, int, rtx, int,
125                          CUMULATIVE_ARGS *);
126 static void precompute_register_parameters (int, struct arg_data *, int *);
127 static int store_one_arg (struct arg_data *, rtx, int, int, int);
128 static void store_unaligned_arguments_into_pseudos (struct arg_data *, int);
129 static int finalize_must_preallocate (int, int, struct arg_data *,
130                                       struct args_size *);
131 static void precompute_arguments (int, int, struct arg_data *);
132 static int compute_argument_block_size (int, struct args_size *, int);
133 static void initialize_argument_information (int, struct arg_data *,
134                                              struct args_size *, int, tree,
135                                              tree, CUMULATIVE_ARGS *, int,
136                                              rtx *, int *, int *, int *,
137                                              bool);
138 static void compute_argument_addresses (struct arg_data *, rtx, int);
139 static rtx rtx_for_function_call (tree, tree);
140 static void load_register_parameters (struct arg_data *, int, rtx *, int,
141                                       int, int *);
142 static rtx emit_library_call_value_1 (int, rtx, rtx, enum libcall_type,
143                                       enum machine_mode, int, va_list);
144 static int special_function_p (tree, int);
145 static rtx try_to_integrate (tree, tree, rtx, int, tree, rtx);
146 static int check_sibcall_argument_overlap_1 (rtx);
147 static int check_sibcall_argument_overlap (rtx, struct arg_data *, int);
148
149 static int combine_pending_stack_adjustment_and_call (int, struct args_size *,
150                                                       int);
151 static tree fix_unsafe_tree (tree);
152 static bool shift_returned_value (tree, rtx *);
153
154 #ifdef REG_PARM_STACK_SPACE
155 static rtx save_fixed_argument_area (int, rtx, int *, int *);
156 static void restore_fixed_argument_area (rtx, rtx, int, int);
157 #endif
158 \f
159 /* If WHICH is 1, return 1 if EXP contains a call to the built-in function
160    `alloca'.
161
162    If WHICH is 0, return 1 if EXP contains a call to any function.
163    Actually, we only need return 1 if evaluating EXP would require pushing
164    arguments on the stack, but that is too difficult to compute, so we just
165    assume any function call might require the stack.  */
166
167 static tree calls_function_save_exprs;
168
169 static int
170 calls_function (tree exp, int which)
171 {
172   int val;
173
174   calls_function_save_exprs = 0;
175   val = calls_function_1 (exp, which);
176   calls_function_save_exprs = 0;
177   return val;
178 }
179
180 /* Recursive function to do the work of above function.  */
181
182 static int
183 calls_function_1 (tree exp, int which)
184 {
185   int i;
186   enum tree_code code = TREE_CODE (exp);
187   int class = TREE_CODE_CLASS (code);
188   int length = first_rtl_op (code);
189
190   /* If this code is language-specific, we don't know what it will do.  */
191   if ((int) code >= NUM_TREE_CODES)
192     return 1;
193
194   switch (code)
195     {
196     case CALL_EXPR:
197       if (which == 0)
198         return 1;
199       else if ((TREE_CODE (TREE_TYPE (TREE_TYPE (TREE_OPERAND (exp, 0))))
200                 == FUNCTION_TYPE)
201                && (TYPE_RETURNS_STACK_DEPRESSED
202                    (TREE_TYPE (TREE_TYPE (TREE_OPERAND (exp, 0))))))
203         return 1;
204       else if (TREE_CODE (TREE_OPERAND (exp, 0)) == ADDR_EXPR
205                && (TREE_CODE (TREE_OPERAND (TREE_OPERAND (exp, 0), 0))
206                    == FUNCTION_DECL)
207                && (special_function_p (TREE_OPERAND (TREE_OPERAND (exp, 0), 0),
208                                        0)
209                    & ECF_MAY_BE_ALLOCA))
210         return 1;
211
212       break;
213
214     case CONSTRUCTOR:
215       {
216         tree tem;
217
218         for (tem = CONSTRUCTOR_ELTS (exp); tem != 0; tem = TREE_CHAIN (tem))
219           if (calls_function_1 (TREE_VALUE (tem), which))
220             return 1;
221       }
222
223       return 0;
224
225     case SAVE_EXPR:
226       if (SAVE_EXPR_RTL (exp) != 0)
227         return 0;
228       if (value_member (exp, calls_function_save_exprs))
229         return 0;
230       calls_function_save_exprs = tree_cons (NULL_TREE, exp,
231                                              calls_function_save_exprs);
232       return (TREE_OPERAND (exp, 0) != 0
233               && calls_function_1 (TREE_OPERAND (exp, 0), which));
234
235     case BLOCK:
236       {
237         tree local;
238         tree subblock;
239
240         for (local = BLOCK_VARS (exp); local; local = TREE_CHAIN (local))
241           if (DECL_INITIAL (local) != 0
242               && calls_function_1 (DECL_INITIAL (local), which))
243             return 1;
244
245         for (subblock = BLOCK_SUBBLOCKS (exp);
246              subblock;
247              subblock = TREE_CHAIN (subblock))
248           if (calls_function_1 (subblock, which))
249             return 1;
250       }
251       return 0;
252
253     case TREE_LIST:
254       for (; exp != 0; exp = TREE_CHAIN (exp))
255         if (calls_function_1 (TREE_VALUE (exp), which))
256           return 1;
257       return 0;
258
259     default:
260       break;
261     }
262
263   /* Only expressions and blocks can contain calls.  */
264   if (! IS_EXPR_CODE_CLASS (class) && class != 'b')
265     return 0;
266
267   for (i = 0; i < length; i++)
268     if (TREE_OPERAND (exp, i) != 0
269         && calls_function_1 (TREE_OPERAND (exp, i), which))
270       return 1;
271
272   return 0;
273 }
274 \f
275 /* Force FUNEXP into a form suitable for the address of a CALL,
276    and return that as an rtx.  Also load the static chain register
277    if FNDECL is a nested function.
278
279    CALL_FUSAGE points to a variable holding the prospective
280    CALL_INSN_FUNCTION_USAGE information.  */
281
282 rtx
283 prepare_call_address (rtx funexp, tree fndecl, rtx *call_fusage,
284                       int reg_parm_seen, int sibcallp)
285 {
286   rtx static_chain_value = 0;
287
288   funexp = protect_from_queue (funexp, 0);
289
290   if (fndecl != 0)
291     /* Get possible static chain value for nested function in C.  */
292     static_chain_value = lookup_static_chain (fndecl);
293
294   /* Make a valid memory address and copy constants through pseudo-regs,
295      but not for a constant address if -fno-function-cse.  */
296   if (GET_CODE (funexp) != SYMBOL_REF)
297     /* If we are using registers for parameters, force the
298        function address into a register now.  */
299     funexp = ((SMALL_REGISTER_CLASSES && reg_parm_seen)
300               ? force_not_mem (memory_address (FUNCTION_MODE, funexp))
301               : memory_address (FUNCTION_MODE, funexp));
302   else if (! sibcallp)
303     {
304 #ifndef NO_FUNCTION_CSE
305       if (optimize && ! flag_no_function_cse)
306 #ifdef NO_RECURSIVE_FUNCTION_CSE
307         if (fndecl != current_function_decl)
308 #endif
309           funexp = force_reg (Pmode, funexp);
310 #endif
311     }
312
313   if (static_chain_value != 0)
314     {
315       emit_move_insn (static_chain_rtx, static_chain_value);
316
317       if (GET_CODE (static_chain_rtx) == REG)
318         use_reg (call_fusage, static_chain_rtx);
319     }
320
321   return funexp;
322 }
323
324 /* Generate instructions to call function FUNEXP,
325    and optionally pop the results.
326    The CALL_INSN is the first insn generated.
327
328    FNDECL is the declaration node of the function.  This is given to the
329    macro RETURN_POPS_ARGS to determine whether this function pops its own args.
330
331    FUNTYPE is the data type of the function.  This is given to the macro
332    RETURN_POPS_ARGS to determine whether this function pops its own args.
333    We used to allow an identifier for library functions, but that doesn't
334    work when the return type is an aggregate type and the calling convention
335    says that the pointer to this aggregate is to be popped by the callee.
336
337    STACK_SIZE is the number of bytes of arguments on the stack,
338    ROUNDED_STACK_SIZE is that number rounded up to
339    PREFERRED_STACK_BOUNDARY; zero if the size is variable.  This is
340    both to put into the call insn and to generate explicit popping
341    code if necessary.
342
343    STRUCT_VALUE_SIZE is the number of bytes wanted in a structure value.
344    It is zero if this call doesn't want a structure value.
345
346    NEXT_ARG_REG is the rtx that results from executing
347      FUNCTION_ARG (args_so_far, VOIDmode, void_type_node, 1)
348    just after all the args have had their registers assigned.
349    This could be whatever you like, but normally it is the first
350    arg-register beyond those used for args in this call,
351    or 0 if all the arg-registers are used in this call.
352    It is passed on to `gen_call' so you can put this info in the call insn.
353
354    VALREG is a hard register in which a value is returned,
355    or 0 if the call does not return a value.
356
357    OLD_INHIBIT_DEFER_POP is the value that `inhibit_defer_pop' had before
358    the args to this call were processed.
359    We restore `inhibit_defer_pop' to that value.
360
361    CALL_FUSAGE is either empty or an EXPR_LIST of USE expressions that
362    denote registers used by the called function.  */
363
364 static void
365 emit_call_1 (rtx funexp, tree fndecl ATTRIBUTE_UNUSED, tree funtype ATTRIBUTE_UNUSED,
366              HOST_WIDE_INT stack_size ATTRIBUTE_UNUSED,
367              HOST_WIDE_INT rounded_stack_size,
368              HOST_WIDE_INT struct_value_size ATTRIBUTE_UNUSED,
369              rtx next_arg_reg ATTRIBUTE_UNUSED, rtx valreg,
370              int old_inhibit_defer_pop, rtx call_fusage, int ecf_flags,
371              CUMULATIVE_ARGS *args_so_far ATTRIBUTE_UNUSED)
372 {
373   rtx rounded_stack_size_rtx = GEN_INT (rounded_stack_size);
374   rtx call_insn;
375   int already_popped = 0;
376   HOST_WIDE_INT n_popped = RETURN_POPS_ARGS (fndecl, funtype, stack_size);
377 #if defined (HAVE_call) && defined (HAVE_call_value)
378   rtx struct_value_size_rtx;
379   struct_value_size_rtx = GEN_INT (struct_value_size);
380 #endif
381
382 #ifdef CALL_POPS_ARGS
383   n_popped += CALL_POPS_ARGS (* args_so_far);
384 #endif
385
386   /* Ensure address is valid.  SYMBOL_REF is already valid, so no need,
387      and we don't want to load it into a register as an optimization,
388      because prepare_call_address already did it if it should be done.  */
389   if (GET_CODE (funexp) != SYMBOL_REF)
390     funexp = memory_address (FUNCTION_MODE, funexp);
391
392 #if defined (HAVE_sibcall_pop) && defined (HAVE_sibcall_value_pop)
393   if ((ecf_flags & ECF_SIBCALL)
394       && HAVE_sibcall_pop && HAVE_sibcall_value_pop
395       && (n_popped > 0 || stack_size == 0))
396     {
397       rtx n_pop = GEN_INT (n_popped);
398       rtx pat;
399
400       /* If this subroutine pops its own args, record that in the call insn
401          if possible, for the sake of frame pointer elimination.  */
402
403       if (valreg)
404         pat = GEN_SIBCALL_VALUE_POP (valreg,
405                                      gen_rtx_MEM (FUNCTION_MODE, funexp),
406                                      rounded_stack_size_rtx, next_arg_reg,
407                                      n_pop);
408       else
409         pat = GEN_SIBCALL_POP (gen_rtx_MEM (FUNCTION_MODE, funexp),
410                                rounded_stack_size_rtx, next_arg_reg, n_pop);
411
412       emit_call_insn (pat);
413       already_popped = 1;
414     }
415   else
416 #endif
417
418 #if defined (HAVE_call_pop) && defined (HAVE_call_value_pop)
419   /* If the target has "call" or "call_value" insns, then prefer them
420      if no arguments are actually popped.  If the target does not have
421      "call" or "call_value" insns, then we must use the popping versions
422      even if the call has no arguments to pop.  */
423 #if defined (HAVE_call) && defined (HAVE_call_value)
424   if (HAVE_call && HAVE_call_value && HAVE_call_pop && HAVE_call_value_pop
425       && n_popped > 0 && ! (ecf_flags & ECF_SP_DEPRESSED))
426 #else
427   if (HAVE_call_pop && HAVE_call_value_pop)
428 #endif
429     {
430       rtx n_pop = GEN_INT (n_popped);
431       rtx pat;
432
433       /* If this subroutine pops its own args, record that in the call insn
434          if possible, for the sake of frame pointer elimination.  */
435
436       if (valreg)
437         pat = GEN_CALL_VALUE_POP (valreg,
438                                   gen_rtx_MEM (FUNCTION_MODE, funexp),
439                                   rounded_stack_size_rtx, next_arg_reg, n_pop);
440       else
441         pat = GEN_CALL_POP (gen_rtx_MEM (FUNCTION_MODE, funexp),
442                             rounded_stack_size_rtx, next_arg_reg, n_pop);
443
444       emit_call_insn (pat);
445       already_popped = 1;
446     }
447   else
448 #endif
449
450 #if defined (HAVE_sibcall) && defined (HAVE_sibcall_value)
451   if ((ecf_flags & ECF_SIBCALL)
452       && HAVE_sibcall && HAVE_sibcall_value)
453     {
454       if (valreg)
455         emit_call_insn (GEN_SIBCALL_VALUE (valreg,
456                                            gen_rtx_MEM (FUNCTION_MODE, funexp),
457                                            rounded_stack_size_rtx,
458                                            next_arg_reg, NULL_RTX));
459       else
460         emit_call_insn (GEN_SIBCALL (gen_rtx_MEM (FUNCTION_MODE, funexp),
461                                      rounded_stack_size_rtx, next_arg_reg,
462                                      struct_value_size_rtx));
463     }
464   else
465 #endif
466
467 #if defined (HAVE_call) && defined (HAVE_call_value)
468   if (HAVE_call && HAVE_call_value)
469     {
470       if (valreg)
471         emit_call_insn (GEN_CALL_VALUE (valreg,
472                                         gen_rtx_MEM (FUNCTION_MODE, funexp),
473                                         rounded_stack_size_rtx, next_arg_reg,
474                                         NULL_RTX));
475       else
476         emit_call_insn (GEN_CALL (gen_rtx_MEM (FUNCTION_MODE, funexp),
477                                   rounded_stack_size_rtx, next_arg_reg,
478                                   struct_value_size_rtx));
479     }
480   else
481 #endif
482     abort ();
483
484   /* Find the call we just emitted.  */
485   call_insn = last_call_insn ();
486
487   /* Mark memory as used for "pure" function call.  */
488   if (ecf_flags & ECF_PURE)
489     call_fusage
490       = gen_rtx_EXPR_LIST
491         (VOIDmode,
492          gen_rtx_USE (VOIDmode,
493                       gen_rtx_MEM (BLKmode, gen_rtx_SCRATCH (VOIDmode))),
494          call_fusage);
495
496   /* Put the register usage information there.  */
497   add_function_usage_to (call_insn, call_fusage);
498
499   /* If this is a const call, then set the insn's unchanging bit.  */
500   if (ecf_flags & (ECF_CONST | ECF_PURE))
501     CONST_OR_PURE_CALL_P (call_insn) = 1;
502
503   /* If this call can't throw, attach a REG_EH_REGION reg note to that
504      effect.  */
505   if (ecf_flags & ECF_NOTHROW)
506     REG_NOTES (call_insn) = gen_rtx_EXPR_LIST (REG_EH_REGION, const0_rtx,
507                                                REG_NOTES (call_insn));
508   else
509     note_eh_region_may_contain_throw ();
510
511   if (ecf_flags & ECF_NORETURN)
512     REG_NOTES (call_insn) = gen_rtx_EXPR_LIST (REG_NORETURN, const0_rtx,
513                                                REG_NOTES (call_insn));
514   if (ecf_flags & ECF_ALWAYS_RETURN)
515     REG_NOTES (call_insn) = gen_rtx_EXPR_LIST (REG_ALWAYS_RETURN, const0_rtx,
516                                                REG_NOTES (call_insn));
517
518   if (ecf_flags & ECF_RETURNS_TWICE)
519     {
520       REG_NOTES (call_insn) = gen_rtx_EXPR_LIST (REG_SETJMP, const0_rtx,
521                                                  REG_NOTES (call_insn));
522       current_function_calls_setjmp = 1;
523     }
524
525   SIBLING_CALL_P (call_insn) = ((ecf_flags & ECF_SIBCALL) != 0);
526
527   /* Restore this now, so that we do defer pops for this call's args
528      if the context of the call as a whole permits.  */
529   inhibit_defer_pop = old_inhibit_defer_pop;
530
531   if (n_popped > 0)
532     {
533       if (!already_popped)
534         CALL_INSN_FUNCTION_USAGE (call_insn)
535           = gen_rtx_EXPR_LIST (VOIDmode,
536                                gen_rtx_CLOBBER (VOIDmode, stack_pointer_rtx),
537                                CALL_INSN_FUNCTION_USAGE (call_insn));
538       rounded_stack_size -= n_popped;
539       rounded_stack_size_rtx = GEN_INT (rounded_stack_size);
540       stack_pointer_delta -= n_popped;
541     }
542
543   if (!ACCUMULATE_OUTGOING_ARGS)
544     {
545       /* If returning from the subroutine does not automatically pop the args,
546          we need an instruction to pop them sooner or later.
547          Perhaps do it now; perhaps just record how much space to pop later.
548
549          If returning from the subroutine does pop the args, indicate that the
550          stack pointer will be changed.  */
551
552       if (rounded_stack_size != 0)
553         {
554           if (ecf_flags & (ECF_SP_DEPRESSED | ECF_NORETURN | ECF_LONGJMP))
555             /* Just pretend we did the pop.  */
556             stack_pointer_delta -= rounded_stack_size;
557           else if (flag_defer_pop && inhibit_defer_pop == 0
558               && ! (ecf_flags & (ECF_CONST | ECF_PURE)))
559             pending_stack_adjust += rounded_stack_size;
560           else
561             adjust_stack (rounded_stack_size_rtx);
562         }
563     }
564   /* When we accumulate outgoing args, we must avoid any stack manipulations.
565      Restore the stack pointer to its original value now.  Usually
566      ACCUMULATE_OUTGOING_ARGS targets don't get here, but there are exceptions.
567      On  i386 ACCUMULATE_OUTGOING_ARGS can be enabled on demand, and
568      popping variants of functions exist as well.
569
570      ??? We may optimize similar to defer_pop above, but it is
571      probably not worthwhile.
572
573      ??? It will be worthwhile to enable combine_stack_adjustments even for
574      such machines.  */
575   else if (n_popped)
576     anti_adjust_stack (GEN_INT (n_popped));
577 }
578
579 /* Determine if the function identified by NAME and FNDECL is one with
580    special properties we wish to know about.
581
582    For example, if the function might return more than one time (setjmp), then
583    set RETURNS_TWICE to a nonzero value.
584
585    Similarly set LONGJMP for if the function is in the longjmp family.
586
587    Set MAY_BE_ALLOCA for any memory allocation function that might allocate
588    space from the stack such as alloca.  */
589
590 static int
591 special_function_p (tree fndecl, int flags)
592 {
593   if (! (flags & ECF_MALLOC)
594       && fndecl && DECL_NAME (fndecl)
595       && IDENTIFIER_LENGTH (DECL_NAME (fndecl)) <= 17
596       /* Exclude functions not at the file scope, or not `extern',
597          since they are not the magic functions we would otherwise
598          think they are.
599          FIXME: this should be handled with attributes, not with this
600          hacky imitation of DECL_ASSEMBLER_NAME.  It's (also) wrong
601          because you can declare fork() inside a function if you
602          wish.  */
603       && (DECL_CONTEXT (fndecl) == NULL_TREE 
604           || TREE_CODE (DECL_CONTEXT (fndecl)) == TRANSLATION_UNIT_DECL)
605       && TREE_PUBLIC (fndecl))
606     {
607       const char *name = IDENTIFIER_POINTER (DECL_NAME (fndecl));
608       const char *tname = name;
609
610       /* We assume that alloca will always be called by name.  It
611          makes no sense to pass it as a pointer-to-function to
612          anything that does not understand its behavior.  */
613       if (((IDENTIFIER_LENGTH (DECL_NAME (fndecl)) == 6
614             && name[0] == 'a'
615             && ! strcmp (name, "alloca"))
616            || (IDENTIFIER_LENGTH (DECL_NAME (fndecl)) == 16
617                && name[0] == '_'
618                && ! strcmp (name, "__builtin_alloca"))))
619         flags |= ECF_MAY_BE_ALLOCA;
620
621       /* Disregard prefix _, __ or __x.  */
622       if (name[0] == '_')
623         {
624           if (name[1] == '_' && name[2] == 'x')
625             tname += 3;
626           else if (name[1] == '_')
627             tname += 2;
628           else
629             tname += 1;
630         }
631
632       if (tname[0] == 's')
633         {
634           if ((tname[1] == 'e'
635                && (! strcmp (tname, "setjmp")
636                    || ! strcmp (tname, "setjmp_syscall")))
637               || (tname[1] == 'i'
638                   && ! strcmp (tname, "sigsetjmp"))
639               || (tname[1] == 'a'
640                   && ! strcmp (tname, "savectx")))
641             flags |= ECF_RETURNS_TWICE;
642
643           if (tname[1] == 'i'
644               && ! strcmp (tname, "siglongjmp"))
645             flags |= ECF_LONGJMP;
646         }
647       else if ((tname[0] == 'q' && tname[1] == 's'
648                 && ! strcmp (tname, "qsetjmp"))
649                || (tname[0] == 'v' && tname[1] == 'f'
650                    && ! strcmp (tname, "vfork")))
651         flags |= ECF_RETURNS_TWICE;
652
653       else if (tname[0] == 'l' && tname[1] == 'o'
654                && ! strcmp (tname, "longjmp"))
655         flags |= ECF_LONGJMP;
656
657       else if ((tname[0] == 'f' && tname[1] == 'o'
658                 && ! strcmp (tname, "fork"))
659                /* Linux specific: __clone.  check NAME to insist on the
660                   leading underscores, to avoid polluting the ISO / POSIX
661                   namespace.  */
662                || (name[0] == '_' && name[1] == '_'
663                    && ! strcmp (tname, "clone"))
664                || (tname[0] == 'e' && tname[1] == 'x' && tname[2] == 'e'
665                    && tname[3] == 'c' && (tname[4] == 'l' || tname[4] == 'v')
666                    && (tname[5] == '\0'
667                        || ((tname[5] == 'p' || tname[5] == 'e')
668                            && tname[6] == '\0'))))
669         flags |= ECF_FORK_OR_EXEC;
670     }
671   return flags;
672 }
673
674 /* Return nonzero when tree represent call to longjmp.  */
675
676 int
677 setjmp_call_p (tree fndecl)
678 {
679   return special_function_p (fndecl, 0) & ECF_RETURNS_TWICE;
680 }
681
682 /* Return true when exp contains alloca call.  */
683 bool
684 alloca_call_p (tree exp)
685 {
686   if (TREE_CODE (exp) == CALL_EXPR
687       && TREE_CODE (TREE_OPERAND (exp, 0)) == ADDR_EXPR
688       && (TREE_CODE (TREE_OPERAND (TREE_OPERAND (exp, 0), 0))
689           == FUNCTION_DECL)
690       && (special_function_p (TREE_OPERAND (TREE_OPERAND (exp, 0), 0),
691                               0) & ECF_MAY_BE_ALLOCA))
692     return true;
693   return false;
694 }
695
696 /* Detect flags (function attributes) from the function decl or type node.  */
697
698 int
699 flags_from_decl_or_type (tree exp)
700 {
701   int flags = 0;
702   tree type = exp;
703
704   if (DECL_P (exp))
705     {
706       struct cgraph_rtl_info *i = cgraph_rtl_info (exp);
707       type = TREE_TYPE (exp);
708
709       if (i)
710         {
711           if (i->pure_function)
712             flags |= ECF_PURE | ECF_LIBCALL_BLOCK;
713           if (i->const_function)
714             flags |= ECF_CONST | ECF_LIBCALL_BLOCK;
715         }
716
717       /* The function exp may have the `malloc' attribute.  */
718       if (DECL_IS_MALLOC (exp))
719         flags |= ECF_MALLOC;
720
721       /* The function exp may have the `pure' attribute.  */
722       if (DECL_IS_PURE (exp))
723         flags |= ECF_PURE | ECF_LIBCALL_BLOCK;
724
725       if (TREE_NOTHROW (exp))
726         flags |= ECF_NOTHROW;
727
728       if (TREE_READONLY (exp) && ! TREE_THIS_VOLATILE (exp))
729         flags |= ECF_LIBCALL_BLOCK;
730     }
731
732   if (TREE_READONLY (exp) && ! TREE_THIS_VOLATILE (exp))
733     flags |= ECF_CONST;
734
735   if (TREE_THIS_VOLATILE (exp))
736     flags |= ECF_NORETURN;
737
738   /* Mark if the function returns with the stack pointer depressed.   We
739      cannot consider it pure or constant in that case.  */
740   if (TREE_CODE (type) == FUNCTION_TYPE && TYPE_RETURNS_STACK_DEPRESSED (type))
741     {
742       flags |= ECF_SP_DEPRESSED;
743       flags &= ~(ECF_PURE | ECF_CONST | ECF_LIBCALL_BLOCK);
744     }
745
746   return flags;
747 }
748
749 /* Detect flags from a CALL_EXPR.  */
750
751 int
752 call_expr_flags (tree t)
753 {
754   int flags;
755   tree decl = get_callee_fndecl (t);
756
757   if (decl)
758     flags = flags_from_decl_or_type (decl);
759   else
760     {
761       t = TREE_TYPE (TREE_OPERAND (t, 0));
762       if (t && TREE_CODE (t) == POINTER_TYPE)
763         flags = flags_from_decl_or_type (TREE_TYPE (t));
764       else
765         flags = 0;
766     }
767
768   return flags;
769 }
770
771 /* Precompute all register parameters as described by ARGS, storing values
772    into fields within the ARGS array.
773
774    NUM_ACTUALS indicates the total number elements in the ARGS array.
775
776    Set REG_PARM_SEEN if we encounter a register parameter.  */
777
778 static void
779 precompute_register_parameters (int num_actuals, struct arg_data *args, int *reg_parm_seen)
780 {
781   int i;
782
783   *reg_parm_seen = 0;
784
785   for (i = 0; i < num_actuals; i++)
786     if (args[i].reg != 0 && ! args[i].pass_on_stack)
787       {
788         *reg_parm_seen = 1;
789
790         if (args[i].value == 0)
791           {
792             push_temp_slots ();
793             args[i].value = expand_expr (args[i].tree_value, NULL_RTX,
794                                          VOIDmode, 0);
795             preserve_temp_slots (args[i].value);
796             pop_temp_slots ();
797
798             /* ANSI doesn't require a sequence point here,
799                but PCC has one, so this will avoid some problems.  */
800             emit_queue ();
801           }
802
803         /* If the value is a non-legitimate constant, force it into a
804            pseudo now.  TLS symbols sometimes need a call to resolve.  */
805         if (CONSTANT_P (args[i].value)
806             && !LEGITIMATE_CONSTANT_P (args[i].value))
807           args[i].value = force_reg (args[i].mode, args[i].value);
808
809         /* If we are to promote the function arg to a wider mode,
810            do it now.  */
811
812         if (args[i].mode != TYPE_MODE (TREE_TYPE (args[i].tree_value)))
813           args[i].value
814             = convert_modes (args[i].mode,
815                              TYPE_MODE (TREE_TYPE (args[i].tree_value)),
816                              args[i].value, args[i].unsignedp);
817
818         /* If the value is expensive, and we are inside an appropriately
819            short loop, put the value into a pseudo and then put the pseudo
820            into the hard reg.
821
822            For small register classes, also do this if this call uses
823            register parameters.  This is to avoid reload conflicts while
824            loading the parameters registers.  */
825
826         if ((! (GET_CODE (args[i].value) == REG
827                 || (GET_CODE (args[i].value) == SUBREG
828                     && GET_CODE (SUBREG_REG (args[i].value)) == REG)))
829             && args[i].mode != BLKmode
830             && rtx_cost (args[i].value, SET) > COSTS_N_INSNS (1)
831             && ((SMALL_REGISTER_CLASSES && *reg_parm_seen)
832                 || preserve_subexpressions_p ()))
833           args[i].value = copy_to_mode_reg (args[i].mode, args[i].value);
834       }
835 }
836
837 #ifdef REG_PARM_STACK_SPACE
838
839   /* The argument list is the property of the called routine and it
840      may clobber it.  If the fixed area has been used for previous
841      parameters, we must save and restore it.  */
842
843 static rtx
844 save_fixed_argument_area (int reg_parm_stack_space, rtx argblock, int *low_to_save, int *high_to_save)
845 {
846   int low;
847   int high;
848
849   /* Compute the boundary of the area that needs to be saved, if any.  */
850   high = reg_parm_stack_space;
851 #ifdef ARGS_GROW_DOWNWARD
852   high += 1;
853 #endif
854   if (high > highest_outgoing_arg_in_use)
855     high = highest_outgoing_arg_in_use;
856
857   for (low = 0; low < high; low++)
858     if (stack_usage_map[low] != 0)
859       {
860         int num_to_save;
861         enum machine_mode save_mode;
862         int delta;
863         rtx stack_area;
864         rtx save_area;
865
866         while (stack_usage_map[--high] == 0)
867           ;
868
869         *low_to_save = low;
870         *high_to_save = high;
871
872         num_to_save = high - low + 1;
873         save_mode = mode_for_size (num_to_save * BITS_PER_UNIT, MODE_INT, 1);
874
875         /* If we don't have the required alignment, must do this
876            in BLKmode.  */
877         if ((low & (MIN (GET_MODE_SIZE (save_mode),
878                          BIGGEST_ALIGNMENT / UNITS_PER_WORD) - 1)))
879           save_mode = BLKmode;
880
881 #ifdef ARGS_GROW_DOWNWARD
882         delta = -high;
883 #else
884         delta = low;
885 #endif
886         stack_area = gen_rtx_MEM (save_mode,
887                                   memory_address (save_mode,
888                                                   plus_constant (argblock,
889                                                                  delta)));
890
891         set_mem_align (stack_area, PARM_BOUNDARY);
892         if (save_mode == BLKmode)
893           {
894             save_area = assign_stack_temp (BLKmode, num_to_save, 0);
895             emit_block_move (validize_mem (save_area), stack_area,
896                              GEN_INT (num_to_save), BLOCK_OP_CALL_PARM);
897           }
898         else
899           {
900             save_area = gen_reg_rtx (save_mode);
901             emit_move_insn (save_area, stack_area);
902           }
903
904         return save_area;
905       }
906
907   return NULL_RTX;
908 }
909
910 static void
911 restore_fixed_argument_area (rtx save_area, rtx argblock, int high_to_save, int low_to_save)
912 {
913   enum machine_mode save_mode = GET_MODE (save_area);
914   int delta;
915   rtx stack_area;
916
917 #ifdef ARGS_GROW_DOWNWARD
918   delta = -high_to_save;
919 #else
920   delta = low_to_save;
921 #endif
922   stack_area = gen_rtx_MEM (save_mode,
923                             memory_address (save_mode,
924                                             plus_constant (argblock, delta)));
925   set_mem_align (stack_area, PARM_BOUNDARY);
926
927   if (save_mode != BLKmode)
928     emit_move_insn (stack_area, save_area);
929   else
930     emit_block_move (stack_area, validize_mem (save_area),
931                      GEN_INT (high_to_save - low_to_save + 1),
932                      BLOCK_OP_CALL_PARM);
933 }
934 #endif /* REG_PARM_STACK_SPACE */
935
936 /* If any elements in ARGS refer to parameters that are to be passed in
937    registers, but not in memory, and whose alignment does not permit a
938    direct copy into registers.  Copy the values into a group of pseudos
939    which we will later copy into the appropriate hard registers.
940
941    Pseudos for each unaligned argument will be stored into the array
942    args[argnum].aligned_regs.  The caller is responsible for deallocating
943    the aligned_regs array if it is nonzero.  */
944
945 static void
946 store_unaligned_arguments_into_pseudos (struct arg_data *args, int num_actuals)
947 {
948   int i, j;
949
950   for (i = 0; i < num_actuals; i++)
951     if (args[i].reg != 0 && ! args[i].pass_on_stack
952         && args[i].mode == BLKmode
953         && (TYPE_ALIGN (TREE_TYPE (args[i].tree_value))
954             < (unsigned int) MIN (BIGGEST_ALIGNMENT, BITS_PER_WORD)))
955       {
956         int bytes = int_size_in_bytes (TREE_TYPE (args[i].tree_value));
957         int nregs = (bytes + UNITS_PER_WORD - 1) / UNITS_PER_WORD;
958         int endian_correction = 0;
959
960         args[i].n_aligned_regs = args[i].partial ? args[i].partial : nregs;
961         args[i].aligned_regs = xmalloc (sizeof (rtx) * args[i].n_aligned_regs);
962
963         /* Structures smaller than a word are normally aligned to the
964            least significant byte.  On a BYTES_BIG_ENDIAN machine,
965            this means we must skip the empty high order bytes when
966            calculating the bit offset.  */
967         if (bytes < UNITS_PER_WORD
968 #ifdef BLOCK_REG_PADDING
969             && (BLOCK_REG_PADDING (args[i].mode,
970                                    TREE_TYPE (args[i].tree_value), 1)
971                 == downward)
972 #else
973             && BYTES_BIG_ENDIAN
974 #endif
975             )
976           endian_correction = BITS_PER_WORD - bytes * BITS_PER_UNIT;
977
978         for (j = 0; j < args[i].n_aligned_regs; j++)
979           {
980             rtx reg = gen_reg_rtx (word_mode);
981             rtx word = operand_subword_force (args[i].value, j, BLKmode);
982             int bitsize = MIN (bytes * BITS_PER_UNIT, BITS_PER_WORD);
983
984             args[i].aligned_regs[j] = reg;
985             word = extract_bit_field (word, bitsize, 0, 1, NULL_RTX,
986                                       word_mode, word_mode, BITS_PER_WORD);
987
988             /* There is no need to restrict this code to loading items
989                in TYPE_ALIGN sized hunks.  The bitfield instructions can
990                load up entire word sized registers efficiently.
991
992                ??? This may not be needed anymore.
993                We use to emit a clobber here but that doesn't let later
994                passes optimize the instructions we emit.  By storing 0 into
995                the register later passes know the first AND to zero out the
996                bitfield being set in the register is unnecessary.  The store
997                of 0 will be deleted as will at least the first AND.  */
998
999             emit_move_insn (reg, const0_rtx);
1000
1001             bytes -= bitsize / BITS_PER_UNIT;
1002             store_bit_field (reg, bitsize, endian_correction, word_mode,
1003                              word, BITS_PER_WORD);
1004           }
1005       }
1006 }
1007
1008 /* Fill in ARGS_SIZE and ARGS array based on the parameters found in
1009    ACTPARMS.
1010
1011    NUM_ACTUALS is the total number of parameters.
1012
1013    N_NAMED_ARGS is the total number of named arguments.
1014
1015    FNDECL is the tree code for the target of this call (if known)
1016
1017    ARGS_SO_FAR holds state needed by the target to know where to place
1018    the next argument.
1019
1020    REG_PARM_STACK_SPACE is the number of bytes of stack space reserved
1021    for arguments which are passed in registers.
1022
1023    OLD_STACK_LEVEL is a pointer to an rtx which olds the old stack level
1024    and may be modified by this routine.
1025
1026    OLD_PENDING_ADJ, MUST_PREALLOCATE and FLAGS are pointers to integer
1027    flags which may may be modified by this routine. 
1028
1029    CALL_FROM_THUNK_P is true if this call is the jump from a thunk to
1030    the thunked-to function.  */
1031
1032 static void
1033 initialize_argument_information (int num_actuals ATTRIBUTE_UNUSED,
1034                                  struct arg_data *args,
1035                                  struct args_size *args_size,
1036                                  int n_named_args ATTRIBUTE_UNUSED,
1037                                  tree actparms, tree fndecl,
1038                                  CUMULATIVE_ARGS *args_so_far,
1039                                  int reg_parm_stack_space,
1040                                  rtx *old_stack_level, int *old_pending_adj,
1041                                  int *must_preallocate, int *ecf_flags,
1042                                  bool call_from_thunk_p)
1043 {
1044   /* 1 if scanning parms front to back, -1 if scanning back to front.  */
1045   int inc;
1046
1047   /* Count arg position in order args appear.  */
1048   int argpos;
1049
1050   int i;
1051   tree p;
1052
1053   args_size->constant = 0;
1054   args_size->var = 0;
1055
1056   /* In this loop, we consider args in the order they are written.
1057      We fill up ARGS from the front or from the back if necessary
1058      so that in any case the first arg to be pushed ends up at the front.  */
1059
1060   if (PUSH_ARGS_REVERSED)
1061     {
1062       i = num_actuals - 1, inc = -1;
1063       /* In this case, must reverse order of args
1064          so that we compute and push the last arg first.  */
1065     }
1066   else
1067     {
1068       i = 0, inc = 1;
1069     }
1070
1071   /* I counts args in order (to be) pushed; ARGPOS counts in order written.  */
1072   for (p = actparms, argpos = 0; p; p = TREE_CHAIN (p), i += inc, argpos++)
1073     {
1074       tree type = TREE_TYPE (TREE_VALUE (p));
1075       int unsignedp;
1076       enum machine_mode mode;
1077
1078       args[i].tree_value = TREE_VALUE (p);
1079
1080       /* Replace erroneous argument with constant zero.  */
1081       if (type == error_mark_node || !COMPLETE_TYPE_P (type))
1082         args[i].tree_value = integer_zero_node, type = integer_type_node;
1083
1084       /* If TYPE is a transparent union, pass things the way we would
1085          pass the first field of the union.  We have already verified that
1086          the modes are the same.  */
1087       if (TREE_CODE (type) == UNION_TYPE && TYPE_TRANSPARENT_UNION (type))
1088         type = TREE_TYPE (TYPE_FIELDS (type));
1089
1090       /* Decide where to pass this arg.
1091
1092          args[i].reg is nonzero if all or part is passed in registers.
1093
1094          args[i].partial is nonzero if part but not all is passed in registers,
1095          and the exact value says how many words are passed in registers.
1096
1097          args[i].pass_on_stack is nonzero if the argument must at least be
1098          computed on the stack.  It may then be loaded back into registers
1099          if args[i].reg is nonzero.
1100
1101          These decisions are driven by the FUNCTION_... macros and must agree
1102          with those made by function.c.  */
1103
1104       /* See if this argument should be passed by invisible reference.  */
1105       if (CONTAINS_PLACEHOLDER_P (TYPE_SIZE (type))
1106           || TREE_ADDRESSABLE (type)
1107 #ifdef FUNCTION_ARG_PASS_BY_REFERENCE
1108           || FUNCTION_ARG_PASS_BY_REFERENCE (*args_so_far, TYPE_MODE (type),
1109                                              type, argpos < n_named_args)
1110 #endif
1111           )
1112         {
1113           /* If we're compiling a thunk, pass through invisible
1114              references instead of making a copy.  */
1115           if (call_from_thunk_p
1116 #ifdef FUNCTION_ARG_CALLEE_COPIES
1117               || (FUNCTION_ARG_CALLEE_COPIES (*args_so_far, TYPE_MODE (type),
1118                                              type, argpos < n_named_args)
1119                   /* If it's in a register, we must make a copy of it too.  */
1120                   /* ??? Is this a sufficient test?  Is there a better one? */
1121                   && !(TREE_CODE (args[i].tree_value) == VAR_DECL
1122                        && REG_P (DECL_RTL (args[i].tree_value)))
1123                   && ! TREE_ADDRESSABLE (type))
1124 #endif
1125               )
1126             {
1127               /* C++ uses a TARGET_EXPR to indicate that we want to make a
1128                  new object from the argument.  If we are passing by
1129                  invisible reference, the callee will do that for us, so we
1130                  can strip off the TARGET_EXPR.  This is not always safe,
1131                  but it is safe in the only case where this is a useful
1132                  optimization; namely, when the argument is a plain object.
1133                  In that case, the frontend is just asking the backend to
1134                  make a bitwise copy of the argument.  */
1135
1136               if (TREE_CODE (args[i].tree_value) == TARGET_EXPR
1137                   && (DECL_P (TREE_OPERAND (args[i].tree_value, 1)))
1138                   && ! REG_P (DECL_RTL (TREE_OPERAND (args[i].tree_value, 1))))
1139                 args[i].tree_value = TREE_OPERAND (args[i].tree_value, 1);
1140
1141               args[i].tree_value = build1 (ADDR_EXPR,
1142                                            build_pointer_type (type),
1143                                            args[i].tree_value);
1144               type = build_pointer_type (type);
1145             }
1146           else if (TREE_CODE (args[i].tree_value) == TARGET_EXPR)
1147             {
1148               /* In the V3 C++ ABI, parameters are destroyed in the caller.
1149                  We implement this by passing the address of the temporary
1150                  rather than expanding it into another allocated slot.  */
1151               args[i].tree_value = build1 (ADDR_EXPR,
1152                                            build_pointer_type (type),
1153                                            args[i].tree_value);
1154               type = build_pointer_type (type);
1155             }
1156           else
1157             {
1158               /* We make a copy of the object and pass the address to the
1159                  function being called.  */
1160               rtx copy;
1161
1162               if (!COMPLETE_TYPE_P (type)
1163                   || TREE_CODE (TYPE_SIZE (type)) != INTEGER_CST
1164                   || (flag_stack_check && ! STACK_CHECK_BUILTIN
1165                       && (0 < compare_tree_int (TYPE_SIZE_UNIT (type),
1166                                                 STACK_CHECK_MAX_VAR_SIZE))))
1167                 {
1168                   /* This is a variable-sized object.  Make space on the stack
1169                      for it.  */
1170                   rtx size_rtx = expr_size (TREE_VALUE (p));
1171
1172                   if (*old_stack_level == 0)
1173                     {
1174                       emit_stack_save (SAVE_BLOCK, old_stack_level, NULL_RTX);
1175                       *old_pending_adj = pending_stack_adjust;
1176                       pending_stack_adjust = 0;
1177                     }
1178
1179                   copy = gen_rtx_MEM (BLKmode,
1180                                       allocate_dynamic_stack_space
1181                                       (size_rtx, NULL_RTX, TYPE_ALIGN (type)));
1182                   set_mem_attributes (copy, type, 1);
1183                 }
1184               else
1185                 copy = assign_temp (type, 0, 1, 0);
1186
1187               store_expr (args[i].tree_value, copy, 0);
1188               *ecf_flags &= ~(ECF_CONST | ECF_PURE | ECF_LIBCALL_BLOCK);
1189
1190               args[i].tree_value = build1 (ADDR_EXPR,
1191                                            build_pointer_type (type),
1192                                            make_tree (type, copy));
1193               type = build_pointer_type (type);
1194             }
1195         }
1196
1197       mode = TYPE_MODE (type);
1198       unsignedp = TREE_UNSIGNED (type);
1199
1200       if (targetm.calls.promote_function_args (fndecl ? TREE_TYPE (fndecl) : 0))
1201         mode = promote_mode (type, mode, &unsignedp, 1);
1202
1203       args[i].unsignedp = unsignedp;
1204       args[i].mode = mode;
1205
1206       args[i].reg = FUNCTION_ARG (*args_so_far, mode, type,
1207                                   argpos < n_named_args);
1208 #ifdef FUNCTION_INCOMING_ARG
1209       /* If this is a sibling call and the machine has register windows, the
1210          register window has to be unwinded before calling the routine, so
1211          arguments have to go into the incoming registers.  */
1212       args[i].tail_call_reg = FUNCTION_INCOMING_ARG (*args_so_far, mode, type,
1213                                                      argpos < n_named_args);
1214 #else
1215       args[i].tail_call_reg = args[i].reg;
1216 #endif
1217
1218 #ifdef FUNCTION_ARG_PARTIAL_NREGS
1219       if (args[i].reg)
1220         args[i].partial
1221           = FUNCTION_ARG_PARTIAL_NREGS (*args_so_far, mode, type,
1222                                         argpos < n_named_args);
1223 #endif
1224
1225       args[i].pass_on_stack = MUST_PASS_IN_STACK (mode, type);
1226
1227       /* If FUNCTION_ARG returned a (parallel [(expr_list (nil) ...) ...]),
1228          it means that we are to pass this arg in the register(s) designated
1229          by the PARALLEL, but also to pass it in the stack.  */
1230       if (args[i].reg && GET_CODE (args[i].reg) == PARALLEL
1231           && XEXP (XVECEXP (args[i].reg, 0, 0), 0) == 0)
1232         args[i].pass_on_stack = 1;
1233
1234       /* If this is an addressable type, we must preallocate the stack
1235          since we must evaluate the object into its final location.
1236
1237          If this is to be passed in both registers and the stack, it is simpler
1238          to preallocate.  */
1239       if (TREE_ADDRESSABLE (type)
1240           || (args[i].pass_on_stack && args[i].reg != 0))
1241         *must_preallocate = 1;
1242
1243       /* If this is an addressable type, we cannot pre-evaluate it.  Thus,
1244          we cannot consider this function call constant.  */
1245       if (TREE_ADDRESSABLE (type))
1246         *ecf_flags &= ~ECF_LIBCALL_BLOCK;
1247
1248       /* Compute the stack-size of this argument.  */
1249       if (args[i].reg == 0 || args[i].partial != 0
1250           || reg_parm_stack_space > 0
1251           || args[i].pass_on_stack)
1252         locate_and_pad_parm (mode, type,
1253 #ifdef STACK_PARMS_IN_REG_PARM_AREA
1254                              1,
1255 #else
1256                              args[i].reg != 0,
1257 #endif
1258                              args[i].pass_on_stack ? 0 : args[i].partial,
1259                              fndecl, args_size, &args[i].locate);
1260 #ifdef BLOCK_REG_PADDING
1261       else
1262         /* The argument is passed entirely in registers.  See at which
1263            end it should be padded.  */
1264         args[i].locate.where_pad =
1265           BLOCK_REG_PADDING (mode, type,
1266                              int_size_in_bytes (type) <= UNITS_PER_WORD);
1267 #endif
1268
1269       /* Update ARGS_SIZE, the total stack space for args so far.  */
1270
1271       args_size->constant += args[i].locate.size.constant;
1272       if (args[i].locate.size.var)
1273         ADD_PARM_SIZE (*args_size, args[i].locate.size.var);
1274
1275       /* Increment ARGS_SO_FAR, which has info about which arg-registers
1276          have been used, etc.  */
1277
1278       FUNCTION_ARG_ADVANCE (*args_so_far, TYPE_MODE (type), type,
1279                             argpos < n_named_args);
1280     }
1281 }
1282
1283 /* Update ARGS_SIZE to contain the total size for the argument block.
1284    Return the original constant component of the argument block's size.
1285
1286    REG_PARM_STACK_SPACE holds the number of bytes of stack space reserved
1287    for arguments passed in registers.  */
1288
1289 static int
1290 compute_argument_block_size (int reg_parm_stack_space,
1291                              struct args_size *args_size,
1292                              int preferred_stack_boundary ATTRIBUTE_UNUSED)
1293 {
1294   int unadjusted_args_size = args_size->constant;
1295
1296   /* For accumulate outgoing args mode we don't need to align, since the frame
1297      will be already aligned.  Align to STACK_BOUNDARY in order to prevent
1298      backends from generating misaligned frame sizes.  */
1299   if (ACCUMULATE_OUTGOING_ARGS && preferred_stack_boundary > STACK_BOUNDARY)
1300     preferred_stack_boundary = STACK_BOUNDARY;
1301
1302   /* Compute the actual size of the argument block required.  The variable
1303      and constant sizes must be combined, the size may have to be rounded,
1304      and there may be a minimum required size.  */
1305
1306   if (args_size->var)
1307     {
1308       args_size->var = ARGS_SIZE_TREE (*args_size);
1309       args_size->constant = 0;
1310
1311       preferred_stack_boundary /= BITS_PER_UNIT;
1312       if (preferred_stack_boundary > 1)
1313         {
1314           /* We don't handle this case yet.  To handle it correctly we have
1315              to add the delta, round and subtract the delta.
1316              Currently no machine description requires this support.  */
1317           if (stack_pointer_delta & (preferred_stack_boundary - 1))
1318             abort ();
1319           args_size->var = round_up (args_size->var, preferred_stack_boundary);
1320         }
1321
1322       if (reg_parm_stack_space > 0)
1323         {
1324           args_size->var
1325             = size_binop (MAX_EXPR, args_size->var,
1326                           ssize_int (reg_parm_stack_space));
1327
1328 #ifndef OUTGOING_REG_PARM_STACK_SPACE
1329           /* The area corresponding to register parameters is not to count in
1330              the size of the block we need.  So make the adjustment.  */
1331           args_size->var
1332             = size_binop (MINUS_EXPR, args_size->var,
1333                           ssize_int (reg_parm_stack_space));
1334 #endif
1335         }
1336     }
1337   else
1338     {
1339       preferred_stack_boundary /= BITS_PER_UNIT;
1340       if (preferred_stack_boundary < 1)
1341         preferred_stack_boundary = 1;
1342       args_size->constant = (((args_size->constant
1343                                + stack_pointer_delta
1344                                + preferred_stack_boundary - 1)
1345                               / preferred_stack_boundary
1346                               * preferred_stack_boundary)
1347                              - stack_pointer_delta);
1348
1349       args_size->constant = MAX (args_size->constant,
1350                                  reg_parm_stack_space);
1351
1352 #ifdef MAYBE_REG_PARM_STACK_SPACE
1353       if (reg_parm_stack_space == 0)
1354         args_size->constant = 0;
1355 #endif
1356
1357 #ifndef OUTGOING_REG_PARM_STACK_SPACE
1358       args_size->constant -= reg_parm_stack_space;
1359 #endif
1360     }
1361   return unadjusted_args_size;
1362 }
1363
1364 /* Precompute parameters as needed for a function call.
1365
1366    FLAGS is mask of ECF_* constants.
1367
1368    NUM_ACTUALS is the number of arguments.
1369
1370    ARGS is an array containing information for each argument; this
1371    routine fills in the INITIAL_VALUE and VALUE fields for each
1372    precomputed argument.  */
1373
1374 static void
1375 precompute_arguments (int flags, int num_actuals, struct arg_data *args)
1376 {
1377   int i;
1378
1379   /* If this function call is cse'able, precompute all the parameters.
1380      Note that if the parameter is constructed into a temporary, this will
1381      cause an additional copy because the parameter will be constructed
1382      into a temporary location and then copied into the outgoing arguments.
1383      If a parameter contains a call to alloca and this function uses the
1384      stack, precompute the parameter.  */
1385
1386   /* If we preallocated the stack space, and some arguments must be passed
1387      on the stack, then we must precompute any parameter which contains a
1388      function call which will store arguments on the stack.
1389      Otherwise, evaluating the parameter may clobber previous parameters
1390      which have already been stored into the stack.  (we have code to avoid
1391      such case by saving the outgoing stack arguments, but it results in
1392      worse code)  */
1393
1394   for (i = 0; i < num_actuals; i++)
1395     if ((flags & ECF_LIBCALL_BLOCK)
1396         || calls_function (args[i].tree_value, !ACCUMULATE_OUTGOING_ARGS))
1397       {
1398         enum machine_mode mode;
1399
1400         /* If this is an addressable type, we cannot pre-evaluate it.  */
1401         if (TREE_ADDRESSABLE (TREE_TYPE (args[i].tree_value)))
1402           abort ();
1403
1404         args[i].value
1405           = expand_expr (args[i].tree_value, NULL_RTX, VOIDmode, 0);
1406
1407         /* ANSI doesn't require a sequence point here,
1408            but PCC has one, so this will avoid some problems.  */
1409         emit_queue ();
1410
1411         args[i].initial_value = args[i].value
1412           = protect_from_queue (args[i].value, 0);
1413
1414         mode = TYPE_MODE (TREE_TYPE (args[i].tree_value));
1415         if (mode != args[i].mode)
1416           {
1417             args[i].value
1418               = convert_modes (args[i].mode, mode,
1419                                args[i].value, args[i].unsignedp);
1420 #ifdef PROMOTE_FOR_CALL_ONLY
1421             /* CSE will replace this only if it contains args[i].value
1422                pseudo, so convert it down to the declared mode using
1423                a SUBREG.  */
1424             if (GET_CODE (args[i].value) == REG
1425                 && GET_MODE_CLASS (args[i].mode) == MODE_INT)
1426               {
1427                 args[i].initial_value
1428                   = gen_lowpart_SUBREG (mode, args[i].value);
1429                 SUBREG_PROMOTED_VAR_P (args[i].initial_value) = 1;
1430                 SUBREG_PROMOTED_UNSIGNED_SET (args[i].initial_value,
1431                   args[i].unsignedp);
1432               }
1433 #endif
1434           }
1435       }
1436 }
1437
1438 /* Given the current state of MUST_PREALLOCATE and information about
1439    arguments to a function call in NUM_ACTUALS, ARGS and ARGS_SIZE,
1440    compute and return the final value for MUST_PREALLOCATE.  */
1441
1442 static int
1443 finalize_must_preallocate (int must_preallocate, int num_actuals, struct arg_data *args, struct args_size *args_size)
1444 {
1445   /* See if we have or want to preallocate stack space.
1446
1447      If we would have to push a partially-in-regs parm
1448      before other stack parms, preallocate stack space instead.
1449
1450      If the size of some parm is not a multiple of the required stack
1451      alignment, we must preallocate.
1452
1453      If the total size of arguments that would otherwise create a copy in
1454      a temporary (such as a CALL) is more than half the total argument list
1455      size, preallocation is faster.
1456
1457      Another reason to preallocate is if we have a machine (like the m88k)
1458      where stack alignment is required to be maintained between every
1459      pair of insns, not just when the call is made.  However, we assume here
1460      that such machines either do not have push insns (and hence preallocation
1461      would occur anyway) or the problem is taken care of with
1462      PUSH_ROUNDING.  */
1463
1464   if (! must_preallocate)
1465     {
1466       int partial_seen = 0;
1467       int copy_to_evaluate_size = 0;
1468       int i;
1469
1470       for (i = 0; i < num_actuals && ! must_preallocate; i++)
1471         {
1472           if (args[i].partial > 0 && ! args[i].pass_on_stack)
1473             partial_seen = 1;
1474           else if (partial_seen && args[i].reg == 0)
1475             must_preallocate = 1;
1476
1477           if (TYPE_MODE (TREE_TYPE (args[i].tree_value)) == BLKmode
1478               && (TREE_CODE (args[i].tree_value) == CALL_EXPR
1479                   || TREE_CODE (args[i].tree_value) == TARGET_EXPR
1480                   || TREE_CODE (args[i].tree_value) == COND_EXPR
1481                   || TREE_ADDRESSABLE (TREE_TYPE (args[i].tree_value))))
1482             copy_to_evaluate_size
1483               += int_size_in_bytes (TREE_TYPE (args[i].tree_value));
1484         }
1485
1486       if (copy_to_evaluate_size * 2 >= args_size->constant
1487           && args_size->constant > 0)
1488         must_preallocate = 1;
1489     }
1490   return must_preallocate;
1491 }
1492
1493 /* If we preallocated stack space, compute the address of each argument
1494    and store it into the ARGS array.
1495
1496    We need not ensure it is a valid memory address here; it will be
1497    validized when it is used.
1498
1499    ARGBLOCK is an rtx for the address of the outgoing arguments.  */
1500
1501 static void
1502 compute_argument_addresses (struct arg_data *args, rtx argblock, int num_actuals)
1503 {
1504   if (argblock)
1505     {
1506       rtx arg_reg = argblock;
1507       int i, arg_offset = 0;
1508
1509       if (GET_CODE (argblock) == PLUS)
1510         arg_reg = XEXP (argblock, 0), arg_offset = INTVAL (XEXP (argblock, 1));
1511
1512       for (i = 0; i < num_actuals; i++)
1513         {
1514           rtx offset = ARGS_SIZE_RTX (args[i].locate.offset);
1515           rtx slot_offset = ARGS_SIZE_RTX (args[i].locate.slot_offset);
1516           rtx addr;
1517
1518           /* Skip this parm if it will not be passed on the stack.  */
1519           if (! args[i].pass_on_stack && args[i].reg != 0)
1520             continue;
1521
1522           if (GET_CODE (offset) == CONST_INT)
1523             addr = plus_constant (arg_reg, INTVAL (offset));
1524           else
1525             addr = gen_rtx_PLUS (Pmode, arg_reg, offset);
1526
1527           addr = plus_constant (addr, arg_offset);
1528           args[i].stack = gen_rtx_MEM (args[i].mode, addr);
1529           set_mem_align (args[i].stack, PARM_BOUNDARY);
1530           set_mem_attributes (args[i].stack,
1531                               TREE_TYPE (args[i].tree_value), 1);
1532
1533           if (GET_CODE (slot_offset) == CONST_INT)
1534             addr = plus_constant (arg_reg, INTVAL (slot_offset));
1535           else
1536             addr = gen_rtx_PLUS (Pmode, arg_reg, slot_offset);
1537
1538           addr = plus_constant (addr, arg_offset);
1539           args[i].stack_slot = gen_rtx_MEM (args[i].mode, addr);
1540           set_mem_align (args[i].stack_slot, PARM_BOUNDARY);
1541           set_mem_attributes (args[i].stack_slot,
1542                               TREE_TYPE (args[i].tree_value), 1);
1543
1544           /* Function incoming arguments may overlap with sibling call
1545              outgoing arguments and we cannot allow reordering of reads
1546              from function arguments with stores to outgoing arguments
1547              of sibling calls.  */
1548           set_mem_alias_set (args[i].stack, 0);
1549           set_mem_alias_set (args[i].stack_slot, 0);
1550         }
1551     }
1552 }
1553
1554 /* Given a FNDECL and EXP, return an rtx suitable for use as a target address
1555    in a call instruction.
1556
1557    FNDECL is the tree node for the target function.  For an indirect call
1558    FNDECL will be NULL_TREE.
1559
1560    ADDR is the operand 0 of CALL_EXPR for this call.  */
1561
1562 static rtx
1563 rtx_for_function_call (tree fndecl, tree addr)
1564 {
1565   rtx funexp;
1566
1567   /* Get the function to call, in the form of RTL.  */
1568   if (fndecl)
1569     {
1570       /* If this is the first use of the function, see if we need to
1571          make an external definition for it.  */
1572       if (! TREE_USED (fndecl))
1573         {
1574           assemble_external (fndecl);
1575           TREE_USED (fndecl) = 1;
1576         }
1577
1578       /* Get a SYMBOL_REF rtx for the function address.  */
1579       funexp = XEXP (DECL_RTL (fndecl), 0);
1580     }
1581   else
1582     /* Generate an rtx (probably a pseudo-register) for the address.  */
1583     {
1584       push_temp_slots ();
1585       funexp = expand_expr (addr, NULL_RTX, VOIDmode, 0);
1586       pop_temp_slots ();        /* FUNEXP can't be BLKmode.  */
1587       emit_queue ();
1588     }
1589   return funexp;
1590 }
1591
1592 /* Do the register loads required for any wholly-register parms or any
1593    parms which are passed both on the stack and in a register.  Their
1594    expressions were already evaluated.
1595
1596    Mark all register-parms as living through the call, putting these USE
1597    insns in the CALL_INSN_FUNCTION_USAGE field.
1598
1599    When IS_SIBCALL, perform the check_sibcall_overlap_argument_overlap
1600    checking, setting *SIBCALL_FAILURE if appropriate.  */
1601
1602 static void
1603 load_register_parameters (struct arg_data *args, int num_actuals,
1604                           rtx *call_fusage, int flags, int is_sibcall,
1605                           int *sibcall_failure)
1606 {
1607   int i, j;
1608
1609   for (i = 0; i < num_actuals; i++)
1610     {
1611       rtx reg = ((flags & ECF_SIBCALL)
1612                  ? args[i].tail_call_reg : args[i].reg);
1613       if (reg)
1614         {
1615           int partial = args[i].partial;
1616           int nregs;
1617           int size = 0;
1618           rtx before_arg = get_last_insn ();
1619           /* Set to non-negative if must move a word at a time, even if just
1620              one word (e.g, partial == 1 && mode == DFmode).  Set to -1 if
1621              we just use a normal move insn.  This value can be zero if the
1622              argument is a zero size structure with no fields.  */
1623           nregs = -1;
1624           if (partial)
1625             nregs = partial;
1626           else if (TYPE_MODE (TREE_TYPE (args[i].tree_value)) == BLKmode)
1627             {
1628               size = int_size_in_bytes (TREE_TYPE (args[i].tree_value));
1629               nregs = (size + (UNITS_PER_WORD - 1)) / UNITS_PER_WORD;
1630             }
1631           else
1632             size = GET_MODE_SIZE (args[i].mode);
1633
1634           /* Handle calls that pass values in multiple non-contiguous
1635              locations.  The Irix 6 ABI has examples of this.  */
1636
1637           if (GET_CODE (reg) == PARALLEL)
1638             {
1639               tree type = TREE_TYPE (args[i].tree_value);
1640               emit_group_load (reg, args[i].value, type,
1641                                int_size_in_bytes (type));
1642             }
1643
1644           /* If simple case, just do move.  If normal partial, store_one_arg
1645              has already loaded the register for us.  In all other cases,
1646              load the register(s) from memory.  */
1647
1648           else if (nregs == -1)
1649             {
1650               emit_move_insn (reg, args[i].value);
1651 #ifdef BLOCK_REG_PADDING
1652               /* Handle case where we have a value that needs shifting
1653                  up to the msb.  eg. a QImode value and we're padding
1654                  upward on a BYTES_BIG_ENDIAN machine.  */
1655               if (size < UNITS_PER_WORD
1656                   && (args[i].locate.where_pad
1657                       == (BYTES_BIG_ENDIAN ? upward : downward)))
1658                 {
1659                   rtx x;
1660                   int shift = (UNITS_PER_WORD - size) * BITS_PER_UNIT;
1661
1662                   /* Assigning REG here rather than a temp makes CALL_FUSAGE
1663                      report the whole reg as used.  Strictly speaking, the
1664                      call only uses SIZE bytes at the msb end, but it doesn't
1665                      seem worth generating rtl to say that.  */
1666                   reg = gen_rtx_REG (word_mode, REGNO (reg));
1667                   x = expand_binop (word_mode, ashl_optab, reg,
1668                                     GEN_INT (shift), reg, 1, OPTAB_WIDEN);
1669                   if (x != reg)
1670                     emit_move_insn (reg, x);
1671                 }
1672 #endif
1673             }
1674
1675           /* If we have pre-computed the values to put in the registers in
1676              the case of non-aligned structures, copy them in now.  */
1677
1678           else if (args[i].n_aligned_regs != 0)
1679             for (j = 0; j < args[i].n_aligned_regs; j++)
1680               emit_move_insn (gen_rtx_REG (word_mode, REGNO (reg) + j),
1681                               args[i].aligned_regs[j]);
1682
1683           else if (partial == 0 || args[i].pass_on_stack)
1684             {
1685               rtx mem = validize_mem (args[i].value);
1686
1687 #ifdef BLOCK_REG_PADDING
1688               /* Handle a BLKmode that needs shifting.  */
1689               if (nregs == 1 && size < UNITS_PER_WORD
1690                   && args[i].locate.where_pad == downward)
1691                 {
1692                   rtx tem = operand_subword_force (mem, 0, args[i].mode);
1693                   rtx ri = gen_rtx_REG (word_mode, REGNO (reg));
1694                   rtx x = gen_reg_rtx (word_mode);
1695                   int shift = (UNITS_PER_WORD - size) * BITS_PER_UNIT;
1696                   optab dir = BYTES_BIG_ENDIAN ? lshr_optab : ashl_optab;
1697
1698                   emit_move_insn (x, tem);
1699                   x = expand_binop (word_mode, dir, x, GEN_INT (shift),
1700                                     ri, 1, OPTAB_WIDEN);
1701                   if (x != ri)
1702                     emit_move_insn (ri, x);
1703                 }
1704               else
1705 #endif
1706                 move_block_to_reg (REGNO (reg), mem, nregs, args[i].mode);
1707             }
1708
1709           /* When a parameter is a block, and perhaps in other cases, it is
1710              possible that it did a load from an argument slot that was
1711              already clobbered.  */
1712           if (is_sibcall
1713               && check_sibcall_argument_overlap (before_arg, &args[i], 0))
1714             *sibcall_failure = 1;
1715
1716           /* Handle calls that pass values in multiple non-contiguous
1717              locations.  The Irix 6 ABI has examples of this.  */
1718           if (GET_CODE (reg) == PARALLEL)
1719             use_group_regs (call_fusage, reg);
1720           else if (nregs == -1)
1721             use_reg (call_fusage, reg);
1722           else
1723             use_regs (call_fusage, REGNO (reg), nregs == 0 ? 1 : nregs);
1724         }
1725     }
1726 }
1727
1728 /* Try to integrate function.  See expand_inline_function for documentation
1729    about the parameters.  */
1730
1731 static rtx
1732 try_to_integrate (tree fndecl, tree actparms, rtx target, int ignore,
1733                   tree type, rtx structure_value_addr)
1734 {
1735   rtx temp;
1736   rtx before_call;
1737   int i;
1738   rtx old_stack_level = 0;
1739   int reg_parm_stack_space = 0;
1740
1741 #ifdef REG_PARM_STACK_SPACE
1742 #ifdef MAYBE_REG_PARM_STACK_SPACE
1743   reg_parm_stack_space = MAYBE_REG_PARM_STACK_SPACE;
1744 #else
1745   reg_parm_stack_space = REG_PARM_STACK_SPACE (fndecl);
1746 #endif
1747 #endif
1748
1749   before_call = get_last_insn ();
1750
1751   timevar_push (TV_INTEGRATION);
1752
1753   temp = expand_inline_function (fndecl, actparms, target,
1754                                  ignore, type,
1755                                  structure_value_addr);
1756
1757   timevar_pop (TV_INTEGRATION);
1758
1759   /* If inlining succeeded, return.  */
1760   if (temp != (rtx) (size_t) - 1)
1761     {
1762       if (ACCUMULATE_OUTGOING_ARGS)
1763         {
1764           /* If the outgoing argument list must be preserved, push
1765              the stack before executing the inlined function if it
1766              makes any calls.  */
1767
1768           i = reg_parm_stack_space;
1769           if (i > highest_outgoing_arg_in_use)
1770             i = highest_outgoing_arg_in_use;
1771           while (--i >= 0 && stack_usage_map[i] == 0)
1772             ;
1773
1774           if (stack_arg_under_construction || i >= 0)
1775             {
1776               rtx first_insn
1777                 = before_call ? NEXT_INSN (before_call) : get_insns ();
1778               rtx insn = NULL_RTX, seq;
1779
1780               /* Look for a call in the inline function code.
1781                  If DECL_SAVED_INSNS (fndecl)->outgoing_args_size is
1782                  nonzero then there is a call and it is not necessary
1783                  to scan the insns.  */
1784
1785               if (DECL_SAVED_INSNS (fndecl)->outgoing_args_size == 0)
1786                 for (insn = first_insn; insn; insn = NEXT_INSN (insn))
1787                   if (GET_CODE (insn) == CALL_INSN)
1788                     break;
1789
1790               if (insn)
1791                 {
1792                   /* Reserve enough stack space so that the largest
1793                      argument list of any function call in the inline
1794                      function does not overlap the argument list being
1795                      evaluated.  This is usually an overestimate because
1796                      allocate_dynamic_stack_space reserves space for an
1797                      outgoing argument list in addition to the requested
1798                      space, but there is no way to ask for stack space such
1799                      that an argument list of a certain length can be
1800                      safely constructed.
1801
1802                      Add the stack space reserved for register arguments, if
1803                      any, in the inline function.  What is really needed is the
1804                      largest value of reg_parm_stack_space in the inline
1805                      function, but that is not available.  Using the current
1806                      value of reg_parm_stack_space is wrong, but gives
1807                      correct results on all supported machines.  */
1808
1809                   int adjust = (DECL_SAVED_INSNS (fndecl)->outgoing_args_size
1810                                 + reg_parm_stack_space);
1811
1812                   start_sequence ();
1813                   emit_stack_save (SAVE_BLOCK, &old_stack_level, NULL_RTX);
1814                   allocate_dynamic_stack_space (GEN_INT (adjust),
1815                                                 NULL_RTX, BITS_PER_UNIT);
1816                   seq = get_insns ();
1817                   end_sequence ();
1818                   emit_insn_before (seq, first_insn);
1819                   emit_stack_restore (SAVE_BLOCK, old_stack_level, NULL_RTX);
1820                 }
1821             }
1822         }
1823
1824       /* If the result is equivalent to TARGET, return TARGET to simplify
1825          checks in store_expr.  They can be equivalent but not equal in the
1826          case of a function that returns BLKmode.  */
1827       if (temp != target && rtx_equal_p (temp, target))
1828         return target;
1829       return temp;
1830     }
1831
1832   /* If inlining failed, mark FNDECL as needing to be compiled
1833      separately after all.  If function was declared inline,
1834      give a warning.  */
1835   if (DECL_INLINE (fndecl) && warn_inline && !flag_no_inline
1836       && optimize > 0 && !TREE_ADDRESSABLE (fndecl))
1837     {
1838       warning ("%Jinlining failed in call to '%F'", fndecl, fndecl);
1839       warning ("called from here");
1840     }
1841   (*lang_hooks.mark_addressable) (fndecl);
1842   return (rtx) (size_t) - 1;
1843 }
1844
1845 /* We need to pop PENDING_STACK_ADJUST bytes.  But, if the arguments
1846    wouldn't fill up an even multiple of PREFERRED_UNIT_STACK_BOUNDARY
1847    bytes, then we would need to push some additional bytes to pad the
1848    arguments.  So, we compute an adjust to the stack pointer for an
1849    amount that will leave the stack under-aligned by UNADJUSTED_ARGS_SIZE
1850    bytes.  Then, when the arguments are pushed the stack will be perfectly
1851    aligned.  ARGS_SIZE->CONSTANT is set to the number of bytes that should
1852    be popped after the call.  Returns the adjustment.  */
1853
1854 static int
1855 combine_pending_stack_adjustment_and_call (int unadjusted_args_size,
1856                                            struct args_size *args_size,
1857                                            int preferred_unit_stack_boundary)
1858 {
1859   /* The number of bytes to pop so that the stack will be
1860      under-aligned by UNADJUSTED_ARGS_SIZE bytes.  */
1861   HOST_WIDE_INT adjustment;
1862   /* The alignment of the stack after the arguments are pushed, if we
1863      just pushed the arguments without adjust the stack here.  */
1864   HOST_WIDE_INT unadjusted_alignment;
1865
1866   unadjusted_alignment
1867     = ((stack_pointer_delta + unadjusted_args_size)
1868        % preferred_unit_stack_boundary);
1869
1870   /* We want to get rid of as many of the PENDING_STACK_ADJUST bytes
1871      as possible -- leaving just enough left to cancel out the
1872      UNADJUSTED_ALIGNMENT.  In other words, we want to ensure that the
1873      PENDING_STACK_ADJUST is non-negative, and congruent to
1874      -UNADJUSTED_ALIGNMENT modulo the PREFERRED_UNIT_STACK_BOUNDARY.  */
1875
1876   /* Begin by trying to pop all the bytes.  */
1877   unadjusted_alignment
1878     = (unadjusted_alignment
1879        - (pending_stack_adjust % preferred_unit_stack_boundary));
1880   adjustment = pending_stack_adjust;
1881   /* Push enough additional bytes that the stack will be aligned
1882      after the arguments are pushed.  */
1883   if (preferred_unit_stack_boundary > 1)
1884     {
1885       if (unadjusted_alignment > 0)
1886         adjustment -= preferred_unit_stack_boundary - unadjusted_alignment;
1887       else
1888         adjustment += unadjusted_alignment;
1889     }
1890
1891   /* Now, sets ARGS_SIZE->CONSTANT so that we pop the right number of
1892      bytes after the call.  The right number is the entire
1893      PENDING_STACK_ADJUST less our ADJUSTMENT plus the amount required
1894      by the arguments in the first place.  */
1895   args_size->constant
1896     = pending_stack_adjust - adjustment + unadjusted_args_size;
1897
1898   return adjustment;
1899 }
1900
1901 /* Scan X expression if it does not dereference any argument slots
1902    we already clobbered by tail call arguments (as noted in stored_args_map
1903    bitmap).
1904    Return nonzero if X expression dereferences such argument slots,
1905    zero otherwise.  */
1906
1907 static int
1908 check_sibcall_argument_overlap_1 (rtx x)
1909 {
1910   RTX_CODE code;
1911   int i, j;
1912   unsigned int k;
1913   const char *fmt;
1914
1915   if (x == NULL_RTX)
1916     return 0;
1917
1918   code = GET_CODE (x);
1919
1920   if (code == MEM)
1921     {
1922       if (XEXP (x, 0) == current_function_internal_arg_pointer)
1923         i = 0;
1924       else if (GET_CODE (XEXP (x, 0)) == PLUS
1925                && XEXP (XEXP (x, 0), 0) ==
1926                   current_function_internal_arg_pointer
1927                && GET_CODE (XEXP (XEXP (x, 0), 1)) == CONST_INT)
1928         i = INTVAL (XEXP (XEXP (x, 0), 1));
1929       else
1930         return 0;
1931
1932 #ifdef ARGS_GROW_DOWNWARD
1933       i = -i - GET_MODE_SIZE (GET_MODE (x));
1934 #endif
1935
1936       for (k = 0; k < GET_MODE_SIZE (GET_MODE (x)); k++)
1937         if (i + k < stored_args_map->n_bits
1938             && TEST_BIT (stored_args_map, i + k))
1939           return 1;
1940
1941       return 0;
1942     }
1943
1944   /* Scan all subexpressions.  */
1945   fmt = GET_RTX_FORMAT (code);
1946   for (i = 0; i < GET_RTX_LENGTH (code); i++, fmt++)
1947     {
1948       if (*fmt == 'e')
1949         {
1950           if (check_sibcall_argument_overlap_1 (XEXP (x, i)))
1951             return 1;
1952         }
1953       else if (*fmt == 'E')
1954         {
1955           for (j = 0; j < XVECLEN (x, i); j++)
1956             if (check_sibcall_argument_overlap_1 (XVECEXP (x, i, j)))
1957               return 1;
1958         }
1959     }
1960   return 0;
1961 }
1962
1963 /* Scan sequence after INSN if it does not dereference any argument slots
1964    we already clobbered by tail call arguments (as noted in stored_args_map
1965    bitmap).  If MARK_STORED_ARGS_MAP, add stack slots for ARG to
1966    stored_args_map bitmap afterwards (when ARG is a register MARK_STORED_ARGS_MAP
1967    should be 0).  Return nonzero if sequence after INSN dereferences such argument
1968    slots, zero otherwise.  */
1969
1970 static int
1971 check_sibcall_argument_overlap (rtx insn, struct arg_data *arg, int mark_stored_args_map)
1972 {
1973   int low, high;
1974
1975   if (insn == NULL_RTX)
1976     insn = get_insns ();
1977   else
1978     insn = NEXT_INSN (insn);
1979
1980   for (; insn; insn = NEXT_INSN (insn))
1981     if (INSN_P (insn)
1982         && check_sibcall_argument_overlap_1 (PATTERN (insn)))
1983       break;
1984
1985   if (mark_stored_args_map)
1986     {
1987 #ifdef ARGS_GROW_DOWNWARD
1988       low = -arg->locate.slot_offset.constant - arg->locate.size.constant;
1989 #else
1990       low = arg->locate.slot_offset.constant;
1991 #endif
1992
1993       for (high = low + arg->locate.size.constant; low < high; low++)
1994         SET_BIT (stored_args_map, low);
1995     }
1996   return insn != NULL_RTX;
1997 }
1998
1999 static tree
2000 fix_unsafe_tree (tree t)
2001 {
2002   switch (unsafe_for_reeval (t))
2003     {
2004     case 0: /* Safe.  */
2005       break;
2006
2007     case 1: /* Mildly unsafe.  */
2008       t = unsave_expr (t);
2009       break;
2010
2011     case 2: /* Wildly unsafe.  */
2012       {
2013         tree var = build_decl (VAR_DECL, NULL_TREE,
2014                                TREE_TYPE (t));
2015         SET_DECL_RTL (var,
2016                       expand_expr (t, NULL_RTX, VOIDmode, EXPAND_NORMAL));
2017         t = var;
2018       }
2019       break;
2020
2021     default:
2022       abort ();
2023     }
2024   return t;
2025 }
2026
2027
2028 /* If function value *VALUE was returned at the most significant end of a
2029    register, shift it towards the least significant end and convert it to
2030    TYPE's mode.  Return true and update *VALUE if some action was needed.
2031
2032    TYPE is the type of the function's return value, which is known not
2033    to have mode BLKmode.  */
2034
2035 static bool
2036 shift_returned_value (tree type, rtx *value)
2037 {
2038   if (targetm.calls.return_in_msb (type))
2039     {
2040       HOST_WIDE_INT shift;
2041
2042       shift = (GET_MODE_BITSIZE (GET_MODE (*value))
2043                - BITS_PER_UNIT * int_size_in_bytes (type));
2044       if (shift > 0)
2045         {
2046           *value = expand_binop (GET_MODE (*value), lshr_optab, *value,
2047                                  GEN_INT (shift), 0, 1, OPTAB_WIDEN);
2048           *value = convert_to_mode (TYPE_MODE (type), *value, 0);
2049           return true;
2050         }
2051     }
2052   return false;
2053 }
2054
2055 /* Generate all the code for a function call
2056    and return an rtx for its value.
2057    Store the value in TARGET (specified as an rtx) if convenient.
2058    If the value is stored in TARGET then TARGET is returned.
2059    If IGNORE is nonzero, then we ignore the value of the function call.  */
2060
2061 rtx
2062 expand_call (tree exp, rtx target, int ignore)
2063 {
2064   /* Nonzero if we are currently expanding a call.  */
2065   static int currently_expanding_call = 0;
2066
2067   /* List of actual parameters.  */
2068   tree actparms = TREE_OPERAND (exp, 1);
2069   /* RTX for the function to be called.  */
2070   rtx funexp;
2071   /* Sequence of insns to perform a tail recursive "call".  */
2072   rtx tail_recursion_insns = NULL_RTX;
2073   /* Sequence of insns to perform a normal "call".  */
2074   rtx normal_call_insns = NULL_RTX;
2075   /* Sequence of insns to perform a tail recursive "call".  */
2076   rtx tail_call_insns = NULL_RTX;
2077   /* Data type of the function.  */
2078   tree funtype;
2079   tree type_arg_types;
2080   /* Declaration of the function being called,
2081      or 0 if the function is computed (not known by name).  */
2082   tree fndecl = 0;
2083   /* The type of the function being called.  */
2084   tree fntype;
2085   rtx insn;
2086   int try_tail_call = 1;
2087   int try_tail_recursion = 1;
2088   int pass;
2089
2090   /* Register in which non-BLKmode value will be returned,
2091      or 0 if no value or if value is BLKmode.  */
2092   rtx valreg;
2093   /* Address where we should return a BLKmode value;
2094      0 if value not BLKmode.  */
2095   rtx structure_value_addr = 0;
2096   /* Nonzero if that address is being passed by treating it as
2097      an extra, implicit first parameter.  Otherwise,
2098      it is passed by being copied directly into struct_value_rtx.  */
2099   int structure_value_addr_parm = 0;
2100   /* Size of aggregate value wanted, or zero if none wanted
2101      or if we are using the non-reentrant PCC calling convention
2102      or expecting the value in registers.  */
2103   HOST_WIDE_INT struct_value_size = 0;
2104   /* Nonzero if called function returns an aggregate in memory PCC style,
2105      by returning the address of where to find it.  */
2106   int pcc_struct_value = 0;
2107   rtx struct_value = 0;
2108
2109   /* Number of actual parameters in this call, including struct value addr.  */
2110   int num_actuals;
2111   /* Number of named args.  Args after this are anonymous ones
2112      and they must all go on the stack.  */
2113   int n_named_args;
2114
2115   /* Vector of information about each argument.
2116      Arguments are numbered in the order they will be pushed,
2117      not the order they are written.  */
2118   struct arg_data *args;
2119
2120   /* Total size in bytes of all the stack-parms scanned so far.  */
2121   struct args_size args_size;
2122   struct args_size adjusted_args_size;
2123   /* Size of arguments before any adjustments (such as rounding).  */
2124   int unadjusted_args_size;
2125   /* Data on reg parms scanned so far.  */
2126   CUMULATIVE_ARGS args_so_far;
2127   /* Nonzero if a reg parm has been scanned.  */
2128   int reg_parm_seen;
2129   /* Nonzero if this is an indirect function call.  */
2130
2131   /* Nonzero if we must avoid push-insns in the args for this call.
2132      If stack space is allocated for register parameters, but not by the
2133      caller, then it is preallocated in the fixed part of the stack frame.
2134      So the entire argument block must then be preallocated (i.e., we
2135      ignore PUSH_ROUNDING in that case).  */
2136
2137   int must_preallocate = !PUSH_ARGS;
2138
2139   /* Size of the stack reserved for parameter registers.  */
2140   int reg_parm_stack_space = 0;
2141
2142   /* Address of space preallocated for stack parms
2143      (on machines that lack push insns), or 0 if space not preallocated.  */
2144   rtx argblock = 0;
2145
2146   /* Mask of ECF_ flags.  */
2147   int flags = 0;
2148   /* Nonzero if this is a call to an inline function.  */
2149   int is_integrable = 0;
2150 #ifdef REG_PARM_STACK_SPACE
2151   /* Define the boundary of the register parm stack space that needs to be
2152      saved, if any.  */
2153   int low_to_save, high_to_save;
2154   rtx save_area = 0;            /* Place that it is saved */
2155 #endif
2156
2157   int initial_highest_arg_in_use = highest_outgoing_arg_in_use;
2158   rtx temp_target = 0;
2159   char *initial_stack_usage_map = stack_usage_map;
2160
2161   int old_stack_allocated;
2162
2163   /* State variables to track stack modifications.  */
2164   rtx old_stack_level = 0;
2165   int old_stack_arg_under_construction = 0;
2166   int old_pending_adj = 0;
2167   int old_inhibit_defer_pop = inhibit_defer_pop;
2168
2169   /* Some stack pointer alterations we make are performed via
2170      allocate_dynamic_stack_space. This modifies the stack_pointer_delta,
2171      which we then also need to save/restore along the way.  */
2172   int old_stack_pointer_delta = 0;
2173
2174   rtx call_fusage;
2175   tree p = TREE_OPERAND (exp, 0);
2176   tree addr = TREE_OPERAND (exp, 0);
2177   int i;
2178   /* The alignment of the stack, in bits.  */
2179   HOST_WIDE_INT preferred_stack_boundary;
2180   /* The alignment of the stack, in bytes.  */
2181   HOST_WIDE_INT preferred_unit_stack_boundary;
2182
2183   /* See if this is "nothrow" function call.  */
2184   if (TREE_NOTHROW (exp))
2185     flags |= ECF_NOTHROW;
2186
2187   /* See if we can find a DECL-node for the actual function.
2188      As a result, decide whether this is a call to an integrable function.  */
2189
2190   fndecl = get_callee_fndecl (exp);
2191   if (fndecl)
2192     {
2193       fntype = TREE_TYPE (fndecl);
2194       if (!flag_no_inline
2195           && fndecl != current_function_decl
2196           && DECL_INLINE (fndecl)
2197           && DECL_SAVED_INSNS (fndecl)
2198           && DECL_SAVED_INSNS (fndecl)->inlinable)
2199         is_integrable = 1;
2200       else if (! TREE_ADDRESSABLE (fndecl))
2201         {
2202           /* In case this function later becomes inlinable,
2203              record that there was already a non-inline call to it.
2204
2205              Use abstraction instead of setting TREE_ADDRESSABLE
2206              directly.  */
2207           if (DECL_INLINE (fndecl) && warn_inline && !flag_no_inline
2208               && optimize > 0)
2209             {
2210               warning ("%Jcan't inline call to '%F'", fndecl, fndecl);
2211               warning ("called from here");
2212             }
2213           (*lang_hooks.mark_addressable) (fndecl);
2214         }
2215
2216       if (ignore
2217           && lookup_attribute ("warn_unused_result",
2218                                TYPE_ATTRIBUTES (TREE_TYPE (fndecl))))
2219         warning ("ignoring return value of `%D', "
2220                  "declared with attribute warn_unused_result", fndecl);
2221
2222       flags |= flags_from_decl_or_type (fndecl);
2223     }
2224
2225   /* If we don't have specific function to call, see if we have a
2226      attributes set in the type.  */
2227   else
2228     {
2229       fntype = TREE_TYPE (TREE_TYPE (p));
2230       if (ignore
2231           && lookup_attribute ("warn_unused_result", TYPE_ATTRIBUTES (fntype)))
2232         warning ("ignoring return value of function "
2233                  "declared with attribute warn_unused_result");
2234       flags |= flags_from_decl_or_type (fntype);
2235     }
2236
2237   struct_value = targetm.calls.struct_value_rtx (fntype, 0);
2238
2239   /* Warn if this value is an aggregate type,
2240      regardless of which calling convention we are using for it.  */
2241   if (warn_aggregate_return && AGGREGATE_TYPE_P (TREE_TYPE (exp)))
2242     warning ("function call has aggregate value");
2243
2244   /* If the result of a pure or const function call is ignored (or void),
2245      and none of its arguments are volatile, we can avoid expanding the
2246      call and just evaluate the arguments for side-effects.  */
2247   if ((flags & (ECF_CONST | ECF_PURE))
2248       && (ignore || target == const0_rtx
2249           || TYPE_MODE (TREE_TYPE (exp)) == VOIDmode))
2250     {
2251       bool volatilep = false;
2252       tree arg;
2253
2254       for (arg = actparms; arg; arg = TREE_CHAIN (arg))
2255         if (TREE_THIS_VOLATILE (TREE_VALUE (arg)))
2256           {
2257             volatilep = true;
2258             break;
2259           }
2260
2261       if (! volatilep)
2262         {
2263           for (arg = actparms; arg; arg = TREE_CHAIN (arg))
2264             expand_expr (TREE_VALUE (arg), const0_rtx,
2265                          VOIDmode, EXPAND_NORMAL);
2266           return const0_rtx;
2267         }
2268     }
2269
2270 #ifdef REG_PARM_STACK_SPACE
2271 #ifdef MAYBE_REG_PARM_STACK_SPACE
2272   reg_parm_stack_space = MAYBE_REG_PARM_STACK_SPACE;
2273 #else
2274   reg_parm_stack_space = REG_PARM_STACK_SPACE (fndecl);
2275 #endif
2276 #endif
2277
2278 #ifndef OUTGOING_REG_PARM_STACK_SPACE
2279   if (reg_parm_stack_space > 0 && PUSH_ARGS)
2280     must_preallocate = 1;
2281 #endif
2282
2283   /* Set up a place to return a structure.  */
2284
2285   /* Cater to broken compilers.  */
2286   if (aggregate_value_p (exp, fndecl))
2287     {
2288       /* This call returns a big structure.  */
2289       flags &= ~(ECF_CONST | ECF_PURE | ECF_LIBCALL_BLOCK);
2290
2291 #ifdef PCC_STATIC_STRUCT_RETURN
2292       {
2293         pcc_struct_value = 1;
2294         /* Easier than making that case work right.  */
2295         if (is_integrable)
2296           {
2297             /* In case this is a static function, note that it has been
2298                used.  */
2299             if (! TREE_ADDRESSABLE (fndecl))
2300               (*lang_hooks.mark_addressable) (fndecl);
2301             is_integrable = 0;
2302           }
2303       }
2304 #else /* not PCC_STATIC_STRUCT_RETURN */
2305       {
2306         struct_value_size = int_size_in_bytes (TREE_TYPE (exp));
2307
2308         if (CALL_EXPR_HAS_RETURN_SLOT_ADDR (exp))
2309           {
2310             /* The structure value address arg is already in actparms.
2311                Pull it out.  It might be nice to just leave it there, but
2312                we need to set structure_value_addr.  */
2313             tree return_arg = TREE_VALUE (actparms);
2314             actparms = TREE_CHAIN (actparms);
2315             structure_value_addr = expand_expr (return_arg, NULL_RTX,
2316                                                 VOIDmode, EXPAND_NORMAL);
2317           }
2318         else if (target && GET_CODE (target) == MEM)
2319           structure_value_addr = XEXP (target, 0);
2320         else
2321           {
2322             /* For variable-sized objects, we must be called with a target
2323                specified.  If we were to allocate space on the stack here,
2324                we would have no way of knowing when to free it.  */
2325             rtx d = assign_temp (TREE_TYPE (exp), 1, 1, 1);
2326
2327             mark_temp_addr_taken (d);
2328             structure_value_addr = XEXP (d, 0);
2329             target = 0;
2330           }
2331       }
2332 #endif /* not PCC_STATIC_STRUCT_RETURN */
2333     }
2334
2335   /* If called function is inline, try to integrate it.  */
2336
2337   if (is_integrable)
2338     {
2339       rtx temp = try_to_integrate (fndecl, actparms, target,
2340                                    ignore, TREE_TYPE (exp),
2341                                    structure_value_addr);
2342       if (temp != (rtx) (size_t) - 1)
2343         return temp;
2344     }
2345
2346   /* Figure out the amount to which the stack should be aligned.  */
2347   preferred_stack_boundary = PREFERRED_STACK_BOUNDARY;
2348   if (fndecl)
2349     {
2350       struct cgraph_rtl_info *i = cgraph_rtl_info (fndecl);
2351       if (i && i->preferred_incoming_stack_boundary)
2352         preferred_stack_boundary = i->preferred_incoming_stack_boundary;
2353     }
2354
2355   /* Operand 0 is a pointer-to-function; get the type of the function.  */
2356   funtype = TREE_TYPE (addr);
2357   if (! POINTER_TYPE_P (funtype))
2358     abort ();
2359   funtype = TREE_TYPE (funtype);
2360
2361   /* Munge the tree to split complex arguments into their imaginary
2362      and real parts.  */
2363   if (targetm.calls.split_complex_arg)
2364     {
2365       type_arg_types = split_complex_types (TYPE_ARG_TYPES (funtype));
2366       actparms = split_complex_values (actparms);
2367     }
2368   else
2369     type_arg_types = TYPE_ARG_TYPES (funtype);
2370
2371   /* See if this is a call to a function that can return more than once
2372      or a call to longjmp or malloc.  */
2373   flags |= special_function_p (fndecl, flags);
2374
2375   if (flags & ECF_MAY_BE_ALLOCA)
2376     current_function_calls_alloca = 1;
2377
2378   /* If struct_value_rtx is 0, it means pass the address
2379      as if it were an extra parameter.  */
2380   if (structure_value_addr && struct_value == 0)
2381     {
2382       /* If structure_value_addr is a REG other than
2383          virtual_outgoing_args_rtx, we can use always use it.  If it
2384          is not a REG, we must always copy it into a register.
2385          If it is virtual_outgoing_args_rtx, we must copy it to another
2386          register in some cases.  */
2387       rtx temp = (GET_CODE (structure_value_addr) != REG
2388                   || (ACCUMULATE_OUTGOING_ARGS
2389                       && stack_arg_under_construction
2390                       && structure_value_addr == virtual_outgoing_args_rtx)
2391                   ? copy_addr_to_reg (convert_memory_address 
2392                                       (Pmode, structure_value_addr))
2393                   : structure_value_addr);
2394
2395       actparms
2396         = tree_cons (error_mark_node,
2397                      make_tree (build_pointer_type (TREE_TYPE (funtype)),
2398                                 temp),
2399                      actparms);
2400       structure_value_addr_parm = 1;
2401     }
2402
2403   /* Count the arguments and set NUM_ACTUALS.  */
2404   for (p = actparms, num_actuals = 0; p; p = TREE_CHAIN (p))
2405     num_actuals++;
2406
2407   /* Compute number of named args.
2408      First, do a raw count of the args for INIT_CUMULATIVE_ARGS.  */
2409
2410   if (type_arg_types != 0)
2411     n_named_args
2412       = (list_length (type_arg_types)
2413          /* Count the struct value address, if it is passed as a parm.  */
2414          + structure_value_addr_parm);
2415   else
2416     /* If we know nothing, treat all args as named.  */
2417     n_named_args = num_actuals;
2418
2419   /* Start updating where the next arg would go.
2420
2421      On some machines (such as the PA) indirect calls have a different
2422      calling convention than normal calls.  The fourth argument in
2423      INIT_CUMULATIVE_ARGS tells the backend if this is an indirect call
2424      or not.  */
2425   INIT_CUMULATIVE_ARGS (args_so_far, funtype, NULL_RTX, fndecl, n_named_args);
2426
2427   /* Now possibly adjust the number of named args.
2428      Normally, don't include the last named arg if anonymous args follow.
2429      We do include the last named arg if
2430      targetm.calls.strict_argument_naming() returns nonzero.
2431      (If no anonymous args follow, the result of list_length is actually
2432      one too large.  This is harmless.)
2433
2434      If targetm.calls.pretend_outgoing_varargs_named() returns
2435      nonzero, and targetm.calls.strict_argument_naming() returns zero,
2436      this machine will be able to place unnamed args that were passed
2437      in registers into the stack.  So treat all args as named.  This
2438      allows the insns emitting for a specific argument list to be
2439      independent of the function declaration.
2440
2441      If targetm.calls.pretend_outgoing_varargs_named() returns zero,
2442      we do not have any reliable way to pass unnamed args in
2443      registers, so we must force them into memory.  */
2444
2445   if (type_arg_types != 0
2446       && targetm.calls.strict_argument_naming (&args_so_far))
2447     ;
2448   else if (type_arg_types != 0
2449            && ! targetm.calls.pretend_outgoing_varargs_named (&args_so_far))
2450     /* Don't include the last named arg.  */
2451     --n_named_args;
2452   else
2453     /* Treat all args as named.  */
2454     n_named_args = num_actuals;
2455
2456   /* Make a vector to hold all the information about each arg.  */
2457   args = alloca (num_actuals * sizeof (struct arg_data));
2458   memset (args, 0, num_actuals * sizeof (struct arg_data));
2459
2460   /* Build up entries in the ARGS array, compute the size of the
2461      arguments into ARGS_SIZE, etc.  */
2462   initialize_argument_information (num_actuals, args, &args_size,
2463                                    n_named_args, actparms, fndecl,
2464                                    &args_so_far, reg_parm_stack_space,
2465                                    &old_stack_level, &old_pending_adj,
2466                                    &must_preallocate, &flags,
2467                                    CALL_FROM_THUNK_P (exp));
2468
2469   if (args_size.var)
2470     {
2471       /* If this function requires a variable-sized argument list, don't
2472          try to make a cse'able block for this call.  We may be able to
2473          do this eventually, but it is too complicated to keep track of
2474          what insns go in the cse'able block and which don't.  */
2475
2476       flags &= ~ECF_LIBCALL_BLOCK;
2477       must_preallocate = 1;
2478     }
2479
2480   /* Now make final decision about preallocating stack space.  */
2481   must_preallocate = finalize_must_preallocate (must_preallocate,
2482                                                 num_actuals, args,
2483                                                 &args_size);
2484
2485   /* If the structure value address will reference the stack pointer, we
2486      must stabilize it.  We don't need to do this if we know that we are
2487      not going to adjust the stack pointer in processing this call.  */
2488
2489   if (structure_value_addr
2490       && (reg_mentioned_p (virtual_stack_dynamic_rtx, structure_value_addr)
2491           || reg_mentioned_p (virtual_outgoing_args_rtx,
2492                               structure_value_addr))
2493       && (args_size.var
2494           || (!ACCUMULATE_OUTGOING_ARGS && args_size.constant)))
2495     structure_value_addr = copy_to_reg (structure_value_addr);
2496
2497   /* Tail calls can make things harder to debug, and we're traditionally
2498      pushed these optimizations into -O2.  Don't try if we're already
2499      expanding a call, as that means we're an argument.  Don't try if
2500      there's cleanups, as we know there's code to follow the call.
2501
2502      If rtx_equal_function_value_matters is false, that means we've
2503      finished with regular parsing.  Which means that some of the
2504      machinery we use to generate tail-calls is no longer in place.
2505      This is most often true of sjlj-exceptions, which we couldn't
2506      tail-call to anyway.
2507
2508      If current_nesting_level () == 0, we're being called after
2509      the function body has been expanded.  This can happen when
2510      setting up trampolines in expand_function_end.  */
2511   if (currently_expanding_call++ != 0
2512       || !flag_optimize_sibling_calls
2513       || !rtx_equal_function_value_matters
2514       || current_nesting_level () == 0
2515       || any_pending_cleanups ()
2516       || args_size.var)
2517     try_tail_call = try_tail_recursion = 0;
2518
2519   /* Tail recursion fails, when we are not dealing with recursive calls.  */
2520   if (!try_tail_recursion
2521       || TREE_CODE (addr) != ADDR_EXPR
2522       || TREE_OPERAND (addr, 0) != current_function_decl)
2523     try_tail_recursion = 0;
2524
2525   /*  Rest of purposes for tail call optimizations to fail.  */
2526   if (
2527 #ifdef HAVE_sibcall_epilogue
2528       !HAVE_sibcall_epilogue
2529 #else
2530       1
2531 #endif
2532       || !try_tail_call
2533       /* Doing sibling call optimization needs some work, since
2534          structure_value_addr can be allocated on the stack.
2535          It does not seem worth the effort since few optimizable
2536          sibling calls will return a structure.  */
2537       || structure_value_addr != NULL_RTX
2538       /* Check whether the target is able to optimize the call
2539          into a sibcall.  */
2540       || !(*targetm.function_ok_for_sibcall) (fndecl, exp)
2541       /* Functions that do not return exactly once may not be sibcall
2542          optimized.  */
2543       || (flags & (ECF_RETURNS_TWICE | ECF_LONGJMP | ECF_NORETURN))
2544       || TYPE_VOLATILE (TREE_TYPE (TREE_TYPE (addr)))
2545       /* If the called function is nested in the current one, it might access
2546          some of the caller's arguments, but could clobber them beforehand if
2547          the argument areas are shared.  */
2548       || (fndecl && decl_function_context (fndecl) == current_function_decl)
2549       /* If this function requires more stack slots than the current
2550          function, we cannot change it into a sibling call.  */
2551       || args_size.constant > current_function_args_size
2552       /* If the callee pops its own arguments, then it must pop exactly
2553          the same number of arguments as the current function.  */
2554       || (RETURN_POPS_ARGS (fndecl, funtype, args_size.constant)
2555           != RETURN_POPS_ARGS (current_function_decl,
2556                                TREE_TYPE (current_function_decl),
2557                                current_function_args_size))
2558       || !(*lang_hooks.decls.ok_for_sibcall) (fndecl))
2559     try_tail_call = 0;
2560
2561   if (try_tail_call || try_tail_recursion)
2562     {
2563       int end, inc;
2564       actparms = NULL_TREE;
2565       /* Ok, we're going to give the tail call the old college try.
2566          This means we're going to evaluate the function arguments
2567          up to three times.  There are two degrees of badness we can
2568          encounter, those that can be unsaved and those that can't.
2569          (See unsafe_for_reeval commentary for details.)
2570
2571          Generate a new argument list.  Pass safe arguments through
2572          unchanged.  For the easy badness wrap them in UNSAVE_EXPRs.
2573          For hard badness, evaluate them now and put their resulting
2574          rtx in a temporary VAR_DECL.
2575
2576          initialize_argument_information has ordered the array for the
2577          order to be pushed, and we must remember this when reconstructing
2578          the original argument order.  */
2579
2580       if (PUSH_ARGS_REVERSED)
2581         {
2582           inc = 1;
2583           i = 0;
2584           end = num_actuals;
2585         }
2586       else
2587         {
2588           inc = -1;
2589           i = num_actuals - 1;
2590           end = -1;
2591         }
2592
2593       for (; i != end; i += inc)
2594         {
2595           args[i].tree_value = fix_unsafe_tree (args[i].tree_value);
2596           /* We need to build actparms for optimize_tail_recursion.  We can
2597              safely trash away TREE_PURPOSE, since it is unused by this
2598              function.  */
2599           if (try_tail_recursion)
2600             actparms = tree_cons (NULL_TREE, args[i].tree_value, actparms);
2601         }
2602       /* Do the same for the function address if it is an expression.  */
2603       if (!fndecl)
2604         addr = fix_unsafe_tree (addr);
2605       /* Expanding one of those dangerous arguments could have added
2606          cleanups, but otherwise give it a whirl.  */
2607       if (any_pending_cleanups ())
2608         try_tail_call = try_tail_recursion = 0;
2609     }
2610
2611   /* Generate a tail recursion sequence when calling ourselves.  */
2612
2613   if (try_tail_recursion)
2614     {
2615       /* We want to emit any pending stack adjustments before the tail
2616          recursion "call".  That way we know any adjustment after the tail
2617          recursion call can be ignored if we indeed use the tail recursion
2618          call expansion.  */
2619       int save_pending_stack_adjust = pending_stack_adjust;
2620       int save_stack_pointer_delta = stack_pointer_delta;
2621
2622       /* Emit any queued insns now; otherwise they would end up in
2623          only one of the alternates.  */
2624       emit_queue ();
2625
2626       /* Use a new sequence to hold any RTL we generate.  We do not even
2627          know if we will use this RTL yet.  The final decision can not be
2628          made until after RTL generation for the entire function is
2629          complete.  */
2630       start_sequence ();
2631       /* If expanding any of the arguments creates cleanups, we can't
2632          do a tailcall.  So, we'll need to pop the pending cleanups
2633          list.  If, however, all goes well, and there are no cleanups
2634          then the call to expand_start_target_temps will have no
2635          effect.  */
2636       expand_start_target_temps ();
2637       if (optimize_tail_recursion (actparms, get_last_insn ()))
2638         {
2639           if (any_pending_cleanups ())
2640             try_tail_call = try_tail_recursion = 0;
2641           else
2642             tail_recursion_insns = get_insns ();
2643         }
2644       expand_end_target_temps ();
2645       end_sequence ();
2646
2647       /* Restore the original pending stack adjustment for the sibling and
2648          normal call cases below.  */
2649       pending_stack_adjust = save_pending_stack_adjust;
2650       stack_pointer_delta = save_stack_pointer_delta;
2651     }
2652
2653   if (profile_arc_flag && (flags & ECF_FORK_OR_EXEC))
2654     {
2655       /* A fork duplicates the profile information, and an exec discards
2656          it.  We can't rely on fork/exec to be paired.  So write out the
2657          profile information we have gathered so far, and clear it.  */
2658       /* ??? When Linux's __clone is called with CLONE_VM set, profiling
2659          is subject to race conditions, just as with multithreaded
2660          programs.  */
2661
2662       emit_library_call (gcov_flush_libfunc, LCT_ALWAYS_RETURN, VOIDmode, 0);
2663     }
2664
2665   /* Ensure current function's preferred stack boundary is at least
2666      what we need.  We don't have to increase alignment for recursive
2667      functions.  */
2668   if (cfun->preferred_stack_boundary < preferred_stack_boundary
2669       && fndecl != current_function_decl)
2670     cfun->preferred_stack_boundary = preferred_stack_boundary;
2671   if (fndecl == current_function_decl)
2672     cfun->recursive_call_emit = true;
2673
2674   preferred_unit_stack_boundary = preferred_stack_boundary / BITS_PER_UNIT;
2675
2676   function_call_count++;
2677
2678   /* We want to make two insn chains; one for a sibling call, the other
2679      for a normal call.  We will select one of the two chains after
2680      initial RTL generation is complete.  */
2681   for (pass = try_tail_call ? 0 : 1; pass < 2; pass++)
2682     {
2683       int sibcall_failure = 0;
2684       /* We want to emit any pending stack adjustments before the tail
2685          recursion "call".  That way we know any adjustment after the tail
2686          recursion call can be ignored if we indeed use the tail recursion
2687          call expansion.  */
2688       int save_pending_stack_adjust = 0;
2689       int save_stack_pointer_delta = 0;
2690       rtx insns;
2691       rtx before_call, next_arg_reg;
2692
2693       if (pass == 0)
2694         {
2695           /* Emit any queued insns now; otherwise they would end up in
2696              only one of the alternates.  */
2697           emit_queue ();
2698
2699           /* State variables we need to save and restore between
2700              iterations.  */
2701           save_pending_stack_adjust = pending_stack_adjust;
2702           save_stack_pointer_delta = stack_pointer_delta;
2703         }
2704       if (pass)
2705         flags &= ~ECF_SIBCALL;
2706       else
2707         flags |= ECF_SIBCALL;
2708
2709       /* Other state variables that we must reinitialize each time
2710          through the loop (that are not initialized by the loop itself).  */
2711       argblock = 0;
2712       call_fusage = 0;
2713
2714       /* Start a new sequence for the normal call case.
2715
2716          From this point on, if the sibling call fails, we want to set
2717          sibcall_failure instead of continuing the loop.  */
2718       start_sequence ();
2719
2720       if (pass == 0)
2721         {
2722           /* We know at this point that there are not currently any
2723              pending cleanups.  If, however, in the process of evaluating
2724              the arguments we were to create some, we'll need to be
2725              able to get rid of them.  */
2726           expand_start_target_temps ();
2727         }
2728
2729       /* Don't let pending stack adjusts add up to too much.
2730          Also, do all pending adjustments now if there is any chance
2731          this might be a call to alloca or if we are expanding a sibling
2732          call sequence or if we are calling a function that is to return
2733          with stack pointer depressed.  */
2734       if (pending_stack_adjust >= 32
2735           || (pending_stack_adjust > 0
2736               && (flags & (ECF_MAY_BE_ALLOCA | ECF_SP_DEPRESSED)))
2737           || pass == 0)
2738         do_pending_stack_adjust ();
2739
2740       /* When calling a const function, we must pop the stack args right away,
2741          so that the pop is deleted or moved with the call.  */
2742       if (pass && (flags & ECF_LIBCALL_BLOCK))
2743         NO_DEFER_POP;
2744
2745 #ifdef FINAL_REG_PARM_STACK_SPACE
2746       reg_parm_stack_space = FINAL_REG_PARM_STACK_SPACE (args_size.constant,
2747                                                          args_size.var);
2748 #endif
2749       /* Precompute any arguments as needed.  */
2750       if (pass)
2751         precompute_arguments (flags, num_actuals, args);
2752
2753       /* Now we are about to start emitting insns that can be deleted
2754          if a libcall is deleted.  */
2755       if (pass && (flags & (ECF_LIBCALL_BLOCK | ECF_MALLOC)))
2756         start_sequence ();
2757
2758       adjusted_args_size = args_size;
2759       /* Compute the actual size of the argument block required.  The variable
2760          and constant sizes must be combined, the size may have to be rounded,
2761          and there may be a minimum required size.  When generating a sibcall
2762          pattern, do not round up, since we'll be re-using whatever space our
2763          caller provided.  */
2764       unadjusted_args_size
2765         = compute_argument_block_size (reg_parm_stack_space,
2766                                        &adjusted_args_size,
2767                                        (pass == 0 ? 0
2768                                         : preferred_stack_boundary));
2769
2770       old_stack_allocated = stack_pointer_delta - pending_stack_adjust;
2771
2772       /* The argument block when performing a sibling call is the
2773          incoming argument block.  */
2774       if (pass == 0)
2775         {
2776           argblock = virtual_incoming_args_rtx;
2777           argblock
2778 #ifdef STACK_GROWS_DOWNWARD
2779             = plus_constant (argblock, current_function_pretend_args_size);
2780 #else
2781             = plus_constant (argblock, -current_function_pretend_args_size);
2782 #endif
2783           stored_args_map = sbitmap_alloc (args_size.constant);
2784           sbitmap_zero (stored_args_map);
2785         }
2786
2787       /* If we have no actual push instructions, or shouldn't use them,
2788          make space for all args right now.  */
2789       else if (adjusted_args_size.var != 0)
2790         {
2791           if (old_stack_level == 0)
2792             {
2793               emit_stack_save (SAVE_BLOCK, &old_stack_level, NULL_RTX);
2794               old_stack_pointer_delta = stack_pointer_delta;
2795               old_pending_adj = pending_stack_adjust;
2796               pending_stack_adjust = 0;
2797               /* stack_arg_under_construction says whether a stack arg is
2798                  being constructed at the old stack level.  Pushing the stack
2799                  gets a clean outgoing argument block.  */
2800               old_stack_arg_under_construction = stack_arg_under_construction;
2801               stack_arg_under_construction = 0;
2802             }
2803           argblock = push_block (ARGS_SIZE_RTX (adjusted_args_size), 0, 0);
2804         }
2805       else
2806         {
2807           /* Note that we must go through the motions of allocating an argument
2808              block even if the size is zero because we may be storing args
2809              in the area reserved for register arguments, which may be part of
2810              the stack frame.  */
2811
2812           int needed = adjusted_args_size.constant;
2813
2814           /* Store the maximum argument space used.  It will be pushed by
2815              the prologue (if ACCUMULATE_OUTGOING_ARGS, or stack overflow
2816              checking).  */
2817
2818           if (needed > current_function_outgoing_args_size)
2819             current_function_outgoing_args_size = needed;
2820
2821           if (must_preallocate)
2822             {
2823               if (ACCUMULATE_OUTGOING_ARGS)
2824                 {
2825                   /* Since the stack pointer will never be pushed, it is
2826                      possible for the evaluation of a parm to clobber
2827                      something we have already written to the stack.
2828                      Since most function calls on RISC machines do not use
2829                      the stack, this is uncommon, but must work correctly.
2830
2831                      Therefore, we save any area of the stack that was already
2832                      written and that we are using.  Here we set up to do this
2833                      by making a new stack usage map from the old one.  The
2834                      actual save will be done by store_one_arg.
2835
2836                      Another approach might be to try to reorder the argument
2837                      evaluations to avoid this conflicting stack usage.  */
2838
2839 #ifndef OUTGOING_REG_PARM_STACK_SPACE
2840                   /* Since we will be writing into the entire argument area,
2841                      the map must be allocated for its entire size, not just
2842                      the part that is the responsibility of the caller.  */
2843                   needed += reg_parm_stack_space;
2844 #endif
2845
2846 #ifdef ARGS_GROW_DOWNWARD
2847                   highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
2848                                                      needed + 1);
2849 #else
2850                   highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
2851                                                      needed);
2852 #endif
2853                   stack_usage_map = alloca (highest_outgoing_arg_in_use);
2854
2855                   if (initial_highest_arg_in_use)
2856                     memcpy (stack_usage_map, initial_stack_usage_map,
2857                             initial_highest_arg_in_use);
2858
2859                   if (initial_highest_arg_in_use != highest_outgoing_arg_in_use)
2860                     memset (&stack_usage_map[initial_highest_arg_in_use], 0,
2861                            (highest_outgoing_arg_in_use
2862                             - initial_highest_arg_in_use));
2863                   needed = 0;
2864
2865                   /* The address of the outgoing argument list must not be
2866                      copied to a register here, because argblock would be left
2867                      pointing to the wrong place after the call to
2868                      allocate_dynamic_stack_space below.  */
2869
2870                   argblock = virtual_outgoing_args_rtx;
2871                 }
2872               else
2873                 {
2874                   if (inhibit_defer_pop == 0)
2875                     {
2876                       /* Try to reuse some or all of the pending_stack_adjust
2877                          to get this space.  */
2878                       needed
2879                         = (combine_pending_stack_adjustment_and_call
2880                            (unadjusted_args_size,
2881                             &adjusted_args_size,
2882                             preferred_unit_stack_boundary));
2883
2884                       /* combine_pending_stack_adjustment_and_call computes
2885                          an adjustment before the arguments are allocated.
2886                          Account for them and see whether or not the stack
2887                          needs to go up or down.  */
2888                       needed = unadjusted_args_size - needed;
2889
2890                       if (needed < 0)
2891                         {
2892                           /* We're releasing stack space.  */
2893                           /* ??? We can avoid any adjustment at all if we're
2894                              already aligned.  FIXME.  */
2895                           pending_stack_adjust = -needed;
2896                           do_pending_stack_adjust ();
2897                           needed = 0;
2898                         }
2899                       else
2900                         /* We need to allocate space.  We'll do that in
2901                            push_block below.  */
2902                         pending_stack_adjust = 0;
2903                     }
2904
2905                   /* Special case this because overhead of `push_block' in
2906                      this case is non-trivial.  */
2907                   if (needed == 0)
2908                     argblock = virtual_outgoing_args_rtx;
2909                   else
2910                     {
2911                       argblock = push_block (GEN_INT (needed), 0, 0);
2912 #ifdef ARGS_GROW_DOWNWARD
2913                       argblock = plus_constant (argblock, needed);
2914 #endif
2915                     }
2916
2917                   /* We only really need to call `copy_to_reg' in the case
2918                      where push insns are going to be used to pass ARGBLOCK
2919                      to a function call in ARGS.  In that case, the stack
2920                      pointer changes value from the allocation point to the
2921                      call point, and hence the value of
2922                      VIRTUAL_OUTGOING_ARGS_RTX changes as well.  But might
2923                      as well always do it.  */
2924                   argblock = copy_to_reg (argblock);
2925                 }
2926             }
2927         }
2928
2929       if (ACCUMULATE_OUTGOING_ARGS)
2930         {
2931           /* The save/restore code in store_one_arg handles all
2932              cases except one: a constructor call (including a C
2933              function returning a BLKmode struct) to initialize
2934              an argument.  */
2935           if (stack_arg_under_construction)
2936             {
2937 #ifndef OUTGOING_REG_PARM_STACK_SPACE
2938               rtx push_size = GEN_INT (reg_parm_stack_space
2939                                        + adjusted_args_size.constant);
2940 #else
2941               rtx push_size = GEN_INT (adjusted_args_size.constant);
2942 #endif
2943               if (old_stack_level == 0)
2944                 {
2945                   emit_stack_save (SAVE_BLOCK, &old_stack_level,
2946                                    NULL_RTX);
2947                   old_stack_pointer_delta = stack_pointer_delta;
2948                   old_pending_adj = pending_stack_adjust;
2949                   pending_stack_adjust = 0;
2950                   /* stack_arg_under_construction says whether a stack
2951                      arg is being constructed at the old stack level.
2952                      Pushing the stack gets a clean outgoing argument
2953                      block.  */
2954                   old_stack_arg_under_construction
2955                     = stack_arg_under_construction;
2956                   stack_arg_under_construction = 0;
2957                   /* Make a new map for the new argument list.  */
2958                   stack_usage_map = alloca (highest_outgoing_arg_in_use);
2959                   memset (stack_usage_map, 0, highest_outgoing_arg_in_use);
2960                   highest_outgoing_arg_in_use = 0;
2961                 }
2962               allocate_dynamic_stack_space (push_size, NULL_RTX,
2963                                             BITS_PER_UNIT);
2964             }
2965
2966           /* If argument evaluation might modify the stack pointer,
2967              copy the address of the argument list to a register.  */
2968           for (i = 0; i < num_actuals; i++)
2969             if (args[i].pass_on_stack)
2970               {
2971                 argblock = copy_addr_to_reg (argblock);
2972                 break;
2973               }
2974         }
2975
2976       compute_argument_addresses (args, argblock, num_actuals);
2977
2978       /* If we push args individually in reverse order, perform stack alignment
2979          before the first push (the last arg).  */
2980       if (PUSH_ARGS_REVERSED && argblock == 0
2981           && adjusted_args_size.constant != unadjusted_args_size)
2982         {
2983           /* When the stack adjustment is pending, we get better code
2984              by combining the adjustments.  */
2985           if (pending_stack_adjust
2986               && ! (flags & ECF_LIBCALL_BLOCK)
2987               && ! inhibit_defer_pop)
2988             {
2989               pending_stack_adjust
2990                 = (combine_pending_stack_adjustment_and_call
2991                    (unadjusted_args_size,
2992                     &adjusted_args_size,
2993                     preferred_unit_stack_boundary));
2994               do_pending_stack_adjust ();
2995             }
2996           else if (argblock == 0)
2997             anti_adjust_stack (GEN_INT (adjusted_args_size.constant
2998                                         - unadjusted_args_size));
2999         }
3000       /* Now that the stack is properly aligned, pops can't safely
3001          be deferred during the evaluation of the arguments.  */
3002       NO_DEFER_POP;
3003
3004       funexp = rtx_for_function_call (fndecl, addr);
3005
3006       /* Figure out the register where the value, if any, will come back.  */
3007       valreg = 0;
3008       if (TYPE_MODE (TREE_TYPE (exp)) != VOIDmode
3009           && ! structure_value_addr)
3010         {
3011           if (pcc_struct_value)
3012             valreg = hard_function_value (build_pointer_type (TREE_TYPE (exp)),
3013                                           fndecl, (pass == 0));
3014           else
3015             valreg = hard_function_value (TREE_TYPE (exp), fndecl, (pass == 0));
3016         }
3017
3018       /* Precompute all register parameters.  It isn't safe to compute anything
3019          once we have started filling any specific hard regs.  */
3020       precompute_register_parameters (num_actuals, args, &reg_parm_seen);
3021
3022 #ifdef REG_PARM_STACK_SPACE
3023       /* Save the fixed argument area if it's part of the caller's frame and
3024          is clobbered by argument setup for this call.  */
3025       if (ACCUMULATE_OUTGOING_ARGS && pass)
3026         save_area = save_fixed_argument_area (reg_parm_stack_space, argblock,
3027                                               &low_to_save, &high_to_save);
3028 #endif
3029
3030       /* Now store (and compute if necessary) all non-register parms.
3031          These come before register parms, since they can require block-moves,
3032          which could clobber the registers used for register parms.
3033          Parms which have partial registers are not stored here,
3034          but we do preallocate space here if they want that.  */
3035
3036       for (i = 0; i < num_actuals; i++)
3037         if (args[i].reg == 0 || args[i].pass_on_stack)
3038           {
3039             rtx before_arg = get_last_insn ();
3040
3041             if (store_one_arg (&args[i], argblock, flags,
3042                                adjusted_args_size.var != 0,
3043                                reg_parm_stack_space)
3044                 || (pass == 0
3045                     && check_sibcall_argument_overlap (before_arg,
3046                                                        &args[i], 1)))
3047               sibcall_failure = 1;
3048
3049             if (flags & ECF_CONST
3050                 && args[i].stack
3051                 && args[i].value == args[i].stack)
3052               call_fusage = gen_rtx_EXPR_LIST (VOIDmode,
3053                                                gen_rtx_USE (VOIDmode,
3054                                                             args[i].value),
3055                                                call_fusage);
3056           }
3057
3058       /* If we have a parm that is passed in registers but not in memory
3059          and whose alignment does not permit a direct copy into registers,
3060          make a group of pseudos that correspond to each register that we
3061          will later fill.  */
3062       if (STRICT_ALIGNMENT)
3063         store_unaligned_arguments_into_pseudos (args, num_actuals);
3064
3065       /* Now store any partially-in-registers parm.
3066          This is the last place a block-move can happen.  */
3067       if (reg_parm_seen)
3068         for (i = 0; i < num_actuals; i++)
3069           if (args[i].partial != 0 && ! args[i].pass_on_stack)
3070             {
3071               rtx before_arg = get_last_insn ();
3072
3073               if (store_one_arg (&args[i], argblock, flags,
3074                                  adjusted_args_size.var != 0,
3075                                  reg_parm_stack_space)
3076                   || (pass == 0
3077                       && check_sibcall_argument_overlap (before_arg,
3078                                                          &args[i], 1)))
3079                 sibcall_failure = 1;
3080             }
3081
3082       /* If we pushed args in forward order, perform stack alignment
3083          after pushing the last arg.  */
3084       if (!PUSH_ARGS_REVERSED && argblock == 0)
3085         anti_adjust_stack (GEN_INT (adjusted_args_size.constant
3086                                     - unadjusted_args_size));
3087
3088       /* If register arguments require space on the stack and stack space
3089          was not preallocated, allocate stack space here for arguments
3090          passed in registers.  */
3091 #ifdef OUTGOING_REG_PARM_STACK_SPACE
3092       if (!ACCUMULATE_OUTGOING_ARGS
3093           && must_preallocate == 0 && reg_parm_stack_space > 0)
3094         anti_adjust_stack (GEN_INT (reg_parm_stack_space));
3095 #endif
3096
3097       /* Pass the function the address in which to return a
3098          structure value.  */
3099       if (pass != 0 && structure_value_addr && ! structure_value_addr_parm)
3100         {
3101           structure_value_addr 
3102             = convert_memory_address (Pmode, structure_value_addr);
3103           emit_move_insn (struct_value,
3104                           force_reg (Pmode,
3105                                      force_operand (structure_value_addr,
3106                                                     NULL_RTX)));
3107
3108           if (GET_CODE (struct_value) == REG)
3109             use_reg (&call_fusage, struct_value);
3110         }
3111
3112       funexp = prepare_call_address (funexp, fndecl, &call_fusage,
3113                                      reg_parm_seen, pass == 0);
3114
3115       load_register_parameters (args, num_actuals, &call_fusage, flags,
3116                                 pass == 0, &sibcall_failure);
3117
3118       /* Perform postincrements before actually calling the function.  */
3119       emit_queue ();
3120
3121       /* Save a pointer to the last insn before the call, so that we can
3122          later safely search backwards to find the CALL_INSN.  */
3123       before_call = get_last_insn ();
3124
3125       /* Set up next argument register.  For sibling calls on machines
3126          with register windows this should be the incoming register.  */
3127 #ifdef FUNCTION_INCOMING_ARG
3128       if (pass == 0)
3129         next_arg_reg = FUNCTION_INCOMING_ARG (args_so_far, VOIDmode,
3130                                               void_type_node, 1);
3131       else
3132 #endif
3133         next_arg_reg = FUNCTION_ARG (args_so_far, VOIDmode,
3134                                      void_type_node, 1);
3135
3136       /* All arguments and registers used for the call must be set up by
3137          now!  */
3138
3139       /* Stack must be properly aligned now.  */
3140       if (pass && stack_pointer_delta % preferred_unit_stack_boundary)
3141         abort ();
3142
3143       /* Generate the actual call instruction.  */
3144       emit_call_1 (funexp, fndecl, funtype, unadjusted_args_size,
3145                    adjusted_args_size.constant, struct_value_size,
3146                    next_arg_reg, valreg, old_inhibit_defer_pop, call_fusage,
3147                    flags, & args_so_far);
3148
3149       /* If call is cse'able, make appropriate pair of reg-notes around it.
3150          Test valreg so we don't crash; may safely ignore `const'
3151          if return type is void.  Disable for PARALLEL return values, because
3152          we have no way to move such values into a pseudo register.  */
3153       if (pass && (flags & ECF_LIBCALL_BLOCK))
3154         {
3155           rtx insns;
3156           rtx insn;
3157           bool failed = valreg == 0 || GET_CODE (valreg) == PARALLEL;
3158
3159           insns = get_insns ();
3160
3161           /* Expansion of block moves possibly introduced a loop that may
3162              not appear inside libcall block.  */
3163           for (insn = insns; insn; insn = NEXT_INSN (insn))
3164             if (GET_CODE (insn) == JUMP_INSN)
3165               failed = true;
3166
3167           if (failed)
3168             {
3169               end_sequence ();
3170               emit_insn (insns);
3171             }
3172           else
3173             {
3174               rtx note = 0;
3175               rtx temp = gen_reg_rtx (GET_MODE (valreg));
3176
3177               /* Mark the return value as a pointer if needed.  */
3178               if (TREE_CODE (TREE_TYPE (exp)) == POINTER_TYPE)
3179                 mark_reg_pointer (temp,
3180                                   TYPE_ALIGN (TREE_TYPE (TREE_TYPE (exp))));
3181
3182               end_sequence ();
3183               if (flag_unsafe_math_optimizations
3184                   && fndecl
3185                   && DECL_BUILT_IN (fndecl)
3186                   && (DECL_FUNCTION_CODE (fndecl) == BUILT_IN_SQRT
3187                       || DECL_FUNCTION_CODE (fndecl) == BUILT_IN_SQRTF
3188                       || DECL_FUNCTION_CODE (fndecl) == BUILT_IN_SQRTL))
3189                 note = gen_rtx_fmt_e (SQRT, 
3190                                       GET_MODE (temp), 
3191                                       args[0].initial_value);
3192               else
3193                 {
3194                   /* Construct an "equal form" for the value which
3195                      mentions all the arguments in order as well as
3196                      the function name.  */
3197                   for (i = 0; i < num_actuals; i++)
3198                     note = gen_rtx_EXPR_LIST (VOIDmode,
3199                                               args[i].initial_value, note);
3200                   note = gen_rtx_EXPR_LIST (VOIDmode, funexp, note);
3201                   
3202                   if (flags & ECF_PURE)
3203                     note = gen_rtx_EXPR_LIST (VOIDmode,
3204                         gen_rtx_USE (VOIDmode,
3205                                      gen_rtx_MEM (BLKmode,
3206                                                   gen_rtx_SCRATCH (VOIDmode))),
3207                         note);
3208                 }
3209               emit_libcall_block (insns, temp, valreg, note);
3210
3211               valreg = temp;
3212             }
3213         }
3214       else if (pass && (flags & ECF_MALLOC))
3215         {
3216           rtx temp = gen_reg_rtx (GET_MODE (valreg));
3217           rtx last, insns;
3218
3219           /* The return value from a malloc-like function is a pointer.  */
3220           if (TREE_CODE (TREE_TYPE (exp)) == POINTER_TYPE)
3221             mark_reg_pointer (temp, BIGGEST_ALIGNMENT);
3222
3223           emit_move_insn (temp, valreg);
3224
3225           /* The return value from a malloc-like function can not alias
3226              anything else.  */
3227           last = get_last_insn ();
3228           REG_NOTES (last) =
3229             gen_rtx_EXPR_LIST (REG_NOALIAS, temp, REG_NOTES (last));
3230
3231           /* Write out the sequence.  */
3232           insns = get_insns ();
3233           end_sequence ();
3234           emit_insn (insns);
3235           valreg = temp;
3236         }
3237
3238       /* For calls to `setjmp', etc., inform flow.c it should complain
3239          if nonvolatile values are live.  For functions that cannot return,
3240          inform flow that control does not fall through.  */
3241
3242       if ((flags & (ECF_NORETURN | ECF_LONGJMP)) || pass == 0)
3243         {
3244           /* The barrier must be emitted
3245              immediately after the CALL_INSN.  Some ports emit more
3246              than just a CALL_INSN above, so we must search for it here.  */
3247
3248           rtx last = get_last_insn ();
3249           while (GET_CODE (last) != CALL_INSN)
3250             {
3251               last = PREV_INSN (last);
3252               /* There was no CALL_INSN?  */
3253               if (last == before_call)
3254                 abort ();
3255             }
3256
3257           emit_barrier_after (last);
3258
3259           /* Stack adjustments after a noreturn call are dead code.
3260              However when NO_DEFER_POP is in effect, we must preserve
3261              stack_pointer_delta.  */
3262           if (inhibit_defer_pop == 0)
3263             {
3264               stack_pointer_delta = old_stack_allocated;
3265               pending_stack_adjust = 0;
3266             }
3267         }
3268
3269       if (flags & ECF_LONGJMP)
3270         current_function_calls_longjmp = 1;
3271
3272       /* If value type not void, return an rtx for the value.  */
3273
3274       /* If there are cleanups to be called, don't use a hard reg as target.
3275          We need to double check this and see if it matters anymore.  */
3276       if (any_pending_cleanups ())
3277         {
3278           if (target && REG_P (target)
3279               && REGNO (target) < FIRST_PSEUDO_REGISTER)
3280             target = 0;
3281           sibcall_failure = 1;
3282         }
3283
3284       if (TYPE_MODE (TREE_TYPE (exp)) == VOIDmode
3285           || ignore)
3286         target = const0_rtx;
3287       else if (structure_value_addr)
3288         {
3289           if (target == 0 || GET_CODE (target) != MEM)
3290             {
3291               target
3292                 = gen_rtx_MEM (TYPE_MODE (TREE_TYPE (exp)),
3293                                memory_address (TYPE_MODE (TREE_TYPE (exp)),
3294                                                structure_value_addr));
3295               set_mem_attributes (target, exp, 1);
3296             }
3297         }
3298       else if (pcc_struct_value)
3299         {
3300           /* This is the special C++ case where we need to
3301              know what the true target was.  We take care to
3302              never use this value more than once in one expression.  */
3303           target = gen_rtx_MEM (TYPE_MODE (TREE_TYPE (exp)),
3304                                 copy_to_reg (valreg));
3305           set_mem_attributes (target, exp, 1);
3306         }
3307       /* Handle calls that return values in multiple non-contiguous locations.
3308          The Irix 6 ABI has examples of this.  */
3309       else if (GET_CODE (valreg) == PARALLEL)
3310         {
3311           /* Second condition is added because "target" is freed at the
3312              the end of "pass0" for -O2 when call is made to
3313              expand_end_target_temps ().  Its "in_use" flag has been set
3314              to false, so allocate a new temp.  */
3315           if (target == 0 || (pass == 1 && target == temp_target))
3316             {
3317               /* This will only be assigned once, so it can be readonly.  */
3318               tree nt = build_qualified_type (TREE_TYPE (exp),
3319                                               (TYPE_QUALS (TREE_TYPE (exp))
3320                                                | TYPE_QUAL_CONST));
3321
3322               target = assign_temp (nt, 0, 1, 1);
3323               temp_target = target;
3324               preserve_temp_slots (target);
3325             }
3326
3327           if (! rtx_equal_p (target, valreg))
3328             emit_group_store (target, valreg, TREE_TYPE (exp),
3329                               int_size_in_bytes (TREE_TYPE (exp)));
3330
3331           /* We can not support sibling calls for this case.  */
3332           sibcall_failure = 1;
3333         }
3334       else if (target
3335                && GET_MODE (target) == TYPE_MODE (TREE_TYPE (exp))
3336                && GET_MODE (target) == GET_MODE (valreg))
3337         {
3338           /* TARGET and VALREG cannot be equal at this point because the
3339              latter would not have REG_FUNCTION_VALUE_P true, while the
3340              former would if it were referring to the same register.
3341
3342              If they refer to the same register, this move will be a no-op,
3343              except when function inlining is being done.  */
3344           emit_move_insn (target, valreg);
3345
3346           /* If we are setting a MEM, this code must be executed.  Since it is
3347              emitted after the call insn, sibcall optimization cannot be
3348              performed in that case.  */
3349           if (GET_CODE (target) == MEM)
3350             sibcall_failure = 1;
3351         }
3352       else if (TYPE_MODE (TREE_TYPE (exp)) == BLKmode)
3353         {
3354           target = copy_blkmode_from_reg (target, valreg, TREE_TYPE (exp));
3355
3356           /* We can not support sibling calls for this case.  */
3357           sibcall_failure = 1;
3358         }
3359       else
3360         {
3361           if (shift_returned_value (TREE_TYPE (exp), &valreg))
3362             sibcall_failure = 1;
3363
3364           target = copy_to_reg (valreg);
3365         }
3366
3367       if (targetm.calls.promote_function_return(funtype))
3368         {
3369       /* If we promoted this return value, make the proper SUBREG.  TARGET
3370          might be const0_rtx here, so be careful.  */
3371       if (GET_CODE (target) == REG
3372           && TYPE_MODE (TREE_TYPE (exp)) != BLKmode
3373           && GET_MODE (target) != TYPE_MODE (TREE_TYPE (exp)))
3374         {
3375           tree type = TREE_TYPE (exp);
3376           int unsignedp = TREE_UNSIGNED (type);
3377           int offset = 0;
3378
3379           /* If we don't promote as expected, something is wrong.  */
3380           if (GET_MODE (target)
3381               != promote_mode (type, TYPE_MODE (type), &unsignedp, 1))
3382             abort ();
3383
3384         if ((WORDS_BIG_ENDIAN || BYTES_BIG_ENDIAN)
3385             && GET_MODE_SIZE (GET_MODE (target))
3386                > GET_MODE_SIZE (TYPE_MODE (type)))
3387           {
3388             offset = GET_MODE_SIZE (GET_MODE (target))
3389                      - GET_MODE_SIZE (TYPE_MODE (type));
3390             if (! BYTES_BIG_ENDIAN)
3391               offset = (offset / UNITS_PER_WORD) * UNITS_PER_WORD;
3392             else if (! WORDS_BIG_ENDIAN)
3393               offset %= UNITS_PER_WORD;
3394           }
3395           target = gen_rtx_SUBREG (TYPE_MODE (type), target, offset);
3396           SUBREG_PROMOTED_VAR_P (target) = 1;
3397           SUBREG_PROMOTED_UNSIGNED_SET (target, unsignedp);
3398         }
3399         }
3400
3401       /* If size of args is variable or this was a constructor call for a stack
3402          argument, restore saved stack-pointer value.  */
3403
3404       if (old_stack_level && ! (flags & ECF_SP_DEPRESSED))
3405         {
3406           emit_stack_restore (SAVE_BLOCK, old_stack_level, NULL_RTX);
3407           stack_pointer_delta = old_stack_pointer_delta;
3408           pending_stack_adjust = old_pending_adj;
3409           stack_arg_under_construction = old_stack_arg_under_construction;
3410           highest_outgoing_arg_in_use = initial_highest_arg_in_use;
3411           stack_usage_map = initial_stack_usage_map;
3412           sibcall_failure = 1;
3413         }
3414       else if (ACCUMULATE_OUTGOING_ARGS && pass)
3415         {
3416 #ifdef REG_PARM_STACK_SPACE
3417           if (save_area)
3418             restore_fixed_argument_area (save_area, argblock,
3419                                          high_to_save, low_to_save);
3420 #endif
3421
3422           /* If we saved any argument areas, restore them.  */
3423           for (i = 0; i < num_actuals; i++)
3424             if (args[i].save_area)
3425               {
3426                 enum machine_mode save_mode = GET_MODE (args[i].save_area);
3427                 rtx stack_area
3428                   = gen_rtx_MEM (save_mode,
3429                                  memory_address (save_mode,
3430                                                  XEXP (args[i].stack_slot, 0)));
3431
3432                 if (save_mode != BLKmode)
3433                   emit_move_insn (stack_area, args[i].save_area);
3434                 else
3435                   emit_block_move (stack_area, args[i].save_area,
3436                                    GEN_INT (args[i].locate.size.constant),
3437                                    BLOCK_OP_CALL_PARM);
3438               }
3439
3440           highest_outgoing_arg_in_use = initial_highest_arg_in_use;
3441           stack_usage_map = initial_stack_usage_map;
3442         }
3443
3444       /* If this was alloca, record the new stack level for nonlocal gotos.
3445          Check for the handler slots since we might not have a save area
3446          for non-local gotos.  */
3447
3448       if ((flags & ECF_MAY_BE_ALLOCA) && nonlocal_goto_handler_slots != 0)
3449         emit_stack_save (SAVE_NONLOCAL, &nonlocal_goto_stack_level, NULL_RTX);
3450
3451       /* Free up storage we no longer need.  */
3452       for (i = 0; i < num_actuals; ++i)
3453         if (args[i].aligned_regs)
3454           free (args[i].aligned_regs);
3455
3456       if (pass == 0)
3457         {
3458           /* Undo the fake expand_start_target_temps we did earlier.  If
3459              there had been any cleanups created, we've already set
3460              sibcall_failure.  */
3461           expand_end_target_temps ();
3462         }
3463
3464       /* If this function is returning into a memory location marked as
3465          readonly, it means it is initializing that location. We normally treat
3466          functions as not clobbering such locations, so we need to specify that
3467          this one does. We do this by adding the appropriate CLOBBER to the
3468          CALL_INSN function usage list.  This cannot be done by emitting a
3469          standalone CLOBBER after the call because the latter would be ignored
3470          by at least the delay slot scheduling pass. We do this now instead of
3471          adding to call_fusage before the call to emit_call_1 because TARGET
3472          may be modified in the meantime.  */
3473       if (structure_value_addr != 0 && target != 0
3474           && GET_CODE (target) == MEM && RTX_UNCHANGING_P (target))
3475         add_function_usage_to
3476           (last_call_insn (),
3477            gen_rtx_EXPR_LIST (VOIDmode, gen_rtx_CLOBBER (VOIDmode, target),
3478                               NULL_RTX));
3479
3480       insns = get_insns ();
3481       end_sequence ();
3482
3483       if (pass == 0)
3484         {
3485           tail_call_insns = insns;
3486
3487           /* Restore the pending stack adjustment now that we have
3488              finished generating the sibling call sequence.  */
3489
3490           pending_stack_adjust = save_pending_stack_adjust;
3491           stack_pointer_delta = save_stack_pointer_delta;
3492
3493           /* Prepare arg structure for next iteration.  */
3494           for (i = 0; i < num_actuals; i++)
3495             {
3496               args[i].value = 0;
3497               args[i].aligned_regs = 0;
3498               args[i].stack = 0;
3499             }
3500
3501           sbitmap_free (stored_args_map);
3502         }
3503       else
3504         {
3505           normal_call_insns = insns;
3506
3507           /* Verify that we've deallocated all the stack we used.  */
3508           if (! (flags & (ECF_NORETURN | ECF_LONGJMP))
3509               && old_stack_allocated != stack_pointer_delta
3510                                         - pending_stack_adjust)
3511             abort ();
3512         }
3513
3514       /* If something prevents making this a sibling call,
3515          zero out the sequence.  */
3516       if (sibcall_failure)
3517         tail_call_insns = NULL_RTX;
3518     }
3519
3520   /* The function optimize_sibling_and_tail_recursive_calls doesn't
3521      handle CALL_PLACEHOLDERs inside other CALL_PLACEHOLDERs.  This
3522      can happen if the arguments to this function call an inline
3523      function who's expansion contains another CALL_PLACEHOLDER.
3524
3525      If there are any C_Ps in any of these sequences, replace them
3526      with their normal call.  */
3527
3528   for (insn = normal_call_insns; insn; insn = NEXT_INSN (insn))
3529     if (GET_CODE (insn) == CALL_INSN
3530         && GET_CODE (PATTERN (insn)) == CALL_PLACEHOLDER)
3531       replace_call_placeholder (insn, sibcall_use_normal);
3532
3533   for (insn = tail_call_insns; insn; insn = NEXT_INSN (insn))
3534     if (GET_CODE (insn) == CALL_INSN
3535         && GET_CODE (PATTERN (insn)) == CALL_PLACEHOLDER)
3536       replace_call_placeholder (insn, sibcall_use_normal);
3537
3538   for (insn = tail_recursion_insns; insn; insn = NEXT_INSN (insn))
3539     if (GET_CODE (insn) == CALL_INSN
3540         && GET_CODE (PATTERN (insn)) == CALL_PLACEHOLDER)
3541       replace_call_placeholder (insn, sibcall_use_normal);
3542
3543   /* If this was a potential tail recursion site, then emit a
3544      CALL_PLACEHOLDER with the normal and the tail recursion streams.
3545      One of them will be selected later.  */
3546   if (tail_recursion_insns || tail_call_insns)
3547     {
3548       /* The tail recursion label must be kept around.  We could expose
3549          its use in the CALL_PLACEHOLDER, but that creates unwanted edges
3550          and makes determining true tail recursion sites difficult.
3551
3552          So we set LABEL_PRESERVE_P here, then clear it when we select
3553          one of the call sequences after rtl generation is complete.  */
3554       if (tail_recursion_insns)
3555         LABEL_PRESERVE_P (tail_recursion_label) = 1;
3556       emit_call_insn (gen_rtx_CALL_PLACEHOLDER (VOIDmode, normal_call_insns,
3557                                                 tail_call_insns,
3558                                                 tail_recursion_insns,
3559                                                 tail_recursion_label));
3560     }
3561   else
3562     emit_insn (normal_call_insns);
3563
3564   currently_expanding_call--;
3565
3566   /* If this function returns with the stack pointer depressed, ensure
3567      this block saves and restores the stack pointer, show it was
3568      changed, and adjust for any outgoing arg space.  */
3569   if (flags & ECF_SP_DEPRESSED)
3570     {
3571       clear_pending_stack_adjust ();
3572       emit_insn (gen_rtx (CLOBBER, VOIDmode, stack_pointer_rtx));
3573       emit_move_insn (virtual_stack_dynamic_rtx, stack_pointer_rtx);
3574       save_stack_pointer ();
3575     }
3576
3577   return target;
3578 }
3579
3580 /* Traverse an argument list in VALUES and expand all complex
3581    arguments into their components.  */
3582 tree
3583 split_complex_values (tree values)
3584 {
3585   tree p;
3586
3587   /* Before allocating memory, check for the common case of no complex.  */
3588   for (p = values; p; p = TREE_CHAIN (p))
3589     {
3590       tree type = TREE_TYPE (TREE_VALUE (p));
3591       if (type && TREE_CODE (type) == COMPLEX_TYPE
3592           && targetm.calls.split_complex_arg (type))
3593         goto found;
3594     }
3595   return values;
3596
3597  found:
3598   values = copy_list (values);
3599
3600   for (p = values; p; p = TREE_CHAIN (p))
3601     {
3602       tree complex_value = TREE_VALUE (p);
3603       tree complex_type;
3604
3605       complex_type = TREE_TYPE (complex_value);
3606       if (!complex_type)
3607         continue;
3608
3609       if (TREE_CODE (complex_type) == COMPLEX_TYPE
3610           && targetm.calls.split_complex_arg (complex_type))
3611         {
3612           tree subtype;
3613           tree real, imag, next;
3614
3615           subtype = TREE_TYPE (complex_type);
3616           complex_value = save_expr (complex_value);
3617           real = build1 (REALPART_EXPR, subtype, complex_value);
3618           imag = build1 (IMAGPART_EXPR, subtype, complex_value);
3619
3620           TREE_VALUE (p) = real;
3621           next = TREE_CHAIN (p);
3622           imag = build_tree_list (NULL_TREE, imag);
3623           TREE_CHAIN (p) = imag;
3624           TREE_CHAIN (imag) = next;
3625
3626           /* Skip the newly created node.  */
3627           p = TREE_CHAIN (p);
3628         }
3629     }
3630
3631   return values;
3632 }
3633
3634 /* Traverse a list of TYPES and expand all complex types into their
3635    components.  */
3636 tree
3637 split_complex_types (tree types)
3638 {
3639   tree p;
3640
3641   /* Before allocating memory, check for the common case of no complex.  */
3642   for (p = types; p; p = TREE_CHAIN (p))
3643     {
3644       tree type = TREE_VALUE (p);
3645       if (TREE_CODE (type) == COMPLEX_TYPE
3646           && targetm.calls.split_complex_arg (type))
3647         goto found;
3648     }
3649   return types;
3650
3651  found:
3652   types = copy_list (types);
3653
3654   for (p = types; p; p = TREE_CHAIN (p))
3655     {
3656       tree complex_type = TREE_VALUE (p);
3657
3658       if (TREE_CODE (complex_type) == COMPLEX_TYPE
3659           && targetm.calls.split_complex_arg (complex_type))
3660         {
3661           tree next, imag;
3662
3663           /* Rewrite complex type with component type.  */
3664           TREE_VALUE (p) = TREE_TYPE (complex_type);
3665           next = TREE_CHAIN (p);
3666
3667           /* Add another component type for the imaginary part.  */
3668           imag = build_tree_list (NULL_TREE, TREE_VALUE (p));
3669           TREE_CHAIN (p) = imag;
3670           TREE_CHAIN (imag) = next;
3671
3672           /* Skip the newly created node.  */
3673           p = TREE_CHAIN (p);
3674         }
3675     }
3676
3677   return types;
3678 }
3679 \f
3680 /* Output a library call to function FUN (a SYMBOL_REF rtx).
3681    The RETVAL parameter specifies whether return value needs to be saved, other
3682    parameters are documented in the emit_library_call function below.  */
3683
3684 static rtx
3685 emit_library_call_value_1 (int retval, rtx orgfun, rtx value,
3686                            enum libcall_type fn_type,
3687                            enum machine_mode outmode, int nargs, va_list p)
3688 {
3689   /* Total size in bytes of all the stack-parms scanned so far.  */
3690   struct args_size args_size;
3691   /* Size of arguments before any adjustments (such as rounding).  */
3692   struct args_size original_args_size;
3693   int argnum;
3694   rtx fun;
3695   int inc;
3696   int count;
3697   rtx argblock = 0;
3698   CUMULATIVE_ARGS args_so_far;
3699   struct arg
3700   {
3701     rtx value;
3702     enum machine_mode mode;
3703     rtx reg;
3704     int partial;
3705     struct locate_and_pad_arg_data locate;
3706     rtx save_area;
3707   };
3708   struct arg *argvec;
3709   int old_inhibit_defer_pop = inhibit_defer_pop;
3710   rtx call_fusage = 0;
3711   rtx mem_value = 0;
3712   rtx valreg;
3713   int pcc_struct_value = 0;
3714   int struct_value_size = 0;
3715   int flags;
3716   int reg_parm_stack_space = 0;
3717   int needed;
3718   rtx before_call;
3719   tree tfom;                    /* type_for_mode (outmode, 0) */
3720
3721 #ifdef REG_PARM_STACK_SPACE
3722   /* Define the boundary of the register parm stack space that needs to be
3723      save, if any.  */
3724   int low_to_save, high_to_save;
3725   rtx save_area = 0;            /* Place that it is saved.  */
3726 #endif
3727
3728   /* Size of the stack reserved for parameter registers.  */
3729   int initial_highest_arg_in_use = highest_outgoing_arg_in_use;
3730   char *initial_stack_usage_map = stack_usage_map;
3731
3732   rtx struct_value = targetm.calls.struct_value_rtx (0, 0);
3733
3734 #ifdef REG_PARM_STACK_SPACE
3735 #ifdef MAYBE_REG_PARM_STACK_SPACE
3736   reg_parm_stack_space = MAYBE_REG_PARM_STACK_SPACE;
3737 #else
3738   reg_parm_stack_space = REG_PARM_STACK_SPACE ((tree) 0);
3739 #endif
3740 #endif
3741
3742   /* By default, library functions can not throw.  */
3743   flags = ECF_NOTHROW;
3744
3745   switch (fn_type)
3746     {
3747     case LCT_NORMAL:
3748       break;
3749     case LCT_CONST:
3750       flags |= ECF_CONST;
3751       break;
3752     case LCT_PURE:
3753       flags |= ECF_PURE;
3754       break;
3755     case LCT_CONST_MAKE_BLOCK:
3756       flags |= ECF_CONST | ECF_LIBCALL_BLOCK;
3757       break;
3758     case LCT_PURE_MAKE_BLOCK:
3759       flags |= ECF_PURE | ECF_LIBCALL_BLOCK;
3760       break;
3761     case LCT_NORETURN:
3762       flags |= ECF_NORETURN;
3763       break;
3764     case LCT_THROW:
3765       flags = ECF_NORETURN;
3766       break;
3767     case LCT_ALWAYS_RETURN:
3768       flags = ECF_ALWAYS_RETURN;
3769       break;
3770     case LCT_RETURNS_TWICE:
3771       flags = ECF_RETURNS_TWICE;
3772       break;
3773     }
3774   fun = orgfun;
3775
3776   /* Ensure current function's preferred stack boundary is at least
3777      what we need.  */
3778   if (cfun->preferred_stack_boundary < PREFERRED_STACK_BOUNDARY)
3779     cfun->preferred_stack_boundary = PREFERRED_STACK_BOUNDARY;
3780
3781   /* If this kind of value comes back in memory,
3782      decide where in memory it should come back.  */
3783   if (outmode != VOIDmode)
3784     {
3785       tfom = (*lang_hooks.types.type_for_mode) (outmode, 0);
3786       if (aggregate_value_p (tfom, 0))
3787         {
3788 #ifdef PCC_STATIC_STRUCT_RETURN
3789           rtx pointer_reg
3790             = hard_function_value (build_pointer_type (tfom), 0, 0);
3791           mem_value = gen_rtx_MEM (outmode, pointer_reg);
3792           pcc_struct_value = 1;
3793           if (value == 0)
3794             value = gen_reg_rtx (outmode);
3795 #else /* not PCC_STATIC_STRUCT_RETURN */
3796           struct_value_size = GET_MODE_SIZE (outmode);
3797           if (value != 0 && GET_CODE (value) == MEM)
3798             mem_value = value;
3799           else
3800             mem_value = assign_temp (tfom, 0, 1, 1);
3801 #endif
3802           /* This call returns a big structure.  */
3803           flags &= ~(ECF_CONST | ECF_PURE | ECF_LIBCALL_BLOCK);
3804         }
3805     }
3806   else
3807     tfom = void_type_node;
3808
3809   /* ??? Unfinished: must pass the memory address as an argument.  */
3810
3811   /* Copy all the libcall-arguments out of the varargs data
3812      and into a vector ARGVEC.
3813
3814      Compute how to pass each argument.  We only support a very small subset
3815      of the full argument passing conventions to limit complexity here since
3816      library functions shouldn't have many args.  */
3817
3818   argvec = alloca ((nargs + 1) * sizeof (struct arg));
3819   memset (argvec, 0, (nargs + 1) * sizeof (struct arg));
3820
3821 #ifdef INIT_CUMULATIVE_LIBCALL_ARGS
3822   INIT_CUMULATIVE_LIBCALL_ARGS (args_so_far, outmode, fun);
3823 #else
3824   INIT_CUMULATIVE_ARGS (args_so_far, NULL_TREE, fun, 0, nargs);
3825 #endif
3826
3827   args_size.constant = 0;
3828   args_size.var = 0;
3829
3830   count = 0;
3831
3832   /* Now we are about to start emitting insns that can be deleted
3833      if a libcall is deleted.  */
3834   if (flags & ECF_LIBCALL_BLOCK)
3835     start_sequence ();
3836
3837   push_temp_slots ();
3838
3839   /* If there's a structure value address to be passed,
3840      either pass it in the special place, or pass it as an extra argument.  */
3841   if (mem_value && struct_value == 0 && ! pcc_struct_value)
3842     {
3843       rtx addr = XEXP (mem_value, 0);
3844       nargs++;
3845
3846       /* Make sure it is a reasonable operand for a move or push insn.  */
3847       if (GET_CODE (addr) != REG && GET_CODE (addr) != MEM
3848           && ! (CONSTANT_P (addr) && LEGITIMATE_CONSTANT_P (addr)))
3849         addr = force_operand (addr, NULL_RTX);
3850
3851       argvec[count].value = addr;
3852       argvec[count].mode = Pmode;
3853       argvec[count].partial = 0;
3854
3855       argvec[count].reg = FUNCTION_ARG (args_so_far, Pmode, NULL_TREE, 1);
3856 #ifdef FUNCTION_ARG_PARTIAL_NREGS
3857       if (FUNCTION_ARG_PARTIAL_NREGS (args_so_far, Pmode, NULL_TREE, 1))
3858         abort ();
3859 #endif
3860
3861       locate_and_pad_parm (Pmode, NULL_TREE,
3862 #ifdef STACK_PARMS_IN_REG_PARM_AREA
3863                            1,
3864 #else
3865                            argvec[count].reg != 0,
3866 #endif
3867                            0, NULL_TREE, &args_size, &argvec[count].locate);
3868
3869       if (argvec[count].reg == 0 || argvec[count].partial != 0
3870           || reg_parm_stack_space > 0)
3871         args_size.constant += argvec[count].locate.size.constant;
3872
3873       FUNCTION_ARG_ADVANCE (args_so_far, Pmode, (tree) 0, 1);
3874
3875       count++;
3876     }
3877
3878   for (; count < nargs; count++)
3879     {
3880       rtx val = va_arg (p, rtx);
3881       enum machine_mode mode = va_arg (p, enum machine_mode);
3882
3883       /* We cannot convert the arg value to the mode the library wants here;
3884          must do it earlier where we know the signedness of the arg.  */
3885       if (mode == BLKmode
3886           || (GET_MODE (val) != mode && GET_MODE (val) != VOIDmode))
3887         abort ();
3888
3889       /* There's no need to call protect_from_queue, because
3890          either emit_move_insn or emit_push_insn will do that.  */
3891
3892       /* Make sure it is a reasonable operand for a move or push insn.  */
3893       if (GET_CODE (val) != REG && GET_CODE (val) != MEM
3894           && ! (CONSTANT_P (val) && LEGITIMATE_CONSTANT_P (val)))
3895         val = force_operand (val, NULL_RTX);
3896
3897 #ifdef FUNCTION_ARG_PASS_BY_REFERENCE
3898       if (FUNCTION_ARG_PASS_BY_REFERENCE (args_so_far, mode, NULL_TREE, 1))
3899         {
3900           rtx slot;
3901           int must_copy = 1
3902 #ifdef FUNCTION_ARG_CALLEE_COPIES
3903             && ! FUNCTION_ARG_CALLEE_COPIES (args_so_far, mode,
3904                                              NULL_TREE, 1)
3905 #endif
3906             ;
3907
3908           /* loop.c won't look at CALL_INSN_FUNCTION_USAGE of const/pure
3909              functions, so we have to pretend this isn't such a function.  */
3910           if (flags & ECF_LIBCALL_BLOCK)
3911             {
3912               rtx insns = get_insns ();
3913               end_sequence ();
3914               emit_insn (insns);
3915             }
3916           flags &= ~(ECF_CONST | ECF_PURE | ECF_LIBCALL_BLOCK);
3917
3918           /* If this was a CONST function, it is now PURE since
3919              it now reads memory.  */
3920           if (flags & ECF_CONST)
3921             {
3922               flags &= ~ECF_CONST;
3923               flags |= ECF_PURE;
3924             }
3925
3926           if (GET_MODE (val) == MEM && ! must_copy)
3927             slot = val;
3928           else if (must_copy)
3929             {
3930               slot = assign_temp ((*lang_hooks.types.type_for_mode) (mode, 0),
3931                                   0, 1, 1);
3932               emit_move_insn (slot, val);
3933             }
3934           else
3935             {
3936               tree type = (*lang_hooks.types.type_for_mode) (mode, 0);
3937
3938               slot
3939                 = gen_rtx_MEM (mode,
3940                                expand_expr (build1 (ADDR_EXPR,
3941                                                     build_pointer_type (type),
3942                                                     make_tree (type, val)),
3943                                             NULL_RTX, VOIDmode, 0));
3944             }
3945
3946           call_fusage = gen_rtx_EXPR_LIST (VOIDmode,
3947                                            gen_rtx_USE (VOIDmode, slot),
3948                                            call_fusage);
3949           if (must_copy)
3950             call_fusage = gen_rtx_EXPR_LIST (VOIDmode,
3951                                              gen_rtx_CLOBBER (VOIDmode,
3952                                                               slot),
3953                                              call_fusage);
3954
3955           mode = Pmode;
3956           val = force_operand (XEXP (slot, 0), NULL_RTX);
3957         }
3958 #endif
3959
3960       argvec[count].value = val;
3961       argvec[count].mode = mode;
3962
3963       argvec[count].reg = FUNCTION_ARG (args_so_far, mode, NULL_TREE, 1);
3964
3965 #ifdef FUNCTION_ARG_PARTIAL_NREGS
3966       argvec[count].partial
3967         = FUNCTION_ARG_PARTIAL_NREGS (args_so_far, mode, NULL_TREE, 1);
3968 #else
3969       argvec[count].partial = 0;
3970 #endif
3971
3972       locate_and_pad_parm (mode, NULL_TREE,
3973 #ifdef STACK_PARMS_IN_REG_PARM_AREA
3974                            1,
3975 #else
3976                            argvec[count].reg != 0,
3977 #endif
3978                            argvec[count].partial,
3979                            NULL_TREE, &args_size, &argvec[count].locate);
3980
3981       if (argvec[count].locate.size.var)
3982         abort ();
3983
3984       if (argvec[count].reg == 0 || argvec[count].partial != 0
3985           || reg_parm_stack_space > 0)
3986         args_size.constant += argvec[count].locate.size.constant;
3987
3988       FUNCTION_ARG_ADVANCE (args_so_far, mode, (tree) 0, 1);
3989     }
3990
3991 #ifdef FINAL_REG_PARM_STACK_SPACE
3992   reg_parm_stack_space = FINAL_REG_PARM_STACK_SPACE (args_size.constant,
3993                                                      args_size.var);
3994 #endif
3995   /* If this machine requires an external definition for library
3996      functions, write one out.  */
3997   assemble_external_libcall (fun);
3998
3999   original_args_size = args_size;
4000   args_size.constant = (((args_size.constant
4001                           + stack_pointer_delta
4002                           + STACK_BYTES - 1)
4003                           / STACK_BYTES
4004                           * STACK_BYTES)
4005                          - stack_pointer_delta);
4006
4007   args_size.constant = MAX (args_size.constant,
4008                             reg_parm_stack_space);
4009
4010 #ifndef OUTGOING_REG_PARM_STACK_SPACE
4011   args_size.constant -= reg_parm_stack_space;
4012 #endif
4013
4014   if (args_size.constant > current_function_outgoing_args_size)
4015     current_function_outgoing_args_size = args_size.constant;
4016
4017   if (ACCUMULATE_OUTGOING_ARGS)
4018     {
4019       /* Since the stack pointer will never be pushed, it is possible for
4020          the evaluation of a parm to clobber something we have already
4021          written to the stack.  Since most function calls on RISC machines
4022          do not use the stack, this is uncommon, but must work correctly.
4023
4024          Therefore, we save any area of the stack that was already written
4025          and that we are using.  Here we set up to do this by making a new
4026          stack usage map from the old one.
4027
4028          Another approach might be to try to reorder the argument
4029          evaluations to avoid this conflicting stack usage.  */
4030
4031       needed = args_size.constant;
4032
4033 #ifndef OUTGOING_REG_PARM_STACK_SPACE
4034       /* Since we will be writing into the entire argument area, the
4035          map must be allocated for its entire size, not just the part that
4036          is the responsibility of the caller.  */
4037       needed += reg_parm_stack_space;
4038 #endif
4039
4040 #ifdef ARGS_GROW_DOWNWARD
4041       highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
4042                                          needed + 1);
4043 #else
4044       highest_outgoing_arg_in_use = MAX (initial_highest_arg_in_use,
4045                                          needed);
4046 #endif
4047       stack_usage_map = alloca (highest_outgoing_arg_in_use);
4048
4049       if (initial_highest_arg_in_use)
4050         memcpy (stack_usage_map, initial_stack_usage_map,
4051                 initial_highest_arg_in_use);
4052
4053       if (initial_highest_arg_in_use != highest_outgoing_arg_in_use)
4054         memset (&stack_usage_map[initial_highest_arg_in_use], 0,
4055                highest_outgoing_arg_in_use - initial_highest_arg_in_use);
4056       needed = 0;
4057
4058       /* We must be careful to use virtual regs before they're instantiated,
4059          and real regs afterwards.  Loop optimization, for example, can create
4060          new libcalls after we've instantiated the virtual regs, and if we
4061          use virtuals anyway, they won't match the rtl patterns.  */
4062
4063       if (virtuals_instantiated)
4064         argblock = plus_constant (stack_pointer_rtx, STACK_POINTER_OFFSET);
4065       else
4066         argblock = virtual_outgoing_args_rtx;
4067     }
4068   else
4069     {
4070       if (!PUSH_ARGS)
4071         argblock = push_block (GEN_INT (args_size.constant), 0, 0);
4072     }
4073
4074   /* If we push args individually in reverse order, perform stack alignment
4075      before the first push (the last arg).  */
4076   if (argblock == 0 && PUSH_ARGS_REVERSED)
4077     anti_adjust_stack (GEN_INT (args_size.constant
4078                                 - original_args_size.constant));
4079
4080   if (PUSH_ARGS_REVERSED)
4081     {
4082       inc = -1;
4083       argnum = nargs - 1;
4084     }
4085   else
4086     {
4087       inc = 1;
4088       argnum = 0;
4089     }
4090
4091 #ifdef REG_PARM_STACK_SPACE
4092   if (ACCUMULATE_OUTGOING_ARGS)
4093     {
4094       /* The argument list is the property of the called routine and it
4095          may clobber it.  If the fixed area has been used for previous
4096          parameters, we must save and restore it.  */
4097       save_area = save_fixed_argument_area (reg_parm_stack_space, argblock,
4098                                             &low_to_save, &high_to_save);
4099     }
4100 #endif
4101
4102   /* Push the args that need to be pushed.  */
4103
4104   /* ARGNUM indexes the ARGVEC array in the order in which the arguments
4105      are to be pushed.  */
4106   for (count = 0; count < nargs; count++, argnum += inc)
4107     {
4108       enum machine_mode mode = argvec[argnum].mode;
4109       rtx val = argvec[argnum].value;
4110       rtx reg = argvec[argnum].reg;
4111       int partial = argvec[argnum].partial;
4112       int lower_bound = 0, upper_bound = 0, i;
4113
4114       if (! (reg != 0 && partial == 0))
4115         {
4116           if (ACCUMULATE_OUTGOING_ARGS)
4117             {
4118               /* If this is being stored into a pre-allocated, fixed-size,
4119                  stack area, save any previous data at that location.  */
4120
4121 #ifdef ARGS_GROW_DOWNWARD
4122               /* stack_slot is negative, but we want to index stack_usage_map
4123                  with positive values.  */
4124               upper_bound = -argvec[argnum].locate.offset.constant + 1;
4125               lower_bound = upper_bound - argvec[argnum].locate.size.constant;
4126 #else
4127               lower_bound = argvec[argnum].locate.offset.constant;
4128               upper_bound = lower_bound + argvec[argnum].locate.size.constant;
4129 #endif
4130
4131               i = lower_bound;
4132               /* Don't worry about things in the fixed argument area;
4133                  it has already been saved.  */
4134               if (i < reg_parm_stack_space)
4135                 i = reg_parm_stack_space;
4136               while (i < upper_bound && stack_usage_map[i] == 0)
4137                 i++;
4138
4139               if (i < upper_bound)
4140                 {
4141                   /* We need to make a save area.  */
4142                   unsigned int size
4143                     = argvec[argnum].locate.size.constant * BITS_PER_UNIT;
4144                   enum machine_mode save_mode
4145                     = mode_for_size (size, MODE_INT, 1);
4146                   rtx adr
4147                     = plus_constant (argblock,
4148                                      argvec[argnum].locate.offset.constant);
4149                   rtx stack_area
4150                     = gen_rtx_MEM (save_mode, memory_address (save_mode, adr));
4151
4152                   if (save_mode == BLKmode)
4153                     {
4154                       argvec[argnum].save_area
4155                         = assign_stack_temp (BLKmode,
4156                                              argvec[argnum].locate.size.constant,
4157                                              0);
4158
4159                       emit_block_move (validize_mem (argvec[argnum].save_area),
4160                                        stack_area,
4161                                        GEN_INT (argvec[argnum].locate.size.constant),
4162                                        BLOCK_OP_CALL_PARM);
4163                     }
4164                   else
4165                     {
4166                       argvec[argnum].save_area = gen_reg_rtx (save_mode);
4167
4168                       emit_move_insn (argvec[argnum].save_area, stack_area);
4169                     }
4170                 }
4171             }
4172
4173           emit_push_insn (val, mode, NULL_TREE, NULL_RTX, PARM_BOUNDARY,
4174                           partial, reg, 0, argblock,
4175                           GEN_INT (argvec[argnum].locate.offset.constant),
4176                           reg_parm_stack_space,
4177                           ARGS_SIZE_RTX (argvec[argnum].locate.alignment_pad));
4178
4179           /* Now mark the segment we just used.  */
4180           if (ACCUMULATE_OUTGOING_ARGS)
4181             for (i = lower_bound; i < upper_bound; i++)
4182               stack_usage_map[i] = 1;
4183
4184           NO_DEFER_POP;
4185         }
4186     }
4187
4188   /* If we pushed args in forward order, perform stack alignment
4189      after pushing the last arg.  */
4190   if (argblock == 0 && !PUSH_ARGS_REVERSED)
4191     anti_adjust_stack (GEN_INT (args_size.constant
4192                                 - original_args_size.constant));
4193
4194   if (PUSH_ARGS_REVERSED)
4195     argnum = nargs - 1;
4196   else
4197     argnum = 0;
4198
4199   fun = prepare_call_address (fun, NULL_TREE, &call_fusage, 0, 0);
4200
4201   /* Now load any reg parms into their regs.  */
4202
4203   /* ARGNUM indexes the ARGVEC array in the order in which the arguments
4204      are to be pushed.  */
4205   for (count = 0; count < nargs; count++, argnum += inc)
4206     {
4207       rtx val = argvec[argnum].value;
4208       rtx reg = argvec[argnum].reg;
4209       int partial = argvec[argnum].partial;
4210
4211       /* Handle calls that pass values in multiple non-contiguous
4212          locations.  The PA64 has examples of this for library calls.  */
4213       if (reg != 0 && GET_CODE (reg) == PARALLEL)
4214         emit_group_load (reg, val, NULL_TREE, GET_MODE_SIZE (GET_MODE (val)));
4215       else if (reg != 0 && partial == 0)
4216         emit_move_insn (reg, val);
4217
4218       NO_DEFER_POP;
4219     }
4220
4221   /* Any regs containing parms remain in use through the call.  */
4222   for (count = 0; count < nargs; count++)
4223     {
4224       rtx reg = argvec[count].reg;
4225       if (reg != 0 && GET_CODE (reg) == PARALLEL)
4226         use_group_regs (&call_fusage, reg);
4227       else if (reg != 0)
4228         use_reg (&call_fusage, reg);
4229     }
4230
4231   /* Pass the function the address in which to return a structure value.  */
4232   if (mem_value != 0 && struct_value != 0 && ! pcc_struct_value)
4233     {
4234       emit_move_insn (struct_value,
4235                       force_reg (Pmode,
4236                                  force_operand (XEXP (mem_value, 0),
4237                                                 NULL_RTX)));
4238       if (GET_CODE (struct_value) == REG)
4239         use_reg (&call_fusage, struct_value);
4240     }
4241
4242   /* Don't allow popping to be deferred, since then
4243      cse'ing of library calls could delete a call and leave the pop.  */
4244   NO_DEFER_POP;
4245   valreg = (mem_value == 0 && outmode != VOIDmode
4246             ? hard_libcall_value (outmode) : NULL_RTX);
4247
4248   /* Stack must be properly aligned now.  */
4249   if (stack_pointer_delta & (PREFERRED_STACK_BOUNDARY / BITS_PER_UNIT - 1))
4250     abort ();
4251
4252   before_call = get_last_insn ();
4253
4254   /* We pass the old value of inhibit_defer_pop + 1 to emit_call_1, which
4255      will set inhibit_defer_pop to that value.  */
4256   /* The return type is needed to decide how many bytes the function pops.
4257      Signedness plays no role in that, so for simplicity, we pretend it's
4258      always signed.  We also assume that the list of arguments passed has
4259      no impact, so we pretend it is unknown.  */
4260
4261   emit_call_1 (fun,
4262                get_identifier (XSTR (orgfun, 0)),
4263                build_function_type (tfom, NULL_TREE),
4264                original_args_size.constant, args_size.constant,
4265                struct_value_size,
4266                FUNCTION_ARG (args_so_far, VOIDmode, void_type_node, 1),
4267                valreg,
4268                old_inhibit_defer_pop + 1, call_fusage, flags, & args_so_far);
4269
4270   /* For calls to `setjmp', etc., inform flow.c it should complain
4271      if nonvolatile values are live.  For functions that cannot return,
4272      inform flow that control does not fall through.  */
4273
4274   if (flags & (ECF_NORETURN | ECF_LONGJMP))
4275     {
4276       /* The barrier note must be emitted
4277          immediately after the CALL_INSN.  Some ports emit more than
4278          just a CALL_INSN above, so we must search for it here.  */
4279
4280       rtx last = get_last_insn ();
4281       while (GET_CODE (last) != CALL_INSN)
4282         {
4283           last = PREV_INSN (last);
4284           /* There was no CALL_INSN?  */
4285           if (last == before_call)
4286             abort ();
4287         }
4288
4289       emit_barrier_after (last);
4290     }
4291
4292   /* Now restore inhibit_defer_pop to its actual original value.  */
4293   OK_DEFER_POP;
4294
4295   /* If call is cse'able, make appropriate pair of reg-notes around it.
4296      Test valreg so we don't crash; may safely ignore `const'
4297      if return type is void.  Disable for PARALLEL return values, because
4298      we have no way to move such values into a pseudo register.  */
4299   if (flags & ECF_LIBCALL_BLOCK)
4300     {
4301       rtx insns;
4302
4303       if (valreg == 0)
4304         {
4305           insns = get_insns ();
4306           end_sequence ();
4307           emit_insn (insns);
4308         }
4309       else
4310         {
4311           rtx note = 0;
4312           rtx temp;
4313           int i;
4314
4315           if (GET_CODE (valreg) == PARALLEL)
4316             {
4317               temp = gen_reg_rtx (outmode);
4318               emit_group_store (temp, valreg, NULL_TREE, 
4319                                 GET_MODE_SIZE (outmode));
4320               valreg = temp;
4321             }
4322
4323           temp = gen_reg_rtx (GET_MODE (valreg));
4324
4325           /* Construct an "equal form" for the value which mentions all the
4326              arguments in order as well as the function name.  */
4327           for (i = 0; i < nargs; i++)
4328             note = gen_rtx_EXPR_LIST (VOIDmode, argvec[i].value, note);
4329           note = gen_rtx_EXPR_LIST (VOIDmode, fun, note);
4330
4331           insns = get_insns ();
4332           end_sequence ();
4333
4334           if (flags & ECF_PURE)
4335             note = gen_rtx_EXPR_LIST (VOIDmode,
4336                         gen_rtx_USE (VOIDmode,
4337                                      gen_rtx_MEM (BLKmode,
4338                                                   gen_rtx_SCRATCH (VOIDmode))),
4339                         note);
4340
4341           emit_libcall_block (insns, temp, valreg, note);
4342
4343           valreg = temp;
4344         }
4345     }
4346   pop_temp_slots ();
4347
4348   /* Copy the value to the right place.  */
4349   if (outmode != VOIDmode && retval)
4350     {
4351       if (mem_value)
4352         {
4353           if (value == 0)
4354             value = mem_value;
4355           if (value != mem_value)
4356             emit_move_insn (value, mem_value);
4357         }
4358       else if (GET_CODE (valreg) == PARALLEL)
4359         {
4360           if (value == 0)
4361             value = gen_reg_rtx (outmode);
4362           emit_group_store (value, valreg, NULL_TREE, GET_MODE_SIZE (outmode));
4363         }
4364       else if (value != 0)
4365         emit_move_insn (value, valreg);
4366       else
4367         value = valreg;
4368     }
4369
4370   if (ACCUMULATE_OUTGOING_ARGS)
4371     {
4372 #ifdef REG_PARM_STACK_SPACE
4373       if (save_area)
4374         restore_fixed_argument_area (save_area, argblock,
4375                                      high_to_save, low_to_save);
4376 #endif
4377
4378       /* If we saved any argument areas, restore them.  */
4379       for (count = 0; count < nargs; count++)
4380         if (argvec[count].save_area)
4381           {
4382             enum machine_mode save_mode = GET_MODE (argvec[count].save_area);
4383             rtx adr = plus_constant (argblock,
4384                                      argvec[count].locate.offset.constant);
4385             rtx stack_area = gen_rtx_MEM (save_mode,
4386                                           memory_address (save_mode, adr));
4387
4388             if (save_mode == BLKmode)
4389               emit_block_move (stack_area,
4390                                validize_mem (argvec[count].save_area),
4391                                GEN_INT (argvec[count].locate.size.constant),
4392                                BLOCK_OP_CALL_PARM);
4393             else
4394               emit_move_insn (stack_area, argvec[count].save_area);
4395           }
4396
4397       highest_outgoing_arg_in_use = initial_highest_arg_in_use;
4398       stack_usage_map = initial_stack_usage_map;
4399     }
4400
4401   return value;
4402
4403 }
4404 \f
4405 /* Output a library call to function FUN (a SYMBOL_REF rtx)
4406    (emitting the queue unless NO_QUEUE is nonzero),
4407    for a value of mode OUTMODE,
4408    with NARGS different arguments, passed as alternating rtx values
4409    and machine_modes to convert them to.
4410    The rtx values should have been passed through protect_from_queue already.
4411
4412    FN_TYPE should be LCT_NORMAL for `normal' calls, LCT_CONST for `const'
4413    calls, LCT_PURE for `pure' calls, LCT_CONST_MAKE_BLOCK for `const' calls
4414    which should be enclosed in REG_LIBCALL/REG_RETVAL notes,
4415    LCT_PURE_MAKE_BLOCK for `purep' calls which should be enclosed in
4416    REG_LIBCALL/REG_RETVAL notes with extra (use (memory (scratch)),
4417    or other LCT_ value for other types of library calls.  */
4418
4419 void
4420 emit_library_call (rtx orgfun, enum libcall_type fn_type,
4421                    enum machine_mode outmode, int nargs, ...)
4422 {
4423   va_list p;
4424
4425   va_start (p, nargs);
4426   emit_library_call_value_1 (0, orgfun, NULL_RTX, fn_type, outmode, nargs, p);
4427   va_end (p);
4428 }
4429 \f
4430 /* Like emit_library_call except that an extra argument, VALUE,
4431    comes second and says where to store the result.
4432    (If VALUE is zero, this function chooses a convenient way
4433    to return the value.
4434
4435    This function returns an rtx for where the value is to be found.
4436    If VALUE is nonzero, VALUE is returned.  */
4437
4438 rtx
4439 emit_library_call_value (rtx orgfun, rtx value,
4440                          enum libcall_type fn_type,
4441                          enum machine_mode outmode, int nargs, ...)
4442 {
4443   rtx result;
4444   va_list p;
4445
4446   va_start (p, nargs);
4447   result = emit_library_call_value_1 (1, orgfun, value, fn_type, outmode,
4448                                       nargs, p);
4449   va_end (p);
4450
4451   return result;
4452 }
4453 \f
4454 /* Store a single argument for a function call
4455    into the register or memory area where it must be passed.
4456    *ARG describes the argument value and where to pass it.
4457
4458    ARGBLOCK is the address of the stack-block for all the arguments,
4459    or 0 on a machine where arguments are pushed individually.
4460
4461    MAY_BE_ALLOCA nonzero says this could be a call to `alloca'
4462    so must be careful about how the stack is used.
4463
4464    VARIABLE_SIZE nonzero says that this was a variable-sized outgoing
4465    argument stack.  This is used if ACCUMULATE_OUTGOING_ARGS to indicate
4466    that we need not worry about saving and restoring the stack.
4467
4468    FNDECL is the declaration of the function we are calling.
4469
4470    Return nonzero if this arg should cause sibcall failure,
4471    zero otherwise.  */
4472
4473 static int
4474 store_one_arg (struct arg_data *arg, rtx argblock, int flags,
4475                int variable_size ATTRIBUTE_UNUSED, int reg_parm_stack_space)
4476 {
4477   tree pval = arg->tree_value;
4478   rtx reg = 0;
4479   int partial = 0;
4480   int used = 0;
4481   int i, lower_bound = 0, upper_bound = 0;
4482   int sibcall_failure = 0;
4483
4484   if (TREE_CODE (pval) == ERROR_MARK)
4485     return 1;
4486
4487   /* Push a new temporary level for any temporaries we make for
4488      this argument.  */
4489   push_temp_slots ();
4490
4491   if (ACCUMULATE_OUTGOING_ARGS && !(flags & ECF_SIBCALL))
4492     {
4493       /* If this is being stored into a pre-allocated, fixed-size, stack area,
4494          save any previous data at that location.  */
4495       if (argblock && ! variable_size && arg->stack)
4496         {
4497 #ifdef ARGS_GROW_DOWNWARD
4498           /* stack_slot is negative, but we want to index stack_usage_map
4499              with positive values.  */
4500           if (GET_CODE (XEXP (arg->stack_slot, 0)) == PLUS)
4501             upper_bound = -INTVAL (XEXP (XEXP (arg->stack_slot, 0), 1)) + 1;
4502           else
4503             upper_bound = 0;
4504
4505           lower_bound = upper_bound - arg->locate.size.constant;
4506 #else
4507           if (GET_CODE (XEXP (arg->stack_slot, 0)) == PLUS)
4508             lower_bound = INTVAL (XEXP (XEXP (arg->stack_slot, 0), 1));
4509           else
4510             lower_bound = 0;
4511
4512           upper_bound = lower_bound + arg->locate.size.constant;
4513 #endif
4514
4515           i = lower_bound;
4516           /* Don't worry about things in the fixed argument area;
4517              it has already been saved.  */
4518           if (i < reg_parm_stack_space)
4519             i = reg_parm_stack_space;
4520           while (i < upper_bound && stack_usage_map[i] == 0)
4521             i++;
4522
4523           if (i < upper_bound)
4524             {
4525               /* We need to make a save area.  */
4526               unsigned int size = arg->locate.size.constant * BITS_PER_UNIT;
4527               enum machine_mode save_mode = mode_for_size (size, MODE_INT, 1);
4528               rtx adr = memory_address (save_mode, XEXP (arg->stack_slot, 0));
4529               rtx stack_area = gen_rtx_MEM (save_mode, adr);
4530
4531               if (save_mode == BLKmode)
4532                 {
4533                   tree ot = TREE_TYPE (arg->tree_value);
4534                   tree nt = build_qualified_type (ot, (TYPE_QUALS (ot)
4535                                                        | TYPE_QUAL_CONST));
4536
4537                   arg->save_area = assign_temp (nt, 0, 1, 1);
4538                   preserve_temp_slots (arg->save_area);
4539                   emit_block_move (validize_mem (arg->save_area), stack_area,
4540                                    expr_size (arg->tree_value),
4541                                    BLOCK_OP_CALL_PARM);
4542                 }
4543               else
4544                 {
4545                   arg->save_area = gen_reg_rtx (save_mode);
4546                   emit_move_insn (arg->save_area, stack_area);
4547                 }
4548             }
4549         }
4550     }
4551
4552   /* If this isn't going to be placed on both the stack and in registers,
4553      set up the register and number of words.  */
4554   if (! arg->pass_on_stack)
4555     {
4556       if (flags & ECF_SIBCALL)
4557         reg = arg->tail_call_reg;
4558       else
4559         reg = arg->reg;
4560       partial = arg->partial;
4561     }
4562
4563   if (reg != 0 && partial == 0)
4564     /* Being passed entirely in a register.  We shouldn't be called in
4565        this case.  */
4566     abort ();
4567
4568   /* If this arg needs special alignment, don't load the registers
4569      here.  */
4570   if (arg->n_aligned_regs != 0)
4571     reg = 0;
4572
4573   /* If this is being passed partially in a register, we can't evaluate
4574      it directly into its stack slot.  Otherwise, we can.  */
4575   if (arg->value == 0)
4576     {
4577       /* stack_arg_under_construction is nonzero if a function argument is
4578          being evaluated directly into the outgoing argument list and
4579          expand_call must take special action to preserve the argument list
4580          if it is called recursively.
4581
4582          For scalar function arguments stack_usage_map is sufficient to
4583          determine which stack slots must be saved and restored.  Scalar
4584          arguments in general have pass_on_stack == 0.
4585
4586          If this argument is initialized by a function which takes the
4587          address of the argument (a C++ constructor or a C function
4588          returning a BLKmode structure), then stack_usage_map is
4589          insufficient and expand_call must push the stack around the
4590          function call.  Such arguments have pass_on_stack == 1.
4591
4592          Note that it is always safe to set stack_arg_under_construction,
4593          but this generates suboptimal code if set when not needed.  */
4594
4595       if (arg->pass_on_stack)
4596         stack_arg_under_construction++;
4597
4598       arg->value = expand_expr (pval,
4599                                 (partial
4600                                  || TYPE_MODE (TREE_TYPE (pval)) != arg->mode)
4601                                 ? NULL_RTX : arg->stack,
4602                                 VOIDmode, EXPAND_STACK_PARM);
4603
4604       /* If we are promoting object (or for any other reason) the mode
4605          doesn't agree, convert the mode.  */
4606
4607       if (arg->mode != TYPE_MODE (TREE_TYPE (pval)))
4608         arg->value = convert_modes (arg->mode, TYPE_MODE (TREE_TYPE (pval)),
4609                                     arg->value, arg->unsignedp);
4610
4611       if (arg->pass_on_stack)
4612         stack_arg_under_construction--;
4613     }
4614
4615   /* Don't allow anything left on stack from computation
4616      of argument to alloca.  */
4617   if (flags & ECF_MAY_BE_ALLOCA)
4618     do_pending_stack_adjust ();
4619
4620   if (arg->value == arg->stack)
4621     /* If the value is already in the stack slot, we are done.  */
4622     ;
4623   else if (arg->mode != BLKmode)
4624     {
4625       int size;
4626
4627       /* Argument is a scalar, not entirely passed in registers.
4628          (If part is passed in registers, arg->partial says how much
4629          and emit_push_insn will take care of putting it there.)
4630
4631          Push it, and if its size is less than the
4632          amount of space allocated to it,
4633          also bump stack pointer by the additional space.
4634          Note that in C the default argument promotions
4635          will prevent such mismatches.  */
4636
4637       size = GET_MODE_SIZE (arg->mode);
4638       /* Compute how much space the push instruction will push.
4639          On many machines, pushing a byte will advance the stack
4640          pointer by a halfword.  */
4641 #ifdef PUSH_ROUNDING
4642       size = PUSH_ROUNDING (size);
4643 #endif
4644       used = size;
4645
4646       /* Compute how much space the argument should get:
4647          round up to a multiple of the alignment for arguments.  */
4648       if (none != FUNCTION_ARG_PADDING (arg->mode, TREE_TYPE (pval)))
4649         used = (((size + PARM_BOUNDARY / BITS_PER_UNIT - 1)
4650                  / (PARM_BOUNDARY / BITS_PER_UNIT))
4651                 * (PARM_BOUNDARY / BITS_PER_UNIT));
4652
4653       /* This isn't already where we want it on the stack, so put it there.
4654          This can either be done with push or copy insns.  */
4655       emit_push_insn (arg->value, arg->mode, TREE_TYPE (pval), NULL_RTX,
4656                       PARM_BOUNDARY, partial, reg, used - size, argblock,
4657                       ARGS_SIZE_RTX (arg->locate.offset), reg_parm_stack_space,
4658                       ARGS_SIZE_RTX (arg->locate.alignment_pad));
4659
4660       /* Unless this is a partially-in-register argument, the argument is now
4661          in the stack.  */
4662       if (partial == 0)
4663         arg->value = arg->stack;
4664     }
4665   else
4666     {
4667       /* BLKmode, at least partly to be pushed.  */
4668
4669       unsigned int parm_align;
4670       int excess;
4671       rtx size_rtx;
4672
4673       /* Pushing a nonscalar.
4674          If part is passed in registers, PARTIAL says how much
4675          and emit_push_insn will take care of putting it there.  */
4676
4677       /* Round its size up to a multiple
4678          of the allocation unit for arguments.  */
4679
4680       if (arg->locate.size.var != 0)
4681         {
4682           excess = 0;
4683           size_rtx = ARGS_SIZE_RTX (arg->locate.size);
4684         }
4685       else
4686         {
4687           /* PUSH_ROUNDING has no effect on us, because
4688              emit_push_insn for BLKmode is careful to avoid it.  */
4689           if (reg && GET_CODE (reg) == PARALLEL)
4690           {
4691             /* Use the size of the elt to compute excess.  */
4692             rtx elt = XEXP (XVECEXP (reg, 0, 0), 0);
4693             excess = (arg->locate.size.constant
4694                       - int_size_in_bytes (TREE_TYPE (pval))
4695                       + partial * GET_MODE_SIZE (GET_MODE (elt)));
4696           } 
4697           else
4698             excess = (arg->locate.size.constant
4699                       - int_size_in_bytes (TREE_TYPE (pval))
4700                       + partial * UNITS_PER_WORD);
4701           size_rtx = expand_expr (size_in_bytes (TREE_TYPE (pval)),
4702                                   NULL_RTX, TYPE_MODE (sizetype), 0);
4703         }
4704
4705       /* Some types will require stricter alignment, which will be
4706          provided for elsewhere in argument layout.  */
4707       parm_align = MAX (PARM_BOUNDARY, TYPE_ALIGN (TREE_TYPE (pval)));
4708
4709       /* When an argument is padded down, the block is aligned to
4710          PARM_BOUNDARY, but the actual argument isn't.  */
4711       if (FUNCTION_ARG_PADDING (arg->mode, TREE_TYPE (pval)) == downward)
4712         {
4713           if (arg->locate.size.var)
4714             parm_align = BITS_PER_UNIT;
4715           else if (excess)
4716             {
4717               unsigned int excess_align = (excess & -excess) * BITS_PER_UNIT;
4718               parm_align = MIN (parm_align, excess_align);
4719             }
4720         }
4721
4722       if ((flags & ECF_SIBCALL) && GET_CODE (arg->value) == MEM)
4723         {
4724           /* emit_push_insn might not work properly if arg->value and
4725              argblock + arg->locate.offset areas overlap.  */
4726           rtx x = arg->value;
4727           int i = 0;
4728
4729           if (XEXP (x, 0) == current_function_internal_arg_pointer
4730               || (GET_CODE (XEXP (x, 0)) == PLUS
4731                   && XEXP (XEXP (x, 0), 0) ==
4732                      current_function_internal_arg_pointer
4733                   && GET_CODE (XEXP (XEXP (x, 0), 1)) == CONST_INT))
4734             {
4735               if (XEXP (x, 0) != current_function_internal_arg_pointer)
4736                 i = INTVAL (XEXP (XEXP (x, 0), 1));
4737
4738               /* expand_call should ensure this.  */
4739               if (arg->locate.offset.var || GET_CODE (size_rtx) != CONST_INT)
4740                 abort ();
4741
4742               if (arg->locate.offset.constant > i)
4743                 {
4744                   if (arg->locate.offset.constant < i + INTVAL (size_rtx))
4745                     sibcall_failure = 1;
4746                 }
4747               else if (arg->locate.offset.constant < i)
4748                 {
4749                   if (i < arg->locate.offset.constant + INTVAL (size_rtx))
4750                     sibcall_failure = 1;
4751                 }
4752             }
4753         }
4754
4755       emit_push_insn (arg->value, arg->mode, TREE_TYPE (pval), size_rtx,
4756                       parm_align, partial, reg, excess, argblock,
4757                       ARGS_SIZE_RTX (arg->locate.offset), reg_parm_stack_space,
4758                       ARGS_SIZE_RTX (arg->locate.alignment_pad));
4759
4760       /* Unless this is a partially-in-register argument, the argument is now
4761          in the stack.
4762
4763          ??? Unlike the case above, in which we want the actual
4764          address of the data, so that we can load it directly into a
4765          register, here we want the address of the stack slot, so that
4766          it's properly aligned for word-by-word copying or something
4767          like that.  It's not clear that this is always correct.  */
4768       if (partial == 0)
4769         arg->value = arg->stack_slot;
4770     }
4771
4772   /* Mark all slots this store used.  */
4773   if (ACCUMULATE_OUTGOING_ARGS && !(flags & ECF_SIBCALL)
4774       && argblock && ! variable_size && arg->stack)
4775     for (i = lower_bound; i < upper_bound; i++)
4776       stack_usage_map[i] = 1;
4777
4778   /* Once we have pushed something, pops can't safely
4779      be deferred during the rest of the arguments.  */
4780   NO_DEFER_POP;
4781
4782   /* ANSI doesn't require a sequence point here,
4783      but PCC has one, so this will avoid some problems.  */
4784   emit_queue ();
4785
4786   /* Free any temporary slots made in processing this argument.  Show
4787      that we might have taken the address of something and pushed that
4788      as an operand.  */
4789   preserve_temp_slots (NULL_RTX);
4790   free_temp_slots ();
4791   pop_temp_slots ();
4792
4793   return sibcall_failure;
4794 }
4795
4796 /* Nonzero if we do not know how to pass TYPE solely in registers.
4797    We cannot do so in the following cases:
4798
4799    - if the type has variable size
4800    - if the type is marked as addressable (it is required to be constructed
4801      into the stack)
4802    - if the padding and mode of the type is such that a copy into a register
4803      would put it into the wrong part of the register.
4804
4805    Which padding can't be supported depends on the byte endianness.
4806
4807    A value in a register is implicitly padded at the most significant end.
4808    On a big-endian machine, that is the lower end in memory.
4809    So a value padded in memory at the upper end can't go in a register.
4810    For a little-endian machine, the reverse is true.  */
4811
4812 bool
4813 default_must_pass_in_stack (enum machine_mode mode, tree type)
4814 {
4815   if (!type)
4816     return false;
4817
4818   /* If the type has variable size...  */
4819   if (TREE_CODE (TYPE_SIZE (type)) != INTEGER_CST)
4820     return true;
4821
4822   /* If the type is marked as addressable (it is required
4823      to be constructed into the stack)...  */
4824   if (TREE_ADDRESSABLE (type))
4825     return true;
4826
4827   /* If the padding and mode of the type is such that a copy into
4828      a register would put it into the wrong part of the register.  */
4829   if (mode == BLKmode
4830       && int_size_in_bytes (type) % (PARM_BOUNDARY / BITS_PER_UNIT)
4831       && (FUNCTION_ARG_PADDING (mode, type)
4832           == (BYTES_BIG_ENDIAN ? upward : downward)))
4833     return true;
4834
4835   return false;
4836 }