sort: Replace GNU sort with NetBSD sort
[dragonfly.git] / gnu / usr.bin / sort / getopt.c
1 /* Getopt for GNU.
2    NOTE: getopt is now part of the C library, so if you don't know what
3    "Keep this file name-space clean" means, talk to roland@gnu.ai.mit.edu
4    before changing it!
5
6    Copyright (C) 1987, 88, 89, 90, 91, 92, 93, 94, 95
7         Free Software Foundation, Inc.
8
9    This program is free software; you can redistribute it and/or modify it
10    under the terms of the GNU General Public License as published by the
11    Free Software Foundation; either version 2, or (at your option) any
12    later version.
13
14    This program is distributed in the hope that it will be useful,
15    but WITHOUT ANY WARRANTY; without even the implied warranty of
16    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17    GNU General Public License for more details.
18
19    You should have received a copy of the GNU General Public License
20    along with this program; if not, write to the Free Software
21    Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.  */
22 \f
23 /* This tells Alpha OSF/1 not to define a getopt prototype in <stdio.h>.
24    Ditto for AIX 3.2 and <stdlib.h>.  */
25 #ifndef _NO_PROTO
26 #define _NO_PROTO
27 #endif
28
29 #ifdef HAVE_CONFIG_H
30 #include <config.h>
31 #endif
32
33 #if !defined (__STDC__) || !__STDC__
34 /* This is a separate conditional since some stdc systems
35    reject `defined (const)'.  */
36 #ifndef const
37 #define const
38 #endif
39 #endif
40
41 #include <stdio.h>
42 #include <string.h>
43
44 /* Comment out all this code if we are using the GNU C Library, and are not
45    actually compiling the library itself.  This code is part of the GNU C
46    Library, but also included in many other GNU distributions.  Compiling
47    and linking in this code is a waste when using the GNU C library
48    (especially if it is a shared library).  Rather than having every GNU
49    program understand `configure --with-gnu-libc' and omit the object files,
50    it is simpler to just do this in the source for each such file.  */
51
52 #if defined (_LIBC) || !defined (__GNU_LIBRARY__)
53
54
55 /* This needs to come after some library #include
56    to get __GNU_LIBRARY__ defined.  */
57 #ifdef  __GNU_LIBRARY__
58 /* Don't include stdlib.h for non-GNU C libraries because some of them
59    contain conflicting prototypes for getopt.  */
60 #include <stdlib.h>
61 #endif  /* GNU C library.  */
62
63 #ifndef _
64 /* This is for other GNU distributions with internationalized messages.
65    When compiling libc, the _ macro is predefined.  */
66 #ifdef HAVE_LIBINTL_H
67 # include <libintl.h>
68 # define _(msgid)       gettext (msgid)
69 #else
70 # define _(msgid)       (msgid)
71 #endif
72 #endif
73
74 /* This version of `getopt' appears to the caller like standard Unix `getopt'
75    but it behaves differently for the user, since it allows the user
76    to intersperse the options with the other arguments.
77
78    As `getopt' works, it permutes the elements of ARGV so that,
79    when it is done, all the options precede everything else.  Thus
80    all application programs are extended to handle flexible argument order.
81
82    Setting the environment variable POSIXLY_CORRECT disables permutation.
83    Then the behavior is completely standard.
84
85    GNU application programs can use a third alternative mode in which
86    they can distinguish the relative order of options and other arguments.  */
87
88 #include "getopt.h"
89
90 /* For communication from `getopt' to the caller.
91    When `getopt' finds an option that takes an argument,
92    the argument value is returned here.
93    Also, when `ordering' is RETURN_IN_ORDER,
94    each non-option ARGV-element is returned here.  */
95
96 char *optarg = NULL;
97
98 /* Index in ARGV of the next element to be scanned.
99    This is used for communication to and from the caller
100    and for communication between successive calls to `getopt'.
101
102    On entry to `getopt', zero means this is the first call; initialize.
103
104    When `getopt' returns EOF, this is the index of the first of the
105    non-option elements that the caller should itself scan.
106
107    Otherwise, `optind' communicates from one call to the next
108    how much of ARGV has been scanned so far.  */
109
110 /* XXX 1003.2 says this must be 1 before any call.  */
111 int optind = 0;
112
113 /* The next char to be scanned in the option-element
114    in which the last option character we returned was found.
115    This allows us to pick up the scan where we left off.
116
117    If this is zero, or a null string, it means resume the scan
118    by advancing to the next ARGV-element.  */
119
120 static char *nextchar;
121
122 /* Callers store zero here to inhibit the error message
123    for unrecognized options.  */
124
125 int opterr = 1;
126
127 /* Set to an option character which was unrecognized.
128    This must be initialized on some systems to avoid linking in the
129    system's own getopt implementation.  */
130
131 int optopt = '?';
132
133 /* Describe how to deal with options that follow non-option ARGV-elements.
134
135    If the caller did not specify anything,
136    the default is REQUIRE_ORDER if the environment variable
137    POSIXLY_CORRECT is defined, PERMUTE otherwise.
138
139    REQUIRE_ORDER means don't recognize them as options;
140    stop option processing when the first non-option is seen.
141    This is what Unix does.
142    This mode of operation is selected by either setting the environment
143    variable POSIXLY_CORRECT, or using `+' as the first character
144    of the list of option characters.
145
146    PERMUTE is the default.  We permute the contents of ARGV as we scan,
147    so that eventually all the non-options are at the end.  This allows options
148    to be given in any order, even with programs that were not written to
149    expect this.
150
151    RETURN_IN_ORDER is an option available to programs that were written
152    to expect options and other ARGV-elements in any order and that care about
153    the ordering of the two.  We describe each non-option ARGV-element
154    as if it were the argument of an option with character code 1.
155    Using `-' as the first character of the list of option characters
156    selects this mode of operation.
157
158    The special argument `--' forces an end of option-scanning regardless
159    of the value of `ordering'.  In the case of RETURN_IN_ORDER, only
160    `--' can cause `getopt' to return EOF with `optind' != ARGC.  */
161
162 static enum
163 {
164   REQUIRE_ORDER, PERMUTE, RETURN_IN_ORDER
165 } ordering;
166
167 /* Value of POSIXLY_CORRECT environment variable.  */
168 static char *posixly_correct;
169 \f
170 #ifdef  __GNU_LIBRARY__
171 /* We want to avoid inclusion of string.h with non-GNU libraries
172    because there are many ways it can cause trouble.
173    On some systems, it contains special magic macros that don't work
174    in GCC.  */
175 #include <string.h>
176 #define my_index        strchr
177 #else
178
179 /* Avoid depending on library functions or files
180    whose names are inconsistent.  */
181
182 char *getenv ();
183
184 static char *
185 my_index (str, chr)
186      const char *str;
187      int chr;
188 {
189   while (*str)
190     {
191       if (*str == chr)
192         return (char *) str;
193       str++;
194     }
195   return 0;
196 }
197
198 /* If using GCC, we can safely declare strlen this way.
199    If not using GCC, it is ok not to declare it.  */
200 #ifdef __GNUC__
201 /* Note that Motorola Delta 68k R3V7 comes with GCC but not stddef.h.
202    That was relevant to code that was here before.  */
203 #if !defined (__STDC__) || !__STDC__
204 /* gcc with -traditional declares the built-in strlen to return int,
205    and has done so at least since version 2.4.5. -- rms.  */
206 extern int strlen (const char *);
207 #endif /* not __STDC__ */
208 #endif /* __GNUC__ */
209
210 #endif /* not __GNU_LIBRARY__ */
211 \f
212 /* Handle permutation of arguments.  */
213
214 /* Describe the part of ARGV that contains non-options that have
215    been skipped.  `first_nonopt' is the index in ARGV of the first of them;
216    `last_nonopt' is the index after the last of them.  */
217
218 static int first_nonopt;
219 static int last_nonopt;
220
221 /* Exchange two adjacent subsequences of ARGV.
222    One subsequence is elements [first_nonopt,last_nonopt)
223    which contains all the non-options that have been skipped so far.
224    The other is elements [last_nonopt,optind), which contains all
225    the options processed since those non-options were skipped.
226
227    `first_nonopt' and `last_nonopt' are relocated so that they describe
228    the new indices of the non-options in ARGV after they are moved.  */
229
230 static void
231 exchange (argv)
232      char **argv;
233 {
234   int bottom = first_nonopt;
235   int middle = last_nonopt;
236   int top = optind;
237   char *tem;
238
239   /* Exchange the shorter segment with the far end of the longer segment.
240      That puts the shorter segment into the right place.
241      It leaves the longer segment in the right place overall,
242      but it consists of two parts that need to be swapped next.  */
243
244   while (top > middle && middle > bottom)
245     {
246       if (top - middle > middle - bottom)
247         {
248           /* Bottom segment is the short one.  */
249           int len = middle - bottom;
250           register int i;
251
252           /* Swap it with the top part of the top segment.  */
253           for (i = 0; i < len; i++)
254             {
255               tem = argv[bottom + i];
256               argv[bottom + i] = argv[top - (middle - bottom) + i];
257               argv[top - (middle - bottom) + i] = tem;
258             }
259           /* Exclude the moved bottom segment from further swapping.  */
260           top -= len;
261         }
262       else
263         {
264           /* Top segment is the short one.  */
265           int len = top - middle;
266           register int i;
267
268           /* Swap it with the bottom part of the bottom segment.  */
269           for (i = 0; i < len; i++)
270             {
271               tem = argv[bottom + i];
272               argv[bottom + i] = argv[middle + i];
273               argv[middle + i] = tem;
274             }
275           /* Exclude the moved top segment from further swapping.  */
276           bottom += len;
277         }
278     }
279
280   /* Update records for the slots the non-options now occupy.  */
281
282   first_nonopt += (optind - last_nonopt);
283   last_nonopt = optind;
284 }
285
286 /* Initialize the internal data when the first call is made.  */
287
288 static const char *
289 _getopt_initialize (optstring)
290      const char *optstring;
291 {
292   /* Start processing options with ARGV-element 1 (since ARGV-element 0
293      is the program name); the sequence of previously skipped
294      non-option ARGV-elements is empty.  */
295
296   first_nonopt = last_nonopt = optind = 1;
297
298   nextchar = NULL;
299
300   posixly_correct = getenv ("POSIXLY_CORRECT");
301
302   /* Determine how to handle the ordering of options and nonoptions.  */
303
304   if (optstring[0] == '-')
305     {
306       ordering = RETURN_IN_ORDER;
307       ++optstring;
308     }
309   else if (optstring[0] == '+')
310     {
311       ordering = REQUIRE_ORDER;
312       ++optstring;
313     }
314   else if (posixly_correct != NULL)
315     ordering = REQUIRE_ORDER;
316   else
317     ordering = PERMUTE;
318
319   return optstring;
320 }
321 \f
322 /* Scan elements of ARGV (whose length is ARGC) for option characters
323    given in OPTSTRING.
324
325    If an element of ARGV starts with '-', and is not exactly "-" or "--",
326    then it is an option element.  The characters of this element
327    (aside from the initial '-') are option characters.  If `getopt'
328    is called repeatedly, it returns successively each of the option characters
329    from each of the option elements.
330
331    If `getopt' finds another option character, it returns that character,
332    updating `optind' and `nextchar' so that the next call to `getopt' can
333    resume the scan with the following option character or ARGV-element.
334
335    If there are no more option characters, `getopt' returns `EOF'.
336    Then `optind' is the index in ARGV of the first ARGV-element
337    that is not an option.  (The ARGV-elements have been permuted
338    so that those that are not options now come last.)
339
340    OPTSTRING is a string containing the legitimate option characters.
341    If an option character is seen that is not listed in OPTSTRING,
342    return '?' after printing an error message.  If you set `opterr' to
343    zero, the error message is suppressed but we still return '?'.
344
345    If a char in OPTSTRING is followed by a colon, that means it wants an arg,
346    so the following text in the same ARGV-element, or the text of the following
347    ARGV-element, is returned in `optarg'.  Two colons mean an option that
348    wants an optional arg; if there is text in the current ARGV-element,
349    it is returned in `optarg', otherwise `optarg' is set to zero.
350
351    If OPTSTRING starts with `-' or `+', it requests different methods of
352    handling the non-option ARGV-elements.
353    See the comments about RETURN_IN_ORDER and REQUIRE_ORDER, above.
354
355    Long-named options begin with `--' instead of `-'.
356    Their names may be abbreviated as long as the abbreviation is unique
357    or is an exact match for some defined option.  If they have an
358    argument, it follows the option name in the same ARGV-element, separated
359    from the option name by a `=', or else the in next ARGV-element.
360    When `getopt' finds a long-named option, it returns 0 if that option's
361    `flag' field is nonzero, the value of the option's `val' field
362    if the `flag' field is zero.
363
364    The elements of ARGV aren't really const, because we permute them.
365    But we pretend they're const in the prototype to be compatible
366    with other systems.
367
368    LONGOPTS is a vector of `struct option' terminated by an
369    element containing a name which is zero.
370
371    LONGIND returns the index in LONGOPT of the long-named option found.
372    It is only valid when a long-named option has been found by the most
373    recent call.
374
375    If LONG_ONLY is nonzero, '-' as well as '--' can introduce
376    long-named options.  */
377
378 int
379 _getopt_internal (argc, argv, optstring, longopts, longind, long_only)
380      int argc;
381      char *const *argv;
382      const char *optstring;
383      const struct option *longopts;
384      int *longind;
385      int long_only;
386 {
387   optarg = NULL;
388
389   if (optind == 0)
390     {
391       optstring = _getopt_initialize (optstring);
392       optind = 1;               /* Don't scan ARGV[0], the program name.  */
393     }
394
395   if (nextchar == NULL || *nextchar == '\0')
396     {
397       /* Advance to the next ARGV-element.  */
398
399       if (ordering == PERMUTE)
400         {
401           /* If we have just processed some options following some non-options,
402              exchange them so that the options come first.  */
403
404           if (first_nonopt != last_nonopt && last_nonopt != optind)
405             exchange ((char **) argv);
406           else if (last_nonopt != optind)
407             first_nonopt = optind;
408
409           /* Skip any additional non-options
410              and extend the range of non-options previously skipped.  */
411
412           while (optind < argc
413                  && (argv[optind][0] != '-' || argv[optind][1] == '\0'))
414             optind++;
415           last_nonopt = optind;
416         }
417
418       /* The special ARGV-element `--' means premature end of options.
419          Skip it like a null option,
420          then exchange with previous non-options as if it were an option,
421          then skip everything else like a non-option.  */
422
423       if (optind != argc && !strcmp (argv[optind], "--"))
424         {
425           optind++;
426
427           if (first_nonopt != last_nonopt && last_nonopt != optind)
428             exchange ((char **) argv);
429           else if (first_nonopt == last_nonopt)
430             first_nonopt = optind;
431           last_nonopt = argc;
432
433           optind = argc;
434         }
435
436       /* If we have done all the ARGV-elements, stop the scan
437          and back over any non-options that we skipped and permuted.  */
438
439       if (optind == argc)
440         {
441           /* Set the next-arg-index to point at the non-options
442              that we previously skipped, so the caller will digest them.  */
443           if (first_nonopt != last_nonopt)
444             optind = first_nonopt;
445           return EOF;
446         }
447
448       /* If we have come to a non-option and did not permute it,
449          either stop the scan or describe it to the caller and pass it by.  */
450
451       if ((argv[optind][0] != '-' || argv[optind][1] == '\0'))
452         {
453           if (ordering == REQUIRE_ORDER)
454             return EOF;
455           optarg = argv[optind++];
456           return 1;
457         }
458
459       /* We have found another option-ARGV-element.
460          Skip the initial punctuation.  */
461
462       nextchar = (argv[optind] + 1
463                   + (longopts != NULL && argv[optind][1] == '-'));
464     }
465
466   /* Decode the current option-ARGV-element.  */
467
468   /* Check whether the ARGV-element is a long option.
469
470      If long_only and the ARGV-element has the form "-f", where f is
471      a valid short option, don't consider it an abbreviated form of
472      a long option that starts with f.  Otherwise there would be no
473      way to give the -f short option.
474
475      On the other hand, if there's a long option "fubar" and
476      the ARGV-element is "-fu", do consider that an abbreviation of
477      the long option, just like "--fu", and not "-f" with arg "u".
478
479      This distinction seems to be the most useful approach.  */
480
481   if (longopts != NULL
482       && (argv[optind][1] == '-'
483           || (long_only && (argv[optind][2]
484                             || !my_index (optstring, argv[optind][1])))))
485     {
486       char *nameend;
487       const struct option *p;
488       const struct option *pfound = NULL;
489       int exact = 0;
490       int ambig = 0;
491       int indfound;
492       int option_index;
493
494       for (nameend = nextchar; *nameend && *nameend != '='; nameend++)
495         /* Do nothing.  */ ;
496
497 #ifdef lint
498       indfound = 0;  /* Avoid spurious compiler warning.  */
499 #endif
500
501       /* Test all long options for either exact match
502          or abbreviated matches.  */
503       for (p = longopts, option_index = 0; p->name; p++, option_index++)
504         if (!strncmp (p->name, nextchar, nameend - nextchar))
505           {
506             if (nameend - nextchar == strlen (p->name))
507               {
508                 /* Exact match found.  */
509                 pfound = p;
510                 indfound = option_index;
511                 exact = 1;
512                 break;
513               }
514             else if (pfound == NULL)
515               {
516                 /* First nonexact match found.  */
517                 pfound = p;
518                 indfound = option_index;
519               }
520             else
521               /* Second or later nonexact match found.  */
522               ambig = 1;
523           }
524
525       if (ambig && !exact)
526         {
527           if (opterr)
528             fprintf (stderr, _("%s: option `%s' is ambiguous\n"),
529                      argv[0], argv[optind]);
530           nextchar += strlen (nextchar);
531           optind++;
532           return '?';
533         }
534
535       if (pfound != NULL)
536         {
537           option_index = indfound;
538           optind++;
539           if (*nameend)
540             {
541               /* Don't test has_arg with >, because some C compilers don't
542                  allow it to be used on enums.  */
543               if (pfound->has_arg)
544                 optarg = nameend + 1;
545               else
546                 {
547                   if (opterr) {
548                    if (argv[optind - 1][1] == '-')
549                     /* --option */
550                     fprintf (stderr,
551                      _("%s: option `--%s' doesn't allow an argument\n"),
552                      argv[0], pfound->name);
553                    else
554                     /* +option or -option */
555                     fprintf (stderr,
556                      _("%s: option `%c%s' doesn't allow an argument\n"),
557                      argv[0], argv[optind - 1][0], pfound->name);
558                   }
559                   nextchar += strlen (nextchar);
560                   return '?';
561                 }
562             }
563           else if (pfound->has_arg == 1)
564             {
565               if (optind < argc)
566                 optarg = argv[optind++];
567               else
568                 {
569                   if (opterr)
570                     fprintf (stderr,
571                            _("%s: option `%s' requires an argument\n"),
572                            argv[0], argv[optind - 1]);
573                   nextchar += strlen (nextchar);
574                   return optstring[0] == ':' ? ':' : '?';
575                 }
576             }
577           nextchar += strlen (nextchar);
578           if (longind != NULL)
579             *longind = option_index;
580           if (pfound->flag)
581             {
582               *(pfound->flag) = pfound->val;
583               return 0;
584             }
585           return pfound->val;
586         }
587
588       /* Can't find it as a long option.  If this is not getopt_long_only,
589          or the option starts with '--' or is not a valid short
590          option, then it's an error.
591          Otherwise interpret it as a short option.  */
592       if (!long_only || argv[optind][1] == '-'
593           || my_index (optstring, *nextchar) == NULL)
594         {
595           if (opterr)
596             {
597               if (argv[optind][1] == '-')
598                 /* --option */
599                 fprintf (stderr, _("%s: unrecognized option `--%s'\n"),
600                          argv[0], nextchar);
601               else
602                 /* +option or -option */
603                 fprintf (stderr, _("%s: unrecognized option `%c%s'\n"),
604                          argv[0], argv[optind][0], nextchar);
605             }
606           nextchar = (char *) "";
607           optind++;
608           return '?';
609         }
610     }
611
612   /* Look at and handle the next short option-character.  */
613
614   {
615     char c = *nextchar++;
616     char *temp = my_index (optstring, c);
617
618     /* Increment `optind' when we start to process its last character.  */
619     if (*nextchar == '\0')
620       ++optind;
621
622     if (temp == NULL || c == ':')
623       {
624         if (opterr)
625           {
626             if (posixly_correct)
627               /* 1003.2 specifies the format of this message.  */
628               fprintf (stderr, _("%s: illegal option -- %c\n"),
629                        argv[0], c);
630             else
631               fprintf (stderr, _("%s: invalid option -- %c\n"),
632                        argv[0], c);
633           }
634         optopt = c;
635         return '?';
636       }
637     if (temp[1] == ':')
638       {
639         if (temp[2] == ':')
640           {
641             /* This is an option that accepts an argument optionally.  */
642             if (*nextchar != '\0')
643               {
644                 optarg = nextchar;
645                 optind++;
646               }
647             else
648               optarg = NULL;
649             nextchar = NULL;
650           }
651         else
652           {
653             /* This is an option that requires an argument.  */
654             if (*nextchar != '\0')
655               {
656                 optarg = nextchar;
657                 /* If we end this ARGV-element by taking the rest as an arg,
658                    we must advance to the next element now.  */
659                 optind++;
660               }
661             else if (optind == argc)
662               {
663                 if (opterr)
664                   {
665                     /* 1003.2 specifies the format of this message.  */
666                     fprintf (stderr,
667                            _("%s: option requires an argument -- %c\n"),
668                            argv[0], c);
669                   }
670                 optopt = c;
671                 if (optstring[0] == ':')
672                   c = ':';
673                 else
674                   c = '?';
675               }
676             else
677               /* We already incremented `optind' once;
678                  increment it again when taking next ARGV-elt as argument.  */
679               optarg = argv[optind++];
680             nextchar = NULL;
681           }
682       }
683     return c;
684   }
685 }
686
687 int
688 getopt (argc, argv, optstring)
689      int argc;
690      char *const *argv;
691      const char *optstring;
692 {
693   return _getopt_internal (argc, argv, optstring,
694                            (const struct option *) 0,
695                            (int *) 0,
696                            0);
697 }
698
699 #endif  /* _LIBC or not __GNU_LIBRARY__.  */
700 \f
701 #ifdef TEST
702
703 /* Compile with -DTEST to make an executable for use in testing
704    the above definition of `getopt'.  */
705
706 int
707 main (argc, argv)
708      int argc;
709      char **argv;
710 {
711   int c;
712   int digit_optind = 0;
713
714   while (1)
715     {
716       int this_option_optind = optind ? optind : 1;
717
718       c = getopt (argc, argv, "abc:d:0123456789");
719       if (c == EOF)
720         break;
721
722       switch (c)
723         {
724         case '0':
725         case '1':
726         case '2':
727         case '3':
728         case '4':
729         case '5':
730         case '6':
731         case '7':
732         case '8':
733         case '9':
734           if (digit_optind != 0 && digit_optind != this_option_optind)
735             printf ("digits occur in two different argv-elements.\n");
736           digit_optind = this_option_optind;
737           printf ("option %c\n", c);
738           break;
739
740         case 'a':
741           printf ("option a\n");
742           break;
743
744         case 'b':
745           printf ("option b\n");
746           break;
747
748         case 'c':
749           printf ("option c with value `%s'\n", optarg);
750           break;
751
752         case '?':
753           break;
754
755         default:
756           printf ("?? getopt returned character code 0%o ??\n", c);
757         }
758     }
759
760   if (optind < argc)
761     {
762       printf ("non-option ARGV-elements: ");
763       while (optind < argc)
764         printf ("%s ", argv[optind++]);
765       printf ("\n");
766     }
767
768   exit (0);
769 }
770
771 #endif /* TEST */