Upgrade awk(1). 1/2
[dragonfly.git] / lib / libc / stdio / printf.3
1 .\" Copyright (c) 1990, 1991, 1993
2 .\"     The Regents of the University of California.  All rights reserved.
3 .\"
4 .\" This code is derived from software contributed to Berkeley by
5 .\" Chris Torek and the American National Standards Committee X3,
6 .\" on Information Processing Systems.
7 .\"
8 .\" Redistribution and use in source and binary forms, with or without
9 .\" modification, are permitted provided that the following conditions
10 .\" are met:
11 .\" 1. Redistributions of source code must retain the above copyright
12 .\"    notice, this list of conditions and the following disclaimer.
13 .\" 2. Redistributions in binary form must reproduce the above copyright
14 .\"    notice, this list of conditions and the following disclaimer in the
15 .\"    documentation and/or other materials provided with the distribution.
16 .\" 3. Neither the name of the University nor the names of its contributors
17 .\"    may be used to endorse or promote products derived from this software
18 .\"    without specific prior written permission.
19 .\"
20 .\" THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
21 .\" ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
22 .\" IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
23 .\" ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
24 .\" FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
25 .\" DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
26 .\" OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
27 .\" HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
28 .\" LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
29 .\" OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
30 .\" SUCH DAMAGE.
31 .\"
32 .\"     @(#)printf.3    8.1 (Berkeley) 6/4/93
33 .\" $FreeBSD: head/lib/libc/stdio/printf.3 303524 2016-07-30 01:00:16Z bapt $
34 .\"
35 .Dd August 31, 2016
36 .Dt PRINTF 3
37 .Os
38 .Sh NAME
39 .Nm printf ,
40 .Nm fprintf ,
41 .Nm sprintf ,
42 .Nm snprintf ,
43 .Nm asprintf ,
44 .Nm dprintf ,
45 .Nm vprintf ,
46 .Nm vfprintf ,
47 .Nm vsprintf ,
48 .Nm vsnprintf ,
49 .Nm vasprintf ,
50 .Nm vdprintf
51 .Nd formatted output conversion
52 .Sh LIBRARY
53 .Lb libc
54 .Sh SYNOPSIS
55 .In stdio.h
56 .Ft int
57 .Fn printf "const char * restrict format" ...
58 .Ft int
59 .Fn fprintf "FILE * restrict stream" "const char * restrict format" ...
60 .Ft int
61 .Fn sprintf "char * restrict str" "const char * restrict format" ...
62 .Ft int
63 .Fn snprintf "char * restrict str" "size_t size" "const char * restrict format" ...
64 .Ft int
65 .Fn asprintf "char **ret" "const char *format" ...
66 .Ft int
67 .Fn dprintf "int" "const char * restrict format" ...
68 .In stdarg.h
69 .Ft int
70 .Fn vprintf "const char * restrict format" "va_list ap"
71 .Ft int
72 .Fn vfprintf "FILE * restrict stream" "const char * restrict format" "va_list ap"
73 .Ft int
74 .Fn vsprintf "char * restrict str" "const char * restrict format" "va_list ap"
75 .Ft int
76 .Fn vsnprintf "char * restrict str" "size_t size" "const char * restrict format" "va_list ap"
77 .Ft int
78 .Fn vasprintf "char **ret" "const char *format" "va_list ap"
79 .Ft int
80 .Fn vdprintf "int fd" "const char * restrict format" "va_list ap"
81 .Sh DESCRIPTION
82 The
83 .Fn printf
84 family of functions produces output according to a
85 .Fa format
86 as described below.
87 The
88 .Fn printf
89 and
90 .Fn vprintf
91 functions
92 write output to
93 .Dv stdout ,
94 the standard output stream;
95 .Fn fprintf
96 and
97 .Fn vfprintf
98 write output to the given output
99 .Fa stream ;
100 .Fn dprintf
101 and
102 .Fn vdprintf
103 write output to the given file descriptor;
104 .Fn sprintf ,
105 .Fn snprintf ,
106 .Fn vsprintf ,
107 and
108 .Fn vsnprintf
109 write to the character string
110 .Fa str ;
111 and
112 .Fn asprintf
113 and
114 .Fn vasprintf
115 dynamically allocate a new string with
116 .Xr malloc 3 .
117 .Pp
118 These functions write the output under the control of a
119 .Fa format
120 string that specifies how subsequent arguments
121 (or arguments accessed via the variable-length argument facilities of
122 .Xr stdarg 3 )
123 are converted for output.
124 .Pp
125 The
126 .Fn asprintf
127 and
128 .Fn vasprintf
129 functions
130 set
131 .Fa *ret
132 to be a pointer to a buffer sufficiently large to hold the formatted string.
133 This pointer should be passed to
134 .Xr free 3
135 to release the allocated storage when it is no longer needed.
136 If sufficient space cannot be allocated,
137 .Fn asprintf
138 and
139 .Fn vasprintf
140 will return \-1 and set
141 .Fa ret
142 to be a
143 .Dv NULL
144 pointer.
145 .Pp
146 The
147 .Fn snprintf
148 and
149 .Fn vsnprintf
150 functions
151 will write at most
152 .Fa size Ns \-1
153 of the characters printed into the output string
154 (the
155 .Fa size Ns 'th
156 character then gets the terminating
157 .Ql \e0 ) ;
158 if the return value is greater than or equal to the
159 .Fa size
160 argument, the string was too short
161 and some of the printed characters were discarded.
162 The output is always null-terminated, unless
163 .Fa size
164 is 0.
165 .Pp
166 The
167 .Fn sprintf
168 and
169 .Fn vsprintf
170 functions
171 effectively assume a
172 .Fa size
173 of
174 .Dv INT_MAX
175 + 1.
176 .Pp
177 The format string is composed of zero or more directives:
178 ordinary
179 .\" multibyte
180 characters (not
181 .Cm % ) ,
182 which are copied unchanged to the output stream;
183 and conversion specifications, each of which results
184 in fetching zero or more subsequent arguments.
185 Each conversion specification is introduced by
186 the
187 .Cm %
188 character.
189 The arguments must correspond properly (after type promotion)
190 with the conversion specifier.
191 After the
192 .Cm % ,
193 the following appear in sequence:
194 .Bl -bullet
195 .It
196 An optional field, consisting of a decimal digit string followed by a
197 .Cm $ ,
198 specifying the next argument to access.
199 If this field is not provided, the argument following the last
200 argument accessed will be used.
201 Arguments are numbered starting at
202 .Cm 1 .
203 If unaccessed arguments in the format string are interspersed with ones that
204 are accessed the results will be indeterminate.
205 .It
206 Zero or more of the following flags:
207 .Bl -tag -width ".So \  Sc (space)"
208 .It Sq Cm #
209 The value should be converted to an
210 .Dq alternate form .
211 For
212 .Cm c , d , i , n , p , s ,
213 and
214 .Cm u
215 conversions, this option has no effect.
216 For
217 .Cm o
218 conversions, the precision of the number is increased to force the first
219 character of the output string to a zero.
220 For
221 .Cm x
222 and
223 .Cm X
224 conversions, a non-zero result has the string
225 .Ql 0x
226 (or
227 .Ql 0X
228 for
229 .Cm X
230 conversions) prepended to it.
231 For
232 .Cm a , A , e , E , f , F , g ,
233 and
234 .Cm G
235 conversions, the result will always contain a decimal point, even if no
236 digits follow it (normally, a decimal point appears in the results of
237 those conversions only if a digit follows).
238 For
239 .Cm g
240 and
241 .Cm G
242 conversions, trailing zeros are not removed from the result as they
243 would otherwise be.
244 .It So Cm 0 Sc (zero)
245 Zero padding.
246 For all conversions except
247 .Cm n ,
248 the converted value is padded on the left with zeros rather than blanks.
249 If a precision is given with a numeric conversion
250 .Cm ( d , i , o , u , i , x ,
251 and
252 .Cm X ) ,
253 the
254 .Cm 0
255 flag is ignored.
256 .It Sq Cm \-
257 A negative field width flag;
258 the converted value is to be left adjusted on the field boundary.
259 Except for
260 .Cm n
261 conversions, the converted value is padded on the right with blanks,
262 rather than on the left with blanks or zeros.
263 A
264 .Cm \-
265 overrides a
266 .Cm 0
267 if both are given.
268 .It So "\ " Sc (space)
269 A blank should be left before a positive number
270 produced by a signed conversion
271 .Cm ( a , A , d , e , E , f , F , g , G ,
272 or
273 .Cm i ) .
274 .It Sq Cm +
275 A sign must always be placed before a
276 number produced by a signed conversion.
277 A
278 .Cm +
279 overrides a space if both are used.
280 .It So "'" Sc (apostrophe)
281 Decimal conversions
282 .Cm ( d , u ,
283 or
284 .Cm i )
285 or the integral portion of a floating point conversion
286 .Cm ( f
287 or
288 .Cm F )
289 should be grouped and separated by thousands using
290 the non-monetary separator returned by
291 .Xr localeconv 3 .
292 .El
293 .It
294 An optional decimal digit string specifying a minimum field width.
295 If the converted value has fewer characters than the field width, it will
296 be padded with spaces on the left (or right, if the left-adjustment
297 flag has been given) to fill out
298 the field width.
299 .It
300 An optional precision, in the form of a period
301 .Cm \&.
302 followed by an
303 optional digit string.
304 If the digit string is omitted, the precision is taken as zero.
305 This gives the minimum number of digits to appear for
306 .Cm d , i , o , u , x ,
307 and
308 .Cm X
309 conversions, the number of digits to appear after the decimal-point for
310 .Cm a , A , e , E , f ,
311 and
312 .Cm F
313 conversions, the maximum number of significant digits for
314 .Cm g
315 and
316 .Cm G
317 conversions, or the maximum number of characters to be printed from a
318 string for
319 .Cm s
320 conversions.
321 .It
322 An optional length modifier, that specifies the size of the argument.
323 The following length modifiers are valid for the
324 .Cm d , i , n , o , u , x ,
325 or
326 .Cm X
327 conversion:
328 .Bl -column ".Cm q Em (deprecated)" ".Vt signed char" ".Vt unsigned long long" ".Vt long long *"
329 .It Sy Modifier Ta Cm d , i Ta Cm o , u , x , X Ta Cm n
330 .It Cm hh Ta Vt "signed char" Ta Vt "unsigned char" Ta Vt "signed char *"
331 .It Cm h Ta Vt short Ta Vt "unsigned short" Ta Vt "short *"
332 .It Cm l No (ell) Ta Vt long Ta Vt "unsigned long" Ta Vt "long *"
333 .It Cm ll No (ell ell) Ta Vt "long long" Ta Vt "unsigned long long" Ta Vt "long long *"
334 .It Cm j Ta Vt intmax_t Ta Vt uintmax_t Ta Vt "intmax_t *"
335 .It Cm t Ta Vt ptrdiff_t Ta (see note) Ta Vt "ptrdiff_t *"
336 .It Cm z Ta (see note) Ta Vt size_t Ta (see note)
337 .It Cm q Em (deprecated) Ta Vt quad_t Ta Vt u_quad_t Ta Vt "quad_t *"
338 .El
339 .Pp
340 Note:
341 the
342 .Cm t
343 modifier, when applied to a
344 .Cm o , u , x ,
345 or
346 .Cm X
347 conversion, indicates that the argument is of an unsigned type
348 equivalent in size to a
349 .Vt ptrdiff_t .
350 The
351 .Cm z
352 modifier, when applied to a
353 .Cm d
354 or
355 .Cm i
356 conversion, indicates that the argument is of a signed type equivalent in
357 size to a
358 .Vt size_t .
359 Similarly, when applied to an
360 .Cm n
361 conversion, it indicates that the argument is a pointer to a signed type
362 equivalent in size to a
363 .Vt size_t .
364 .Pp
365 The following length modifier is valid for the
366 .Cm a , A , e , E , f , F , g ,
367 or
368 .Cm G
369 conversion:
370 .Bl -column ".Sy Modifier" ".Cm a , A , e , E , f , F , g , G"
371 .It Sy Modifier Ta Cm a , A , e , E , f , F , g , G
372 .It Cm l No (ell) Ta Vt double
373 (ignored, same behavior as without it)
374 .It Cm L Ta Vt "long double"
375 .El
376 .Pp
377 The following length modifier is valid for the
378 .Cm c
379 or
380 .Cm s
381 conversion:
382 .Bl -column ".Sy Modifier" ".Vt wint_t" ".Vt wchar_t *"
383 .It Sy Modifier Ta Cm c Ta Cm s
384 .It Cm l No (ell) Ta Vt wint_t Ta Vt "wchar_t *"
385 .El
386 .It
387 A character that specifies the type of conversion to be applied.
388 .El
389 .Pp
390 A field width or precision, or both, may be indicated by
391 an asterisk
392 .Ql *
393 or an asterisk followed by one or more decimal digits and a
394 .Ql $
395 instead of a
396 digit string.
397 In this case, an
398 .Vt int
399 argument supplies the field width or precision.
400 A negative field width is treated as a left adjustment flag followed by a
401 positive field width; a negative precision is treated as though it were
402 missing.
403 If a single format directive mixes positional
404 .Pq Li nn$
405 and non-positional arguments, the results are undefined.
406 .Pp
407 The conversion specifiers and their meanings are:
408 .Bl -tag -width ".Cm diouxX"
409 .It Cm diouxX
410 The
411 .Vt int
412 (or appropriate variant) argument is converted to signed decimal
413 .Cm ( d
414 and
415 .Cm i ) ,
416 unsigned octal
417 .Pq Cm o ,
418 unsigned decimal
419 .Pq Cm u ,
420 or unsigned hexadecimal
421 .Cm ( x
422 and
423 .Cm X )
424 notation.
425 The letters
426 .Dq Li abcdef
427 are used for
428 .Cm x
429 conversions; the letters
430 .Dq Li ABCDEF
431 are used for
432 .Cm X
433 conversions.
434 The precision, if any, gives the minimum number of digits that must
435 appear; if the converted value requires fewer digits, it is padded on
436 the left with zeros.
437 .It Cm DOU
438 The
439 .Vt "long int"
440 argument is converted to signed decimal, unsigned octal, or unsigned
441 decimal, as if the format had been
442 .Cm ld , lo ,
443 or
444 .Cm lu
445 respectively.
446 These conversion characters are deprecated, and will eventually disappear.
447 .It Cm eE
448 The
449 .Vt double
450 argument is rounded and converted in the style
451 .Sm off
452 .Oo \- Oc Ar d Li \&. Ar ddd Li e \(+- Ar dd
453 .Sm on
454 where there is one digit before the
455 decimal-point character
456 and the number of digits after it is equal to the precision;
457 if the precision is missing,
458 it is taken as 6; if the precision is
459 zero, no decimal-point character appears.
460 An
461 .Cm E
462 conversion uses the letter
463 .Ql E
464 (rather than
465 .Ql e )
466 to introduce the exponent.
467 The exponent always contains at least two digits; if the value is zero,
468 the exponent is 00.
469 .Pp
470 For
471 .Cm a , A , e , E , f , F , g ,
472 and
473 .Cm G
474 conversions, positive and negative infinity are represented as
475 .Li inf
476 and
477 .Li -inf
478 respectively when using the lowercase conversion character, and
479 .Li INF
480 and
481 .Li -INF
482 respectively when using the uppercase conversion character.
483 Similarly, NaN is represented as
484 .Li nan
485 when using the lowercase conversion, and
486 .Li NAN
487 when using the uppercase conversion.
488 .It Cm fF
489 The
490 .Vt double
491 argument is rounded and converted to decimal notation in the style
492 .Sm off
493 .Oo \- Oc Ar ddd Li \&. Ar ddd ,
494 .Sm on
495 where the number of digits after the decimal-point character
496 is equal to the precision specification.
497 If the precision is missing, it is taken as 6; if the precision is
498 explicitly zero, no decimal-point character appears.
499 If a decimal point appears, at least one digit appears before it.
500 .It Cm gG
501 The
502 .Vt double
503 argument is converted in style
504 .Cm f
505 or
506 .Cm e
507 (or
508 .Cm F
509 or
510 .Cm E
511 for
512 .Cm G
513 conversions).
514 The precision specifies the number of significant digits.
515 If the precision is missing, 6 digits are given; if the precision is zero,
516 it is treated as 1.
517 Style
518 .Cm e
519 is used if the exponent from its conversion is less than \-4 or greater than
520 or equal to the precision.
521 Trailing zeros are removed from the fractional part of the result; a
522 decimal point appears only if it is followed by at least one digit.
523 .It Cm aA
524 The
525 .Vt double
526 argument is rounded and converted to hexadecimal notation in the style
527 .Sm off
528 .Oo \- Oc Li 0x Ar h Li \&. Ar hhhp Oo \(+- Oc Ar d ,
529 .Sm on
530 where the number of digits after the hexadecimal-point character
531 is equal to the precision specification.
532 If the precision is missing, it is taken as enough to represent
533 the floating-point number exactly, and no rounding occurs.
534 If the precision is zero, no hexadecimal-point character appears.
535 The
536 .Cm p
537 is a literal character
538 .Ql p ,
539 and the exponent consists of a positive or negative sign
540 followed by a decimal number representing an exponent of 2.
541 The
542 .Cm A
543 conversion uses the prefix
544 .Dq Li 0X
545 (rather than
546 .Dq Li 0x ) ,
547 the letters
548 .Dq Li ABCDEF
549 (rather than
550 .Dq Li abcdef )
551 to represent the hex digits, and the letter
552 .Ql P
553 (rather than
554 .Ql p )
555 to separate the mantissa and exponent.
556 .Pp
557 Note that there may be multiple valid ways to represent floating-point
558 numbers in this hexadecimal format.
559 For example,
560 .Li 0x1.92p+1 , 0x3.24p+0 , 0x6.48p-1 ,
561 and
562 .Li 0xc.9p-2
563 are all equivalent.
564 .Fx 8.0
565 and later always prints finite non-zero numbers using
566 .Ql 1
567 as the digit before the hexadecimal point.
568 Zeroes are always represented with a mantissa of 0 (preceded by a
569 .Ql -
570 if appropriate) and an exponent of
571 .Li +0 .
572 .It Cm C
573 Treated as
574 .Cm c
575 with the
576 .Cm l
577 (ell) modifier.
578 .It Cm c
579 The
580 .Vt int
581 argument is converted to an
582 .Vt "unsigned char" ,
583 and the resulting character is written.
584 .Pp
585 If the
586 .Cm l
587 (ell) modifier is used, the
588 .Vt wint_t
589 argument shall be converted to a
590 .Vt wchar_t ,
591 and the (potentially multi-byte) sequence representing the
592 single wide character is written, including any shift sequences.
593 If a shift sequence is used, the shift state is also restored
594 to the original state after the character.
595 .It Cm S
596 Treated as
597 .Cm s
598 with the
599 .Cm l
600 (ell) modifier.
601 .It Cm s
602 The
603 .Vt "char *"
604 argument is expected to be a pointer to an array of character type (pointer
605 to a string).
606 Characters from the array are written up to (but not including)
607 a terminating
608 .Dv NUL
609 character;
610 if a precision is specified, no more than the number specified are
611 written.
612 If a precision is given, no null character
613 need be present; if the precision is not specified, or is greater than
614 the size of the array, the array must contain a terminating
615 .Dv NUL
616 character.
617 .Pp
618 If the
619 .Cm l
620 (ell) modifier is used, the
621 .Vt "wchar_t *"
622 argument is expected to be a pointer to an array of wide characters
623 (pointer to a wide string).
624 For each wide character in the string, the (potentially multi-byte)
625 sequence representing the
626 wide character is written, including any shift sequences.
627 If any shift sequence is used, the shift state is also restored
628 to the original state after the string.
629 Wide characters from the array are written up to (but not including)
630 a terminating wide
631 .Dv NUL
632 character;
633 if a precision is specified, no more than the number of bytes specified are
634 written (including shift sequences).
635 Partial characters are never written.
636 If a precision is given, no null character
637 need be present; if the precision is not specified, or is greater than
638 the number of bytes required to render the multibyte representation of
639 the string, the array must contain a terminating wide
640 .Dv NUL
641 character.
642 .It Cm p
643 The
644 .Vt "void *"
645 pointer argument is printed in hexadecimal (as if by
646 .Ql %#x
647 or
648 .Ql %#lx ) .
649 .It Cm n
650 The number of characters written so far is stored into the
651 integer indicated by the
652 .Vt "int *"
653 (or variant) pointer argument.
654 No argument is converted.
655 .It Cm %
656 A
657 .Ql %
658 is written.
659 No argument is converted.
660 The complete conversion specification
661 is
662 .Ql %% .
663 .El
664 .Pp
665 The decimal point
666 character is defined in the program's locale (category
667 .Dv LC_NUMERIC ) .
668 .Pp
669 In no case does a non-existent or small field width cause truncation of
670 a numeric field; if the result of a conversion is wider than the field
671 width, the
672 field is expanded to contain the conversion result.
673 .Sh RETURN VALUES
674 These functions return the number of characters printed
675 (not including the trailing
676 .Ql \e0
677 used to end output to strings),
678 except for
679 .Fn snprintf
680 and
681 .Fn vsnprintf ,
682 which return the number of characters that would have been printed if the
683 .Fa size
684 were unlimited
685 (again, not including the final
686 .Ql \e0 ) .
687 These functions return a negative value if an error occurs.
688 .Sh EXAMPLES
689 To print a date and time in the form
690 .Dq Li "Sunday, July 3, 10:02" ,
691 where
692 .Fa weekday
693 and
694 .Fa month
695 are pointers to strings:
696 .Bd -literal -offset indent
697 #include <stdio.h>
698 fprintf(stdout, "%s, %s %d, %.2d:%.2d\en",
699         weekday, month, day, hour, min);
700 .Ed
701 .Pp
702 To print \*(Pi
703 to five decimal places:
704 .Bd -literal -offset indent
705 #include <math.h>
706 #include <stdio.h>
707 fprintf(stdout, "pi = %.5f\en", 4 * atan(1.0));
708 .Ed
709 .Pp
710 To allocate a 128 byte string and print into it:
711 .Bd -literal -offset indent
712 #include <stdio.h>
713 #include <stdlib.h>
714 #include <stdarg.h>
715 char *newfmt(const char *fmt, ...)
716 {
717         char *p;
718         va_list ap;
719         if ((p = malloc(128)) == NULL)
720                 return (NULL);
721         va_start(ap, fmt);
722         (void) vsnprintf(p, 128, fmt, ap);
723         va_end(ap);
724         return (p);
725 }
726 .Ed
727 .Sh COMPATIBILITY
728 The conversion formats
729 .Cm \&%D , \&%O ,
730 and
731 .Cm \&%U
732 are not standard and
733 are provided only for backward compatibility.
734 The effect of padding the
735 .Cm %p
736 format with zeros (either by the
737 .Cm 0
738 flag or by specifying a precision), and the benign effect (i.e., none)
739 of the
740 .Cm #
741 flag on
742 .Cm %n
743 and
744 .Cm %p
745 conversions, as well as other
746 nonsensical combinations such as
747 .Cm %Ld ,
748 are not standard; such combinations
749 should be avoided.
750 .Sh ERRORS
751 In addition to the errors documented for the
752 .Xr write 2
753 system call, the
754 .Fn printf
755 family of functions may fail if:
756 .Bl -tag -width Er
757 .It Bq Er EILSEQ
758 An invalid wide character code was encountered.
759 .It Bq Er ENOMEM
760 Insufficient storage space is available.
761 .It Bq Er EOVERFLOW
762 The
763 .Fa size
764 argument exceeds
765 .Dv INT_MAX + 1 ,
766 or the return value would be too large to be represented by an
767 .Vt int .
768 .El
769 .Sh SEE ALSO
770 .Xr printf 1 ,
771 .Xr fmtcheck 3 ,
772 .Xr scanf 3 ,
773 .Xr setlocale 3 ,
774 .Xr wprintf 3
775 .Sh STANDARDS
776 Subject to the caveats noted in the
777 .Sx BUGS
778 section below, the
779 .Fn fprintf ,
780 .Fn printf ,
781 .Fn sprintf ,
782 .Fn vprintf ,
783 .Fn vfprintf ,
784 and
785 .Fn vsprintf
786 functions
787 conform to
788 .St -ansiC
789 and
790 .St -isoC-99 .
791 With the same reservation, the
792 .Fn snprintf
793 and
794 .Fn vsnprintf
795 functions conform to
796 .St -isoC-99 ,
797 while
798 .Fn dprintf
799 and
800 .Fn vdprintf
801 conform to
802 .St -p1003.1-2008 .
803 .Sh HISTORY
804 The functions
805 .Fn asprintf
806 and
807 .Fn vasprintf
808 first appeared in the
809 .Tn GNU C
810 library.
811 These were implemented by
812 .An Peter Wemm Aq Mt peter@FreeBSD.org
813 in
814 .Fx 2.2 ,
815 but were later replaced with a different implementation
816 from
817 .Ox 2.3
818 by
819 .An Todd C. Miller Aq Mt Todd.Miller@courtesan.com .
820 The
821 .Fn dprintf
822 and
823 .Fn vdprintf
824 functions were added in
825 .Fx 8.0 .
826 .Sh BUGS
827 The
828 .Nm
829 family of functions do not correctly handle multibyte characters in the
830 .Fa format
831 argument.
832 .Sh SECURITY CONSIDERATIONS
833 The
834 .Fn sprintf
835 and
836 .Fn vsprintf
837 functions are easily misused in a manner which enables malicious users
838 to arbitrarily change a running program's functionality through
839 a buffer overflow attack.
840 Because
841 .Fn sprintf
842 and
843 .Fn vsprintf
844 assume an infinitely long string,
845 callers must be careful not to overflow the actual space;
846 this is often hard to assure.
847 For safety, programmers should use the
848 .Fn snprintf
849 interface instead.
850 For example:
851 .Bd -literal
852 void
853 foo(const char *arbitrary_string, const char *and_another)
854 {
855         char onstack[8];
856
857 #ifdef BAD
858         /*
859          * This first sprintf is bad behavior.  Do not use sprintf!
860          */
861         sprintf(onstack, "%s, %s", arbitrary_string, and_another);
862 #else
863         /*
864          * The following two lines demonstrate better use of
865          * snprintf().
866          */
867         snprintf(onstack, sizeof(onstack), "%s, %s", arbitrary_string,
868             and_another);
869 #endif
870 }
871 .Ed
872 .Pp
873 The
874 .Fn printf
875 and
876 .Fn sprintf
877 family of functions are also easily misused in a manner
878 allowing malicious users to arbitrarily change a running program's
879 functionality by either causing the program
880 to print potentially sensitive data
881 .Dq "left on the stack" ,
882 or causing it to generate a memory fault or bus error
883 by dereferencing an invalid pointer.
884 .Pp
885 .Cm %n
886 can be used to write arbitrary data to potentially carefully-selected
887 addresses.
888 Programmers are therefore strongly advised to never pass untrusted strings
889 as the
890 .Fa format
891 argument, as an attacker can put format specifiers in the string
892 to mangle your stack,
893 leading to a possible security hole.
894 This holds true even if the string was built using a function like
895 .Fn snprintf ,
896 as the resulting string may still contain user-supplied conversion specifiers
897 for later interpolation by
898 .Fn printf .
899 .Pp
900 Always use the proper secure idiom:
901 .Pp
902 .Dl "snprintf(buffer, sizeof(buffer), \*q%s\*q, string);"