Merge from vendor branch CVS:
[dragonfly.git] / contrib / cvs-1.12.9 / doc / cvsclient.texi
1 \input texinfo @c -*- texinfo -*-
2
3 @setfilename cvsclient.info
4 @include version-client.texi
5
6 @dircategory Programming
7 @direntry
8 * cvsclient: (cvsclient).      The CVS client/server protocol.
9 @end direntry
10
11 @node Top
12 @top CVS Client/Server
13
14 This document describes the client/server protocol used by CVS.  It does
15 not describe how to use or administer client/server CVS; see the regular
16 CVS manual for that.  This is version @value{VERSION} of the protocol
17 specification---@xref{Introduction}, for more on what this version number
18 means.
19
20 @menu
21 * Introduction::      What is CVS and what is the client/server protocol for?
22 * Goals::             Basic design decisions, requirements, scope, etc.
23 * Connection and Authentication::  Various ways to connect to the server
24 * Password scrambling::  Scrambling used by pserver
25 * Protocol::          Complete description of the protocol
26 * Protocol Notes::    Possible enhancements, limitations, etc. of the protocol
27 @end menu
28
29 @node Introduction
30 @chapter Introduction
31
32 CVS is a version control system (with some additional configuration
33 management functionality).  It maintains a central @dfn{repository}
34 which stores files (often source code), including past versions,
35 information about who modified them and when, and so on.  People who
36 wish to look at or modify those files, known as @dfn{developers}, use
37 CVS to @dfn{check out} a @dfn{working directory} from the repository, to
38 @dfn{check in} new versions of files to the repository, and other
39 operations such as viewing the modification history of a file.  If
40 developers are connected to the repository by a network, particularly a
41 slow or flaky one, the most efficient way to use the network is with the
42 CVS-specific protocol described in this document.
43
44 Developers, using the machine on which they store their working
45 directory, run the CVS @dfn{client} program.  To perform operations
46 which cannot be done locally, it connects to the CVS @dfn{server}
47 program, which maintains the repository.  For more information on how
48 to connect see @ref{Connection and Authentication}.
49
50 This document describes the CVS protocol.  Unfortunately, it does not
51 yet completely document one aspect of the protocol---the detailed
52 operation of each CVS command and option---and one must look at the CVS
53 user documentation, @file{cvs.texinfo}, for that information.  The
54 protocol is non-proprietary (anyone who wants to is encouraged to
55 implement it) and an implementation, known as CVS, is available under
56 the GNU Public License.  The CVS distribution, containing this
57 implementation, @file{cvs.texinfo}, and a copy (possibly more or less up
58 to date than what you are reading now) of this document,
59 @file{cvsclient.texi}, can be found at the usual GNU FTP sites, with a
60 filename such as @file{cvs-@var{version}.tar.gz}.
61
62 This is version @value{VERSION} of the protocol specification.  This
63 version number is intended only to aid in distinguishing different
64 versions of this specification.  Although the specification is currently
65 maintained in conjunction with the CVS implementation, and carries the
66 same version number, it also intends to document what is involved with
67 interoperating with other implementations (such as other versions of
68 CVS); see @ref{Requirements}.  This version number should not be used
69 by clients or servers to determine what variant of the protocol to
70 speak; they should instead use the @code{valid-requests} and
71 @code{Valid-responses} mechanism (@pxref{Protocol}), which is more
72 flexible.
73
74 @node Goals
75 @chapter Goals
76
77 @itemize @bullet
78 @item
79 Do not assume any access to the repository other than via this protocol.
80 It does not depend on NFS, rdist, etc.
81
82 @item
83 Providing a reliable transport is outside this protocol.  The protocol
84 expects a reliable transport that is transparent (that is, there is no
85 translation of characters, including characters such as such as
86 linefeeds or carriage returns), and can transmit all 256 octets (for
87 example for proper handling of binary files, compression, and
88 encryption).  The encoding of characters specified by the protocol (the
89 names of requests and so on) is the invariant ISO 646 character set (a
90 subset of most popular character sets including ASCII and others).  For
91 more details on running the protocol over the TCP reliable transport,
92 see @ref{Connection and Authentication}.
93
94 @item
95 Security and authentication are handled outside this protocol (but see
96 below about @samp{cvs kserver} and @samp{cvs pserver}).
97
98 @item
99 The protocol makes it possible for updates to be atomic with respect to
100 checkins; that is if someone commits changes to several files in one cvs
101 command, then an update by someone else would either get all the
102 changes, or none of them.  The current @sc{cvs} server can't do this,
103 but that isn't the protocol's fault.
104
105 @item
106 The protocol is, with a few exceptions, transaction-based.  That is, the
107 client sends all its requests (without waiting for server responses),
108 and then waits for the server to send back all responses (without
109 waiting for further client requests).  This has the advantage of
110 minimizing network turnarounds and the disadvantage of sometimes
111 transferring more data than would be necessary if there were a richer
112 interaction.  Another, more subtle, advantage is that there is no need
113 for the protocol to provide locking for features such as making checkins
114 atomic with respect to updates.  Any such locking can be handled
115 entirely by the server.  A good server implementation (such as the
116 current @sc{cvs} server) will make sure that it does not have any such
117 locks in place whenever it is waiting for communication with the client;
118 this prevents one client on a slow or flaky network from interfering
119 with the work of others.
120
121 @item
122 It is a general design goal to provide only one way to do a given
123 operation (where possible).  For example, implementations have no choice
124 about whether to terminate lines with linefeeds or some other
125 character(s), and request and response names are case-sensitive.  This
126 is to enhance interoperability.  If a protocol allows more than one way
127 to do something, it is all too easy for some implementations to support
128 only some of them (perhaps accidentally).
129 @c I vaguely remember reading, probably in an RFC, about the problems
130 @c that were caused when some people decided that SMTP should accept
131 @c other line termination (in the message ("DATA")?) than CRLF.  However, I
132 @c can't seem to track down the reference.
133 @end itemize
134
135 @node Connection and Authentication
136 @chapter How to Connect to and Authenticate Oneself to the CVS server
137
138 Connection and authentication occurs before the CVS protocol itself is
139 started.  There are several ways to connect.
140
141 @table @asis
142 @item server
143 If the client has a way to execute commands on the server, and provide
144 input to the commands and output from them, then it can connect that
145 way.  This could be the usual rsh (port 514) protocol, Kerberos rsh,
146 SSH, or any similar mechanism.  The client may allow the user to specify
147 the name of the server program; the default is @code{cvs}.  It is
148 invoked with one argument, @code{server}.  Once it invokes the server,
149 the client proceeds to start the cvs protocol.
150
151 @item kserver
152 The kerberized server listens on a port (in the current implementation,
153 by having inetd call "cvs kserver") which defaults to 1999.  The client
154 connects, sends the usual kerberos authentication information, and then
155 starts the cvs protocol.  Note: port 1999 is officially registered for
156 another use, and in any event one cannot register more than one port for
157 CVS, so GSS-API (see below) is recommended instead of kserver as a way
158 to support kerberos.
159
160 @item pserver
161 The name @dfn{pserver} is somewhat confusing.  It refers to both a
162 generic framework which allows the CVS protocol to support several
163 authentication mechanisms, and a name for a specific mechanism which
164 transfers a username and a cleartext password.  Servers need not support
165 all mechanisms, and in fact servers will typically want to support only
166 those mechanisms which meet the relevant security needs.
167
168 The pserver server listens on a port (in the current
169 implementation, by having inetd call "cvs pserver") which defaults to
170 2401 (this port is officially registered).  The client
171 connects, and sends the following:
172
173 @itemize @bullet
174 @item
175 the string @samp{BEGIN AUTH REQUEST}, a linefeed, 
176 @item
177 the cvs root, a linefeed,
178 @item
179 the username, a linefeed,
180 @item
181 the password trivially encoded (see @ref{Password scrambling}), a
182 linefeed,
183 @item
184 the string @samp{END AUTH REQUEST}, and a linefeed.
185 @end itemize
186
187 The client must send the
188 identical string for cvs root both here and later in the
189 @code{Root} request of the cvs
190 protocol itself.  Servers are encouraged to enforce this restriction.
191 The possible server responses (each of which is followed by a linefeed)
192 are the following.  Note that although there is a small similarity
193 between this authentication protocol and the cvs protocol, they are
194 separate.
195
196 @table @code
197 @item I LOVE YOU
198 The authentication is successful.  The client proceeds with the cvs
199 protocol itself.
200
201 @item I HATE YOU
202 The authentication fails.  After sending this response, the server may
203 close the connection.  It is up to the server to decide whether to give
204 this response, which is generic, or a more specific response using
205 @samp{E} and/or @samp{error}.
206
207 @item E @var{text}
208 Provide a message for the user.  After this reponse, the authentication
209 protocol continues with another response.  Typically the server will
210 provide a series of @samp{E} responses followed by @samp{error}.
211 Compatibility note: @sc{cvs} 1.9.10 and older clients will print
212 @code{unrecognized auth response} and @var{text}, and then exit, upon
213 receiving this response.
214
215 @item error @var{code} @var{text}
216 The authentication fails.  After sending this response, the server may
217 close the connection.  The @var{code} is a code describing why it
218 failed, intended for computer consumption.  The only code currently
219 defined is @samp{0} which is nonspecific, but clients must silently
220 treat any unrecognized codes as nonspecific.
221 The @var{text} should be supplied to the
222 user.  Compatibility note: @sc{cvs} 1.9.10 and older clients will print
223 @code{unrecognized auth response} and @var{text}, and then exit, upon
224 receiving this response.
225 Note that @var{text} for this response, or the @var{text} in an @code{E}
226 response, is not designed for machine parsing.  More vigorous use of
227 @var{code}, or future extensions, will be needed to prove a cleaner
228 machine-parseable indication of what the error was.
229 @end table
230
231 @c If you are thinking of putting samp or code around BEGIN AUTH REQUEST
232 @c and friends, watch for overfull hboxes.
233 If the client wishes to merely authenticate without starting the cvs
234 protocol, the procedure is the same, except BEGIN AUTH REQUEST is
235 replaced with BEGIN VERIFICATION REQUEST, END AUTH REQUEST
236 is replaced with END VERIFICATION REQUEST, and upon receipt of
237 I LOVE YOU the connection is closed rather than continuing.
238
239 Another mechanism is GSSAPI authentication.  GSSAPI is a
240 generic interface to security services such as kerberos.  GSSAPI is
241 specified in RFC2078 (GSSAPI version 2) and RFC1508 (GSSAPI version 1);
242 we are not aware of differences between the two which affect the
243 protocol in incompatible ways, so we make no attempt to specify one
244 version or the other.
245 The procedure here is to start with @samp{BEGIN
246 GSSAPI REQUEST}.  GSSAPI authentication information is then exchanged
247 between the client and the server.  Each packet of information consists
248 of a two byte big endian length, followed by that many bytes of data.
249 After the GSSAPI authentication is complete, the server continues with
250 the responses described above (@samp{I LOVE YOU}, etc.).
251
252 @item future possibilities
253 There are a nearly unlimited number of ways to connect and authenticate.
254 One might want to allow access based on IP address (similar to the usual
255 rsh protocol but with different/no restrictions on ports < 1024), to
256 adopt mechanisms such as Pluggable Authentication Modules (PAM), to
257 allow users to run their own servers under their own usernames without
258 root access, or any number of other possibilities.  The way to add
259 future mechanisms, for the most part, should be to continue to use port
260 2401, but to use different strings in place of @samp{BEGIN AUTH
261 REQUEST}.
262 @end table
263
264 @node Password scrambling
265 @chapter Password scrambling algorithm
266
267 The pserver authentication protocol, as described in @ref{Connection and
268 Authentication}, trivially encodes the passwords.  This is only to
269 prevent inadvertent compromise; it provides no protection against even a
270 relatively unsophisticated attacker.  For comparison, HTTP Basic
271 Authentication (as described in RFC2068) uses BASE64 for a similar
272 purpose.  CVS uses its own algorithm, described here.
273
274 The scrambled password starts with @samp{A}, which serves to identify
275 the scrambling algorithm in use.  After that follows a single octet for
276 each character in the password, according to a fixed encoding.  The
277 values are shown here, with the encoded values in decimal.  Control
278 characters, space, and characters outside the invariant ISO 646
279 character set are not shown; such characters are not recommended for use
280 in passwords.  There is a long discussion of character set issues in
281 @ref{Protocol Notes}.
282
283 @example
284         0 111           P 125           p  58
285 ! 120   1  52   A  57   Q  55   a 121   q 113
286 "  53   2  75   B  83   R  54   b 117   r  32
287         3 119   C  43   S  66   c 104   s  90
288         4  49   D  46   T 124   d 101   t  44
289 % 109   5  34   E 102   U 126   e 100   u  98
290 &  72   6  82   F  40   V  59   f  69   v  60
291 ' 108   7  81   G  89   W  47   g  73   w  51
292 (  70   8  95   H  38   X  92   h  99   x  33
293 )  64   9  65   I 103   Y  71   i  63   y  97
294 *  76   : 112   J  45   Z 115   j  94   z  62
295 +  67   ;  86   K  50           k  93
296 , 116   < 118   L  42           l  39
297 -  74   = 110   M 123           m  37
298 .  68   > 122   N  91           n  61
299 /  87   ? 105   O  35   _  56   o  48
300 @end example
301
302 @node Protocol
303 @chapter The CVS client/server protocol
304
305 In the following, @samp{\n} refers to a linefeed and @samp{\t} refers to
306 a horizontal tab; @dfn{requests} are what the client sends and
307 @dfn{responses} are what the server sends.  In general, the connection is
308 governed by the client---the server does not send responses without
309 first receiving requests to do so; see @ref{Response intro} for more
310 details of this convention.
311
312 It is typical, early in the connection, for the client to transmit a
313 @code{Valid-responses} request, containing all the responses it
314 supports, followed by a @code{valid-requests} request, which elicits
315 from the server a @code{Valid-requests} response containing all the
316 requests it understands.  In this way, the client and server each find
317 out what the other supports before exchanging large amounts of data
318 (such as file contents).
319
320 @c Hmm, having 3 sections in this menu makes a certain amount of sense
321 @c but that structure gets lost in the printed manual (not sure about
322 @c HTML).  Perhaps there is a better way.
323 @menu
324
325 General protocol conventions:
326
327 * Entries Lines::                   Transmitting RCS data
328 * File Modes::                      Read, write, execute, and possibly more...
329 * Filenames::                       Conventions regarding filenames
330 * File transmissions::              How file contents are transmitted
331 * Strings::                         Strings in various requests and responses
332 * Dates::                           Times and dates
333
334 The protocol itself:
335
336 * Request intro::                   General conventions relating to requests
337 * Requests::                        List of requests
338 * Response intro::                  General conventions relating to responses
339 * Response pathnames::              The "pathname" in responses
340 * Responses::                       List of responses
341 * Text tags::                       More details about the MT response
342
343 An example session, and some further observations:
344
345 * Example::                         A conversation between client and server
346 * Requirements::                    Things not to omit from an implementation
347 * Obsolete::                        Former protocol features
348 @end menu
349
350 @node Entries Lines
351 @section Entries Lines
352
353 Entries lines are transmitted as:
354
355 @example
356 / @var{name} / @var{version} / @var{conflict} / @var{options} / @var{tag_or_date}
357 @end example
358
359 @var{tag_or_date} is either @samp{T} @var{tag} or @samp{D} @var{date}
360 or empty.  If it is followed by a slash, anything after the slash
361 shall be silently ignored.
362
363 @var{version} can be empty, or start with @samp{0} or @samp{-}, for no
364 user file, new user file, or user file to be removed, respectively.
365
366 @c FIXME: should distinguish sender and receiver behavior here; the
367 @c "anything else" and "does not start with" are intended for future
368 @c expansion, and we should specify a sender behavior.
369 @var{conflict}, if it starts with @samp{+}, indicates that the file had
370 conflicts in it.  The rest of @var{conflict} is @samp{=} if the
371 timestamp matches the file, or anything else if it doesn't.  If
372 @var{conflict} does not start with a @samp{+}, it is silently ignored.
373
374 @var{options} signifies the keyword expansion options (for example
375 @samp{-ko}).  In an @code{Entry} request, this indicates the options
376 that were specified with the file from the previous file updating
377 response (@pxref{Response intro}, for a list of file updating
378 responses); if the client is specifying the @samp{-k} or @samp{-A}
379 option to @code{update}, then it is the server which figures out what
380 overrides what.
381
382 @node File Modes
383 @section File Modes
384
385 A mode is any number of repetitions of
386
387 @example
388 @var{mode-type} = @var{data}
389 @end example
390
391 separated by @samp{,}.
392
393 @var{mode-type} is an identifier composed of alphanumeric characters.
394 Currently specified: @samp{u} for user, @samp{g} for group, @samp{o}
395 for other (see below for discussion of whether these have their POSIX
396 meaning or are more loose).  Unrecognized values of @var{mode-type}
397 are silently ignored.
398
399 @var{data} consists of any data not containing @samp{,}, @samp{\0} or
400 @samp{\n}.  For @samp{u}, @samp{g}, and @samp{o} mode types, data
401 consists of alphanumeric characters, where @samp{r} means read, @samp{w}
402 means write, @samp{x} means execute, and unrecognized letters are
403 silently ignored.
404
405 The two most obvious ways in which the mode matters are: (1) is it
406 writeable?  This is used by the developer communication features, and
407 is implemented even on OS/2 (and could be implemented on DOS), whose
408 notion of mode is limited to a readonly bit. (2) is it executable?
409 Unix CVS users need CVS to store this setting (for shell scripts and
410 the like).  The current CVS implementation on unix does a little bit
411 more than just maintain these two settings, but it doesn't really have
412 a nice general facility to store or version control the mode, even on
413 unix, much less across operating systems with diverse protection
414 features.  So all the ins and outs of what the mode means across
415 operating systems haven't really been worked out (e.g. should the VMS
416 port use ACLs to get POSIX semantics for groups?).
417
418 @node Filenames
419 @section Conventions regarding transmission of file names
420
421 In most contexts, @samp{/} is used to separate directory and file
422 names in filenames, and any use of other conventions (for example,
423 that the user might type on the command line) is converted to that
424 form.  The only exceptions might be a few cases in which the server
425 provides a magic cookie which the client then repeats verbatim, but as
426 the server has not yet been ported beyond unix, the two rules provide
427 the same answer (and what to do if future server ports are operating
428 on a repository like e:/foo or CVS_ROOT:[FOO.BAR] has not been
429 carefully thought out).
430
431 Characters outside the invariant ISO 646 character set should be avoided
432 in filenames.  This restriction may need to be relaxed to allow for
433 characters such as @samp{[} and @samp{]} (see above about non-unix
434 servers); this has not been carefully considered (and currently
435 implementations probably use whatever character sets that the operating
436 systems they are running on allow, and/or that users specify).  Of
437 course the most portable practice is to restrict oneself further, to the
438 POSIX portable filename character set as specified in POSIX.1.
439
440 @node File transmissions
441 @section File transmissions
442
443 File contents (noted below as @var{file transmission}) can be sent in
444 one of two forms.  The simpler form is a number of bytes, followed by a
445 linefeed, followed by the specified number of bytes of file contents.
446 These are the entire contents of the specified file.  Second, if both
447 client and server support @samp{gzip-file-contents}, a @samp{z} may
448 precede the length, and the `file contents' sent are actually compressed
449 with @samp{gzip} (RFC1952/1951) compression.  The length specified is
450 that of the compressed version of the file.
451
452 In neither case are the file content followed by any additional data.
453 The transmission of a file will end with a linefeed iff that file (or its
454 compressed form) ends with a linefeed.
455
456 The encoding of file contents depends on the value for the @samp{-k}
457 option.  If the file is binary (as specified by the @samp{-kb} option in
458 the appropriate place), then it is just a certain number of octets, and
459 the protocol contributes nothing towards determining the encoding (using
460 the file name is one widespread, if not universally popular, mechanism).
461 If the file is text (not binary), then the file is sent as a series of
462 lines, separated by linefeeds.  If the keyword expansion is set to
463 something other than @samp{-ko}, then it is expected that the file
464 conform to the RCS expectations regarding keyword expansion---in
465 particular, that it is in a character set such as ASCII in which 0x24 is
466 a dollar sign (@samp{$}).
467
468 @node Strings
469 @section Strings
470
471 In various contexts, for example the @code{Argument} request and the
472 @code{M} response, one transmits what is essentially an arbitrary
473 string.  Often this will have been supplied by the user (for example,
474 the @samp{-m} option to the @code{ci} request).  The protocol has no
475 mechanism to specify the character set of such strings; it would be
476 fairly safe to stick to the invariant ISO 646 character set but the
477 existing practice is probably to just transmit whatever the user
478 specifies, and hope that everyone involved agrees which character set is
479 in use, or sticks to a common subset.
480
481 @node Dates
482 @section Dates
483
484 The protocol contains times and dates in various places.
485
486 For the @samp{-D} option to the @code{annotate}, @code{co}, @code{diff},
487 @code{export}, @code{history}, @code{rannotate}, @code{rdiff},
488 @code{rtag}, @code{tag},
489 and @code{update} requests, the server should support two formats:
490
491 @example
492 26 May 1997 13:01:40 -0000  ; @r{RFC 822 as modified by RFC 1123}
493 5/26/1997 13:01:40 GMT    ; @r{traditional}
494 @end example
495
496 The former format is preferred; the latter however is sent by the CVS
497 command line client (versions 1.5 through at least 1.9).
498
499 For the @samp{-d} option to the @code{log} and @code{rlog} requests,
500 servers should at
501 least support RFC 822/1123 format.  Clients are encouraged to use this
502 format too (the command line CVS client, version 1.10 and older, just passed
503 along the date format specified by the user, however).
504
505 The @code{Mod-time} response and @code{Checkin-time} request use RFC
506 822/1123 format (see the descriptions of that response and request for
507 details).
508
509 For @code{Notify}, see the description of that request.
510
511 @node Request intro
512 @section Request intro
513
514 By convention, requests which begin with a capital letter do not elicit
515 a response from the server, while all others do -- save one.  The
516 exception is @samp{gzip-file-contents}.  Unrecognized requests will
517 always elicit a response from the server, even if that request begins
518 with a capital letter.
519
520 The term @dfn{command} means a request which expects a response (except
521 @code{valid-requests}).  The general model is that the client transmits
522 a great number of requests, but nothing happens until the very end when
523 the client transmits a command.  Although the intention is that
524 transmitting several commands in one connection should be legal,
525 existing servers probably have some bugs with some combinations of more
526 than one command, and so clients may find it necessary to make several
527 connections in some cases.  This should be thought of as a workaround
528 rather than a desired attribute of the protocol.
529
530 @node Requests
531 @section Requests
532
533 Here are the requests:
534
535 @table @code
536 @item Root @var{pathname} \n
537 Response expected: no.  Tell the server which @code{CVSROOT} to use.
538 Note that @var{pathname} is a local directory and @emph{not} a fully
539 qualified @code{CVSROOT} variable.  @var{pathname} must
540 already exist; if creating a new root, use the @code{init} request, not
541 @code{Root}.  @var{pathname} does not include the hostname of the
542 server, how to access the server, etc.; by the time the CVS protocol is
543 in use, connection, authentication, etc., are already taken care of.
544
545 The @code{Root} request must be sent only once, and it must be sent
546 before any requests other than @code{Valid-responses},
547 @code{valid-requests}, @code{UseUnchanged}, @code{Set},
548 @code{Global_option}, @code{init}, @code{noop}, or @code{version}.
549
550 @item Valid-responses @var{request-list} \n
551 Response expected: no.
552 Tell the server what responses the client will accept.
553 request-list is a space separated list of tokens.
554 The @code{Root} request need not have been previously sent.
555
556 @item valid-requests \n
557 Response expected: yes.
558 Ask the server to send back a @code{Valid-requests} response.
559 The @code{Root} request need not have been previously sent.
560
561 @item Directory @var{local-directory} \n
562 Additional data: @var{repository} \n.  Response expected: no.
563 Tell the server what directory to use.  The @var{repository} should be a
564 directory name from a previous server response.  Note that
565 this both gives a default for @code{Entry} and @code{Modified} and
566 also for @code{ci} and the other commands; normal usage is to send 
567 @code{Directory} for each directory in which there will be an
568 @code{Entry} or @code{Modified}, and then a final @code{Directory}
569 for the original directory, then the command.
570 The @var{local-directory} is relative to
571 the top level at which the command is occurring (i.e. the last
572 @code{Directory} which is sent before the command);
573 to indicate that top level, @samp{.} should be sent for
574 @var{local-directory}.
575
576 Here is an example of where a client gets @var{repository} and
577 @var{local-directory}.  Suppose that there is a module defined by
578
579 @example
580 moddir 1dir
581 @end example
582
583 That is, one can check out @code{moddir} and it will take @code{1dir} in
584 the repository and check it out to @code{moddir} in the working
585 directory.  Then an initial check out could proceed like this:
586
587 @example
588 C: Root /home/kingdon/zwork/cvsroot
589 . . .
590 C: Argument moddir
591 C: Directory .
592 C: /home/kingdon/zwork/cvsroot
593 C: co
594 S: Clear-sticky moddir/
595 S: /home/kingdon/zwork/cvsroot/1dir/
596 . . .
597 S: ok
598 @end example
599
600 In this example the response shown is @code{Clear-sticky}, but it could
601 be another response instead.  Note that it returns two pathnames.
602 The first one, @file{moddir/}, indicates the working
603 directory to check out into.  The second one, ending in @file{1dir/},
604 indicates the directory to pass back to the server in a subsequent
605 @code{Directory} request.  For example, a subsequent @code{update}
606 request might look like:
607
608 @example
609 C: Directory moddir
610 C: /home/kingdon/zwork/cvsroot/1dir
611 . . .
612 C: update
613 @end example
614
615 For a given @var{local-directory}, the repository will be the same for
616 each of the responses, so one can use the repository from whichever
617 response is most convenient.  Typically a client will store the
618 repository along with the sources for each @var{local-directory}, use
619 that same setting whenever operating on that @var{local-directory}, and
620 not update the setting as long as the @var{local-directory} exists.
621
622 A client is free to rename a @var{local-directory} at any time (for
623 example, in response to an explicit user request).  While it is true
624 that the server supplies a @var{local-directory} to the client, as noted
625 above, this is only the default place to put the directory.  Of course,
626 the various @code{Directory} requests for a single command (for example,
627 @code{update} or @code{ci} request) should name a particular directory
628 with the same @var{local-directory}.
629
630 Each @code{Directory} request specifies a brand-new
631 @var{local-directory} and @var{repository}; that is,
632 @var{local-directory} and @var{repository} are never relative to paths
633 specified in any previous @code{Directory} request.
634
635 Here's a more complex example, in which we request an update of a
636 working directory which has been checked out from multiple places in the
637 repository.
638
639 @example
640 C: Argument dir1
641 C: Directory dir1
642 C: /home/foo/repos/mod1
643 . . .
644 C: Argument dir2
645 C: Directory dir2
646 C: /home/foo/repos/mod2
647 . . .
648 C: Argument dir3
649 C: Directory dir3/subdir3
650 C: /home/foo/repos/mod3
651 . . .
652 C: update
653 @end example
654
655 While directories @code{dir1} and @code{dir2} will be handled in similar
656 fashion to the other examples given above, @code{dir3} is slightly
657 different from the server's standpoint.  Notice that module @code{mod3}
658 is actually checked out into @code{dir3/subdir3}, meaning that directory
659 @code{dir3} is either empty or does not contain data checked out from
660 this repository.  
661
662 The above example will work correctly in @sc{cvs} 1.10.1 and later.  The
663 server will descend the tree starting from all directories mentioned in
664 @code{Argument} requests and update those directories specifically
665 mentioned in @code{Directory} requests.
666
667 Previous versions of @sc{cvs} (1.10 and earlier) do not behave the same
668 way.  While the descent of the tree begins at all directories mentioned
669 in @code{Argument} requests, descent into subdirectories only occurs if
670 a directory has been mentioned in a @code{Directory} request.
671 Therefore, the above example would succeed in updating @code{dir1} and
672 @code{dir2}, but would skip @code{dir3} because that directory was not
673 specifically mentioned in a @code{Directory} request.  A functional
674 version of the above that would run on a 1.10 or earlier server is as
675 follows:
676
677 @example
678 C: Argument dir1
679 C: Directory dir1
680 C: /home/foo/repos/mod1
681 . . .
682 C: Argument dir2
683 C: Directory dir2
684 C: /home/foo/repos/mod2
685 . . .
686 C: Argument dir3
687 C: Directory dir3
688 C: /home/foo/repos/.
689 . . .
690 C: Directory dir3/subdir3
691 C: /home/foo/repos/mod3
692 . . .
693 C: update
694 @end example
695
696 Note the extra @code{Directory dir3} request.  It might be better to use
697 @code{Emptydir} as the repository for the @code{dir3} directory, but the
698 above will certainly work.
699
700 One more peculiarity of the 1.10 and earlier protocol is the ordering of
701 @code{Directory} arguments.  In order for a subdirectory to be
702 registered correctly for descent by the recursion processor, its parent
703 must be sent first.  For example, the following would not work to update
704 @code{dir3/subdir3}:
705
706 @example
707 . . .
708 C: Argument dir3
709 C: Directory dir3/subdir3
710 C: /home/foo/repos/mod3
711 . . .
712 C: Directory dir3
713 C: /home/foo/repos/.
714 . . .
715 C: update
716 @end example
717
718 The implementation of the server in 1.10 and earlier writes the
719 administration files for a given directory at the time of the
720 @code{Directory} request.  It also tries to register the directory with
721 its parent to mark it for recursion.  In the above example, at the time
722 @code{dir3/subdir3} is created, the physical directory for @code{dir3}
723 will be created on disk, but the administration files will not have been
724 created.  Therefore, when the server tries to register
725 @code{dir3/subdir3} for recursion, the operation will silently fail
726 because the administration files do not yet exist for @code{dir3}.
727
728 @item Max-dotdot @var{level} \n
729 Response expected: no.
730 Tell the server that @var{level} levels of directories above the
731 directory which @code{Directory} requests are relative to will be
732 needed.  For example, if the client is planning to use a
733 @code{Directory} request for @file{../../foo}, it must send a
734 @code{Max-dotdot} request with a @var{level} of at least 2.
735 @code{Max-dotdot} must be sent before the first @code{Directory}
736 request.
737
738 @item Static-directory \n
739 Response expected: no.  Tell the server that the directory most recently
740 specified with @code{Directory} should not have
741 additional files checked out unless explicitly requested.  The client
742 sends this if the @code{Entries.Static} flag is set, which is controlled
743 by the @code{Set-static-directory} and @code{Clear-static-directory}
744 responses.
745
746 @item Sticky @var{tagspec} \n
747 Response expected: no.  Tell the server that the directory most recently
748 specified with @code{Directory} has a sticky tag or date @var{tagspec}.
749 The first character of @var{tagspec} is @samp{T} for a tag, @samp{D}
750 for a date, or some other character supplied by a Set-sticky response
751 from a previous request to the server.  The remainder of @var{tagspec}
752 contains the actual tag or date, again as supplied by Set-sticky.
753
754 The server should remember @code{Static-directory} and @code{Sticky}
755 requests for a particular directory; the client need not resend them
756 each time it sends a @code{Directory} request for a given directory.
757 However, the server is not obliged to remember them beyond the context
758 of a single command.
759
760 @item Checkin-prog @var{program} \n
761 Response expected: no.  Tell the server that the directory most recently
762 specified with @code{Directory} has a checkin program @var{program}.
763 Such a program would have been previously set with the
764 @code{Set-checkin-prog} response.
765
766 @item Update-prog @var{program} \n
767 Response expected: no.  Tell the server that the directory most recently
768 specified with @code{Directory} has an update program @var{program}.
769 Such a program would have been previously set with the
770 @code{Set-update-prog} response.
771
772 @item Entry @var{entry-line} \n
773 Response expected: no.  Tell the server what version of a file is on the
774 local machine.  The name in @var{entry-line} is a name relative to the
775 directory most recently specified with @code{Directory}.  If the user
776 is operating on only some files in a directory, @code{Entry} requests
777 for only those files need be included.  If an @code{Entry} request is
778 sent without @code{Modified}, @code{Is-modified}, or @code{Unchanged},
779 it means the file is
780 lost (does not exist in the working directory).  If both @code{Entry}
781 and one of @code{Modified}, @code{Is-modified}, or @code{Unchanged} are
782 sent for the same file, @code{Entry} must be sent first.  For a
783 given file, one can send @code{Modified}, @code{Is-modified}, or
784 @code{Unchanged}, but not more than one of these three.
785
786 @item Kopt @var{option} \n
787 This indicates to the server which keyword expansion options to use for
788 the file specified by the next @code{Modified} or @code{Is-modified}
789 request (for example @samp{-kb} for a binary file).  This is similar to
790 @code{Entry}, but is used for a file for which there is no entries line.
791 Typically this will be a file being added via an @code{add} or
792 @code{import} request.  The client may not send both @code{Kopt} and
793 @code{Entry} for the same file.
794
795 @item Checkin-time @var{time} \n
796 For the file specified by the next @code{Modified} request, use
797 @var{time} as the time of the checkin.  The @var{time} is in the format
798 specified by RFC822 as modified by RFC1123.  The client may specify any
799 timezone it chooses; servers will want to convert that to their own
800 timezone as appropriate.  An example of this format is:
801
802 @example
803 26 May 1997 13:01:40 -0400
804 @end example
805
806 There is no requirement that the client and server clocks be
807 synchronized.  The client just sends its recommendation for a timestamp
808 (based on file timestamps or whatever), and the server should just believe
809 it (this means that the time might be in the future, for example).
810
811 Note that this is not a general-purpose way to tell the server about the
812 timestamp of a file; that would be a separate request (if there are
813 servers which can maintain timestamp and time of checkin separately).
814
815 This request should affect the @code{import} request, and may optionally
816 affect the @code{ci} request or other relevant requests if any.
817
818 @item Modified @var{filename} \n
819 Response expected: no.  Additional data: mode, \n, file transmission.
820 Send the server a copy of one locally modified file.  @var{filename} is
821 a file within the most recent directory sent with @code{Directory}; it
822 must not contain @samp{/}.  If
823 the user is operating on only some files in a directory, only those
824 files need to be included.  This can also be sent without @code{Entry},
825 if there is no entry for the file.
826
827 @item Is-modified @var{filename} \n
828 Response expected: no.  Additional data: none.  Like @code{Modified},
829 but used if the server only needs
830 to know whether the file is modified, not the contents.
831
832 The commands which can take @code{Is-modified} instead of
833 @code{Modified} with no known change in behavior are: @code{admin},
834 @code{diff} (if and only if two @samp{-r} or @samp{-D} options are
835 specified), @code{watch-on}, @code{watch-off}, @code{watch-add},
836 @code{watch-remove}, @code{watchers}, @code{editors},
837 @code{log}, and @code{annotate}.
838
839 For the @code{status} command, one can send @code{Is-modified} but if
840 the client is using imperfect mechanisms such as timestamps to determine
841 whether to consider a file modified, then the behavior will be
842 different.  That is, if one sends @code{Modified}, then the server will
843 actually compare the contents of the file sent and the one it derives
844 from to determine whether the file is genuinely modified.  But if one
845 sends @code{Is-modified}, then the server takes the client's word for
846 it.  A similar situation exists for @code{tag}, if the @samp{-c} option
847 is specified.
848
849 Commands for which @code{Modified} is necessary are @code{co},
850 @code{ci}, @code{update}, and @code{import}.
851
852 Commands which do not need to inform the server about a working
853 directory, and thus should not be sending either @code{Modified} or
854 @code{Is-modified}: @code{rdiff}, @code{rtag}, @code{history},
855 @code{init}, and @code{release}.
856
857 Commands for which further investigation is warranted are:
858 @code{remove}, @code{add}, and @code{export}.  Pending such
859 investigation, the more conservative course of action is to stick to
860 @code{Modified}.
861
862 @item Unchanged @var{filename} \n
863 Response expected: no.  Tell the server that @var{filename} has not been
864 modified in the checked out directory.  The @var{filename} is
865 a file within the most recent directory sent with @code{Directory}; it
866 must not contain @samp{/}.
867
868 @item UseUnchanged \n
869 Response expected: no.  To specify the version of the protocol described
870 in this document, servers must support this request (although it need
871 not do anything) and clients must issue it.
872 The @code{Root} request need not have been previously sent.
873
874 @item Notify @var{filename} \n
875 Response expected: no.
876 Tell the server that an @code{edit} or @code{unedit} command has taken
877 place.  The server needs to send a @code{Notified} response, but such
878 response is deferred until the next time that the server is sending
879 responses.
880 The @var{filename} is a file within the most recent directory sent with
881 @code{Directory}; it must not contain @samp{/}.
882 Additional data:
883 @example
884 @var{notification-type} \t @var{time} \t @var{clienthost} \t
885 @var{working-dir} \t @var{watches} \n
886 @end example
887 where @var{notification-type} is @samp{E} for edit, @samp{U} for
888 unedit, undefined behavior if @samp{C}, and all other letters should be
889 silently ignored for future expansion.
890 @var{time} is the time at which the edit or unedit took place, in a
891 user-readable format of the client's choice (the server should treat the
892 time as an opaque string rather than interpreting it).
893 @c Might be useful to specify a format, but I don't know if we want to
894 @c specify the status quo (ISO C asctime() format plus timezone) without
895 @c offering the option of ISO8601 and/or RFC822/1123 (see cvs.texinfo
896 @c for much much more on date formats).
897 @var{clienthost} is the name of the host on which the edit or unedit
898 took place, and @var{working-dir} is the pathname of the working
899 directory where the edit or unedit took place.  @var{watches} are the
900 temporary watches, zero or more of the following characters in the
901 following order: @samp{E} for edit, @samp{U} for unedit, @samp{C} for
902 commit, and all other letters should be silently ignored for future
903 expansion.  If @var{notification-type} is @samp{E} the temporary watches
904 are set; if it is @samp{U} they are cleared.
905 If @var{watches} is followed by \t then the
906 \t and the rest of the line should be ignored, for future expansion.
907
908 The @var{time}, @var{clienthost}, and @var{working-dir} fields may not
909 contain the characters @samp{+}, @samp{,}, @samp{>}, @samp{;}, or @samp{=}.
910
911 Note that a client may be capable of performing an @code{edit} or
912 @code{unedit} operation without connecting to the server at that time,
913 and instead connecting to the server when it is convenient (for example,
914 when a laptop is on the net again) to send the @code{Notify} requests.
915 Even if a client is capable of deferring notifications, it should
916 attempt to send them immediately (one can send @code{Notify} requests
917 together with a @code{noop} request, for example), unless perhaps if
918 it can know that a connection would be impossible.
919
920 @item Questionable @var{filename} \n
921 Response expected: no.  Additional data: no.  Tell the server to check
922 whether @var{filename} should be ignored, and if not, next time the
923 server sends responses, send (in a @code{M} response) @samp{?} followed
924 by the directory and filename.  @var{filename} must not contain
925 @samp{/}; it needs to be a file in the directory named by the most
926 recent @code{Directory} request.
927 @c FIXME: the bit about not containing / is true of most of the
928 @c requests, but isn't documented and should be.
929
930 @item Case \n
931 Response expected: no.  Tell the server that filenames should be matched
932 in a case-insensitive fashion.  Note that this is not the primary
933 mechanism for achieving case-insensitivity; for the most part the client
934 keeps track of the case which the server wants to use and takes care to
935 always use that case regardless of what the user specifies.  For example
936 the filenames given in @code{Entry} and @code{Modified} requests for the
937 same file must match in case regardless of whether the @code{Case}
938 request is sent.  The latter mechanism is more general (it could also be
939 used for 8.3 filenames, VMS filenames with more than one @samp{.}, and
940 any other situation in which there is a predictable mapping between
941 filenames in the working directory and filenames in the protocol), but
942 there are some situations it cannot handle (ignore patterns, or
943 situations where the user specifies a filename and the client does not
944 know about that file).
945
946 Though this request will be supported into the forseeable future, it has been
947 the source of numerous bug reports in the past due to the complexity of testing
948 this functionality via the test suite and client developers are encouraged not
949 to use it.  Instead, please consider munging conflicting names and maintaining
950 a map for communicating with the server.  For example, suppose the server sends
951 files @file{case}, @file{CASE}, and @file{CaSe}.  The client could write all
952 three files to names such as, @file{case}, @file{case_prefix_case}, and
953 @file{case_prefix_2_case} and maintain a mapping between the file names in, for
954 instance a new @file{CVS/Map} file.
955
956 @item Argument @var{text} \n
957 Response expected: no.
958 Save argument for use in a subsequent command.  Arguments
959 accumulate until an argument-using command is given, at which point
960 they are forgotten.
961
962 @item Argumentx @var{text} \n
963 Response expected: no.  Append \n followed by text to the current
964 argument being saved.
965
966 @item Global_option @var{option} \n
967 Response expected: no.
968 Transmit one of the global options @samp{-q}, @samp{-Q}, @samp{-l},
969 @samp{-t}, @samp{-r}, or @samp{-n}.  @var{option} must be one of those
970 strings, no variations (such as combining of options) are allowed.  For
971 graceful handling of @code{valid-requests}, it is probably better to
972 make new global options separate requests, rather than trying to add
973 them to this request.
974 The @code{Root} request need not have been previously sent.
975
976 @item Gzip-stream @var{level} \n
977 Response expected: no.
978 Use zlib (RFC 1950/1951) compression to compress all further communication
979 between the client and the server.  After this request is sent, all
980 further communication must be compressed.  All further data received
981 from the server will also be compressed.  The @var{level} argument
982 suggests to the server the level of compression that it should apply; it
983 should be an integer between 1 and 9, inclusive, where a higher number
984 indicates more compression.
985
986 @item Kerberos-encrypt \n
987 Response expected: no.
988 Use Kerberos encryption to encrypt all further communication between the
989 client and the server.  This will only work if the connection was made
990 over Kerberos in the first place.  If both the @code{Gzip-stream} and
991 the @code{Kerberos-encrypt} requests are used, the
992 @code{Kerberos-encrypt} request should be used first.  This will make
993 the client and server encrypt the compressed data, as opposed to
994 compressing the encrypted data.  Encrypted data is generally
995 incompressible.
996
997 Note that this request does not fully prevent an attacker from hijacking
998 the connection, in the sense that it does not prevent hijacking the
999 connection between the initial authentication and the
1000 @code{Kerberos-encrypt} request.
1001
1002 @item Gssapi-encrypt \n
1003 Response expected: no.
1004 Use GSSAPI encryption to encrypt all further communication between the
1005 client and the server.  This will only work if the connection was made
1006 over GSSAPI in the first place.  See @code{Kerberos-encrypt}, above, for
1007 the relation between @code{Gssapi-encrypt} and @code{Gzip-stream}.
1008
1009 Note that this request does not fully prevent an attacker from hijacking
1010 the connection, in the sense that it does not prevent hijacking the
1011 connection between the initial authentication and the
1012 @code{Gssapi-encrypt} request.
1013
1014 @item Gssapi-authenticate \n
1015 Response expected: no.
1016 Use GSSAPI authentication to authenticate all further communication
1017 between the client and the server.  This will only work if the
1018 connection was made over GSSAPI in the first place.  Encrypted data is
1019 automatically authenticated, so using both @code{Gssapi-authenticate}
1020 and @code{Gssapi-encrypt} has no effect beyond that of
1021 @code{Gssapi-encrypt}.  Unlike encrypted data, it is reasonable to
1022 compress authenticated data.
1023
1024 Note that this request does not fully prevent an attacker from hijacking
1025 the connection, in the sense that it does not prevent hijacking the
1026 connection between the initial authentication and the
1027 @code{Gssapi-authenticate} request.
1028
1029 @item Set @var{variable}=@var{value} \n
1030 Response expected: no.
1031 Set a user variable @var{variable} to @var{value}.
1032 The @code{Root} request need not have been previously sent.
1033
1034 @item expand-modules \n
1035 Response expected: yes.  Expand the modules which are specified in the
1036 arguments.  Returns the data in @code{Module-expansion} responses.  Note
1037 that the server can assume that this is checkout or export, not rtag or
1038 rdiff; the latter do not access the working directory and thus have no
1039 need to expand modules on the client side.
1040
1041 Expand may not be the best word for what this request does.  It does not
1042 necessarily tell you all the files contained in a module, for example.
1043 Basically it is a way of telling you which working directories the
1044 server needs to know about in order to handle a checkout of the
1045 specified modules.
1046
1047 For example, suppose that the server has a module defined by
1048
1049 @example
1050 aliasmodule -a 1dir
1051 @end example
1052
1053 That is, one can check out @code{aliasmodule} and it will take
1054 @code{1dir} in the repository and check it out to @code{1dir} in the
1055 working directory.  Now suppose the client already has this module
1056 checked out and is planning on using the @code{co} request to update it.
1057 Without using @code{expand-modules}, the client would have two bad
1058 choices: it could either send information about @emph{all} working
1059 directories under the current directory, which could be unnecessarily
1060 slow, or it could be ignorant of the fact that @code{aliasmodule} stands
1061 for @code{1dir}, and neglect to send information for @code{1dir}, which
1062 would lead to incorrect operation.
1063 @c Those don't really seem like the only two options.  I mean, what
1064 @c about keeping track of the correspondence from when we first checked
1065 @c out a fresh directory?  Not that the CVS client does this, or that
1066 @c I've really thought about whether it would be a good idea...
1067
1068 With @code{expand-modules}, the client would first ask for the module to
1069 be expanded:
1070
1071 @example
1072 C: Root /home/kingdon/zwork/cvsroot
1073 . . .
1074 C: Argument aliasmodule
1075 C: Directory .
1076 C: /home/kingdon/zwork/cvsroot
1077 C: expand-modules
1078 S: Module-expansion 1dir
1079 S: ok
1080 @end example
1081
1082 and then it knows to check the @file{1dir} directory and send
1083 requests such as @code{Entry} and @code{Modified} for the files in that
1084 directory.
1085
1086 @item ci \n
1087 @itemx diff \n
1088 @itemx list \n
1089 @itemx tag \n
1090 @itemx status \n
1091 @itemx admin \n
1092 @itemx history \n
1093 @itemx watchers \n
1094 @itemx editors \n
1095 @itemx annotate \n
1096 Response expected: yes.  Actually do a cvs command.  This uses any
1097 previous @code{Argument}, @code{Directory}, @code{Entry}, or
1098 @code{Modified} requests, if they have been sent.  The
1099 last @code{Directory} sent specifies the working directory at the time
1100 of the operation.  No provision is made for any input from the user.
1101 This means that @code{ci} must use a @code{-m} argument if it wants to
1102 specify a log message.
1103
1104 @item log \n
1105 Response expected: yes.  Show information for past revisions.  This uses
1106 any previous @code{Directory}, @code{Entry}, or @code{Modified}
1107 requests, if they have been sent.  The last @code{Directory} sent
1108 specifies the working directory at the time of the operation.  Also uses
1109 previous @code{Argument}'s of which the canonical forms are the
1110 following (@sc{cvs} 1.10 and older clients sent what the user specified,
1111 but clients are encouraged to use the canonical forms and other forms
1112 are deprecated):
1113
1114 @table @code
1115 @item -b, -h, -l, -N, -R, -t
1116 These options go by themselves, one option per @code{Argument} request.
1117
1118 @item -d @var{date1}<@var{date2}
1119 Select revisions between @var{date1} and @var{date2}.  Either date
1120 may be omitted in which case there is no date limit at that end of the
1121 range (clients may specify dates such as 1 Jan 1970 or 1 Jan 2038 for
1122 similar purposes but this is problematic as it makes assumptions about
1123 what dates the server supports).  Dates are in RFC822/1123 format.  The
1124 @samp{-d} is one @code{Argument} request and the date range is a second
1125 one.
1126
1127 @item -d @var{date1}<=@var{date2}
1128 Likewise but compare dates for equality.
1129
1130 @item -d @var{singledate}
1131 Select the single, latest revision dated @var{singledate} or earlier.
1132
1133 To include several date ranges and/or singledates, repeat the @samp{-d}
1134 option as many times as necessary.
1135
1136 @item -r@var{rev1}:@var{rev2}
1137 @itemx -r@var{branch}
1138 @itemx -r@var{branch}.
1139 @itemx -r
1140 Specify revisions (note that @var{rev1} or @var{rev2} can be omitted, or
1141 can refer to branches).  Send both the @samp{-r} and the revision
1142 information in a single @code{Argument} request.  To include several
1143 revision selections, repeat the @samp{-r} option.
1144
1145 @item -s @var{state}
1146 @itemx -w
1147 @itemx -w@var{login}
1148 Select on states or users.  To include more than one state or user,
1149 repeat the option.  Send the @samp{-s} option as a separate argument
1150 from the state being selected.  Send the @samp{-w} option as part of the
1151 same argument as the user being selected.
1152 @end table
1153
1154 @item co \n
1155 Response expected: yes.  Get files from the repository.  This uses any
1156 previous @code{Argument}, @code{Directory}, @code{Entry}, or
1157 @code{Modified} requests, if they have been sent.  Arguments to this
1158 command are module names; the client cannot know what directories they
1159 correspond to except by (1) just sending the @code{co} request, and then
1160 seeing what directory names the server sends back in its responses, and
1161 (2) the @code{expand-modules} request.
1162
1163 @item export \n
1164 Response expected: yes.  Get files from the repository.  This uses any
1165 previous @code{Argument}, @code{Directory}, @code{Entry}, or
1166 @code{Modified} requests, if they have been sent.  Arguments to this
1167 command are module names, as described for the @code{co} request.  The
1168 intention behind this command is that a client can get sources from a
1169 server without storing CVS information about those sources.  That is, a
1170 client probably should not count on being able to take the entries line
1171 returned in the @code{Created} response from an @code{export} request
1172 and send it in a future @code{Entry} request.  Note that the entries
1173 line in the @code{Created} response must indicate whether the file is
1174 binary or text, so the client can create it correctly.
1175
1176 @item ls \n
1177 @itemx rannotate \n
1178 @itemx rdiff \n
1179 @itemx rlist \n
1180 @itemx rlog \n
1181 @itemx rtag \n
1182 Response expected: yes.  Actually do a cvs command.  This uses any
1183 previous @code{Argument} requests, if they have been sent.  The client
1184 should not send @code{Directory}, @code{Entry}, or @code{Modified}
1185 requests for these commands; they are not used.  Arguments to these
1186 commands are module names, as described for @code{co}.  @code{ls} is a
1187 synonym for @code{rlist}, for compatibility with CVSNT.
1188
1189 @item init @var{root-name} \n
1190 Response expected: yes.  If it doesn't already exist, create a @sc{cvs}
1191 repository @var{root-name}.  Note that @var{root-name} is a local
1192 directory and @emph{not} a fully qualified @code{CVSROOT} variable.
1193 The @code{Root} request need not have been previously sent.
1194
1195 @item update \n
1196 Response expected: yes.  Actually do a @code{cvs update} command.  This
1197 uses any previous @code{Argument}, @code{Directory}, @code{Entry},
1198 or @code{Modified} requests, if they have been sent.  The
1199 last @code{Directory} sent specifies the working directory at the time
1200 of the operation.  The @code{-I} option is not used--files which the
1201 client can decide whether to ignore are not mentioned and the client
1202 sends the @code{Questionable} request for others.
1203
1204 @item import \n
1205 Response expected: yes.  Actually do a @code{cvs import} command.  This
1206 uses any previous @code{Argument}, @code{Directory}, @code{Entry}, or
1207 @code{Modified} requests, if they have been sent.  The
1208 last @code{Directory} sent specifies the working directory at the time
1209 of the operation - unlike most commands, the repository field of each
1210 @code{Directory} request is ignored (it merely must point somewhere
1211 within the root).  The files to be imported are sent in @code{Modified}
1212 requests (files which the client knows should be ignored are not sent;
1213 the server must still process the CVSROOT/cvsignore file unless -I ! is
1214 sent).  A log message must have been specified with a @code{-m}
1215 argument.
1216
1217 @item add \n
1218 Response expected: yes.  Add a file or directory.  This uses any
1219 previous @code{Argument}, @code{Directory}, @code{Entry}, or
1220 @code{Modified} requests, if they have been sent.  The
1221 last @code{Directory} sent specifies the working directory at the time
1222 of the operation.
1223
1224 To add a directory, send the directory to be added using
1225 @code{Directory} and @code{Argument} requests.  For example:
1226
1227 @example
1228 C: Root /u/cvsroot
1229 . . .
1230 C: Argument nsdir
1231 C: Directory nsdir
1232 C: /u/cvsroot/1dir/nsdir
1233 C: Directory .
1234 C: /u/cvsroot/1dir
1235 C: add
1236 S: M Directory /u/cvsroot/1dir/nsdir added to the repository
1237 S: ok
1238 @end example
1239
1240 You will notice that the server does not signal to the client in any
1241 particular way that the directory has been successfully added.  The
1242 client is supposed to just assume that the directory has been added and
1243 update its records accordingly.  Note also that adding a directory is
1244 immediate; it does not wait until a @code{ci} request as files do.
1245
1246 To add a file, send the file to be added using a @code{Modified}
1247 request.  For example:
1248
1249 @example
1250 C: Argument nfile
1251 C: Directory .
1252 C: /u/cvsroot/1dir
1253 C: Modified nfile
1254 C: u=rw,g=r,o=r
1255 C: 6
1256 C: hello
1257 C: add
1258 S: E cvs server: scheduling file `nfile' for addition
1259 S: Mode u=rw,g=r,o=r
1260 S: Checked-in ./
1261 S: /u/cvsroot/1dir/nfile
1262 S: /nfile/0///
1263 S: E cvs server: use 'cvs commit' to add this file permanently
1264 S: ok
1265 @end example
1266
1267 Note that the file has not been added to the repository; the only effect
1268 of a successful @code{add} request, for a file, is to supply the client
1269 with a new entries line containing @samp{0} to indicate an added file.
1270 In fact, the client probably could perform this operation without
1271 contacting the server, although using @code{add} does cause the server
1272 to perform a few more checks.
1273
1274 The client sends a subsequent @code{ci} to actually add the file to the
1275 repository.
1276
1277 Another quirk of the @code{add} request is that with CVS 1.9 and older,
1278 a pathname specified in
1279 an @code{Argument} request cannot contain @samp{/}.  There is no good
1280 reason for this restriction, and in fact more recent CVS servers don't
1281 have it.
1282 But the way to interoperate with the older servers is to ensure that
1283 all @code{Directory} requests for @code{add} (except those used to add
1284 directories, as described above), use @samp{.} for
1285 @var{local-directory}.  Specifying another string for
1286 @var{local-directory} may not get an error, but it will get you strange
1287 @code{Checked-in} responses from the buggy servers.
1288
1289 @item remove \n
1290 Response expected: yes.  Remove a file.  This uses any
1291 previous @code{Argument}, @code{Directory}, @code{Entry}, or
1292 @code{Modified} requests, if they have been sent.  The
1293 last @code{Directory} sent specifies the working directory at the time
1294 of the operation.
1295
1296 Note that this request does not actually do anything to the repository;
1297 the only effect of a successful @code{remove} request is to supply the
1298 client with a new entries line containing @samp{-} to indicate a removed
1299 file.  In fact, the client probably could perform this operation without
1300 contacting the server, although using @code{remove} may cause the server
1301 to perform a few more checks.
1302
1303 The client sends a subsequent @code{ci} request to actually record the
1304 removal in the repository.
1305
1306 @item watch-on \n
1307 @itemx watch-off \n
1308 @itemx watch-add \n
1309 @itemx watch-remove \n
1310 Response expected: yes.  Actually do the @code{cvs watch on}, @code{cvs
1311 watch off}, @code{cvs watch add}, and @code{cvs watch remove} commands,
1312 respectively.  This uses any previous @code{Argument},
1313 @code{Directory}, @code{Entry}, or @code{Modified}
1314 requests, if they have been sent.  The last @code{Directory} sent
1315 specifies the working directory at the time of the operation.
1316
1317 @item release \n
1318 Response expected: yes.  Note that a @code{cvs release} command has
1319 taken place and update the history file accordingly.
1320
1321 @item global-list-quiet \n
1322 Response expected: yes.  This request is a synonym for noop, but its existance
1323 notifies the client that a @code{-q} option to @code{list} and @code{rlist}
1324 will be rejected.  This, in a reverse-logic sort of way, is here so that when
1325 it @emph{isn't} received, as for instance from CVSNT, the client will know that
1326 the quiet option has to be sent as a command option rather than a global
1327 option.
1328
1329 @item noop \n
1330 Response expected: yes.  This request is a null command in the sense
1331 that it doesn't do anything, but merely (as with any other requests
1332 expecting a response) sends back any responses pertaining to pending
1333 errors, pending @code{Notified} responses, etc.
1334 The @code{Root} request need not have been previously sent.
1335
1336 @item update-patches \n
1337 Response expected: yes.
1338 This request does not actually do anything.  It is used as a signal that
1339 the server is able to generate patches when given an @code{update}
1340 request.  The client must issue the @code{-u} argument to @code{update}
1341 in order to receive patches.
1342
1343 @item gzip-file-contents @var{level} \n
1344 Response expected: no.  Note that this request does not follow the
1345 response convention stated above.  @code{Gzip-stream} is suggested
1346 instead of @code{gzip-file-contents} as it gives better compression; the
1347 only reason to implement the latter is to provide compression with
1348 @sc{cvs} 1.8 and earlier.  The @code{gzip-file-contents} request asks
1349 the server to compress files it sends to the client using @code{gzip}
1350 (RFC1952/1951) compression, using the specified level of compression.
1351 If this request is not made, the server must not compress files.
1352
1353 This is only a hint to the server.  It may still decide (for example, in
1354 the case of very small files, or files that already appear to be
1355 compressed) not to do the compression.  Compression is indicated by a
1356 @samp{z} preceding the file length.
1357
1358 Availability of this request in the server indicates to the client that
1359 it may compress files sent to the server, regardless of whether the
1360 client actually uses this request.
1361
1362 @item wrapper-sendme-rcsOptions \n
1363 Response expected: yes.
1364 Request that the server transmit mappings from filenames to keyword
1365 expansion modes in @code{Wrapper-rcsOption} responses.
1366
1367 @item version \n
1368 Response expected: yes.
1369 Request that the server transmit its version message.
1370 The @code{Root} request need not have been previously sent.
1371
1372 @item @var{other-request} @var{text} \n
1373 Response expected: yes.
1374 Any unrecognized request expects a response, and does not
1375 contain any additional data.  The response will normally be something like
1376 @samp{error  unrecognized request}, but it could be a different error if
1377 a previous request which doesn't expect a response produced an error.
1378 @end table
1379
1380 When the client is done, it drops the connection.
1381
1382 @node Response intro
1383 @section Introduction to Responses
1384
1385 After a command which expects a response, the server sends however many
1386 of the following responses are appropriate.  The server should not send
1387 data at other times (the current implementation may violate this
1388 principle in a few minor places, where the server is printing an error
1389 message and exiting---this should be investigated further).
1390
1391 Any set of responses always ends with @samp{error} or @samp{ok}.  This
1392 indicates that the response is over.
1393
1394 @c "file updating response" and "file update modifying response" are
1395 @c lame terms (mostly because they are so awkward).  Any better ideas?
1396 The responses @code{Checked-in}, @code{New-entry}, @code{Updated},
1397 @code{Created}, @code{Update-existing}, @code{Merged}, and
1398 @code{Patched} are refered to as @dfn{file updating} responses, because
1399 they change the status of a file in the working directory in some way.
1400 The responses @code{Mode}, @code{Mod-time}, and @code{Checksum} are
1401 referred to as @dfn{file update modifying} responses because they modify
1402 the next file updating response.  In no case shall a file update
1403 modifying response apply to a file updating response other than the next
1404 one.  Nor can the same file update modifying response occur twice for
1405 a given file updating response (if servers diagnose this problem, it may
1406 aid in detecting the case where clients send an update modifying
1407 response without following it by a file updating response).
1408
1409 @node Response pathnames
1410 @section The "pathname" in responses
1411
1412 Many of the responses contain something called @var{pathname}.
1413 @c FIXME: should better document when the specified repository needs to
1414 @c end in "/.".
1415 The name is somewhat misleading; it actually indicates a pair of
1416 pathnames.  First, a local directory name
1417 relative to the directory in which the command was given (i.e. the last
1418 @code{Directory} before the command).  Then a linefeed and a repository
1419 name.  Then
1420 a slash and the filename (without a @samp{,v} ending).
1421 For example, for a file @file{i386.mh}
1422 which is in the local directory @file{gas.clean/config} and for which
1423 the repository is @file{/rel/cvsfiles/devo/gas/config}:
1424
1425 @example
1426 gas.clean/config/
1427 /rel/cvsfiles/devo/gas/config/i386.mh
1428 @end example
1429
1430 If the server wants to tell the client to create a directory, then it
1431 merely uses the directory in any response, as described above, and the
1432 client should create the directory if it does not exist.  Note that this
1433 should only be done one directory at a time, in order to permit the
1434 client to correctly store the repository for each directory.  Servers
1435 can use requests such as @code{Clear-sticky},
1436 @code{Clear-static-directory}, or any other requests, to create
1437 directories.
1438 @c FIXME: Need example here of how "repository" needs to be sent for
1439 @c each directory, and cannot be correctly deduced from, say, the most
1440 @c deeply nested directory.
1441
1442 Some server
1443 implementations may poorly distinguish between a directory which should
1444 not exist and a directory which contains no files; in order to refrain
1445 from creating empty directories a client should both send the @samp{-P}
1446 option to @code{update} or @code{co}, and should also detect the case in
1447 which the server asks to create a directory but not any files within it
1448 (in that case the client should remove the directory or refrain from
1449 creating it in the first place).  Note that servers could clean this up
1450 greatly by only telling the client to create directories if the
1451 directory in question should exist, but until servers do this, clients
1452 will need to offer the @samp{-P} behavior described above.
1453
1454 @node Responses
1455 @section Responses
1456
1457 Here are the responses:
1458
1459 @table @code
1460 @item Valid-requests @var{request-list} \n
1461 Indicate what requests the server will accept.  @var{request-list}
1462 is a space separated list of tokens.  If the server supports sending
1463 patches, it will include @samp{update-patches} in this list.  The
1464 @samp{update-patches} request does not actually do anything.
1465
1466 @item Checked-in @var{pathname} \n
1467 Additional data: New Entries line, \n.  This means a file @var{pathname}
1468 has been successfully operated on (checked in, added, etc.).  name in
1469 the Entries line is the same as the last component of @var{pathname}.
1470
1471 @item New-entry @var{pathname} \n
1472 Additional data: New Entries line, \n.  Like @code{Checked-in}, but the
1473 file is not up to date.
1474
1475 @item Updated @var{pathname} \n
1476 Additional data: New Entries line, \n, mode, \n, file transmission.  A
1477 new copy of the file is enclosed.  This is used for a new revision of an
1478 existing file, or for a new file, or for any other case in which the
1479 local (client-side) copy of the file needs to be updated, and after
1480 being updated it will be up to date.  If any directory in pathname does
1481 not exist, create it.  This response is not used if @code{Created} and
1482 @code{Update-existing} are supported.
1483
1484 @item Created @var{pathname} \n
1485 This is just like @code{Updated} and takes the same additional data, but
1486 is used only if no @code{Entry}, @code{Modified}, or
1487 @code{Unchanged} request has been sent for the file in question.  The
1488 distinction between @code{Created} and @code{Update-existing} is so
1489 that the client can give an error message in several cases: (1) there is
1490 a file in the working directory, but not one for which @code{Entry},
1491 @code{Modified}, or @code{Unchanged} was sent (for example, a file which
1492 was ignored, or a file for which @code{Questionable} was sent), (2)
1493 there is a file in the working directory whose name differs from the one
1494 mentioned in @code{Created} in ways that the client is unable to use to
1495 distinguish files.  For example, the client is case-insensitive and the
1496 names differ only in case.
1497
1498 @item Update-existing @var{pathname} \n
1499 This is just like @code{Updated} and takes the same additional data, but
1500 is used only if a @code{Entry}, @code{Modified}, or @code{Unchanged}
1501 request has been sent for the file in question.
1502
1503 This response, or @code{Merged}, indicates that the server has
1504 determined that it is OK to overwrite the previous contents of the file
1505 specified by @var{pathname}.  Provided that the client has correctly
1506 sent @code{Modified} or @code{Is-modified} requests for a modified file,
1507 and the file was not modified while CVS was running, the server can
1508 ensure that a user's modifications are not lost.
1509
1510 @item Merged @var{pathname} \n
1511 This is just like @code{Updated} and takes the same additional data,
1512 with the one difference that after the new copy of the file is enclosed,
1513 it will still not be up to date.  Used for the results of a merge, with
1514 or without conflicts.
1515
1516 It is useful to preserve an copy of what the file looked like before the
1517 merge.  This is basically handled by the server; before sending
1518 @code{Merged} it will send a @code{Copy-file} response.  For example, if
1519 the file is @file{aa} and it derives from revision 1.3, the
1520 @code{Copy-file} response will tell the client to copy @file{aa} to
1521 @file{.#aa.1.3}.  It is up to the client to decide how long to keep this
1522 file around; traditionally clients have left it around forever, thus
1523 letting the user clean it up as desired.  But another answer, such as
1524 until the next commit, might be preferable.
1525
1526 @item Rcs-diff @var{pathname} \n
1527 This is just like @code{Updated} and takes the same additional data,
1528 with the one difference that instead of sending a new copy of the file,
1529 the server sends an RCS change text.  This change text is produced by
1530 @samp{diff -n} (the GNU diff @samp{-a} option may also be used).  The
1531 client must apply this change text to the existing file.  This will only
1532 be used when the client has an exact copy of an earlier revision of a
1533 file.  This response is only used if the @code{update} command is given
1534 the @samp{-u} argument.
1535
1536 @item Patched @var{pathname} \n
1537 This is just like @code{Rcs-diff} and takes the same additional data,
1538 except that it sends a standard patch rather than an RCS change text.
1539 The patch is produced by @samp{diff -c} for @sc{cvs} 1.6 and later (see
1540 POSIX.2 for a description of this format), or @samp{diff -u} for
1541 previous versions of @sc{cvs}; clients are encouraged to accept either
1542 format.  Like @code{Rcs-diff}, this response is only used if the
1543 @code{update} command is given the @samp{-u} argument.
1544
1545 The @code{Patched} response is deprecated in favor of the
1546 @code{Rcs-diff} response.  However, older clients (CVS 1.9 and earlier)
1547 only support @code{Patched}.
1548
1549 @item Mode @var{mode} \n
1550 This @var{mode} applies to the next file mentioned in
1551 @code{Checked-in}.  @code{Mode} is a file update modifying response
1552 as described in @ref{Response intro}.
1553
1554 @item Mod-time @var{time} \n
1555 Set the modification time of the next file sent to @var{time}.
1556 @code{Mod-time} is a file update modifying response
1557 as described in @ref{Response intro}.
1558 The
1559 @var{time} is in the format specified by RFC822 as modified by RFC1123.
1560 The server may specify any timezone it chooses; clients will want to
1561 convert that to their own timezone as appropriate.  An example of this
1562 format is:
1563
1564 @example
1565 26 May 1997 13:01:40 -0400
1566 @end example
1567
1568 There is no requirement that the client and server clocks be
1569 synchronized.  The server just sends its recommendation for a timestamp
1570 (based on its own clock, presumably), and the client should just believe
1571 it (this means that the time might be in the future, for example).
1572
1573 If the server does not send @code{Mod-time} for a given file, the client
1574 should pick a modification time in the usual way (usually, just let the
1575 operating system set the modification time to the time that the CVS
1576 command is running).
1577
1578 @item Checksum @var{checksum}\n
1579 The @var{checksum} applies to the next file sent (that is,
1580 @code{Checksum} is a file update modifying response
1581 as described in @ref{Response intro}).
1582 In the case of
1583 @code{Patched}, the checksum applies to the file after being patched,
1584 not to the patch itself.  The client should compute the checksum itself,
1585 after receiving the file or patch, and signal an error if the checksums
1586 do not match.  The checksum is the 128 bit MD5 checksum represented as
1587 32 hex digits (MD5 is described in RFC1321).
1588 This response is optional, and is only used if the
1589 client supports it (as judged by the @code{Valid-responses} request).
1590
1591 @item Copy-file @var{pathname} \n
1592 Additional data: @var{newname} \n.  Copy file @var{pathname} to
1593 @var{newname} in the same directory where it already is.  This does not
1594 affect @code{CVS/Entries}.
1595
1596 This can optionally be implemented as a rename instead of a copy.  The
1597 only use for it which currently has been identified is prior to a
1598 @code{Merged} response as described under @code{Merged}.  Clients can
1599 probably assume that is how it is being used, if they want to worry
1600 about things like how long to keep the @var{newname} file around.
1601
1602 @item Removed @var{pathname} \n
1603 The file has been removed from the repository (this is the case where
1604 cvs prints @samp{file foobar.c is no longer pertinent}).
1605
1606 @item Remove-entry @var{pathname} \n
1607 The file needs its entry removed from @code{CVS/Entries}, but the file
1608 itself is already gone (this happens in response to a @code{ci} request
1609 which involves committing the removal of a file).
1610
1611 @item Set-static-directory @var{pathname} \n
1612 This instructs the client to set the @code{Entries.Static} flag, which
1613 it should then send back to the server in a @code{Static-directory}
1614 request whenever the directory is operated on.  @var{pathname} ends in a
1615 slash; its purpose is to specify a directory, not a file within a
1616 directory.
1617
1618 @item Clear-static-directory @var{pathname} \n
1619 Like @code{Set-static-directory}, but clear, not set, the flag.
1620
1621 @item Set-sticky @var{pathname} \n
1622 Additional data: @var{tagspec} \n.  Tell the client to set a sticky tag
1623 or date, which should be supplied with the @code{Sticky} request for
1624 future operations.  @var{pathname} ends in a slash; its purpose is to
1625 specify a directory, not a file within a directory.  The client should
1626 store @var{tagspec} and pass it back to the server as-is, to allow for
1627 future expansion.  The first character of @var{tagspec} is @samp{T} for
1628 a tag, @samp{D} for a date, or something else for future expansion.  The
1629 remainder of @var{tagspec} contains the actual tag or date.
1630
1631 @item Clear-sticky @var{pathname} \n
1632 Clear any sticky tag or date set by @code{Set-sticky}.
1633
1634 @item Template @var{pathname} \n
1635 Additional data: file transmission (note: compressed file transmissions
1636 are not supported).  @var{pathname} ends in a slash; its purpose is to
1637 specify a directory, not a file within a directory.  Tell the client to
1638 store the file transmission as the template log message, and then use
1639 that template in the future when prompting the user for a log message.
1640
1641 @item Set-checkin-prog @var{dir} \n
1642 Additional data: @var{prog} \n.  Tell the client to set a checkin
1643 program, which should be supplied with the @code{Checkin-prog} request
1644 for future operations.
1645
1646 @item Set-update-prog @var{dir} \n
1647 Additional data: @var{prog} \n.  Tell the client to set an update
1648 program, which should be supplied with the @code{Update-prog} request
1649 for future operations.
1650
1651 @item Notified @var{pathname} \n
1652 Indicate to the client that the notification for @var{pathname} has been
1653 done.  There should be one such response for every @code{Notify}
1654 request; if there are several @code{Notify} requests for a single file,
1655 the requests should be processed in order; the first @code{Notified}
1656 response pertains to the first @code{Notify} request, etc.
1657
1658 @item Module-expansion @var{pathname} \n
1659 Return a file or directory
1660 which is included in a particular module.  @var{pathname} is relative
1661 to cvsroot, unlike most pathnames in responses.  @var{pathname} should
1662 be used to look and see whether some or all of the module exists on
1663 the client side; it is not necessarily suitable for passing as an
1664 argument to a @code{co} request (for example, if the modules file
1665 contains the @samp{-d} option, it will be the directory specified with
1666 @samp{-d}, not the name of the module).
1667
1668 @item Wrapper-rcsOption @var{pattern} -k '@var{option}' \n
1669 Transmit to the client a filename pattern which implies a certain
1670 keyword expansion mode.  The @var{pattern} is a wildcard pattern (for
1671 example, @samp{*.exe}.  The @var{option} is @samp{b} for binary, and so
1672 on.  Note that although the syntax happens to resemble the syntax in
1673 certain CVS configuration files, it is more constrained; there must be
1674 exactly one space between @var{pattern} and @samp{-k} and exactly one
1675 space between @samp{-k} and @samp{'}, and no string is permitted in
1676 place of @samp{-k} (extensions should be done with new responses, not by
1677 extending this one, for graceful handling of @code{Valid-responses}).
1678
1679 @item M @var{text} \n
1680 A one-line message for the user.
1681 Note that the format of @var{text} is not designed for machine parsing.
1682 Although sometimes scripts and clients will have little choice, the
1683 exact text which is output is subject to vary at the discretion of the
1684 server and the example output given in this document is just that,
1685 example output.  Servers are encouraged to use the @samp{MT} response,
1686 and future versions of this document will hopefully standardize more of
1687 the @samp{MT} tags; see @ref{Text tags}.
1688
1689 @item Mbinary \n
1690 Additional data: file transmission (note: compressed file transmissions
1691 are not supported).  This is like @samp{M}, except the contents of the
1692 file transmission are binary and should be copied to standard output
1693 without translation to local text file conventions.  To transmit a text
1694 file to standard output, servers should use a series of @samp{M} requests.
1695
1696 @item E @var{text} \n
1697 Same as @code{M} but send to stderr not stdout.
1698
1699 @item F \n
1700 @c FIXME: The second sentence, defining "flush", is somewhat off the top
1701 @c of my head.  Is there some text we can steal from ANSI C or someplace
1702 @c which is more carefully thought out?
1703 Flush stderr.  That is, make it possible for the user to see what has
1704 been written to stderr (it is up to the implementation to decide exactly
1705 how far it should go to ensure this).
1706
1707 @item MT @var{tagname} @var{data} \n
1708
1709 This response provides for tagged text.  It is similar to
1710 SGML/HTML/XML in that the data is structured and a naive application
1711 can also make some sense of it without understanding the structure.
1712 The syntax is not SGML-like, however, in order to fit into the CVS
1713 protocol better and (more importantly) to make it easier to parse,
1714 especially in a language like perl or awk.
1715
1716 The @var{tagname} can have several forms.  If it starts with @samp{a}
1717 to @samp{z} or @samp{A} to @samp{Z}, then it represents tagged text.
1718 If the implementation recognizes @var{tagname}, then it may interpret
1719 @var{data} in some particular fashion.  If the implementation does not
1720 recognize @var{tagname}, then it should simply treat @var{data} as
1721 text to be sent to the user (similar to an @samp{M} response).  There
1722 are two tags which are general purpose.  The @samp{text} tag is
1723 similar to an unrecognized tag in that it provides text which will
1724 ordinarily be sent to the user.  The @samp{newline} tag is used
1725 without @var{data} and indicates that a newline will ordinarily be
1726 sent to the user (there is no provision for embedding newlines in the
1727 @var{data} of other tagged text responses).
1728
1729 If @var{tagname} starts with @samp{+} it indicates a start tag and if
1730 it starts with @samp{-} it indicates an end tag.  The remainder of
1731 @var{tagname} should be the same for matching start and end tags, and
1732 tags should be nested (for example one could have tags in the
1733 following order @code{+bold} @code{+italic} @code{text} @code{-italic}
1734 @code{-bold} but not @code{+bold} @code{+italic} @code{text}
1735 @code{-bold} @code{-italic}).  A particular start and end tag may be
1736 documented to constrain the tagged text responses which are valid
1737 between them.
1738
1739 Note that if @var{data} is present there will always be exactly one
1740 space between @var{tagname} and @var{data}; if there is more than one
1741 space, then the spaces beyond the first are part of @var{data}.
1742
1743 Here is an example of some tagged text responses.  Note that there is
1744 a trailing space after @samp{Checking in} and @samp{initial revision:}
1745 and there are two trailing spaces after @samp{<--}.  Such trailing
1746 spaces are, of course, part of @var{data}.
1747
1748 @example
1749 MT +checking-in
1750 MT text Checking in 
1751 MT fname gz.tst
1752 MT text ;
1753 MT newline
1754 MT rcsfile /home/kingdon/zwork/cvsroot/foo/gz.tst,v
1755 MT text   <--  
1756 MT fname gz.tst
1757 MT newline
1758 MT text initial revision: 
1759 MT init-rev 1.1
1760 MT newline
1761 MT text done
1762 MT newline
1763 MT -checking-in
1764 @end example
1765
1766 If the client does not support the @samp{MT} response, the same
1767 responses might be sent as:
1768
1769 @example
1770 M Checking in gz.tst;
1771 M /home/kingdon/zwork/cvsroot/foo/gz.tst,v  <--  gz.tst
1772 M initial revision: 1.1
1773 M done
1774 @end example
1775
1776 For a list of specific tags, see @ref{Text tags}.
1777
1778 @item error @var{errno-code} @samp{ } @var{text} \n
1779 The command completed with an error.  @var{errno-code} is a symbolic
1780 error code (e.g. @code{ENOENT}); if the server doesn't support this
1781 feature, or if it's not appropriate for this particular message, it just
1782 omits the errno-code (in that case there are two spaces after
1783 @samp{error}).  Text is an error message such as that provided by
1784 strerror(), or any other message the server wants to use.
1785 The @var{text} is like the @code{M} response, in the sense that it is
1786 not particularly intended to be machine-parsed; servers may wish to
1787 print an error message with @code{MT} responses, and then issue a
1788 @code{error} response without @var{text} (although it should be noted
1789 that @code{MT} currently has no way of flagging the output as intended
1790 for standard error, the way that the @code{E} response does).
1791
1792 @item ok \n
1793 The command completed successfully.
1794 @end table
1795
1796 @node Text tags
1797 @section Tags for the MT tagged text response
1798
1799 The @code{MT} response, as described in @ref{Responses}, offers a
1800 way for the server to send tagged text to the client.  This section
1801 describes specific tags.  The intention is to update this section as
1802 servers add new tags.
1803
1804 In the following descriptions, @code{text} and @code{newline} tags are
1805 omitted.  Such tags contain information which is intended for users (or
1806 to be discarded), and are subject to change at the whim of the server.
1807 To avoid being vulnerable to such whim, clients should look for the tags
1808 listed here, not @code{text}, @code{newline}, or other tags.
1809
1810 The following tag means to indicate to the user that a file has been
1811 updated.  It is more or less redundant with the @code{Created} and
1812 @code{Update-existing} responses, but we don't try to specify here
1813 whether it occurs in exactly the same circumstances as @code{Created}
1814 and @code{Update-existing}.  The @var{name} is the pathname of the file
1815 being updated relative to the directory in which the command is
1816 occurring (that is, the last @code{Directory} request which is sent
1817 before the command).
1818
1819 @example
1820 MT +updated
1821 MT fname @var{name}
1822 MT -updated
1823 @end example
1824
1825 The @code{importmergecmd} tag is used when doing an import which has
1826 conflicts.  The client can use it to report how to merge in the newly
1827 imported changes.  The @var{count} is the number of conflicts.  The
1828 newly imported changes can be merged by running the following command:
1829 @smallexample
1830 cvs checkout -j @var{tag1} -j @var{tag2} @var{repository}
1831 @end smallexample
1832
1833 @example
1834 MT +importmergecmd
1835 MT conflicts @var{count}
1836 MT mergetag1 @var{tag1}
1837 MT mergetag2 @var{tag2}
1838 MT repository @var{repository}
1839 MT -importmergecmd
1840 @end example
1841
1842 @node Example
1843 @section Example
1844
1845 @c The C:/S: convention is in imitation of RFC1869 (and presumably
1846 @c other RFC's).  In other formatting concerns, we might want to think
1847 @c about whether there is an easy way to provide RFC1543 formatting
1848 @c (without negating the advantages of texinfo), and whether we should
1849 @c use RFC2234 BNF (I fear that would be less clear than
1850 @c what we do now, however).  Plus what about RFC2119 terminology (MUST,
1851 @c SHOULD, &c) or ISO terminology (shall, should, or whatever they are)?
1852 Here is an example; lines are prefixed by @samp{C: } to indicate the
1853 client sends them or @samp{S: } to indicate the server sends them.
1854
1855 The client starts by connecting, sending the root, and completing the
1856 protocol negotiation.  In actual practice the lists of valid responses
1857 and requests would be longer.
1858 @c The reason that we artificially shorten the lists is to avoid phony
1859 @c line breaks.  Any better solutions?
1860 @c Other than that, this exchange is taken verbatim from the data
1861 @c exchanged by CVS (as of Nov 1996).  That is why some of the requests and
1862 @c reponses are not quite what you would pick for pedagogical purposes.
1863
1864 @example
1865 C: Root /u/cvsroot
1866 C: Valid-responses ok error Checked-in M E
1867 C: valid-requests
1868 S: Valid-requests Root Directory Entry Modified Argument Argumentx ci co
1869 S: ok
1870 C: UseUnchanged
1871 @end example
1872
1873 The client wants to check out the @code{supermunger} module into a fresh
1874 working directory.  Therefore it first expands the @code{supermunger}
1875 module; this step would be omitted if the client was operating on a
1876 directory rather than a module.
1877 @c Why does it send Directory here?  The description of expand-modules
1878 @c doesn't really say much of anything about what use, if any, it makes of
1879 @c Directory and similar requests sent previously.
1880
1881 @example
1882 C: Argument supermunger
1883 C: Directory .
1884 C: /u/cvsroot
1885 C: expand-modules
1886 @end example
1887
1888 The server replies that the @code{supermunger} module expands to the
1889 directory @code{supermunger} (the simplest case):
1890
1891 @example
1892 S: Module-expansion supermunger
1893 S: ok
1894 @end example
1895
1896 The client then proceeds to check out the directory.  The fact that it
1897 sends only a single @code{Directory} request which specifies @samp{.}
1898 for the working directory means that there is not already a
1899 @code{supermunger} directory on the client.
1900 @c What is -N doing here?
1901
1902 @example
1903 C: Argument -N
1904 C: Argument supermunger
1905 C: Directory .
1906 C: /u/cvsroot
1907 C: co
1908 @end example
1909
1910 The server replies with the requested files.  In this example, there is
1911 only one file, @file{mungeall.c}.  The @code{Clear-sticky} and
1912 @code{Clear-static-directory} requests are sent by the current
1913 implementation but they have no effect because the default is for those
1914 settings to be clear when a directory is newly created.
1915
1916 @example
1917 S: Clear-sticky supermunger/
1918 S: /u/cvsroot/supermunger/
1919 S: Clear-static-directory supermunger/
1920 S: /u/cvsroot/supermunger/
1921 S: E cvs server: Updating supermunger
1922 S: M U supermunger/mungeall.c
1923 S: Created supermunger/
1924 S: /u/cvsroot/supermunger/mungeall.c
1925 S: /mungeall.c/1.1///
1926 S: u=rw,g=r,o=r
1927 S: 26
1928 S: int mein () @{ abort (); @}
1929 S: ok
1930 @end example
1931
1932 The current client implementation would break the connection here and make a
1933 new connection for the next command.  However, the protocol allows it
1934 to keep the connection open and continue, which is what we show here.
1935
1936 After the user modifies the file and instructs the client to check it
1937 back in.  The client sends arguments to specify the log message and file
1938 to check in:
1939
1940 @example
1941 C: Argument -m
1942 C: Argument Well, you see, it took me hours and hours to find
1943 C: Argumentx this typo and I searched and searched and eventually
1944 C: Argumentx had to ask John for help.
1945 C: Argument mungeall.c
1946 @end example
1947
1948 It also sends information about the contents of the working directory,
1949 including the new contents of the modified file.  Note that the user has
1950 changed into the @file{supermunger} directory before executing this
1951 command; the top level directory is a user-visible concept because the
1952 server should print filenames in @code{M} and @code{E} responses
1953 relative to that directory.
1954 @c We are waving our hands about the order of the requests.  "Directory"
1955 @c and "Argument" can be in any order, but this probably isn't specified
1956 @c very well.
1957
1958 @example
1959 C: Directory .
1960 C: /u/cvsroot/supermunger
1961 C: Entry /mungeall.c/1.1///
1962 C: Modified mungeall.c
1963 C: u=rw,g=r,o=r
1964 C: 26
1965 C: int main () @{ abort (); @}
1966 @end example
1967
1968 And finally, the client issues the checkin command (which makes use of
1969 the data just sent):
1970
1971 @example
1972 C: ci
1973 @end example
1974
1975 And the server tells the client that the checkin succeeded:
1976
1977 @example
1978 S: M Checking in mungeall.c;
1979 S: E /u/cvsroot/supermunger/mungeall.c,v  <--  mungeall.c
1980 S: E new revision: 1.2; previous revision: 1.1
1981 S: E done
1982 S: Mode u=rw,g=r,o=r
1983 S: Checked-in ./
1984 S: /u/cvsroot/supermunger/mungeall.c
1985 S: /mungeall.c/1.2///
1986 S: ok
1987 @end example
1988
1989 @node Requirements
1990 @section Required versus optional parts of the protocol
1991
1992 The following are part of every known implementation of the CVS protocol
1993 (except obsolete, pre-1.5, versions of CVS) and it is considered
1994 reasonable behavior to completely fail to work if you are connected with
1995 an implementation which attempts to not support them.  Requests:
1996 @code{Root}, @code{Valid-responses}, @code{valid-requests},
1997 @code{Directory}, @code{Entry}, @code{Modified}, @code{Unchanged},
1998 @code{Argument}, @code{Argumentx}, @code{ci}, @code{co}, @code{update}.
1999 Responses: @code{ok}, @code{error}, @code{Valid-requests},
2000 @code{Checked-in}, @code{Updated}, @code{Merged}, @code{Removed},
2001 @code{M}, @code{E}.
2002
2003 A server need not implement @code{Repository}, but in order to interoperate
2004 with CVS 1.5 through 1.9 it must claim to implement it (in
2005 @code{Valid-requests}).  The client will not actually send the request.
2006
2007 @node Obsolete
2008 @section Obsolete protocol elements
2009
2010 This section briefly describes protocol elements which are obsolete.
2011 There is no attempt to document them in full detail.
2012
2013 There was a @code{Repository} request which was like @code{Directory}
2014 except it only provided @var{repository}, and the local directory was
2015 assumed to be similarly named.
2016
2017 If the @code{UseUnchanged} request was not sent, there was a @code{Lost}
2018 request which was sent to indicate that a file did not exist in the
2019 working directory, and the meaning of sending @code{Entries} without
2020 @code{Lost} or @code{Modified} was different.  All current clients (CVS
2021 1.5 and later) will send @code{UseUnchanged} if it is supported.
2022
2023 @node Protocol Notes
2024 @chapter Notes on the Protocol
2025
2026 A number of enhancements are possible.  Also see the file @sc{todo} in
2027 the @sc{cvs} source distribution, which has further ideas concerning
2028 various aspects of @sc{cvs}, some of which impact the protocol.
2029 Similarly, the @code{http://www.cvshome.org} site, in particular the
2030 @cite{Development} pages.
2031
2032 @itemize @bullet
2033 @item
2034 The @code{Modified} request could be speeded up by sending diffs rather
2035 than entire files.  The client would need some way to keep the version
2036 of the file which was originally checked out; probably requiring the use
2037 of "cvs edit" in this case is the most sensible course (the "cvs edit"
2038 could be handled by a package like VC for emacs).  This would also allow
2039 local operation of @code{cvs diff} without arguments.
2040
2041 @item
2042 The fact that @code{pserver} requires an extra network turnaround in
2043 order to perform authentication would be nice to avoid.  This relates to
2044 the issue of reporting errors; probably the clean solution is to defer
2045 the error until the client has issued a request which expects a
2046 response.  To some extent this might relate to the next item (in terms
2047 of how easy it is to skip a whole bunch of requests until we get to one
2048 that expects a response).  I know that the kerberos code doesn't wait in
2049 this fashion, but that probably can cause network deadlocks and perhaps
2050 future problems running over a transport which is more transaction
2051 oriented than TCP.  On the other hand I'm not sure it is wise to make
2052 the client conduct a lengthy upload only to find there is an
2053 authentication failure.
2054
2055 @item
2056 The protocol uses an extra network turnaround for protocol negotiation
2057 (@code{valid-requests}).  It might be nice to avoid this by having the
2058 client be able to send requests and tell the server to ignore them if
2059 they are unrecognized (different requests could produce a fatal error if
2060 unrecognized).  To do this there should be a standard syntax for
2061 requests.  For example, perhaps all future requests should be a single
2062 line, with mechanisms analogous to @code{Argumentx}, or several requests
2063 working together, to provide greater amounts of information.  Or there
2064 might be a standard mechanism for counted data (analogous to that used
2065 by @code{Modified}) or continuation lines (like a generalized
2066 @code{Argumentx}).  It would be useful to compare what HTTP is planning
2067 in this area; last I looked they were contemplating something called
2068 Protocol Extension Protocol but I haven't looked at the relevant IETF
2069 documents in any detail.  Obviously, we want something as simple as
2070 possible (but no simpler).
2071
2072 @item
2073 The scrambling algorithm in the CVS client and server actually support
2074 more characters than those documented in @ref{Password scrambling}.
2075 Someday we are going to either have to document them all (but this is
2076 not as easy as it may look, see below), or (gradually and with adequate
2077 process) phase out the support for other characters in the CVS
2078 implementation.  This business of having the feature partly undocumented
2079 isn't a desirable state long-term.
2080
2081 The problem with documenting other characters is that unless we know
2082 what character set is in use, there is no way to make a password
2083 portable from one system to another.  For example, a with a circle on
2084 top might have different encodings in different character sets.
2085
2086 It @emph{almost} works to say that the client picks an arbitrary,
2087 unknown character set (indeed, having the CVS client know what character
2088 set the user has in mind is a hard problem otherwise), and scrambles
2089 according to a certain octet<->octet mapping.  There are two problems
2090 with this.  One is that the protocol has no way to transmit character 10
2091 decimal (linefeed), and the current server and clients have no way to
2092 handle 0 decimal (NUL).  This may cause problems with certain multibyte
2093 character sets, in which octets 10 and 0 will appear in the middle of
2094 other characters.  The other problem, which is more minor and possibly
2095 not worth worrying about, is that someone can type a password on one
2096 system and then go to another system which uses a different encoding for
2097 the same characters, and have their password not work.
2098
2099 The restriction to the ISO646 invariant subset is the best approach for
2100 strings which are not particularly significant to users.  Passwords are
2101 visible enough that this is somewhat doubtful as applied here.  ISO646
2102 does, however, have the virtue (!?) of offending everyone.  It is easy
2103 to say "But the $ is right on people's keyboards!  Surely we can't
2104 forbid that".  From a human factors point of view, that makes quite a
2105 bit of sense.  The contrary argument, of course, is that a with a circle
2106 on top, or some of the characters poorly handled by Unicode, are on
2107 @emph{someone}'s keyboard.
2108
2109 @end itemize
2110
2111 @bye