Initial import from FreeBSD RELENG_4:
[games.git] / share / doc / papers / nqnfs / nqnfs.me
1 .\" Copyright (c) 1993 The Usenix Association. All rights reserved.
2 .\"
3 .\" This document is derived from software contributed to Berkeley by
4 .\" Rick Macklem at The University of Guelph with the permission of
5 .\" the Usenix Association.
6 .\"
7 .\" Redistribution and use in source and binary forms, with or without
8 .\" modification, are permitted provided that the following conditions
9 .\" are met:
10 .\" 1. Redistributions of source code must retain the above copyright
11 .\"    notice, this list of conditions and the following disclaimer.
12 .\" 2. Redistributions in binary form must reproduce the above copyright
13 .\"    notice, this list of conditions and the following disclaimer in the
14 .\"    documentation and/or other materials provided with the distribution.
15 .\" 3. All advertising materials mentioning features or use of this software
16 .\"    must display the following acknowledgement:
17 .\"     This product includes software developed by the University of
18 .\"     California, Berkeley and its contributors.
19 .\" 4. Neither the name of the University nor the names of its contributors
20 .\"    may be used to endorse or promote products derived from this software
21 .\"    without specific prior written permission.
22 .\"
23 .\" THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
24 .\" ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
25 .\" IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
26 .\" ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
27 .\" FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
28 .\" DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
29 .\" OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
30 .\" HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
31 .\" LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
32 .\" OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
33 .\" SUCH DAMAGE.
34 .\"
35 .\"     @(#)nqnfs.me    8.1 (Berkeley) 4/20/94
36 .\" $FreeBSD: src/share/doc/papers/nqnfs/nqnfs.me,v 1.2.6.1 2000/11/30 13:10:34 ru Exp $
37 .\"
38 .lp
39 .nr PS 12
40 .ps 12
41 Reprinted with permission from the "Proceedings of the Winter 1994 Usenix
42 Conference", January 1994, San Francisco, CA, Copyright The Usenix
43 Association.
44 .nr PS 14
45 .ps 14
46 .sp
47 .ce
48 \fBNot Quite NFS, Soft Cache Consistency for NFS\fR
49 .nr PS 12
50 .ps 12
51 .sp
52 .ce
53 \fIRick Macklem\fR
54 .ce
55 \fIUniversity of Guelph\fR
56 .sp
57 .nr PS 12
58 .ps 12
59 .ce
60 \fBAbstract\fR
61 .nr PS 10
62 .ps 10
63 .pp
64 There are some constraints inherent in the NFS\(tm\(mo protocol
65 that result in performance limitations
66 for high performance
67 workstation environments.
68 This paper discusses an NFS-like protocol named Not Quite NFS (NQNFS),
69 designed to address some of these limitations.
70 This protocol provides full cache consistency during normal
71 operation, while permitting more effective client-side caching in an
72 effort to improve performance.
73 There are also a variety of minor protocol changes, in order to resolve
74 various NFS issues.
75 The emphasis is on observed performance of a
76 preliminary implementation of the protocol, in order to show
77 how well this design works
78 and to suggest possible areas for further improvement.
79 .sh 1 "Introduction"
80 .pp
81 It has been observed that
82 overall workstation performance has not been scaling with
83 processor speed and that file system I/O is a limiting factor [Ousterhout90].
84 Ousterhout
85 notes
86 that a principal challenge for operating system developers is the
87 decoupling of system calls from their underlying I/O operations, in order
88 to improve average system call response times.
89 For distributed file systems, every synchronous Remote Procedure Call (RPC)
90 takes a minimum of a few milliseconds and, as such, is analogous to an
91 underlying I/O operation.
92 This suggests that client caching with a very good
93 hit ratio for read type operations, along with asynchronous writing, is required in order to avoid delays waiting for RPC replies.
94 However, the NFS protocol requires that the server be stateless\**
95 .(f
96 \**The server must not require any state that may be lost due to a crash, to
97 function correctly.
98 .)f
99 and does not provide any explicit mechanism for client cache
100 consistency, putting
101 constraints on how the client may cache data.
102 This paper describes an NFS-like protocol that includes a cache consistency
103 component designed to enhance client caching performance. It does provide
104 full consistency under normal operation, but without requiring that hard
105 state information be maintained on the server.
106 Design tradeoffs were made towards simplicity and
107 high performance over cache consistency under abnormal conditions.
108 The protocol design uses a variation of Leases [Gray89]
109 to provide state on the server that does not need to be recovered after a
110 crash.
111 .pp
112 The protocol also includes changes designed to address other limitations
113 of NFS in a modern workstation environment.
114 The use of TCP transport is optionally available to avoid
115 the pitfalls of Sun RPC over UDP transport when running across an internetwork [Nowicki89].
116 Kerberos [Steiner88] support is available
117 to do proper user authentication, in order to provide improved security and
118 arbitrary client to server user ID mappings.
119 There are also a variety of other changes to accommodate large file systems,
120 such as 64bit file sizes and offsets, as well as lifting the 8Kbyte I/O size
121 limit.
122 The remainder of this paper gives an overview of the protocol, highlighting
123 performance related components, followed by an evaluation of resultant performance
124 for the 4.4BSD implementation.
125 .sh 1 "Distributed File Systems and Caching"
126 .pp
127 Clients using distributed file systems cache recently-used data in order
128 to reduce the number of synchronous server operations, and therefore improve
129 average response times for system calls.
130 Unfortunately, maintaining consistency between these caches is a problem
131 whenever write sharing occurs; that is, when a process on a client writes
132 to a file and one or more processes on other client(s) read the file.
133 If the writer closes the file before any reader(s) open the file for reading,
134 this is called sequential write sharing. Both the Andrew ITC file system
135 [Howard88] and NFS [Sandberg85] maintain consistency for sequential write
136 sharing by requiring the writer to push all the writes through to the
137 server on close and having readers check to see if the file has been
138 modified upon open. If the file has been modified, the client throws away
139 all cached data for that file, as it is now stale.
140 NFS implementations typically detect file modification by checking a cached
141 copy of the file's modification time; since this cached value is often
142 several seconds out of date and only has a resolution of one second, an NFS
143 client often uses stale cached data for some time after the file has
144 been updated on the server.
145 .pp
146 A more difficult case is concurrent write sharing, where write operations are intermixed
147 with read operations.
148 Consistency for this case, often referred to as "full cache consistency,"
149 requires that a reader always receives the most recently written data.
150 Neither NFS nor the Andrew ITC file system maintain consistency for this
151 case.
152 The simplest mechanism for maintaining full cache consistency is the one
153 used by Sprite [Nelson88], which disables all client caching of the
154 file whenever concurrent write sharing might occur.
155 There are other mechanisms described in the literature [Kent87a,
156 Burrows88], but they appeared to be too elaborate for incorporation
157 into NQNFS (for example, Kent's requires specialized hardware).
158 NQNFS differs from Sprite in the way it
159 detects write sharing. The Sprite server maintains a list of files currently open
160 by the various clients and detects write sharing when a file open request
161 for writing is received and the file is already open for reading
162 (or vice versa).
163 This list of open files is hard state information that must be recovered
164 after a server crash, which is a significant problem in its own
165 right [Mogul93, Welch90].
166 .pp
167 The approach used by NQNFS is a variant of the Leases mechanism [Gray89].
168 In this model, the server issues to a client a promise, referred to as a
169 "lease," that the client may cache a specific object without fear of
170 conflict.
171 A lease has a limited duration and must be renewed by the client if it
172 wishes to continue to cache the object.
173 In NQNFS, clients hold short-term (up to one minute) leases on files
174 for reading or writing.
175 The leases are analogous to entries in the open file list, except that
176 they expire after the lease term unless renewed by the client.
177 As such, one minute after issuing the last lease there are no current
178 leases and therefore no lease records to be recovered after a crash, hence
179 the term "soft server state."
180 .pp
181 A related design consideration is the way client writing is done.
182 Synchronous writing requires that all writes be pushed through to the server
183 during the write system call.
184 This is the simplest variant, from a consistency point of view, since the
185 server always has the most recently written data. It also permits any write
186 errors, such as "file system out of space" to be propagated back to the
187 client's process via the write system call return.
188 Unfortunately this approach limits the client write rate, based on server write
189 performance and client/server RPC round trip time (RTT).
190 .pp
191 An alternative to this is delayed writing, where the write system call returns
192 as soon as the data is cached on the client and the data is written to the
193 server sometime later.
194 This permits client writing to occur at the rate of local storage access
195 up to the size of the local cache.
196 Also, for cases where file truncation/deletion occurs shortly after writing,
197 the write to the server may be avoided since the data has already been
198 deleted, reducing server write load.
199 There are some obvious drawbacks to this approach.
200 For any Sprite-like system to maintain
201 full consistency, the server must "callback" to the client to cause the
202 delayed writes to be written back to the server when write sharing is about to
203 occur.
204 There are also problems with the propagation of errors
205 back to the client process that issued the write system call.
206 The reason for this is that
207 the system call has already returned without reporting an error and the
208 process may also have already terminated.
209 As well, there is a risk of the loss of recently written data if the client
210 crashes before the data is written back to the server.
211 .pp
212 A compromise between these two alternatives is asynchronous writing, where
213 the write to the server is initiated during the write system call but the write system
214 call returns before the write completes.
215 This approach minimizes the risk of data loss due to a client crash, but negates
216 the possibility of reducing server write load by throwing writes away when
217 a file is truncated or deleted.
218 .pp
219 NFS implementations usually do a mix of asynchronous and delayed writing
220 but push all writes to the server upon close, in order to maintain open/close
221 consistency.
222 Pushing the delayed writes on close
223 negates much of the performance advantage of delayed writing, since the
224 delays that were avoided in the write system calls are observed in the close
225 system call.
226 Akin to Sprite, the NQNFS protocol does delayed writing in an effort to achieve
227 good client performance and uses a callback mechanism to maintain full cache
228 consistency.
229 .sh 1 "Related Work"
230 .pp
231 There has been a great deal of effort put into improving the performance and
232 consistency of the NFS protocol. This work can be put in two categories.
233 The first category are implementation enhancements for the NFS protocol and
234 the second involve modifications to the protocol.
235 .pp
236 The work done on implementation enhancements have attacked two problem areas,
237 NFS server write performance and RPC transport problems.
238 Server write performance is a major problem for NFS, in part due to the
239 requirement to push all writes to the server upon close and in part due
240 to the fact that, for writes, all data and meta-data must be committed to
241 non-volatile storage before the server replies to the write RPC.
242 The Prestoserve\(tm\(dg
243 [Moran90]
244 system uses non-volatile RAM as a buffer for recently written data on the server,
245 so that the write RPC replies can be returned to the client before the data is written to the
246 disk surface.
247 Write gathering [Juszczak94] is a software technique used on the server where a write
248 RPC request is delayed for a short time in the hope that another contiguous
249 write request will arrive, so that they can be merged into one write operation.
250 Since the replies to all of the merged writes are not returned to the client until the write
251 operation is completed, this delay does not violate the protocol.
252 When write operations are merged, the number of disk writes can be reduced,
253 improving server write performance.
254 Although either of the above reduces write RPC response time for the server,
255 it cannot be reduced to zero, and so, any client side caching mechanism
256 that reduces write RPC load or client dependence on server RPC response time
257 should still improve overall performance.
258 Good client side caching should be complementary to these server techniques,
259 although client performance improvements as a result of caching may be less
260 dramatic when these techniques are used.
261 .pp
262 In NFS, each Sun RPC request is packaged in a UDP datagram for transmission
263 to the server. A timer is started, and if a timeout occurs before the corresponding
264 RPC reply is received, the RPC request is retransmitted.
265 There are two problems with this model.
266 First, when a retransmit timeout occurs, the RPC may be redone, instead of
267 simply retransmitting the RPC request message to the server. A recent-request
268 cache can be used on the server to minimize the negative impact of redoing
269 RPCs [Juszczak89].
270 The second problem is that a large UDP datagram, such as a read request or
271 write reply, must be fragmented by IP and if any one IP fragment is lost in
272 transit, the entire UDP datagram is lost [Kent87]. Since entire requests and replies
273 are packaged in a single UDP datagram, this puts an upper bound on the read/write
274 data size (8 kbytes).
275 .pp
276 Adjusting the retransmit timeout (RTT) interval dynamically and applying a
277 congestion window on outstanding requests has been shown to be of some help
278 [Nowicki89] with the retransmission problem.
279 An alternative to this is to use TCP transport to delivery the RPC messages
280 reliably [Macklem90] and one of the performance results in this paper
281 shows the effects of this further.
282 .pp
283 Srinivasan and Mogul [Srinivasan89] enhanced the NFS protocol to use the Sprite cache
284 consistency algorithm in an effort to improve performance and to provide
285 full client cache consistency.
286 This experimental implementation demonstrated significantly better
287 performance than NFS, but suffered from a lack of crash recovery support.
288 The NQNFS protocol design borrowed heavily from this work, but differed
289 from the Sprite algorithm by using Leases instead of file open state
290 to detect write sharing.
291 The decision to use Leases was made primarily to avoid the crash recovery
292 problem.
293 More recent work by the Sprite group [Baker91] and Mogul [Mogul93] have
294 addressed the crash recovery problem, making this design tradeoff more
295 questionable now.
296 .pp
297 Sun has recently updated the NFS protocol to Version 3 [SUN93], using some
298 changes similar to NQNFS to address various issues. The Version 3 protocol
299 uses 64bit file sizes and offsets, provides a Readdir_and_Lookup RPC and
300 an access RPC.
301 It also provides cache hints, to permit a client to be able to determine
302 whether a file modification is the result of that client's write or some
303 other client's write.
304 It would be possible to add either Spritely NFS or NQNFS support for cache
305 consistency to the NFS Version 3 protocol.
306 .sh 1 "NQNFS Consistency Protocol and Recovery"
307 .pp
308 The NQNFS cache consistency protocol uses a somewhat Sprite-like [Nelson88]
309 mechanism, but is based on Leases [Gray89] instead of hard server state information
310 about open files.
311 The basic principle is that the server disables client caching of files whenever
312 concurrent write sharing could occur, by performing a server-to-client
313 callback,
314 forcing the client to flush its caches and to do all subsequent I/O on the file with
315 synchronous RPCs.
316 A Sprite server maintains a record of the open state of files for
317 all clients and uses this to determine when concurrent write sharing might
318 occur.
319 This \fIopen state\fR information might also be referred to as an infinite-term
320 lease for the file, with explicit lease cancellation.
321 NQNFS, on the other hand, uses a short-term lease that expires due to timeout
322 after a maximum of one minute, unless explicitly renewed by the client.
323 The fundamental difference is that an NQNFS client must keep renewing
324 a lease to use cached data whereas a Sprite client assumes the data is valid until canceled
325 by the server
326 or the file is closed.
327 Using leases permits the server to remain "stateless," since the soft
328 state information, which consists of the set of current leases, is
329 moot after one minute, when all the leases expire.
330 .pp
331 Whenever a client wishes to access a file's data it must hold one of
332 three types of lease: read-caching, write-caching or non-caching.
333 The latter type requires that all file operations be done synchronously with
334 the server via the appropriate RPCs.
335 .pp
336 A read-caching lease allows for client data caching but no modifications
337 may be done.
338 It may, however, be shared between multiple clients. Diagram 1 shows a typical
339 read-caching scenario. The vertical solid black lines depict the lease records.
340 Note that the time lines are nowhere near to scale, since a client/server
341 interaction will normally take less than one hundred milliseconds, whereas the
342 normal lease duration is thirty seconds.
343 Every lease includes a \fImodrev\fR value, which changes upon every modification
344 of the file. It may be used to check to see if data cached on the client is
345 still current.
346 .pp
347 A write-caching lease permits delayed write caching,
348 but requires that all data be pushed to the server when the lease expires
349 or is terminated by an eviction callback.
350 When a write-caching lease has almost expired, the client will attempt to
351 extend the lease if the file is still open, but is required to push the delayed writes to the server
352 if renewal fails (as depicted by diagram 2).
353 The writes may not arrive at the server until after the write lease has
354 expired on the client, but this does not result in a consistency problem,
355 so long as the write lease is still valid on the server.
356 Note that, in diagram 2, the lease record on the server remains current after
357 the expiry time, due to the conditions mentioned in section 5.
358 If a write RPC is done on the server after the write lease has expired on
359 the server, this could be considered an error since consistency could be
360 lost, but it is not handled as such by NQNFS.
361 .pp
362 Diagram 3 depicts how read and write leases are replaced by a non-caching
363 lease when there is the potential for write sharing.
364 .(z
365 .sp
366 .PS
367 .ps
368 .ps 50
369 line from 0.738,5.388 to 1.238,5.388
370 .ps
371 .ps 10
372 dashwid = 0.050i
373 line dashed from 1.488,10.075 to 1.488,5.450
374 line dashed from 2.987,10.075 to 2.987,5.450
375 line dashed from 4.487,10.075 to 4.487,5.450
376 .ps
377 .ps 50
378 line from 4.487,7.013 to 4.487,5.950
379 line from 2.987,7.700 to 2.987,5.950 to 2.987,6.075
380 line from 1.488,7.513 to 1.488,5.950
381 line from 2.987,9.700 to 2.987,8.325
382 line from 1.488,9.450 to 1.488,8.325
383 .ps
384 .ps 10
385 line from 2.987,6.450 to 4.487,6.200
386 line from 4.385,6.192 to 4.487,6.200 to 4.393,6.241
387 line from 4.487,6.888 to 2.987,6.575
388 line from 3.080,6.620 to 2.987,6.575 to 3.090,6.571
389 line from 2.987,7.263 to 4.487,7.013
390 line from 4.385,7.004 to 4.487,7.013 to 4.393,7.054
391 line from 4.487,7.638 to 2.987,7.388
392 line from 3.082,7.429 to 2.987,7.388 to 3.090,7.379
393 line from 2.987,6.888 to 1.488,6.575
394 line from 1.580,6.620 to 1.488,6.575 to 1.590,6.571
395 line from 1.488,7.200 to 2.987,6.950
396 line from 2.885,6.942 to 2.987,6.950 to 2.893,6.991
397 line from 2.987,7.700 to 1.488,7.513
398 line from 1.584,7.550 to 1.488,7.513 to 1.590,7.500
399 line from 1.488,8.012 to 2.987,7.763
400 line from 2.885,7.754 to 2.987,7.763 to 2.893,7.804
401 line from 2.987,9.012 to 1.488,8.825
402 line from 1.584,8.862 to 1.488,8.825 to 1.590,8.813
403 line from 1.488,9.325 to 2.987,9.137
404 line from 2.885,9.125 to 2.987,9.137 to 2.891,9.175
405 line from 2.987,9.637 to 1.488,9.450
406 line from 1.584,9.487 to 1.488,9.450 to 1.590,9.438
407 line from 1.488,9.887 to 2.987,9.700
408 line from 2.885,9.688 to 2.987,9.700 to 2.891,9.737
409 .ps
410 .ps 12
411 .ft
412 .ft R
413 "Lease valid on machine" at 1.363,5.296 ljust
414 "with same modrev" at 1.675,7.421 ljust
415 "miss)" at 2.612,9.233 ljust
416 "(cache" at 2.300,9.358 ljust
417 .ps
418 .ps 14
419 "Diagram #1: Read Caching Leases" at 0.738,5.114 ljust
420 "Client B" at 4.112,10.176 ljust
421 "Server" at 2.612,10.176 ljust
422 "Client A" at 0.925,10.176 ljust
423 .ps
424 .ps 12
425 "from cache" at 4.675,6.546 ljust
426 "Read syscalls" at 4.675,6.796 ljust
427 "Reply" at 3.737,6.108 ljust
428 "(cache miss)" at 3.675,6.421 ljust
429 "Read  req" at 3.737,6.608 ljust
430 "to lease" at 3.112,6.796 ljust
431 "Client B added" at 3.112,6.983 ljust
432 "Reply" at 3.237,7.296 ljust
433 "Read + lease req" at 3.175,7.671 ljust
434 "Read syscall" at 4.675,7.608 ljust
435 "Reply" at 1.675,6.796 ljust
436 "miss)" at 2.487,7.108 ljust
437 "Read req (cache" at 1.675,7.233 ljust
438 "from cache" at 0.425,6.296 ljust
439 "Read  syscalls" at 0.425,6.546 ljust
440 "cache" at 0.425,6.858 ljust
441 "so can still" at 0.425,7.108 ljust
442 "Modrev  same" at 0.425,7.358 ljust
443 "Reply" at 1.675,7.671 ljust
444 "Get lease req" at 1.675,8.108 ljust
445 "Read syscall" at 0.425,7.983 ljust
446 "Lease times out" at 0.425,8.296 ljust
447 "from cache" at 0.425,9.046 ljust
448 "Read syscalls" at 0.425,9.296 ljust
449 "for Client A" at 3.112,9.296 ljust
450 "Read caching lease" at 3.112,9.483 ljust
451 "Reply" at 1.675,8.983 ljust
452 "Read req" at 1.675,9.358 ljust
453 "Reply" at 1.675,9.608 ljust
454 "Read + lease req" at 1.675,9.921 ljust
455 "Read syscall" at 0.425,9.921 ljust
456 .ps
457 .ft
458 .PE
459 .sp
460 .)z
461 .(z
462 .sp
463 .PS
464 .ps
465 .ps 50
466 line from 1.175,5.700 to 1.300,5.700
467 line from 0.738,5.700 to 1.175,5.700
468 line from 2.987,6.638 to 2.987,6.075
469 .ps
470 .ps 10
471 dashwid = 0.050i
472 line dashed from 2.987,6.575 to 2.987,5.950
473 line dashed from 1.488,6.575 to 1.488,5.888
474 .ps
475 .ps 50
476 line from 2.987,9.762 to 2.987,6.638
477 line from 1.488,9.450 to 1.488,7.700
478 .ps
479 .ps 10
480 line from 2.987,6.763 to 1.488,6.575
481 line from 1.584,6.612 to 1.488,6.575 to 1.590,6.563
482 line from 1.488,7.013 to 2.987,6.825
483 line from 2.885,6.813 to 2.987,6.825 to 2.891,6.862
484 line from 2.987,7.325 to 1.488,7.075
485 line from 1.582,7.116 to 1.488,7.075 to 1.590,7.067
486 line from 1.488,7.700 to 2.987,7.388
487 line from 2.885,7.383 to 2.987,7.388 to 2.895,7.432
488 line from 2.987,8.575 to 1.488,8.325
489 line from 1.582,8.366 to 1.488,8.325 to 1.590,8.317
490 line from 1.488,8.887 to 2.987,8.637
491 line from 2.885,8.629 to 2.987,8.637 to 2.893,8.679
492 line from 2.987,9.637 to 1.488,9.450
493 line from 1.584,9.487 to 1.488,9.450 to 1.590,9.438
494 line from 1.488,9.887 to 2.987,9.762
495 line from 2.886,9.746 to 2.987,9.762 to 2.890,9.796
496 line dashed from 2.987,10.012 to 2.987,6.513
497 line dashed from 1.488,10.012 to 1.488,6.513
498 .ps
499 .ps 12
500 .ft
501 .ft R
502 "write" at 4.237,5.921 ljust
503 "Lease valid on machine" at 1.425,5.733 ljust
504 .ps
505 .ps 14
506 "Diagram #2: Write Caching Lease" at 0.738,5.551 ljust
507 "Server" at 2.675,10.114 ljust
508 "Client A" at 1.113,10.114 ljust
509 .ps
510 .ps 12
511 "seconds after last" at 3.112,5.921 ljust
512 "Expires write_slack" at 3.112,6.108 ljust
513 "due to write activity" at 3.112,6.608 ljust
514 "Expiry delayed" at 3.112,6.796 ljust
515 "Lease times out" at 3.112,7.233 ljust
516 "Lease renewed" at 3.175,8.546 ljust
517 "Lease for client A" at 3.175,9.358 ljust
518 "Write caching" at 3.175,9.608 ljust
519 "Reply" at 1.675,6.733 ljust
520 "Write req" at 1.988,7.046 ljust
521 "Reply" at 1.675,7.233 ljust
522 "Write req" at 1.675,7.796 ljust
523 "Lease expires" at 0.487,7.733 ljust
524 "Close syscall" at 0.487,8.108 ljust
525 "lease granted" at 1.675,8.546 ljust
526 "Get write lease" at 1.675,8.921 ljust
527 "before expiry" at 0.487,8.608 ljust
528 "Lease renewal" at 0.487,8.796 ljust
529 "syscalls" at 0.487,9.046 ljust
530 "Delayed write" at 0.487,9.233 ljust
531 "lease granted" at 1.675,9.608 ljust
532 "Get write lease req" at 1.675,9.921 ljust
533 "Write syscall" at 0.487,9.858 ljust
534 .ps
535 .ft
536 .PE
537 .sp
538 .)z
539 .(z
540 .sp
541 .PS
542 .ps
543 .ps 50
544 line from 0.613,2.638 to 1.238,2.638
545 line from 1.488,4.075 to 1.488,3.638
546 line from 2.987,4.013 to 2.987,3.575
547 line from 4.487,4.013 to 4.487,3.575
548 .ps
549 .ps 10
550 line from 2.987,3.888 to 4.487,3.700
551 line from 4.385,3.688 to 4.487,3.700 to 4.391,3.737
552 line from 4.487,4.138 to 2.987,3.950
553 line from 3.084,3.987 to 2.987,3.950 to 3.090,3.938
554 line from 2.987,4.763 to 4.487,4.450
555 line from 4.385,4.446 to 4.487,4.450 to 4.395,4.495
556 .ps
557 .ps 50
558 line from 4.487,4.438 to 4.487,4.013
559 .ps
560 .ps 10
561 line from 4.487,5.138 to 2.987,4.888
562 line from 3.082,4.929 to 2.987,4.888 to 3.090,4.879
563 .ps
564 .ps 50
565 line from 4.487,6.513 to 4.487,5.513
566 line from 4.487,6.513 to 4.487,6.513 to 4.487,5.513
567 line from 2.987,5.450 to 2.987,5.200
568 line from 1.488,5.075 to 1.488,4.075
569 line from 2.987,5.263 to 2.987,4.013
570 line from 2.987,7.700 to 2.987,5.325
571 line from 4.487,7.575 to 4.487,6.513
572 line from 1.488,8.512 to 1.488,8.075
573 line from 2.987,8.637 to 2.987,8.075
574 line from 2.987,9.637 to 2.987,8.825
575 line from 1.488,9.450 to 1.488,8.950
576 .ps
577 .ps 10
578 line from 2.987,4.450 to 1.488,4.263
579 line from 1.584,4.300 to 1.488,4.263 to 1.590,4.250
580 line from 1.488,4.888 to 2.987,4.575
581 line from 2.885,4.571 to 2.987,4.575 to 2.895,4.620
582 line from 2.987,5.263 to 1.488,5.075
583 line from 1.584,5.112 to 1.488,5.075 to 1.590,5.063
584 line from 4.487,5.513 to 2.987,5.325
585 line from 3.084,5.362 to 2.987,5.325 to 3.090,5.313
586 line from 2.987,5.700 to 4.487,5.575
587 line from 4.386,5.558 to 4.487,5.575 to 4.390,5.608
588 line from 4.487,6.013 to 2.987,5.825
589 line from 3.084,5.862 to 2.987,5.825 to 3.090,5.813
590 line from 2.987,6.200 to 4.487,6.075
591 line from 4.386,6.058 to 4.487,6.075 to 4.390,6.108
592 line from 4.487,6.450 to 2.987,6.263
593 line from 3.084,6.300 to 2.987,6.263 to 3.090,6.250
594 line from 2.987,6.700 to 4.487,6.513
595 line from 4.385,6.500 to 4.487,6.513 to 4.391,6.550
596 line from 1.488,6.950 to 2.987,6.763
597 line from 2.885,6.750 to 2.987,6.763 to 2.891,6.800
598 line from 2.987,7.700 to 4.487,7.575
599 line from 4.386,7.558 to 4.487,7.575 to 4.390,7.608
600 line from 4.487,7.950 to 2.987,7.763
601 line from 3.084,7.800 to 2.987,7.763 to 3.090,7.750
602 line from 2.987,8.637 to 1.488,8.512
603 line from 1.585,8.546 to 1.488,8.512 to 1.589,8.496
604 line from 1.488,8.887 to 2.987,8.700
605 line from 2.885,8.688 to 2.987,8.700 to 2.891,8.737
606 line from 2.987,9.637 to 1.488,9.450
607 line from 1.584,9.487 to 1.488,9.450 to 1.590,9.438
608 line from 1.488,9.950 to 2.987,9.762
609 line from 2.885,9.750 to 2.987,9.762 to 2.891,9.800
610 dashwid = 0.050i
611 line dashed from 4.487,10.137 to 4.487,2.825
612 line dashed from 2.987,10.137 to 2.987,2.825
613 line dashed from 1.488,10.137 to 1.488,2.825
614 .ps
615 .ps 12
616 .ft
617 .ft R
618 "(not cached)" at 4.612,3.858 ljust
619 .ps
620 .ps 14
621 "Diagram #3: Write sharing case" at 0.613,2.239 ljust
622 .ps
623 .ps 12
624 "Write syscall" at 4.675,7.546 ljust
625 "Read syscall" at 0.550,9.921 ljust
626 .ps
627 .ps 14
628 "Lease valid on machine" at 1.363,2.551 ljust
629 .ps
630 .ps 12
631 "(can still cache)" at 1.675,8.171 ljust
632 "Reply" at 3.800,3.858 ljust
633 "Write" at 3.175,4.046 ljust
634 "writes" at 4.612,4.046 ljust
635 "synchronous" at 4.612,4.233 ljust
636 "write syscall" at 4.675,5.108 ljust
637 "non-caching lease" at 3.175,4.296 ljust
638 "Reply " at 3.175,4.483 ljust
639 "req" at 3.175,4.983 ljust
640 "Get write lease" at 3.175,5.108 ljust
641 "Vacated msg" at 3.175,5.483 ljust
642 "to the server" at 4.675,5.858 ljust
643 "being flushed to" at 4.675,6.046 ljust
644 "Delayed writes" at 4.675,6.233 ljust
645 .ps
646 .ps 16
647 "Server" at 2.675,10.182 ljust
648 "Client B" at 3.925,10.182 ljust
649 "Client A" at 0.863,10.182 ljust
650 .ps
651 .ps 12
652 "(not cached)" at 0.550,4.733 ljust
653 "Read data" at 0.550,4.921 ljust
654 "Reply  data" at 1.675,4.421 ljust
655 "Read request" at 1.675,4.921 ljust
656 "lease" at 1.675,5.233 ljust
657 "Reply non-caching" at 1.675,5.421 ljust
658 "Reply" at 3.737,5.733 ljust
659 "Write" at 3.175,5.983 ljust
660 "Reply" at 3.737,6.171 ljust
661 "Write" at 3.175,6.421 ljust
662 "Eviction Notice" at 3.175,6.796 ljust
663 "Get read lease" at 1.675,7.046 ljust
664 "Read syscall" at 0.550,6.983 ljust
665 "being cached" at 4.675,7.171 ljust
666 "Delayed writes" at 4.675,7.358 ljust
667 "lease" at 3.175,7.233 ljust
668 "Reply write caching" at 3.175,7.421 ljust
669 "Get  write lease" at 3.175,7.983 ljust
670 "Write syscall" at 4.675,7.983 ljust
671 "with same modrev" at 1.675,8.358 ljust
672 "Lease" at 0.550,8.171 ljust
673 "Renewed" at 0.550,8.358 ljust
674 "Reply" at 1.675,8.608 ljust
675 "Get Lease Request" at 1.675,8.983 ljust
676 "Read syscall" at 0.550,8.733 ljust
677 "from cache" at 0.550,9.108 ljust
678 "Read syscall" at 0.550,9.296 ljust
679 "Reply " at 1.675,9.671 ljust
680 "plus lease" at 2.050,9.983 ljust
681 "Read Request" at 1.675,10.108 ljust
682 .ps
683 .ft
684 .PE
685 .sp
686 .)z
687 A write-caching lease is not used in the Stanford V Distributed System [Gray89],
688 since synchronous writing is always used. A side effect of this change
689 is that the five to ten second lease duration recommended by Gray was found
690 to be insufficient to achieve good performance for the write-caching lease.
691 Experimentation showed that thirty seconds was about optimal for cases where
692 the client and server are connected to the same local area network, so
693 thirty seconds is the default lease duration for NQNFS.
694 A maximum of twice that value is permitted, since Gray showed that for some
695 network topologies, a larger lease duration functions better.
696 Although there is an explicit get_lease RPC defined for the protocol,
697 most lease requests are piggybacked onto the other RPCs to minimize the
698 additional overhead introduced by leasing.
699 .sh 2 "Rationale"
700 .pp
701 Leasing was chosen over hard server state information for the following
702 reasons:
703 .ip 1.
704 The server must maintain state information about all current
705 client leases.
706 Since at most one lease is allocated for each RPC and the leases expire
707 after their lease term,
708 the upper bound on the number of current leases is the product of the
709 lease term and the server RPC rate.
710 In practice, it has been observed that less than 10% of RPCs request new leases
711 and since most leases have a term of thirty seconds, the following rule of
712 thumb should estimate the number of server lease records:
713 .sp
714 .nf
715         Number of Server Lease Records \(eq 0.1 * 30 * RPC rate
716 .fi
717 .sp
718 Since each lease record occupies 64 bytes of server memory, storing the lease
719 records should not be a serious problem.
720 If a server has exhausted lease storage, it can simply wait a few seconds
721 for a lease to expire and free up a record.
722 On the other hand, a Sprite-like server must store records for all files
723 currently open by all clients, which can require significant storage for
724 a large, heavily loaded server.
725 In [Mogul93], it is proposed that a mechanism vaguely similar to paging could be
726 used to deal with this for Spritely NFS, but this
727 appears to introduce a fair amount of complexity and may limit the
728 usefulness of open records for storing other state information, such
729 as file locks.
730 .ip 2.
731 After a server crashes it must recover lease records for
732 the current outstanding leases, which actually implies that if it waits
733 until all leases have expired, there is no state to recover.
734 The server must wait for the maximum lease duration of one minute, and it must serve
735 all outstanding write requests resulting from terminated write-caching
736 leases before issuing new leases. The one minute delay can be overlapped with
737 file system consistency checking (eg. fsck).
738 Because no state must be recovered, a lease-based server, like an NFS server,
739 avoids the problem of state recovery after a crash.
740 .sp
741 There can, however, be problems during crash recovery
742 because of a potentially large number of write backs due to terminated
743 write-caching leases.
744 One of these problems is a "recovery storm" [Baker91], which could occur when
745 the server is overloaded by the number of write RPC requests.
746 The NQNFS protocol deals with this by replying
747 with a return status code called
748 try_again_later to all
749 RPC requests (except write) until the write requests subside.
750 At this time, there has not been sufficient testing of server crash
751 recovery while under heavy server load to determine if the try_again_later
752 reply is a sufficient solution to the problem.
753 The other problem is that consistency will be lost if other RPCs are performed
754 before all of the write backs for terminated write-caching leases have completed.
755 This is handled by only performing write RPCs until
756 no write RPC requests arrive
757 for write_slack seconds, where write_slack is set to several times
758 the client timeout retransmit interval,
759 at which time it is assumed all clients have had an opportunity to send their writes
760 to the server.
761 .ip 3.
762 Another advantage of leasing is that, since leases are required at times when other I/O operations occur,
763 lease requests can almost always be piggybacked on other RPCs, avoiding some of the
764 overhead associated with the explicit open and close RPCs required by a Sprite-like system.
765 Compared with Sprite cache consistency,
766 this can result in a significantly lower RPC load (see table #1).
767 .sh 1 "Limitations of the NQNFS Protocol"
768 .pp
769 There is a serious risk when leasing is used for delayed write
770 caching.
771 If the server is simply too busy to service a lease renewal before a write-caching
772 lease terminates, the client will not be able to push the write
773 data to the server before the lease has terminated, resulting in
774 inconsistency.
775 Note that the danger of inconsistency occurs when the server assumes that
776 a write-caching lease has terminated before the client has
777 had the opportunity to write the data back to the server.
778 In an effort to avoid this problem, the NQNFS server does not assume that
779 a write-caching lease has terminated until three conditions are met:
780 .sp
781 .(l
782 1 - clock time > (expiry time + clock skew)
783 2 - there is at least one server daemon (nfsd) waiting for an RPC request
784 3 - no write RPCs received for leased file within write_slack after the corrected expiry time
785 .)l
786 .lp
787 The first condition ensures that the lease has expired on the client.
788 The clock_skew, by default three seconds, must be
789 set to a value larger than the maximum time-of-day clock error that is likely to occur
790 during the maximum lease duration.
791 The second condition attempts to ensure that the client
792 is not waiting for replies to any writes that are still queued for service by
793 an nfsd. The third condition tries to guarantee that the client has
794 transmitted all write requests to the server, since write_slack is set to
795 several times the client's timeout retransmit interval.
796 .pp
797 There are also certain file system semantics that are problematic for both NFS and NQNFS,
798 due to the
799 lack of state information maintained by the
800 server. If a file is unlinked on one client while open on another it will
801 be removed from the file server, resulting in failed file accesses on the
802 client that has the file open.
803 If the file system on the server is out of space or the client user's disk
804 quota has been exceeded, a delayed write can fail long after the write system
805 call was successfully completed.
806 With NFS this error will be detected by the close system call, since
807 the delayed writes are pushed upon close. With NQNFS however, the delayed write
808 RPC may not occur until after the close system call, possibly even after the process
809 has exited.
810 Therefore,
811 if a process must check for write errors,
812 a system call such as \fIfsync\fR must be used.
813 .pp
814 Another problem occurs when a process on one client is
815 running an executable file
816 and a process on another client starts to write to the file. The read lease on
817 the first client is terminated by the server, but the client has no recourse but
818 to terminate the process, since the process is already in progress on the old
819 executable.
820 .pp
821 The NQNFS protocol does not support file locking, since a file lock would have
822 to involve hard, recovered after a crash, state information.
823 .sh 1 "Other NQNFS Protocol Features"
824 .pp
825 NQNFS also includes a variety of minor modifications to the NFS protocol, in an
826 attempt to address various limitations.
827 The protocol uses 64bit file sizes and offsets in order to handle large files.
828 TCP transport may be used as an alternative to UDP
829 for cases where UDP does not perform well.
830 Transport mechanisms
831 such as TCP also permit the use of much larger read/write data sizes,
832 which might improve performance in certain environments.
833 .pp
834 The NQNFS protocol replaces the Readdir RPC with a Readdir_and_Lookup
835 RPC that returns the file handle and attributes for each file in the
836 directory as well as name and file id number.
837 This additional information may then be loaded into the lookup and file-attribute
838 caches on the client.
839 Thus, for cases such as "ls -l", the \fIstat\fR system calls can be performed
840 locally without doing any lookup or getattr RPCs.
841 Another additional RPC is the Access RPC that checks for file
842 accessibility against the server. This is necessary since in some cases the
843 client user ID is mapped to a different user on the server and doing the
844 access check locally on the client using file attributes and client credentials is
845 not correct.
846 One case where this becomes necessary is when the NQNFS mount point is using
847 Kerberos authentication, where the Kerberos authentication ticket is translated
848 to credentials on the server that are mapped to the client side user id.
849 For further details on the protocol, see [Macklem93].
850 .sh 1 "Performance"
851 .pp
852 In order to evaluate the effectiveness of the NQNFS protocol,
853 a benchmark was used that was
854 designed to typify
855 real work on the client workstation.
856 Benchmarks, such as Laddis [Wittle93], that perform server load characterization
857 are not appropriate for this work, since it is primarily client caching
858 efficiency that needs to be evaluated.
859 Since these tests are measuring overall client system performance and
860 not just the performance of the file system,
861 each sequence of runs was performed on identical hardware and operating system in order to factor out the system
862 components affecting performance other than the file system protocol.
863 .pp
864 The equipment used for the all the benchmarks are members of the DECstation\(tm\(dg
865 family of workstations using the MIPS\(tm\(sc RISC architecture.
866 The operating system running on these systems was a pre-release version of
867 4.4BSD Unix\(tm\(dd.
868 For all benchmarks, the file server was a DECstation 2100 (10 MIPS) with 8Mbytes of
869 memory and a local RZ23 SCSI disk (27msec average access time).
870 The clients range in speed from DECstation 2100s
871 to a DECstation 5000/25, and always run with six block I/O daemons
872 and a 4Mbyte buffer cache, except for the test runs where the
873 buffer cache size was the independent variable.
874 In all cases /tmp is mounted on the local SCSI disk\**, all machines were
875 attached to the same uncongested Ethernet, and ran in single user mode during the benchmarks.
876 .(f
877 \**Testing using the 4.4BSD MFS [McKusick90] resulted in slightly degraded performance,
878 probably since the machines only had 16Mbytes of memory, and so paging
879 increased.
880 .)f
881 Unless noted otherwise, test runs used UDP RPC transport
882 and the results given are the average values of four runs.
883 .pp
884 The benchmark used is the Modified Andrew Benchmark (MAB)
885 [Ousterhout90],
886 which is a slightly modified version of the benchmark used to characterize
887 performance of the Andrew ITC file system [Howard88].
888 The MAB was set up with the executable binaries in the remote mounted file
889 system and the final load step was commented out, due to a linkage problem
890 during testing under 4.4BSD.
891 Therefore, these results are not directly comparable to other reported MAB
892 results.
893 The MAB is made up of five distinct phases:
894 .sp
895 .ip "1." 10
896 Makes five directories (no significant cost)
897 .ip "2." 10
898 Copy a file system subtree to a working directory
899 .ip "3." 10
900 Get file attributes (stat) of all the working files
901 .ip "4." 10
902 Search for strings (grep) in the files
903 .ip "5." 10
904 Compile a library of C sources and archive them
905 .lp
906 Of the five phases, the fifth is by far the largest and is the one affected most
907 by client caching mechanisms.
908 The results for phase #1 are invariant over all
909 the caching mechanisms.
910 .sh 2 "Buffer Cache Size Tests"
911 .pp
912 The first experiment was done to see what effect changing the size of the
913 buffer cache would have on client performance. A single DECstation 5000/25
914 was used to do a series of runs of MAB with different buffer cache sizes
915 for four variations of the file system protocol. The four variations are
916 as follows:
917 .ip "Case 1:" 10
918 NFS - The NFS protocol as implemented in 4.4BSD
919 .ip "Case 2:" 10
920 Leases - The NQNFS protocol using leases for cache consistency
921 .ip "Case 3:" 10
922 Leases, Rdirlookup - The NQNFS protocol using leases for cache consistency
923 and with the readdir RPC replaced by Readdir_and_Lookup
924 .ip "Case 4:" 10
925 Leases, Attrib leases, Rdirlookup - The NQNFS protocol using leases for
926 cache consistency, with the readdir
927 RPC replaced by the Readdir_and_Lookup,
928 and requiring a valid lease not only for file-data access, but also for file-attribute access.
929 .lp
930 As can be seen in figure 1, the buffer cache achieves about optimal
931 performance for the range of two to ten megabytes in size. At eleven
932 megabytes in size, the system pages heavily and the runs did not
933 complete in a reasonable time. Even at 64Kbytes, the buffer cache improves
934 performance over no buffer cache by a significant margin of 136-148 seconds
935 versus 239 seconds.
936 This may be due, in part, to the fact that the Compile Phase of the MAB
937 uses a rather small working set of file data.
938 All variants of NQNFS achieve about
939 the same performance, running around 30% faster than NFS, with a slightly
940 larger difference for large buffer cache sizes.
941 Based on these results, all remaining tests were run with the buffer cache
942 size set to 4Mbytes.
943 Although I do not know what causes the local peak in the curves between 0.5 and 2 megabytes,
944 there is some indication that contention for buffer cache blocks, between the update process
945 (which pushes delayed writes to the server every thirty seconds) and the I/O
946 system calls, may be involved.
947 .(z
948 .PS
949 .ps
950 .ps 10
951 dashwid = 0.050i
952 line dashed from 0.900,7.888 to 4.787,7.888
953 line dashed from 0.900,7.888 to 0.900,10.262
954 line from 0.900,7.888 to 0.963,7.888
955 line from 4.787,7.888 to 4.725,7.888
956 line from 0.900,8.188 to 0.963,8.188
957 line from 4.787,8.188 to 4.725,8.188
958 line from 0.900,8.488 to 0.963,8.488
959 line from 4.787,8.488 to 4.725,8.488
960 line from 0.900,8.775 to 0.963,8.775
961 line from 4.787,8.775 to 4.725,8.775
962 line from 0.900,9.075 to 0.963,9.075
963 line from 4.787,9.075 to 4.725,9.075
964 line from 0.900,9.375 to 0.963,9.375
965 line from 4.787,9.375 to 4.725,9.375
966 line from 0.900,9.675 to 0.963,9.675
967 line from 4.787,9.675 to 4.725,9.675
968 line from 0.900,9.963 to 0.963,9.963
969 line from 4.787,9.963 to 4.725,9.963
970 line from 0.900,10.262 to 0.963,10.262
971 line from 4.787,10.262 to 4.725,10.262
972 line from 0.900,7.888 to 0.900,7.950
973 line from 0.900,10.262 to 0.900,10.200
974 line from 1.613,7.888 to 1.613,7.950
975 line from 1.613,10.262 to 1.613,10.200
976 line from 2.312,7.888 to 2.312,7.950
977 line from 2.312,10.262 to 2.312,10.200
978 line from 3.025,7.888 to 3.025,7.950
979 line from 3.025,10.262 to 3.025,10.200
980 line from 3.725,7.888 to 3.725,7.950
981 line from 3.725,10.262 to 3.725,10.200
982 line from 4.438,7.888 to 4.438,7.950
983 line from 4.438,10.262 to 4.438,10.200
984 line from 0.900,7.888 to 4.787,7.888
985 line from 4.787,7.888 to 4.787,10.262
986 line from 4.787,10.262 to 0.900,10.262
987 line from 0.900,10.262 to 0.900,7.888
988 line from 3.800,8.775 to 4.025,8.775
989 line from 0.925,10.088 to 0.925,10.088
990 line from 0.925,10.088 to 0.938,9.812
991 line from 0.938,9.812 to 0.988,9.825
992 line from 0.988,9.825 to 1.075,9.838
993 line from 1.075,9.838 to 1.163,9.938
994 line from 1.163,9.938 to 1.250,9.838
995 line from 1.250,9.838 to 1.613,9.825
996 line from 1.613,9.825 to 2.312,9.750
997 line from 2.312,9.750 to 3.025,9.713
998 line from 3.025,9.713 to 3.725,9.850
999 line from 3.725,9.850 to 4.438,9.875
1000 dashwid = 0.037i
1001 line dotted from 3.800,8.625 to 4.025,8.625
1002 line dotted from 0.925,9.912 to 0.925,9.912
1003 line dotted from 0.925,9.912 to 0.938,9.887
1004 line dotted from 0.938,9.887 to 0.988,9.713
1005 line dotted from 0.988,9.713 to 1.075,9.562
1006 line dotted from 1.075,9.562 to 1.163,9.562
1007 line dotted from 1.163,9.562 to 1.250,9.562
1008 line dotted from 1.250,9.562 to 1.613,9.675
1009 line dotted from 1.613,9.675 to 2.312,9.363
1010 line dotted from 2.312,9.363 to 3.025,9.375
1011 line dotted from 3.025,9.375 to 3.725,9.387
1012 line dotted from 3.725,9.387 to 4.438,9.450
1013 line dashed from 3.800,8.475 to 4.025,8.475
1014 line dashed from 0.925,10.000 to 0.925,10.000
1015 line dashed from 0.925,10.000 to 0.938,9.787
1016 line dashed from 0.938,9.787 to 0.988,9.650
1017 line dashed from 0.988,9.650 to 1.075,9.537
1018 line dashed from 1.075,9.537 to 1.163,9.613
1019 line dashed from 1.163,9.613 to 1.250,9.800
1020 line dashed from 1.250,9.800 to 1.613,9.488
1021 line dashed from 1.613,9.488 to 2.312,9.375
1022 line dashed from 2.312,9.375 to 3.025,9.363
1023 line dashed from 3.025,9.363 to 3.725,9.325
1024 line dashed from 3.725,9.325 to 4.438,9.438
1025 dashwid = 0.075i
1026 line dotted from 3.800,8.325 to 4.025,8.325
1027 line dotted from 0.925,9.963 to 0.925,9.963
1028 line dotted from 0.925,9.963 to 0.938,9.750
1029 line dotted from 0.938,9.750 to 0.988,9.662
1030 line dotted from 0.988,9.662 to 1.075,9.613
1031 line dotted from 1.075,9.613 to 1.163,9.613
1032 line dotted from 1.163,9.613 to 1.250,9.700
1033 line dotted from 1.250,9.700 to 1.613,9.438
1034 line dotted from 1.613,9.438 to 2.312,9.463
1035 line dotted from 2.312,9.463 to 3.025,9.312
1036 line dotted from 3.025,9.312 to 3.725,9.387
1037 line dotted from 3.725,9.387 to 4.438,9.425
1038 .ps
1039 .ps -1
1040 .ft
1041 .ft I
1042 "0" at 0.825,7.810 rjust
1043 "20" at 0.825,8.110 rjust
1044 "40" at 0.825,8.410 rjust
1045 "60" at 0.825,8.697 rjust
1046 "80" at 0.825,8.997 rjust
1047 "100" at 0.825,9.297 rjust
1048 "120" at 0.825,9.597 rjust
1049 "140" at 0.825,9.885 rjust
1050 "160" at 0.825,10.185 rjust
1051 "0" at 0.900,7.660
1052 "2" at 1.613,7.660
1053 "4" at 2.312,7.660
1054 "6" at 3.025,7.660
1055 "8" at 3.725,7.660
1056 "10" at 4.438,7.660
1057 "Time (sec)" at 0.150,8.997
1058 "Buffer Cache Size (MBytes)" at 2.837,7.510
1059 "Figure #1: MAB Phase 5 (compile)" at 2.837,10.335
1060 "NFS" at 3.725,8.697 rjust
1061 "Leases" at 3.725,8.547 rjust
1062 "Leases, Rdirlookup" at 3.725,8.397 rjust
1063 "Leases, Attrib leases, Rdirlookup" at 3.725,8.247 rjust
1064 .ps
1065 .ft
1066 .PE
1067 .)z
1068 .sh 2 "Multiple Client Load Tests"
1069 .pp
1070 During preliminary runs of the MAB, it was observed that the server RPC
1071 counts were reduced significantly by NQNFS as compared to NFS (table 1).
1072 (Spritely NFS and Ultrix\(tm4.3/NFS numbers were taken from [Mogul93]
1073 and are not directly comparable, due to numerous differences in the
1074 experimental setup including deletion of the load step from phase 5.)
1075 This suggests
1076 that the NQNFS protocol might scale better with
1077 respect to the number of clients accessing the server.
1078 The experiment described in this section
1079 ran the MAB on from one to ten clients concurrently, to observe the
1080 effects of heavier server load.
1081 The clients were started at roughly the same time by pressing all the
1082 <return> keys together and, although not synchronized beyond that point,
1083 all clients would finish the test run within about two seconds of each
1084 other.
1085 This was not a realistic load of N active clients, but it did
1086 result in a reproducible increasing client load on the server.
1087 The results for the four variants
1088 are plotted in figures 2-5.
1089 .(z
1090 .ps -1
1091 .TS
1092 box, center;
1093 c s s s s s s s
1094 c c c c c c c c
1095 l | n n n n n n n.
1096 Table #1: MAB RPC Counts
1097 RPC     Getattr Read    Write   Lookup  Other   GetLease/Open-Close     Total
1098 _
1099 BSD/NQNFS       277     139     306     575     294     127     1718
1100 BSD/NFS 1210    506     451     489     238     0       2894
1101 Spritely NFS    259     836     192     535     306     1467    3595
1102 Ultrix4.3/NFS   1225    1186    476     810     305     0       4002
1103 .TE
1104 .ps
1105 .)z
1106 .pp
1107 For the MAB benchmark, the NQNFS protocol reduces the RPC counts significantly,
1108 but with a minimum of extra overhead (the GetLease/Open-Close count).
1109 .(z
1110 .PS
1111 .ps
1112 .ps 10
1113 dashwid = 0.050i
1114 line dashed from 0.900,7.888 to 4.787,7.888
1115 line dashed from 0.900,7.888 to 0.900,10.262
1116 line from 0.900,7.888 to 0.963,7.888
1117 line from 4.787,7.888 to 4.725,7.888
1118 line from 0.900,8.225 to 0.963,8.225
1119 line from 4.787,8.225 to 4.725,8.225
1120 line from 0.900,8.562 to 0.963,8.562
1121 line from 4.787,8.562 to 4.725,8.562
1122 line from 0.900,8.900 to 0.963,8.900
1123 line from 4.787,8.900 to 4.725,8.900
1124 line from 0.900,9.250 to 0.963,9.250
1125 line from 4.787,9.250 to 4.725,9.250
1126 line from 0.900,9.588 to 0.963,9.588
1127 line from 4.787,9.588 to 4.725,9.588
1128 line from 0.900,9.925 to 0.963,9.925
1129 line from 4.787,9.925 to 4.725,9.925
1130 line from 0.900,10.262 to 0.963,10.262
1131 line from 4.787,10.262 to 4.725,10.262
1132 line from 0.900,7.888 to 0.900,7.950
1133 line from 0.900,10.262 to 0.900,10.200
1134 line from 1.613,7.888 to 1.613,7.950
1135 line from 1.613,10.262 to 1.613,10.200
1136 line from 2.312,7.888 to 2.312,7.950
1137 line from 2.312,10.262 to 2.312,10.200
1138 line from 3.025,7.888 to 3.025,7.950
1139 line from 3.025,10.262 to 3.025,10.200
1140 line from 3.725,7.888 to 3.725,7.950
1141 line from 3.725,10.262 to 3.725,10.200
1142 line from 4.438,7.888 to 4.438,7.950
1143 line from 4.438,10.262 to 4.438,10.200
1144 line from 0.900,7.888 to 4.787,7.888
1145 line from 4.787,7.888 to 4.787,10.262
1146 line from 4.787,10.262 to 0.900,10.262
1147 line from 0.900,10.262 to 0.900,7.888
1148 line from 3.800,8.900 to 4.025,8.900
1149 line from 1.250,8.325 to 1.250,8.325
1150 line from 1.250,8.325 to 1.613,8.500
1151 line from 1.613,8.500 to 2.312,8.825
1152 line from 2.312,8.825 to 3.025,9.175
1153 line from 3.025,9.175 to 3.725,9.613
1154 line from 3.725,9.613 to 4.438,10.012
1155 dashwid = 0.037i
1156 line dotted from 3.800,8.750 to 4.025,8.750
1157 line dotted from 1.250,8.275 to 1.250,8.275
1158 line dotted from 1.250,8.275 to 1.613,8.412
1159 line dotted from 1.613,8.412 to 2.312,8.562
1160 line dotted from 2.312,8.562 to 3.025,9.088
1161 line dotted from 3.025,9.088 to 3.725,9.375
1162 line dotted from 3.725,9.375 to 4.438,10.000
1163 line dashed from 3.800,8.600 to 4.025,8.600
1164 line dashed from 1.250,8.250 to 1.250,8.250
1165 line dashed from 1.250,8.250 to 1.613,8.438
1166 line dashed from 1.613,8.438 to 2.312,8.637
1167 line dashed from 2.312,8.637 to 3.025,9.088
1168 line dashed from 3.025,9.088 to 3.725,9.525
1169 line dashed from 3.725,9.525 to 4.438,10.075
1170 dashwid = 0.075i
1171 line dotted from 3.800,8.450 to 4.025,8.450
1172 line dotted from 1.250,8.262 to 1.250,8.262
1173 line dotted from 1.250,8.262 to 1.613,8.425
1174 line dotted from 1.613,8.425 to 2.312,8.613
1175 line dotted from 2.312,8.613 to 3.025,9.137
1176 line dotted from 3.025,9.137 to 3.725,9.512
1177 line dotted from 3.725,9.512 to 4.438,9.988
1178 .ps
1179 .ps -1
1180 .ft
1181 .ft I
1182 "0" at 0.825,7.810 rjust
1183 "20" at 0.825,8.147 rjust
1184 "40" at 0.825,8.485 rjust
1185 "60" at 0.825,8.822 rjust
1186 "80" at 0.825,9.172 rjust
1187 "100" at 0.825,9.510 rjust
1188 "120" at 0.825,9.847 rjust
1189 "140" at 0.825,10.185 rjust
1190 "0" at 0.900,7.660
1191 "2" at 1.613,7.660
1192 "4" at 2.312,7.660
1193 "6" at 3.025,7.660
1194 "8" at 3.725,7.660
1195 "10" at 4.438,7.660
1196 "Time (sec)" at 0.150,8.997
1197 "Number of Clients" at 2.837,7.510
1198 "Figure #2: MAB Phase 2 (copying)" at 2.837,10.335
1199 "NFS" at 3.725,8.822 rjust
1200 "Leases" at 3.725,8.672 rjust
1201 "Leases, Rdirlookup" at 3.725,8.522 rjust
1202 "Leases, Attrib leases, Rdirlookup" at 3.725,8.372 rjust
1203 .ps
1204 .ft
1205 .PE
1206 .)z
1207 .(z
1208 .PS
1209 .ps
1210 .ps 10
1211 dashwid = 0.050i
1212 line dashed from 0.900,7.888 to 4.787,7.888
1213 line dashed from 0.900,7.888 to 0.900,10.262
1214 line from 0.900,7.888 to 0.963,7.888
1215 line from 4.787,7.888 to 4.725,7.888
1216 line from 0.900,8.188 to 0.963,8.188
1217 line from 4.787,8.188 to 4.725,8.188
1218 line from 0.900,8.488 to 0.963,8.488
1219 line from 4.787,8.488 to 4.725,8.488
1220 line from 0.900,8.775 to 0.963,8.775
1221 line from 4.787,8.775 to 4.725,8.775
1222 line from 0.900,9.075 to 0.963,9.075
1223 line from 4.787,9.075 to 4.725,9.075
1224 line from 0.900,9.375 to 0.963,9.375
1225 line from 4.787,9.375 to 4.725,9.375
1226 line from 0.900,9.675 to 0.963,9.675
1227 line from 4.787,9.675 to 4.725,9.675
1228 line from 0.900,9.963 to 0.963,9.963
1229 line from 4.787,9.963 to 4.725,9.963
1230 line from 0.900,10.262 to 0.963,10.262
1231 line from 4.787,10.262 to 4.725,10.262
1232 line from 0.900,7.888 to 0.900,7.950
1233 line from 0.900,10.262 to 0.900,10.200
1234 line from 1.613,7.888 to 1.613,7.950
1235 line from 1.613,10.262 to 1.613,10.200
1236 line from 2.312,7.888 to 2.312,7.950
1237 line from 2.312,10.262 to 2.312,10.200
1238 line from 3.025,7.888 to 3.025,7.950
1239 line from 3.025,10.262 to 3.025,10.200
1240 line from 3.725,7.888 to 3.725,7.950
1241 line from 3.725,10.262 to 3.725,10.200
1242 line from 4.438,7.888 to 4.438,7.950
1243 line from 4.438,10.262 to 4.438,10.200
1244 line from 0.900,7.888 to 4.787,7.888
1245 line from 4.787,7.888 to 4.787,10.262
1246 line from 4.787,10.262 to 0.900,10.262
1247 line from 0.900,10.262 to 0.900,7.888
1248 line from 3.800,8.775 to 4.025,8.775
1249 line from 1.250,8.975 to 1.250,8.975
1250 line from 1.250,8.975 to 1.613,8.963
1251 line from 1.613,8.963 to 2.312,8.988
1252 line from 2.312,8.988 to 3.025,9.037
1253 line from 3.025,9.037 to 3.725,9.062
1254 line from 3.725,9.062 to 4.438,9.100
1255 dashwid = 0.037i
1256 line dotted from 3.800,8.625 to 4.025,8.625
1257 line dotted from 1.250,9.312 to 1.250,9.312
1258 line dotted from 1.250,9.312 to 1.613,9.287
1259 line dotted from 1.613,9.287 to 2.312,9.675
1260 line dotted from 2.312,9.675 to 3.025,9.262
1261 line dotted from 3.025,9.262 to 3.725,9.738
1262 line dotted from 3.725,9.738 to 4.438,9.512
1263 line dashed from 3.800,8.475 to 4.025,8.475
1264 line dashed from 1.250,9.400 to 1.250,9.400
1265 line dashed from 1.250,9.400 to 1.613,9.287
1266 line dashed from 1.613,9.287 to 2.312,9.575
1267 line dashed from 2.312,9.575 to 3.025,9.300
1268 line dashed from 3.025,9.300 to 3.725,9.613
1269 line dashed from 3.725,9.613 to 4.438,9.512
1270 dashwid = 0.075i
1271 line dotted from 3.800,8.325 to 4.025,8.325
1272 line dotted from 1.250,9.400 to 1.250,9.400
1273 line dotted from 1.250,9.400 to 1.613,9.412
1274 line dotted from 1.613,9.412 to 2.312,9.700
1275 line dotted from 2.312,9.700 to 3.025,9.537
1276 line dotted from 3.025,9.537 to 3.725,9.938
1277 line dotted from 3.725,9.938 to 4.438,9.812
1278 .ps
1279 .ps -1
1280 .ft
1281 .ft I
1282 "0" at 0.825,7.810 rjust
1283 "5" at 0.825,8.110 rjust
1284 "10" at 0.825,8.410 rjust
1285 "15" at 0.825,8.697 rjust
1286 "20" at 0.825,8.997 rjust
1287 "25" at 0.825,9.297 rjust
1288 "30" at 0.825,9.597 rjust
1289 "35" at 0.825,9.885 rjust
1290 "40" at 0.825,10.185 rjust
1291 "0" at 0.900,7.660
1292 "2" at 1.613,7.660
1293 "4" at 2.312,7.660
1294 "6" at 3.025,7.660
1295 "8" at 3.725,7.660
1296 "10" at 4.438,7.660
1297 "Time (sec)" at 0.150,8.997
1298 "Number of Clients" at 2.837,7.510
1299 "Figure #3: MAB Phase 3 (stat/find)" at 2.837,10.335
1300 "NFS" at 3.725,8.697 rjust
1301 "Leases" at 3.725,8.547 rjust
1302 "Leases, Rdirlookup" at 3.725,8.397 rjust
1303 "Leases, Attrib leases, Rdirlookup" at 3.725,8.247 rjust
1304 .ps
1305 .ft
1306 .PE
1307 .)z
1308 .(z
1309 .PS
1310 .ps
1311 .ps 10
1312 dashwid = 0.050i
1313 line dashed from 0.900,7.888 to 4.787,7.888
1314 line dashed from 0.900,7.888 to 0.900,10.262
1315 line from 0.900,7.888 to 0.963,7.888
1316 line from 4.787,7.888 to 4.725,7.888
1317 line from 0.900,8.188 to 0.963,8.188
1318 line from 4.787,8.188 to 4.725,8.188
1319 line from 0.900,8.488 to 0.963,8.488
1320 line from 4.787,8.488 to 4.725,8.488
1321 line from 0.900,8.775 to 0.963,8.775
1322 line from 4.787,8.775 to 4.725,8.775
1323 line from 0.900,9.075 to 0.963,9.075
1324 line from 4.787,9.075 to 4.725,9.075
1325 line from 0.900,9.375 to 0.963,9.375
1326 line from 4.787,9.375 to 4.725,9.375
1327 line from 0.900,9.675 to 0.963,9.675
1328 line from 4.787,9.675 to 4.725,9.675
1329 line from 0.900,9.963 to 0.963,9.963
1330 line from 4.787,9.963 to 4.725,9.963
1331 line from 0.900,10.262 to 0.963,10.262
1332 line from 4.787,10.262 to 4.725,10.262
1333 line from 0.900,7.888 to 0.900,7.950
1334 line from 0.900,10.262 to 0.900,10.200
1335 line from 1.613,7.888 to 1.613,7.950
1336 line from 1.613,10.262 to 1.613,10.200
1337 line from 2.312,7.888 to 2.312,7.950
1338 line from 2.312,10.262 to 2.312,10.200
1339 line from 3.025,7.888 to 3.025,7.950
1340 line from 3.025,10.262 to 3.025,10.200
1341 line from 3.725,7.888 to 3.725,7.950
1342 line from 3.725,10.262 to 3.725,10.200
1343 line from 4.438,7.888 to 4.438,7.950
1344 line from 4.438,10.262 to 4.438,10.200
1345 line from 0.900,7.888 to 4.787,7.888
1346 line from 4.787,7.888 to 4.787,10.262
1347 line from 4.787,10.262 to 0.900,10.262
1348 line from 0.900,10.262 to 0.900,7.888
1349 line from 3.800,8.775 to 4.025,8.775
1350 line from 1.250,9.412 to 1.250,9.412
1351 line from 1.250,9.412 to 1.613,9.425
1352 line from 1.613,9.425 to 2.312,9.463
1353 line from 2.312,9.463 to 3.025,9.600
1354 line from 3.025,9.600 to 3.725,9.875
1355 line from 3.725,9.875 to 4.438,10.075
1356 dashwid = 0.037i
1357 line dotted from 3.800,8.625 to 4.025,8.625
1358 line dotted from 1.250,9.450 to 1.250,9.450
1359 line dotted from 1.250,9.450 to 1.613,9.438
1360 line dotted from 1.613,9.438 to 2.312,9.438
1361 line dotted from 2.312,9.438 to 3.025,9.525
1362 line dotted from 3.025,9.525 to 3.725,9.550
1363 line dotted from 3.725,9.550 to 4.438,9.662
1364 line dashed from 3.800,8.475 to 4.025,8.475
1365 line dashed from 1.250,9.438 to 1.250,9.438
1366 line dashed from 1.250,9.438 to 1.613,9.412
1367 line dashed from 1.613,9.412 to 2.312,9.450
1368 line dashed from 2.312,9.450 to 3.025,9.500
1369 line dashed from 3.025,9.500 to 3.725,9.613
1370 line dashed from 3.725,9.613 to 4.438,9.675
1371 dashwid = 0.075i
1372 line dotted from 3.800,8.325 to 4.025,8.325
1373 line dotted from 1.250,9.387 to 1.250,9.387
1374 line dotted from 1.250,9.387 to 1.613,9.600
1375 line dotted from 1.613,9.600 to 2.312,9.625
1376 line dotted from 2.312,9.625 to 3.025,9.738
1377 line dotted from 3.025,9.738 to 3.725,9.850
1378 line dotted from 3.725,9.850 to 4.438,9.800
1379 .ps
1380 .ps -1
1381 .ft
1382 .ft I
1383 "0" at 0.825,7.810 rjust
1384 "5" at 0.825,8.110 rjust
1385 "10" at 0.825,8.410 rjust
1386 "15" at 0.825,8.697 rjust
1387 "20" at 0.825,8.997 rjust
1388 "25" at 0.825,9.297 rjust
1389 "30" at 0.825,9.597 rjust
1390 "35" at 0.825,9.885 rjust
1391 "40" at 0.825,10.185 rjust
1392 "0" at 0.900,7.660
1393 "2" at 1.613,7.660
1394 "4" at 2.312,7.660
1395 "6" at 3.025,7.660
1396 "8" at 3.725,7.660
1397 "10" at 4.438,7.660
1398 "Time (sec)" at 0.150,8.997
1399 "Number of Clients" at 2.837,7.510
1400 "Figure #4: MAB Phase 4 (grep/wc/find)" at 2.837,10.335
1401 "NFS" at 3.725,8.697 rjust
1402 "Leases" at 3.725,8.547 rjust
1403 "Leases, Rdirlookup" at 3.725,8.397 rjust
1404 "Leases, Attrib leases, Rdirlookup" at 3.725,8.247 rjust
1405 .ps
1406 .ft
1407 .PE
1408 .)z
1409 .(z
1410 .PS
1411 .ps
1412 .ps 10
1413 dashwid = 0.050i
1414 line dashed from 0.900,7.888 to 4.787,7.888
1415 line dashed from 0.900,7.888 to 0.900,10.262
1416 line from 0.900,7.888 to 0.963,7.888
1417 line from 4.787,7.888 to 4.725,7.888
1418 line from 0.900,8.150 to 0.963,8.150
1419 line from 4.787,8.150 to 4.725,8.150
1420 line from 0.900,8.412 to 0.963,8.412
1421 line from 4.787,8.412 to 4.725,8.412
1422 line from 0.900,8.675 to 0.963,8.675
1423 line from 4.787,8.675 to 4.725,8.675
1424 line from 0.900,8.938 to 0.963,8.938
1425 line from 4.787,8.938 to 4.725,8.938
1426 line from 0.900,9.213 to 0.963,9.213
1427 line from 4.787,9.213 to 4.725,9.213
1428 line from 0.900,9.475 to 0.963,9.475
1429 line from 4.787,9.475 to 4.725,9.475
1430 line from 0.900,9.738 to 0.963,9.738
1431 line from 4.787,9.738 to 4.725,9.738
1432 line from 0.900,10.000 to 0.963,10.000
1433 line from 4.787,10.000 to 4.725,10.000
1434 line from 0.900,10.262 to 0.963,10.262
1435 line from 4.787,10.262 to 4.725,10.262
1436 line from 0.900,7.888 to 0.900,7.950
1437 line from 0.900,10.262 to 0.900,10.200
1438 line from 1.613,7.888 to 1.613,7.950
1439 line from 1.613,10.262 to 1.613,10.200
1440 line from 2.312,7.888 to 2.312,7.950
1441 line from 2.312,10.262 to 2.312,10.200
1442 line from 3.025,7.888 to 3.025,7.950
1443 line from 3.025,10.262 to 3.025,10.200
1444 line from 3.725,7.888 to 3.725,7.950
1445 line from 3.725,10.262 to 3.725,10.200
1446 line from 4.438,7.888 to 4.438,7.950
1447 line from 4.438,10.262 to 4.438,10.200
1448 line from 0.900,7.888 to 4.787,7.888
1449 line from 4.787,7.888 to 4.787,10.262
1450 line from 4.787,10.262 to 0.900,10.262
1451 line from 0.900,10.262 to 0.900,7.888
1452 line from 3.800,8.675 to 4.025,8.675
1453 line from 1.250,8.800 to 1.250,8.800
1454 line from 1.250,8.800 to 1.613,8.912
1455 line from 1.613,8.912 to 2.312,9.113
1456 line from 2.312,9.113 to 3.025,9.438
1457 line from 3.025,9.438 to 3.725,9.750
1458 line from 3.725,9.750 to 4.438,10.088
1459 dashwid = 0.037i
1460 line dotted from 3.800,8.525 to 4.025,8.525
1461 line dotted from 1.250,8.637 to 1.250,8.637
1462 line dotted from 1.250,8.637 to 1.613,8.700
1463 line dotted from 1.613,8.700 to 2.312,8.713
1464 line dotted from 2.312,8.713 to 3.025,8.775
1465 line dotted from 3.025,8.775 to 3.725,8.887
1466 line dotted from 3.725,8.887 to 4.438,9.037
1467 line dashed from 3.800,8.375 to 4.025,8.375
1468 line dashed from 1.250,8.675 to 1.250,8.675
1469 line dashed from 1.250,8.675 to 1.613,8.688
1470 line dashed from 1.613,8.688 to 2.312,8.713
1471 line dashed from 2.312,8.713 to 3.025,8.825
1472 line dashed from 3.025,8.825 to 3.725,8.887
1473 line dashed from 3.725,8.887 to 4.438,9.062
1474 dashwid = 0.075i
1475 line dotted from 3.800,8.225 to 4.025,8.225
1476 line dotted from 1.250,8.700 to 1.250,8.700
1477 line dotted from 1.250,8.700 to 1.613,8.688
1478 line dotted from 1.613,8.688 to 2.312,8.762
1479 line dotted from 2.312,8.762 to 3.025,8.812
1480 line dotted from 3.025,8.812 to 3.725,8.925
1481 line dotted from 3.725,8.925 to 4.438,9.025
1482 .ps
1483 .ps -1
1484 .ft
1485 .ft I
1486 "0" at 0.825,7.810 rjust
1487 "50" at 0.825,8.072 rjust
1488 "100" at 0.825,8.335 rjust
1489 "150" at 0.825,8.597 rjust
1490 "200" at 0.825,8.860 rjust
1491 "250" at 0.825,9.135 rjust
1492 "300" at 0.825,9.397 rjust
1493 "350" at 0.825,9.660 rjust
1494 "400" at 0.825,9.922 rjust
1495 "450" at 0.825,10.185 rjust
1496 "0" at 0.900,7.660
1497 "2" at 1.613,7.660
1498 "4" at 2.312,7.660
1499 "6" at 3.025,7.660
1500 "8" at 3.725,7.660
1501 "10" at 4.438,7.660
1502 "Time (sec)" at 0.150,8.997
1503 "Number of Clients" at 2.837,7.510
1504 "Figure #5: MAB Phase 5 (compile)" at 2.837,10.335
1505 "NFS" at 3.725,8.597 rjust
1506 "Leases" at 3.725,8.447 rjust
1507 "Leases, Rdirlookup" at 3.725,8.297 rjust
1508 "Leases, Attrib leases, Rdirlookup" at 3.725,8.147 rjust
1509 .ps
1510 .ft
1511 .PE
1512 .)z
1513 .pp
1514 In figure 2, where a subtree of seventy small files is copied, the difference between the protocol variants is minimal,
1515 with the NQNFS variants performing slightly better.
1516 For this case, the Readdir_and_Lookup RPC is a slight hindrance under heavy
1517 load, possibly because it results in larger directory blocks in the buffer
1518 cache.
1519 .pp
1520 In figure 3, for the phase that gets file attributes for a large number
1521 of files, the leasing variants take about 50% longer, indicating that
1522 there are performance problems in this area. For the case where valid
1523 current leases are required for every file when attributes are returned,
1524 the performance is significantly worse than when the attributes are allowed
1525 to be stale by a few seconds on the client.
1526 I have not been able to explain the oscillation in the curves for the
1527 Lease cases.
1528 .pp
1529 For the string searching phase depicted in figure 4, the leasing variants
1530 that do not require valid leases for files when attributes are returned
1531 appear to scale better with server load than NFS.
1532 However, the effect appears to be
1533 negligible until the server load is fairly heavy.
1534 .pp
1535 Most of the time in the MAB benchmark is spent in the compilation phase
1536 and this is where the differences between caching methods are most
1537 pronounced.
1538 In figure 5 it can be seen that any protocol variant using Leases performs
1539 about a factor of two better than NFS
1540 at a load of ten clients. This indicates that the use of NQNFS may
1541 allow servers to handle significantly more clients for this type of
1542 workload.
1543 .pp
1544 Table 2 summarizes the MAB run times for all phases for the single client
1545 DECstation 5000/25. The \fILeases\fR case refers to using leases, whereas
1546 the \fILeases, Rdirl\fR case uses the Readdir_and_Lookup RPC as well and
1547 the \fIBCache Only\fR case uses leases, but only the buffer cache and not
1548 the attribute or name caches.
1549 The \fINo Caching\fR cases does not do any client side caching, performing
1550 all system calls via synchronous RPCs to the server.
1551 .(z
1552 .ps -1
1553 .TS
1554 box, center;
1555 c s s s s s s
1556 c c c c c c c c
1557 l | n n n n n n n.
1558 Table #2: Single DECstation 5000/25 Client Elapsed Times (sec)
1559 Phase   1       2       3       4       5       Total   % Improvement
1560 _
1561 No Caching      6       35      41      40      258     380     -93
1562 NFS     5       24      15      20      133     197     0
1563 BCache Only     5       20      24      23      116     188     5
1564 Leases, Rdirl   5       20      21      20      105     171     13
1565 Leases  5       19      21      21      99      165     16
1566 .TE
1567 .ps
1568 .)z
1569 .sh 2 "Processor Speed Tests"
1570 .pp
1571 An important goal of client-side file system caching is to decouple the
1572 I/O system calls from the underlying distributed file system, so that the
1573 client's system performance might scale with processor speed. In order
1574 to test this, a series of MAB runs were performed on three
1575 DECstations that are similar except for processor speed.
1576 In addition to the four protocol variants used for the above tests, runs
1577 were done with the client caches turned off, for
1578 worst case performance numbers for caching mechanisms with a 100% miss rate. The CPU utilization
1579 was measured, as an indicator of how much the processor was blocking for
1580 I/O system calls. Note that since the systems were running in single user mode
1581 and otherwise quiescent, almost all CPU activity was directly related
1582 to the MAB run.
1583 The results are presented in
1584 table 3.
1585 The CPU time is simply the product of the CPU utilization and
1586 elapsed running time and, as such, is the optimistic bound on performance
1587 achievable with an ideal client caching scheme that never blocks for I/O.
1588 .(z
1589 .ps -1
1590 .TS
1591 box, center;
1592 c s s s s s s s s s
1593 c c s s c s s c s s
1594 c c c c c c c c c c
1595 c c c c c c c c c c
1596 l | n n n n n n n n n.
1597 Table #3: MAB Phase 5 (compile)
1598         DS2100 (10.5 MIPS)      DS3100 (14.0 MIPS)      DS5000/25 (26.7 MIPS)
1599         Elapsed CPU     CPU     Elapsed CPU     CPU     Elapsed CPU     CPU
1600         time    Util(%) time    time    Util(%) time    time    Util(%) time
1601 _
1602 Leases  143     89      127     113     87      98      99      89      88
1603 Leases, Rdirl   150     89      134     110     91      100     105     88      92
1604 BCache Only     169     85      144     129     78      101     116     75      87
1605 NFS     172     77      132     135     74      100     133     71      94
1606 No Caching      330     47      155     256     41      105     258     39      101
1607 .TE
1608 .ps
1609 .)z
1610 As can be seen in the table, any caching mechanism achieves significantly
1611 better performance than when caching is disabled, roughly doubling the CPU
1612 utilization with a corresponding reduction in run time. For NFS, the CPU
1613 utilization is dropping with increase in CPU speed, which would suggest that
1614 it is not scaling with CPU speed. For the NQNFS variants, the CPU utilization
1615 remains at just below 90%, which suggests that the caching mechanism is working
1616 well and scaling within this CPU range.
1617 Note that for this benchmark, the ratio of CPU times for
1618 the DECstation 3100 and DECstation 5000/25 are quite different than the
1619 Dhrystone MIPS ratings would suggest.
1620 .pp
1621 Overall, the results seem encouraging, although it remains to be seen whether
1622 or not the caching provided by NQNFS can continue to scale with CPU
1623 performance.
1624 There is a good indication that NQNFS permits a server to scale
1625 to more clients than does NFS, at least for workloads akin to the MAB compile phase.
1626 A more difficult question is "What if the server is much faster doing
1627 write RPCs?" as a result of some technology such as Prestoserve
1628 or write gathering.
1629 Since a significant part of the difference between NFS and NQNFS is
1630 the synchronous writing, it is difficult to predict how much a server
1631 capable of fast write RPCs will negate the performance improvements of NQNFS.
1632 At the very least, table 1 indicates that the write RPC load on the server
1633 has decreased by approximately 30%, and this reduced write load should still
1634 result in some improvement.
1635 .pp
1636 Indications are that the Readdir_and_Lookup RPC has not improved performance
1637 for these tests and may in fact be degrading performance slightly.
1638 The results in figure 3 indicate some problems, possibly with handling
1639 of the attribute cache. It seems logical that the Readdir_and_Lookup RPC
1640 should be permit priming of the attribute cache improving hit rate, but the
1641 results are counter to that.
1642 .sh 2 "Internetwork Delay Tests"
1643 .pp
1644 This experimental setup was used to explore how the different protocol
1645 variants might perform over internetworks with larger RPC RTTs. The
1646 server was moved to a separate Ethernet, using a MicroVAXII\(tm as an
1647 IP router to the other Ethernet. The 4.3Reno BSD Unix system running on the
1648 MicroVAXII was modified to delay IP packets being forwarded by a tunable N
1649 millisecond delay. The implementation was rather crude and did not try to
1650 simulate a distribution of delay times nor was it programmed to drop packets
1651 at a given rate, but it served as a simple emulation of a long,
1652 fat network\** [Jacobson88].
1653 .(f
1654 \**Long fat networks refer to network interconnections with
1655 a Bandwidth X RTT product > 10\u5\d bits.
1656 .)f
1657 The MAB was run using both UDP and TCP RPC transports
1658 for a variety of RTT delays from five to two hundred milliseconds,
1659 to observe the effects of RTT delay on RPC transport.
1660 It was found that, due to a high variability between runs, four runs was not
1661 suffice, so eight runs at each value was done.
1662 The results in figure 6 and table 4 are the average for the eight runs.
1663 .(z
1664 .PS
1665 .ps
1666 .ps 10
1667 dashwid = 0.050i
1668 line dashed from 0.900,7.888 to 4.787,7.888
1669 line dashed from 0.900,7.888 to 0.900,10.262
1670 line from 0.900,7.888 to 0.963,7.888
1671 line from 4.787,7.888 to 4.725,7.888
1672 line from 0.900,8.350 to 0.963,8.350
1673 line from 4.787,8.350 to 4.725,8.350
1674 line from 0.900,8.800 to 0.963,8.800
1675 line from 4.787,8.800 to 4.725,8.800
1676 line from 0.900,9.262 to 0.963,9.262
1677 line from 4.787,9.262 to 4.725,9.262
1678 line from 0.900,9.713 to 0.963,9.713
1679 line from 4.787,9.713 to 4.725,9.713
1680 line from 0.900,10.175 to 0.963,10.175
1681 line from 4.787,10.175 to 4.725,10.175
1682 line from 0.900,7.888 to 0.900,7.950
1683 line from 0.900,10.262 to 0.900,10.200
1684 line from 1.825,7.888 to 1.825,7.950
1685 line from 1.825,10.262 to 1.825,10.200
1686 line from 2.750,7.888 to 2.750,7.950
1687 line from 2.750,10.262 to 2.750,10.200
1688 line from 3.675,7.888 to 3.675,7.950
1689 line from 3.675,10.262 to 3.675,10.200
1690 line from 4.600,7.888 to 4.600,7.950
1691 line from 4.600,10.262 to 4.600,10.200
1692 line from 0.900,7.888 to 4.787,7.888
1693 line from 4.787,7.888 to 4.787,10.262
1694 line from 4.787,10.262 to 0.900,10.262
1695 line from 0.900,10.262 to 0.900,7.888
1696 line from 4.125,8.613 to 4.350,8.613
1697 line from 0.988,8.400 to 0.988,8.400
1698 line from 0.988,8.400 to 1.637,8.575
1699 line from 1.637,8.575 to 2.375,8.713
1700 line from 2.375,8.713 to 3.125,8.900
1701 line from 3.125,8.900 to 3.862,9.137
1702 line from 3.862,9.137 to 4.600,9.425
1703 dashwid = 0.037i
1704 line dotted from 4.125,8.463 to 4.350,8.463
1705 line dotted from 0.988,8.375 to 0.988,8.375
1706 line dotted from 0.988,8.375 to 1.637,8.525
1707 line dotted from 1.637,8.525 to 2.375,8.850
1708 line dotted from 2.375,8.850 to 3.125,8.975
1709 line dotted from 3.125,8.975 to 3.862,9.137
1710 line dotted from 3.862,9.137 to 4.600,9.625
1711 line dashed from 4.125,8.312 to 4.350,8.312
1712 line dashed from 0.988,8.525 to 0.988,8.525
1713 line dashed from 0.988,8.525 to 1.637,8.688
1714 line dashed from 1.637,8.688 to 2.375,8.838
1715 line dashed from 2.375,8.838 to 3.125,9.150
1716 line dashed from 3.125,9.150 to 3.862,9.275
1717 line dashed from 3.862,9.275 to 4.600,9.588
1718 dashwid = 0.075i
1719 line dotted from 4.125,8.162 to 4.350,8.162
1720 line dotted from 0.988,8.525 to 0.988,8.525
1721 line dotted from 0.988,8.525 to 1.637,8.838
1722 line dotted from 1.637,8.838 to 2.375,8.863
1723 line dotted from 2.375,8.863 to 3.125,9.137
1724 line dotted from 3.125,9.137 to 3.862,9.387
1725 line dotted from 3.862,9.387 to 4.600,10.200
1726 .ps
1727 .ps -1
1728 .ft
1729 .ft I
1730 "0" at 0.825,7.810 rjust
1731 "100" at 0.825,8.272 rjust
1732 "200" at 0.825,8.722 rjust
1733 "300" at 0.825,9.185 rjust
1734 "400" at 0.825,9.635 rjust
1735 "500" at 0.825,10.097 rjust
1736 "0" at 0.900,7.660
1737 "50" at 1.825,7.660
1738 "100" at 2.750,7.660
1739 "150" at 3.675,7.660
1740 "200" at 4.600,7.660
1741 "Time (sec)" at 0.150,8.997
1742 "Round Trip Delay (msec)" at 2.837,7.510
1743 "Figure #6: MAB Phase 5 (compile)" at 2.837,10.335
1744 "Leases,UDP" at 4.050,8.535 rjust
1745 "Leases,TCP" at 4.050,8.385 rjust
1746 "NFS,UDP" at 4.050,8.235 rjust
1747 "NFS,TCP" at 4.050,8.085 rjust
1748 .ps
1749 .ft
1750 .PE
1751 .)z
1752 .(z
1753 .ps -1
1754 .TS
1755 box, center;
1756 c s s s s s s s s
1757 c c s c s c s c s
1758 c c c c c c c c c
1759 c c c c c c c c c
1760 l | n n n n n n n n.
1761 Table #4: MAB Phase 5 (compile) for Internetwork Delays
1762         NFS,UDP NFS,TCP Leases,UDP      Leases,TCP
1763 Delay   Elapsed Standard        Elapsed Standard        Elapsed Standard        Elapsed Standard
1764 (msec)  time (sec)      Deviation       time (sec)      Deviation       time (sec)      Deviation       time (sec)      Deviation
1765 _
1766 5       139     2.9     139     2.4     112     7.0     108     6.0
1767 40      175     5.1     208     44.5    150     23.8    139     4.3
1768 80      207     3.9     213     4.7     180     7.7     210     52.9
1769 120     276     29.3    273     17.1    221     7.7     238     5.8
1770 160     304     7.2     328     77.1    275     21.5    274     10.1
1771 200     372     35.0    506     235.1   338     25.2    379     69.2
1772 .TE
1773 .ps
1774 .)z
1775 .pp
1776 I found these results somewhat surprising, since I had assumed that stability
1777 across an internetwork connection would be a function of RPC transport
1778 protocol.
1779 Looking at the standard deviations observed between the eight runs, there is an indication
1780 that the NQNFS protocol plays a larger role in
1781 maintaining stability than the underlying RPC transport protocol.
1782 It appears that NFS over TCP transport
1783 is the least stable variant tested.
1784 It should be noted that the TCP implementation used was roughly at 4.3BSD Tahoe
1785 release and that the 4.4BSD TCP implementation was far less stable and would
1786 fail intermittently, due to a bug I was not able to isolate.
1787 It would appear that some of the recent enhancements to the 4.4BSD TCP
1788 implementation have a detrimental effect on the performance of
1789 RPC-type traffic loads, which intermix small and large
1790 data transfers in both directions.
1791 It is obvious that more exploration of this area is needed before any
1792 conclusions can be made
1793 beyond the fact that over a local area network, TCP transport provides
1794 performance comparable to UDP.
1795 .sh 1 "Lessons Learned"
1796 .pp
1797 Evaluating the performance of a distributed file system is fraught with
1798 difficulties, due to the many software and hardware factors involved.
1799 The limited benchmarking presented here took a considerable amount of time
1800 and the results gained by the exercise only give indications of what the
1801 performance might be for a few scenarios.
1802 .pp
1803 The IP router with delay introduction proved to be a valuable tool for protocol debugging\**,
1804 .(f
1805 \**It exposed two bugs in the 4.4BSD networking, one a problem in the Lance chip
1806 driver for the DECstation and the other a TCP window sizing problem that I was
1807 not able to isolate.
1808 .)f
1809 and may be useful for a more extensive study of performance over internetworks
1810 if enhanced to do a better job of simulating internetwork delay and packet loss.
1811 .pp
1812 The Leases mechanism provided a simple model for the provision of cache
1813 consistency and did seem to improve performance for various scenarios.
1814 Unfortunately, it does not provide the server state information that is required
1815 for file system semantics, such as locking, that many software systems demand.
1816 In production environments on my campus, the need for file locking and the correct
1817 generation of the ETXTBSY error code
1818 are far more important that full cache consistency, and leasing
1819 does not satisfy these needs.
1820 Another file system semantic that requires hard server state is the delay
1821 of file removal until the last close system call. Although Spritely NFS
1822 did not support this semantic either, it is logical that the open file
1823 state maintained by that system would facilitate the implementation of
1824 this semantic more easily than would the Leases mechanism.
1825 .sh 1 "Further Work"
1826 .pp
1827 The current implementation uses a fixed, moderate sized buffer cache designed
1828 for the local UFS [McKusick84] file system.
1829 The results in figure 1 suggest that this is adequate so long as the cache
1830 is of an appropriate size.
1831 However, a mechanism permitting the cache to vary in size
1832 has been shown to outperform fixed sized buffer caches [Nelson90], and could
1833 be beneficial. It could also be useful to allow the buffer cache to grow very
1834 large by making use of local backing store for cases where server performance
1835 is limited.
1836 A very large buffer cache size would in turn permit experimentation with
1837 much larger read/write data sizes, facilitating bulk data transfers
1838 across long fat networks, such as will characterize the Internet of the
1839 near future.
1840 A careful redesign of the buffer cache mechanism to provide
1841 support for these features would probably be the next implementation step.
1842 .pp
1843 The results in figure 3 indicate that the mechanics of caching file
1844 attributes and maintaining the attribute cache's consistency needs to
1845 be looked at further.
1846 There also needs to be more work done on the interaction between a
1847 Readdir_and_Lookup RPC and the name and attribute caches, in an effort
1848 to reduce Getattr and Lookup RPC loads.
1849 .pp
1850 The NQNFS protocol has never been used in a production environment and doing
1851 so would provide needed insight into how well the protocol saisfies the
1852 needs of real workstation environments.
1853 It is hoped that the distribution of the implementation in 4.4BSD will
1854 facilitate use of the protocol in production environments elsewhere.
1855 .pp
1856 The big question that needs to be resolved is whether Leases are an adequate
1857 mechanism for cache consistency or whether hard server state is required.
1858 Given the work presented here and in the papers related to Sprite and Spritely
1859 NFS, there are clear indications that a cache consistency algorithm can
1860 improve both performance and file system semantics.
1861 As yet, however, it is unclear what the best approach to maintain consistency is.
1862 It would appear that hard state information is required for file locking and
1863 other mechanisms and, if so, it seems appropriate to use it for cache
1864 consistency as well.
1865 .sh 1 "Acknowledgements"
1866 .pp
1867 I would like to thank the members of the CSRG at the University of California,
1868 Berkeley for their continued support over the years. Without their encouragement and assistance this
1869 software would never have been implemented.
1870 Prof. Jim Linders and Prof. Tom Wilson here at the University of Guelph helped
1871 proofread this paper and Jeffrey Mogul provided a great deal of
1872 assistance, helping to turn my gibberish into something at least moderately
1873 readable.
1874 .sh 1 "References"
1875 .ip [Baker91] 15
1876 Mary Baker and John Ousterhout, Availability in the Sprite Distributed
1877 File System, In \fIOperating System Review\fR, (25)2, pg. 95-98,
1878 April 1991.
1879 .ip [Baker91a] 15
1880 Mary Baker, private communication, May 1991.
1881 .ip [Burrows88] 15
1882 Michael Burrows, Efficient Data Sharing, Technical Report #153,
1883 Computer Laboratory, University of Cambridge, Dec. 1988.
1884 .ip [Gray89] 15
1885 Cary G. Gray and David R. Cheriton, Leases: An Efficient Fault-Tolerant
1886 Mechanism for Distributed File Cache Consistency, In \fIProc. of the
1887 Twelfth ACM Symposium on Operating Systems Principals\fR, Litchfield Park,
1888 AZ, Dec. 1989.
1889 .ip [Howard88] 15
1890 John H. Howard, Michael L. Kazar, Sherri G. Menees, David A. Nichols,
1891 M. Satyanarayanan, Robert N. Sidebotham and Michael J. West,
1892 Scale and Performance in a Distributed File System, \fIACM Trans. on
1893 Computer Systems\fR, (6)1, pg 51-81, Feb. 1988.
1894 .ip [Jacobson88] 15
1895 Van Jacobson and R. Braden, \fITCP Extensions for Long-Delay Paths\fR,
1896 ARPANET Working Group Requests for Comment, DDN Network Information Center,
1897 SRI International, Menlo Park, CA, October 1988, RFC-1072.
1898 .ip [Jacobson89] 15
1899 Van Jacobson, Sun NFS Performance Problems, \fIPrivate Communication,\fR
1900 November, 1989.
1901 .ip [Juszczak89] 15
1902 Chet Juszczak, Improving the Performance and Correctness of an NFS Server,
1903 In \fIProc. Winter 1989 USENIX Conference,\fR pg. 53-63, San Diego, CA, January 1989.
1904 .ip [Juszczak94] 15
1905 Chet Juszczak, Improving the Write Performance of an NFS Server,
1906 to appear in \fIProc. Winter 1994 USENIX Conference,\fR San Francisco, CA, January 1994.
1907 .ip [Kazar88] 15
1908 Michael L. Kazar, Synchronization and Caching Issues in the Andrew File System,
1909 In \fIProc. Winter 1988 USENIX Conference,\fR pg. 27-36, Dallas, TX, February
1910 1988.
1911 .ip [Kent87] 15
1912 Christopher. A. Kent and Jeffrey C. Mogul, \fIFragmentation Considered Harmful\fR, Research Report 87/3,
1913 Digital Equipment Corporation Western Research Laboratory, Dec. 1987.
1914 .ip [Kent87a] 15
1915 Christopher. A. Kent, \fICache Coherence in Distributed Systems\fR, Research Report 87/4,
1916 Digital Equipment Corporation Western Research Laboratory, April 1987.
1917 .ip [Macklem90] 15
1918 Rick Macklem, Lessons Learned Tuning the 4.3BSD Reno Implementation of the
1919 NFS Protocol,
1920 In \fIProc. Winter 1991 USENIX Conference,\fR pg. 53-64, Dallas, TX,
1921 January 1991.
1922 .ip [Macklem93] 15
1923 Rick Macklem, The 4.4BSD NFS Implementation,
1924 In \fIThe System Manager's Manual\fR, 4.4 Berkeley Software Distribution,
1925 University of California, Berkeley, June 1993.
1926 .ip [McKusick84] 15
1927 Marshall K. McKusick, William N. Joy, Samuel J. Leffler and Robert S. Fabry,
1928 A Fast File System for UNIX, \fIACM Transactions on Computer Systems\fR,
1929 Vol. 2, Number 3, pg. 181-197, August 1984.
1930 .ip [McKusick90] 15
1931 Marshall K. McKusick, Michael J. Karels and Keith Bostic, A Pageable Memory
1932 Based Filesystem,
1933 In \fIProc. Summer 1990 USENIX Conference,\fR pg. 137-143, Anaheim, CA, June
1934 1990.
1935 .ip [Mogul93] 15
1936 Jeffrey C. Mogul, Recovery in Spritely NFS,
1937 Research Report 93/2, Digital Equipment Corporation Western Research
1938 Laboratory, June 1993.
1939 .ip [Moran90] 15
1940 Joseph Moran, Russel Sandberg, Don Coleman, Jonathan Kepecs and Bob Lyon,
1941 Breaking Through the NFS Performance Barrier,
1942 In \fIProc. Spring 1990 EUUG Conference,\fR pg. 199-206, Munich, FRG,
1943 April 1990.
1944 .ip [Nelson88] 15
1945 Michael N. Nelson, Brent B. Welch, and John K. Ousterhout, Caching in the
1946 Sprite Network File System, \fIACM Transactions on Computer Systems\fR (6)1
1947 pg. 134-154, February 1988.
1948 .ip [Nelson90] 15
1949 Michael N. Nelson, \fIVirtual Memory vs. The File System\fR, Research Report
1950 90/4, Digital Equipment Corporation Western Research Laboratory, March 1990.
1951 .ip [Nowicki89] 15
1952 Bill Nowicki, Transport Issues in the Network File System, In \fIComputer
1953 Communication Review\fR, pg. 16-20, March 1989.
1954 .ip [Ousterhout90] 15
1955 John K. Ousterhout, Why Aren't Operating Systems Getting Faster As Fast as
1956 Hardware? In \fIProc. Summer 1990 USENIX Conference\fR, pg. 247-256, Anaheim,
1957 CA, June 1990.
1958 .ip [Sandberg85] 15
1959 Russel Sandberg, David Goldberg, Steve Kleiman, Dan Walsh, and Bob Lyon,
1960 Design and Implementation of the Sun Network filesystem, In \fIProc. Summer
1961 1985 USENIX Conference\fR, pages 119-130, Portland, OR, June 1985.
1962 .ip [Srinivasan89] 15
1963 V. Srinivasan and Jeffrey. C. Mogul, Spritely NFS: Experiments with
1964 Cache-Consistency Protocols,
1965 In \fIProc. of the
1966 Twelfth ACM Symposium on Operating Systems Principals\fR, Litchfield Park,
1967 AZ, Dec. 1989.
1968 .ip [Steiner88] 15
1969 J. G. Steiner, B. C. Neuman and J. I. Schiller, Kerberos: An Authentication
1970 Service for Open Network Systems,
1971 In \fIProc. Winter 1988 USENIX Conference,\fR pg. 191-202, Dallas, TX, February
1972 1988.
1973 .ip [SUN89] 15
1974 Sun Microsystems Inc., \fINFS: Network File System Protocol Specification\fR,
1975 ARPANET Working Group Requests for Comment, DDN Network Information Center,
1976 SRI International, Menlo Park, CA, March 1989, RFC-1094.
1977 .ip [SUN93] 15
1978 Sun Microsystems Inc., \fINFS: Network File System Version 3 Protocol Specification\fR,
1979 Sun Microsystems Inc., Mountain View, CA, June 1993.
1980 .ip [Wittle93] 15
1981 Mark Wittle and Bruce E. Keith, LADDIS: The Next Generation in NFS File
1982 Server Benchmarking,
1983 In \fIProc. Summer 1993 USENIX Conference,\fR pg. 111-128, Cincinnati, OH, June
1984 1993.
1985 .(f
1986 \(mo
1987 NFS is believed to be a trademark of Sun Microsystems, Inc.
1988 .)f
1989 .(f
1990 \(dg
1991 Prestoserve is a trademark of Legato Systems, Inc.
1992 .)f
1993 .(f
1994 \(sc
1995 MIPS is a trademark of Silicon Graphics, Inc.
1996 .)f
1997 .(f
1998 \(dg
1999 DECstation, MicroVAXII and Ultrix are trademarks of Digital Equipment Corp.
2000 .)f
2001 .(f
2002 \(dd
2003 Unix is a trademark of Novell, Inc.
2004 .)f