tmpfs - Fix readdir race
[dragonfly.git] / sys / vfs / tmpfs / tmpfs_subr.c
1 /*      $NetBSD: tmpfs_subr.c,v 1.35 2007/07/09 21:10:50 ad Exp $       */
2
3 /*-
4  * Copyright (c) 2005 The NetBSD Foundation, Inc.
5  * All rights reserved.
6  *
7  * This code is derived from software contributed to The NetBSD Foundation
8  * by Julio M. Merino Vidal, developed as part of Google's Summer of Code
9  * 2005 program.
10  *
11  * Redistribution and use in source and binary forms, with or without
12  * modification, are permitted provided that the following conditions
13  * are met:
14  * 1. Redistributions of source code must retain the above copyright
15  *    notice, this list of conditions and the following disclaimer.
16  * 2. Redistributions in binary form must reproduce the above copyright
17  *    notice, this list of conditions and the following disclaimer in the
18  *    documentation and/or other materials provided with the distribution.
19  *
20  * THIS SOFTWARE IS PROVIDED BY THE NETBSD FOUNDATION, INC. AND CONTRIBUTORS
21  * ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED
22  * TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR
23  * PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR CONTRIBUTORS
24  * BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
25  * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
26  * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
27  * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
28  * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
29  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
30  * POSSIBILITY OF SUCH DAMAGE.
31  */
32
33 /*
34  * Efficient memory file system supporting functions.
35  */
36
37 #include <sys/kernel.h>
38 #include <sys/param.h>
39 #include <sys/namei.h>
40 #include <sys/priv.h>
41 #include <sys/proc.h>
42 #include <sys/spinlock2.h>
43 #include <sys/stat.h>
44 #include <sys/systm.h>
45 #include <sys/vnode.h>
46 #include <sys/vmmeter.h>
47
48 #include <vm/vm.h>
49 #include <vm/vm_object.h>
50 #include <vm/vm_page.h>
51 #include <vm/vm_pager.h>
52 #include <vm/vm_extern.h>
53
54 #include <vfs/tmpfs/tmpfs.h>
55 #include <vfs/tmpfs/tmpfs_vnops.h>
56
57 static ino_t tmpfs_fetch_ino(struct tmpfs_mount *);
58
59 static int tmpfs_dirtree_compare(struct tmpfs_dirent *a,
60         struct tmpfs_dirent *b);
61 RB_GENERATE(tmpfs_dirtree, tmpfs_dirent, rb_node, tmpfs_dirtree_compare);
62
63 static int tmpfs_dirtree_compare_cookie(struct tmpfs_dirent *a,
64         struct tmpfs_dirent *b);
65 RB_GENERATE(tmpfs_dirtree_cookie, tmpfs_dirent,
66         rb_cookienode, tmpfs_dirtree_compare_cookie);
67
68
69 /* --------------------------------------------------------------------- */
70
71 /*
72  * Allocates a new node of type 'type' inside the 'tmp' mount point, with
73  * its owner set to 'uid', its group to 'gid' and its mode set to 'mode',
74  * using the credentials of the process 'p'.
75  *
76  * If the node type is set to 'VDIR', then the parent parameter must point
77  * to the parent directory of the node being created.  It may only be NULL
78  * while allocating the root node.
79  *
80  * If the node type is set to 'VBLK' or 'VCHR', then the rdev parameter
81  * specifies the device the node represents.
82  *
83  * If the node type is set to 'VLNK', then the parameter target specifies
84  * the file name of the target file for the symbolic link that is being
85  * created.
86  *
87  * Note that new nodes are retrieved from the available list if it has
88  * items or, if it is empty, from the node pool as long as there is enough
89  * space to create them.
90  *
91  * Returns zero on success or an appropriate error code on failure.
92  */
93 int
94 tmpfs_alloc_node(struct tmpfs_mount *tmp, enum vtype type,
95                  uid_t uid, gid_t gid, mode_t mode,
96                  char *target, int rmajor, int rminor,
97                  struct tmpfs_node **node)
98 {
99         struct tmpfs_node *nnode;
100         struct timespec ts;
101         udev_t rdev;
102
103         KKASSERT(IFF(type == VLNK, target != NULL));
104         KKASSERT(IFF(type == VBLK || type == VCHR, rmajor != VNOVAL));
105
106         if (tmp->tm_nodes_inuse >= tmp->tm_nodes_max)
107                 return (ENOSPC);
108
109         nnode = objcache_get(tmp->tm_node_pool, M_WAITOK | M_NULLOK);
110         if (nnode == NULL)
111                 return (ENOSPC);
112
113         /* Generic initialization. */
114         nnode->tn_type = type;
115         vfs_timestamp(&ts);
116         nnode->tn_ctime = nnode->tn_mtime = nnode->tn_atime
117                 = ts.tv_sec;
118         nnode->tn_ctimensec = nnode->tn_mtimensec = nnode->tn_atimensec
119                 = ts.tv_nsec;
120         nnode->tn_uid = uid;
121         nnode->tn_gid = gid;
122         nnode->tn_mode = mode;
123         nnode->tn_id = tmpfs_fetch_ino(tmp);
124         nnode->tn_advlock.init_done = 0;
125         KKASSERT(nnode->tn_links == 0);
126
127         /* Type-specific initialization. */
128         switch (nnode->tn_type) {
129         case VBLK:
130         case VCHR:
131                 rdev = makeudev(rmajor, rminor);
132                 if (rdev == NOUDEV) {
133                         objcache_put(tmp->tm_node_pool, nnode);
134                         return(EINVAL);
135                 }
136                 nnode->tn_rdev = rdev;
137                 break;
138
139         case VDIR:
140                 RB_INIT(&nnode->tn_dir.tn_dirtree);
141                 RB_INIT(&nnode->tn_dir.tn_cookietree);
142                 nnode->tn_size = 0;
143                 break;
144
145         case VFIFO:
146                 /* FALLTHROUGH */
147         case VSOCK:
148                 break;
149
150         case VLNK:
151                 nnode->tn_size = strlen(target);
152                 nnode->tn_link = kmalloc(nnode->tn_size + 1, tmp->tm_name_zone,
153                                          M_WAITOK | M_NULLOK);
154                 if (nnode->tn_link == NULL) {
155                         objcache_put(tmp->tm_node_pool, nnode);
156                         return (ENOSPC);
157                 }
158                 bcopy(target, nnode->tn_link, nnode->tn_size);
159                 nnode->tn_link[nnode->tn_size] = '\0';
160                 break;
161
162         case VREG:
163                 nnode->tn_reg.tn_aobj =
164                     swap_pager_alloc(NULL, 0, VM_PROT_DEFAULT, 0);
165                 nnode->tn_reg.tn_aobj_pages = 0;
166                 nnode->tn_size = 0;
167                 break;
168
169         default:
170                 panic("tmpfs_alloc_node: type %p %d", nnode, (int)nnode->tn_type);
171         }
172
173         TMPFS_NODE_LOCK(nnode);
174         TMPFS_LOCK(tmp);
175         LIST_INSERT_HEAD(&tmp->tm_nodes_used, nnode, tn_entries);
176         tmp->tm_nodes_inuse++;
177         TMPFS_UNLOCK(tmp);
178         TMPFS_NODE_UNLOCK(nnode);
179
180         *node = nnode;
181         return 0;
182 }
183
184 /* --------------------------------------------------------------------- */
185
186 /*
187  * Destroys the node pointed to by node from the file system 'tmp'.
188  * If the node does not belong to the given mount point, the results are
189  * unpredicted.
190  *
191  * If the node references a directory; no entries are allowed because
192  * their removal could need a recursive algorithm, something forbidden in
193  * kernel space.  Furthermore, there is not need to provide such
194  * functionality (recursive removal) because the only primitives offered
195  * to the user are the removal of empty directories and the deletion of
196  * individual files.
197  *
198  * Note that nodes are not really deleted; in fact, when a node has been
199  * allocated, it cannot be deleted during the whole life of the file
200  * system.  Instead, they are moved to the available list and remain there
201  * until reused.
202  */
203 void
204 tmpfs_free_node(struct tmpfs_mount *tmp, struct tmpfs_node *node)
205 {
206         vm_pindex_t pages = 0;
207
208 #ifdef INVARIANTS
209         TMPFS_ASSERT_ELOCKED(node);
210         KKASSERT(node->tn_vnode == NULL);
211         KKASSERT((node->tn_vpstate & TMPFS_VNODE_ALLOCATING) == 0);
212 #endif
213
214         TMPFS_LOCK(tmp);
215         LIST_REMOVE(node, tn_entries);
216         tmp->tm_nodes_inuse--;
217         TMPFS_UNLOCK(tmp);
218         TMPFS_NODE_UNLOCK(node);
219
220         switch (node->tn_type) {
221         case VNON:
222                 /* Do not do anything.  VNON is provided to let the
223                  * allocation routine clean itself easily by avoiding
224                  * duplicating code in it. */
225                 /* FALLTHROUGH */
226         case VBLK:
227                 /* FALLTHROUGH */
228         case VCHR:
229                 /* FALLTHROUGH */
230                 break;
231         case VDIR:
232                 /*
233                  * The parent link can be NULL if this is the root
234                  * node or if it is a directory node that was rmdir'd.
235                  *
236                  * XXX what if node is a directory which still contains
237                  * directory entries (e.g. due to a forced umount) ?
238                  */
239                 node->tn_size = 0;
240                 KKASSERT(node->tn_dir.tn_parent == NULL);
241
242                 /*
243                  * If the root node is being destroyed don't leave a
244                  * dangling pointer in tmpfs_mount.
245                  */
246                 if (node == tmp->tm_root)
247                         tmp->tm_root = NULL;
248                 break;
249         case VFIFO:
250                 /* FALLTHROUGH */
251         case VSOCK:
252                 break;
253
254         case VLNK:
255                 kfree(node->tn_link, tmp->tm_name_zone);
256                 node->tn_link = NULL;
257                 node->tn_size = 0;
258                 break;
259
260         case VREG:
261                 if (node->tn_reg.tn_aobj != NULL)
262                         vm_object_deallocate(node->tn_reg.tn_aobj);
263                 node->tn_reg.tn_aobj = NULL;
264                 pages = node->tn_reg.tn_aobj_pages;
265                 break;
266
267         default:
268                 panic("tmpfs_free_node: type %p %d", node, (int)node->tn_type);
269         }
270
271         /*
272          * Clean up fields for the next allocation.  The objcache only ctors
273          * new allocations.
274          */
275         tmpfs_node_ctor(node, NULL, 0);
276         objcache_put(tmp->tm_node_pool, node);
277         /* node is now invalid */
278
279         TMPFS_LOCK(tmp);
280         tmp->tm_pages_used -= pages;
281         TMPFS_UNLOCK(tmp);
282 }
283
284 /* --------------------------------------------------------------------- */
285
286 /*
287  * Allocates a new directory entry for the node node with a name of name.
288  * The new directory entry is returned in *de.
289  *
290  * The link count of node is increased by one to reflect the new object
291  * referencing it.
292  *
293  * Returns zero on success or an appropriate error code on failure.
294  */
295 int
296 tmpfs_alloc_dirent(struct tmpfs_mount *tmp, struct tmpfs_node *node,
297                    const char *name, uint16_t len, struct tmpfs_dirent **de)
298 {
299         struct tmpfs_dirent *nde;
300
301         nde = objcache_get(tmp->tm_dirent_pool, M_WAITOK);
302         nde->td_name = kmalloc(len + 1, tmp->tm_name_zone, M_WAITOK | M_NULLOK);
303         if (nde->td_name == NULL) {
304                 objcache_put(tmp->tm_dirent_pool, nde);
305                 *de = NULL;
306                 return (ENOSPC);
307         }
308         nde->td_namelen = len;
309         bcopy(name, nde->td_name, len);
310         nde->td_name[len] = '\0';
311
312         nde->td_node = node;
313
314         TMPFS_NODE_LOCK(node);
315         ++node->tn_links;
316         TMPFS_NODE_UNLOCK(node);
317
318         *de = nde;
319
320         return 0;
321 }
322
323 /* --------------------------------------------------------------------- */
324
325 /*
326  * Frees a directory entry.  It is the caller's responsibility to destroy
327  * the node referenced by it if needed.
328  *
329  * The link count of node is decreased by one to reflect the removal of an
330  * object that referenced it.  This only happens if 'node_exists' is true;
331  * otherwise the function will not access the node referred to by the
332  * directory entry, as it may already have been released from the outside.
333  */
334 void
335 tmpfs_free_dirent(struct tmpfs_mount *tmp, struct tmpfs_dirent *de)
336 {
337         struct tmpfs_node *node;
338
339         node = de->td_node;
340
341         TMPFS_NODE_LOCK(node);
342         TMPFS_ASSERT_ELOCKED(node);
343         KKASSERT(node->tn_links > 0);
344         node->tn_links--;
345         TMPFS_NODE_UNLOCK(node);
346
347         kfree(de->td_name, tmp->tm_name_zone);
348         de->td_namelen = 0;
349         de->td_name = NULL;
350         de->td_node = NULL;
351         objcache_put(tmp->tm_dirent_pool, de);
352 }
353
354 /* --------------------------------------------------------------------- */
355
356 /*
357  * Allocates a new vnode for the node node or returns a new reference to
358  * an existing one if the node had already a vnode referencing it.  The
359  * resulting locked vnode is returned in *vpp.
360  *
361  * Returns zero on success or an appropriate error code on failure.
362  */
363 int
364 tmpfs_alloc_vp(struct mount *mp, struct tmpfs_node *node, int lkflag,
365                struct vnode **vpp)
366 {
367         int error = 0;
368         struct vnode *vp;
369
370 loop:
371         /*
372          * Interlocked extraction from node.  This can race many things.
373          * We have to get a soft reference on the vnode while we hold
374          * the node locked, then acquire it properly and check for races.
375          */
376         TMPFS_NODE_LOCK(node);
377         if ((vp = node->tn_vnode) != NULL) {
378                 KKASSERT((node->tn_vpstate & TMPFS_VNODE_DOOMED) == 0);
379                 vhold(vp);
380                 TMPFS_NODE_UNLOCK(node);
381
382                 if (vget(vp, lkflag | LK_EXCLUSIVE) != 0) {
383                         vdrop(vp);
384                         goto loop;
385                 }
386                 if (node->tn_vnode != vp) {
387                         vput(vp);
388                         vdrop(vp);
389                         goto loop;
390                 }
391                 vdrop(vp);
392                 goto out;
393         }
394         /* vp is NULL */
395
396         /*
397          * This should never happen.
398          */
399         if (node->tn_vpstate & TMPFS_VNODE_DOOMED) {
400                 TMPFS_NODE_UNLOCK(node);
401                 error = ENOENT;
402                 goto out;
403         }
404
405         /*
406          * Interlock against other calls to tmpfs_alloc_vp() trying to
407          * allocate and assign a vp to node.
408          */
409         if (node->tn_vpstate & TMPFS_VNODE_ALLOCATING) {
410                 node->tn_vpstate |= TMPFS_VNODE_WANT;
411                 error = tsleep(&node->tn_vpstate, PINTERLOCKED | PCATCH,
412                                "tmpfs_alloc_vp", 0);
413                 TMPFS_NODE_UNLOCK(node);
414                 if (error)
415                         return error;
416                 goto loop;
417         }
418         node->tn_vpstate |= TMPFS_VNODE_ALLOCATING;
419         TMPFS_NODE_UNLOCK(node);
420
421         /*
422          * Allocate a new vnode (may block).  The ALLOCATING flag should
423          * prevent a race against someone else assigning node->tn_vnode.
424          */
425         error = getnewvnode(VT_TMPFS, mp, &vp, VLKTIMEOUT, LK_CANRECURSE);
426         if (error != 0)
427                 goto unlock;
428
429         KKASSERT(node->tn_vnode == NULL);
430         KKASSERT(vp != NULL);
431         vp->v_data = node;
432         vp->v_type = node->tn_type;
433
434         /* Type-specific initialization. */
435         switch (node->tn_type) {
436         case VBLK:
437                 /* FALLTHROUGH */
438         case VCHR:
439                 /* FALLTHROUGH */
440         case VSOCK:
441                 break;
442         case VREG:
443                 vinitvmio(vp, node->tn_size, TMPFS_BLKMASK, -1);
444                 break;
445         case VLNK:
446                 break;
447         case VFIFO:
448                 vp->v_ops = &mp->mnt_vn_fifo_ops;
449                 break;
450         case VDIR:
451                 break;
452
453         default:
454                 panic("tmpfs_alloc_vp: type %p %d", node, (int)node->tn_type);
455         }
456
457
458 unlock:
459         TMPFS_NODE_LOCK(node);
460
461         KKASSERT(node->tn_vpstate & TMPFS_VNODE_ALLOCATING);
462         node->tn_vpstate &= ~TMPFS_VNODE_ALLOCATING;
463         node->tn_vnode = vp;
464
465         if (node->tn_vpstate & TMPFS_VNODE_WANT) {
466                 node->tn_vpstate &= ~TMPFS_VNODE_WANT;
467                 TMPFS_NODE_UNLOCK(node);
468                 wakeup(&node->tn_vpstate);
469         } else {
470                 TMPFS_NODE_UNLOCK(node);
471         }
472
473 out:
474         *vpp = vp;
475
476         KKASSERT(IFF(error == 0, *vpp != NULL && vn_islocked(*vpp)));
477 #ifdef INVARIANTS
478         TMPFS_NODE_LOCK(node);
479         KKASSERT(*vpp == node->tn_vnode);
480         TMPFS_NODE_UNLOCK(node);
481 #endif
482
483         return error;
484 }
485
486 /* --------------------------------------------------------------------- */
487
488 /*
489  * Destroys the association between the vnode vp and the node it
490  * references.
491  */
492 void
493 tmpfs_free_vp(struct vnode *vp)
494 {
495         struct tmpfs_node *node;
496
497         node = VP_TO_TMPFS_NODE(vp);
498
499         TMPFS_NODE_LOCK(node);
500         KKASSERT(lockcount(TMPFS_NODE_MTX(node)) > 0);
501         node->tn_vnode = NULL;
502         vp->v_data = NULL;
503         TMPFS_NODE_UNLOCK(node);
504 }
505
506 /* --------------------------------------------------------------------- */
507
508 /*
509  * Allocates a new file of type 'type' and adds it to the parent directory
510  * 'dvp'; this addition is done using the component name given in 'cnp'.
511  * The ownership of the new file is automatically assigned based on the
512  * credentials of the caller (through 'cnp'), the group is set based on
513  * the parent directory and the mode is determined from the 'vap' argument.
514  * If successful, *vpp holds a vnode to the newly created file and zero
515  * is returned.  Otherwise *vpp is NULL and the function returns an
516  * appropriate error code.
517  */
518 int
519 tmpfs_alloc_file(struct vnode *dvp, struct vnode **vpp, struct vattr *vap,
520                  struct namecache *ncp, struct ucred *cred, char *target)
521 {
522         int error;
523         struct tmpfs_dirent *de;
524         struct tmpfs_mount *tmp;
525         struct tmpfs_node *dnode;
526         struct tmpfs_node *node;
527
528         tmp = VFS_TO_TMPFS(dvp->v_mount);
529         dnode = VP_TO_TMPFS_DIR(dvp);
530         *vpp = NULL;
531
532         /*
533          * If the directory was removed but a process was CD'd into it,
534          * we do not allow any more file/dir creation within it.  Otherwise
535          * we will lose track of it.
536          */
537         KKASSERT(dnode->tn_type == VDIR);
538         if (dnode != tmp->tm_root && dnode->tn_dir.tn_parent == NULL)
539                 return ENOENT;
540
541         /*
542          * Make sure the link count does not overflow.
543          */
544         if (vap->va_type == VDIR && dnode->tn_links >= LINK_MAX)
545                 return EMLINK;
546
547         /* Allocate a node that represents the new file. */
548         error = tmpfs_alloc_node(tmp, vap->va_type, cred->cr_uid,
549                                  dnode->tn_gid, vap->va_mode, target,
550                                  vap->va_rmajor, vap->va_rminor, &node);
551         if (error != 0)
552                 return error;
553         TMPFS_NODE_LOCK(node);
554
555         /* Allocate a directory entry that points to the new file. */
556         error = tmpfs_alloc_dirent(tmp, node, ncp->nc_name, ncp->nc_nlen, &de);
557         if (error != 0) {
558                 tmpfs_free_node(tmp, node);
559                 /* eats node lock */
560                 return error;
561         }
562
563         /* Allocate a vnode for the new file. */
564         error = tmpfs_alloc_vp(dvp->v_mount, node, LK_EXCLUSIVE, vpp);
565         if (error != 0) {
566                 tmpfs_free_dirent(tmp, de);
567                 tmpfs_free_node(tmp, node);
568                 /* eats node lock */
569                 return error;
570         }
571
572         /*
573          * Now that all required items are allocated, we can proceed to
574          * insert the new node into the directory, an operation that
575          * cannot fail.
576          */
577         tmpfs_dir_attach(dnode, de);
578         TMPFS_NODE_UNLOCK(node);
579
580         return error;
581 }
582
583 /* --------------------------------------------------------------------- */
584
585 /*
586  * Attaches the directory entry de to the directory represented by vp.
587  * Note that this does not change the link count of the node pointed by
588  * the directory entry, as this is done by tmpfs_alloc_dirent.
589  */
590 void
591 tmpfs_dir_attach(struct tmpfs_node *dnode, struct tmpfs_dirent *de)
592 {
593         struct tmpfs_node *node = de->td_node;
594
595         TMPFS_NODE_LOCK(dnode);
596         if (node && node->tn_type == VDIR) {
597                 TMPFS_NODE_LOCK(node);
598                 ++node->tn_links;
599                 node->tn_status |= TMPFS_NODE_CHANGED;
600                 node->tn_dir.tn_parent = dnode;
601                 ++dnode->tn_links;
602                 TMPFS_NODE_UNLOCK(node);
603         }
604         RB_INSERT(tmpfs_dirtree, &dnode->tn_dir.tn_dirtree, de);
605         RB_INSERT(tmpfs_dirtree_cookie, &dnode->tn_dir.tn_cookietree, de);
606         dnode->tn_size += sizeof(struct tmpfs_dirent);
607         dnode->tn_status |= TMPFS_NODE_ACCESSED | TMPFS_NODE_CHANGED |
608                             TMPFS_NODE_MODIFIED;
609         TMPFS_NODE_UNLOCK(dnode);
610 }
611
612 /* --------------------------------------------------------------------- */
613
614 /*
615  * Detaches the directory entry de from the directory represented by vp.
616  * Note that this does not change the link count of the node pointed by
617  * the directory entry, as this is done by tmpfs_free_dirent.
618  */
619 void
620 tmpfs_dir_detach(struct tmpfs_node *dnode, struct tmpfs_dirent *de)
621 {
622         struct tmpfs_node *node = de->td_node;
623
624         TMPFS_NODE_LOCK(dnode);
625         RB_REMOVE(tmpfs_dirtree, &dnode->tn_dir.tn_dirtree, de);
626         RB_REMOVE(tmpfs_dirtree_cookie, &dnode->tn_dir.tn_cookietree, de);
627         dnode->tn_size -= sizeof(struct tmpfs_dirent);
628         dnode->tn_status |= TMPFS_NODE_ACCESSED | TMPFS_NODE_CHANGED |
629                             TMPFS_NODE_MODIFIED;
630         TMPFS_NODE_UNLOCK(dnode);
631
632         /*
633          * Clean out the tn_parent pointer immediately when removing a
634          * directory.
635          *
636          * Removal of the parent linkage also cleans out the extra tn_links
637          * count we had on both node and dnode.
638          *
639          * node can be NULL (typ during a forced umount), in which case
640          * the mount code is dealing with the linkages from a linked list
641          * scan.
642          */
643         if (node && node->tn_type == VDIR && node->tn_dir.tn_parent) {
644                 TMPFS_NODE_LOCK(dnode);
645                 TMPFS_NODE_LOCK(node);
646                 KKASSERT(node->tn_dir.tn_parent == dnode);
647                 dnode->tn_links--;
648                 node->tn_links--;
649                 node->tn_dir.tn_parent = NULL;
650                 TMPFS_NODE_UNLOCK(node);
651                 TMPFS_NODE_UNLOCK(dnode);
652         }
653 }
654
655 /* --------------------------------------------------------------------- */
656
657 /*
658  * Looks for a directory entry in the directory represented by node.
659  * 'ncp' describes the name of the entry to look for.  Note that the .
660  * and .. components are not allowed as they do not physically exist
661  * within directories.
662  *
663  * Returns a pointer to the entry when found, otherwise NULL.
664  *
665  * Caller must hold the node locked (shared ok)
666  */
667 struct tmpfs_dirent *
668 tmpfs_dir_lookup(struct tmpfs_node *node, struct tmpfs_node *f,
669                  struct namecache *ncp)
670 {
671         struct tmpfs_dirent *de;
672         int len = ncp->nc_nlen;
673         struct tmpfs_dirent wanted;
674
675         wanted.td_namelen = len;
676         wanted.td_name = ncp->nc_name;
677
678         TMPFS_VALIDATE_DIR(node);
679
680         de = RB_FIND(tmpfs_dirtree, &node->tn_dir.tn_dirtree, &wanted);
681
682         KKASSERT(f == NULL || f == de->td_node);
683
684         return de;
685 }
686
687 /* --------------------------------------------------------------------- */
688
689 /*
690  * Helper function for tmpfs_readdir.  Creates a '.' entry for the given
691  * directory and returns it in the uio space.  The function returns 0
692  * on success, -1 if there was not enough space in the uio structure to
693  * hold the directory entry or an appropriate error code if another
694  * error happens.
695  */
696 int
697 tmpfs_dir_getdotdent(struct tmpfs_node *node, struct uio *uio)
698 {
699         int error;
700         struct dirent dent;
701         int dirsize;
702
703         TMPFS_VALIDATE_DIR(node);
704         KKASSERT(uio->uio_offset == TMPFS_DIRCOOKIE_DOT);
705
706         dent.d_ino = node->tn_id;
707         dent.d_type = DT_DIR;
708         dent.d_namlen = 1;
709         dent.d_name[0] = '.';
710         dent.d_name[1] = '\0';
711         dirsize = _DIRENT_DIRSIZ(&dent);
712
713         if (dirsize > uio->uio_resid)
714                 error = -1;
715         else {
716                 error = uiomove((caddr_t)&dent, dirsize, uio);
717                 if (error == 0)
718                         uio->uio_offset = TMPFS_DIRCOOKIE_DOTDOT;
719         }
720         return error;
721 }
722
723 /* --------------------------------------------------------------------- */
724
725 /*
726  * Helper function for tmpfs_readdir.  Creates a '..' entry for the given
727  * directory and returns it in the uio space.  The function returns 0
728  * on success, -1 if there was not enough space in the uio structure to
729  * hold the directory entry or an appropriate error code if another
730  * error happens.
731  */
732 int
733 tmpfs_dir_getdotdotdent(struct tmpfs_mount *tmp, struct tmpfs_node *node,
734                         struct uio *uio)
735 {
736         int error;
737         struct dirent dent;
738         int dirsize;
739
740         TMPFS_VALIDATE_DIR(node);
741         KKASSERT(uio->uio_offset == TMPFS_DIRCOOKIE_DOTDOT);
742
743         if (node->tn_dir.tn_parent) {
744                 TMPFS_NODE_LOCK(node->tn_dir.tn_parent);
745                 dent.d_ino = node->tn_dir.tn_parent->tn_id;
746                 TMPFS_NODE_UNLOCK(node->tn_dir.tn_parent);
747         } else {
748                 dent.d_ino = tmp->tm_root->tn_id;
749         }
750
751         dent.d_type = DT_DIR;
752         dent.d_namlen = 2;
753         dent.d_name[0] = '.';
754         dent.d_name[1] = '.';
755         dent.d_name[2] = '\0';
756         dirsize = _DIRENT_DIRSIZ(&dent);
757
758         if (dirsize > uio->uio_resid)
759                 error = -1;
760         else {
761                 error = uiomove((caddr_t)&dent, dirsize, uio);
762                 if (error == 0) {
763                         struct tmpfs_dirent *de;
764
765                         de = RB_MIN(tmpfs_dirtree_cookie,
766                                     &node->tn_dir.tn_cookietree);
767                         if (de == NULL)
768                                 uio->uio_offset = TMPFS_DIRCOOKIE_EOF;
769                         else
770                                 uio->uio_offset = tmpfs_dircookie(de);
771                 }
772         }
773         return error;
774 }
775
776 /* --------------------------------------------------------------------- */
777
778 /*
779  * Lookup a directory entry by its associated cookie.
780  *
781  * Must be called with the directory node locked (shared ok)
782  */
783 struct lubycookie_info {
784         off_t   cookie;
785         struct tmpfs_dirent *de;
786 };
787
788 static int
789 lubycookie_cmp(struct tmpfs_dirent *de, void *arg)
790 {
791         struct lubycookie_info *info = arg;
792         off_t cookie = tmpfs_dircookie(de);
793
794         if (cookie < info->cookie)
795                 return(-1);
796         if (cookie > info->cookie)
797                 return(1);
798         return(0);
799 }
800
801 static int
802 lubycookie_callback(struct tmpfs_dirent *de, void *arg)
803 {
804         struct lubycookie_info *info = arg;
805
806         if (tmpfs_dircookie(de) == info->cookie) {
807                 info->de = de;
808                 return(-1);
809         }
810         return(0);
811 }
812
813 struct tmpfs_dirent *
814 tmpfs_dir_lookupbycookie(struct tmpfs_node *node, off_t cookie)
815 {
816         struct lubycookie_info info;
817
818         info.cookie = cookie;
819         info.de = NULL;
820         RB_SCAN(tmpfs_dirtree_cookie, &node->tn_dir.tn_cookietree,
821                 lubycookie_cmp, lubycookie_callback, &info);
822         return (info.de);
823 }
824
825 /* --------------------------------------------------------------------- */
826
827 /*
828  * Helper function for tmpfs_readdir.  Returns as much directory entries
829  * as can fit in the uio space.  The read starts at uio->uio_offset.
830  * The function returns 0 on success, -1 if there was not enough space
831  * in the uio structure to hold the directory entry or an appropriate
832  * error code if another error happens.
833  *
834  * Caller must hold the node locked (shared ok)
835  */
836 int
837 tmpfs_dir_getdents(struct tmpfs_node *node, struct uio *uio, off_t *cntp)
838 {
839         int error;
840         off_t startcookie;
841         struct tmpfs_dirent *de;
842
843         TMPFS_VALIDATE_DIR(node);
844
845         /*
846          * Locate the first directory entry we have to return.  We have cached
847          * the last readdir in the node, so use those values if appropriate.
848          * Otherwise do a linear scan to find the requested entry.
849          */
850         startcookie = uio->uio_offset;
851         KKASSERT(startcookie != TMPFS_DIRCOOKIE_DOT);
852         KKASSERT(startcookie != TMPFS_DIRCOOKIE_DOTDOT);
853
854         if (startcookie == TMPFS_DIRCOOKIE_EOF)
855                 return 0;
856
857         de = tmpfs_dir_lookupbycookie(node, startcookie);
858         if (de == NULL)
859                 return EINVAL;
860
861         /*
862          * Read as much entries as possible; i.e., until we reach the end of
863          * the directory or we exhaust uio space.
864          */
865         do {
866                 struct dirent d;
867                 int reclen;
868
869                 /* Create a dirent structure representing the current
870                  * tmpfs_node and fill it. */
871                 d.d_ino = de->td_node->tn_id;
872                 switch (de->td_node->tn_type) {
873                 case VBLK:
874                         d.d_type = DT_BLK;
875                         break;
876
877                 case VCHR:
878                         d.d_type = DT_CHR;
879                         break;
880
881                 case VDIR:
882                         d.d_type = DT_DIR;
883                         break;
884
885                 case VFIFO:
886                         d.d_type = DT_FIFO;
887                         break;
888
889                 case VLNK:
890                         d.d_type = DT_LNK;
891                         break;
892
893                 case VREG:
894                         d.d_type = DT_REG;
895                         break;
896
897                 case VSOCK:
898                         d.d_type = DT_SOCK;
899                         break;
900
901                 default:
902                         panic("tmpfs_dir_getdents: type %p %d",
903                             de->td_node, (int)de->td_node->tn_type);
904                 }
905                 d.d_namlen = de->td_namelen;
906                 KKASSERT(de->td_namelen < sizeof(d.d_name));
907                 bcopy(de->td_name, d.d_name, d.d_namlen);
908                 d.d_name[d.d_namlen] = '\0';
909                 reclen = _DIRENT_RECLEN(d.d_namlen);
910
911                 /* Stop reading if the directory entry we are treating is
912                  * bigger than the amount of data that can be returned. */
913                 if (reclen > uio->uio_resid) {
914                         error = -1;
915                         break;
916                 }
917
918                 /* Copy the new dirent structure into the output buffer and
919                  * advance pointers. */
920                 error = uiomove((caddr_t)&d, reclen, uio);
921
922                 (*cntp)++;
923                 de = RB_NEXT(tmpfs_dirtree_cookie,
924                              node->tn_dir.tn_cookietree, de);
925         } while (error == 0 && uio->uio_resid > 0 && de != NULL);
926
927         /* Update the offset and cache. */
928         if (de == NULL) {
929                 uio->uio_offset = TMPFS_DIRCOOKIE_EOF;
930         } else {
931                 uio->uio_offset = tmpfs_dircookie(de);
932         }
933
934         return error;
935 }
936
937 /* --------------------------------------------------------------------- */
938
939 /*
940  * Resizes the aobj associated to the regular file pointed to by vp to
941  * the size newsize.  'vp' must point to a vnode that represents a regular
942  * file.  'newsize' must be positive.
943  *
944  * pass trivial as 1 when buf content will be overwritten, otherwise set 0
945  * to be zero filled.
946  *
947  * Returns zero on success or an appropriate error code on failure.
948  */
949 int
950 tmpfs_reg_resize(struct vnode *vp, off_t newsize, int trivial)
951 {
952         int error;
953         vm_pindex_t newpages, oldpages;
954         struct tmpfs_mount *tmp;
955         struct tmpfs_node *node;
956         off_t oldsize;
957
958 #ifdef INVARIANTS
959         KKASSERT(vp->v_type == VREG);
960         KKASSERT(newsize >= 0);
961 #endif
962
963         node = VP_TO_TMPFS_NODE(vp);
964         tmp = VFS_TO_TMPFS(vp->v_mount);
965
966         /*
967          * Convert the old and new sizes to the number of pages needed to
968          * store them.  It may happen that we do not need to do anything
969          * because the last allocated page can accommodate the change on
970          * its own.
971          */
972         TMPFS_NODE_LOCK(node);
973         oldsize = node->tn_size;
974         oldpages = round_page64(oldsize) / PAGE_SIZE;
975         KKASSERT(oldpages == node->tn_reg.tn_aobj_pages);
976         newpages = round_page64(newsize) / PAGE_SIZE;
977
978         if (newpages > oldpages &&
979            tmp->tm_pages_used + newpages - oldpages > tmp->tm_pages_max) {
980                 TMPFS_NODE_UNLOCK(node);
981                 error = ENOSPC;
982                 goto out;
983         }
984         node->tn_reg.tn_aobj_pages = newpages;
985         node->tn_size = newsize;
986         TMPFS_NODE_UNLOCK(node);
987
988         TMPFS_LOCK(tmp);
989         tmp->tm_pages_used += (newpages - oldpages);
990         TMPFS_UNLOCK(tmp);
991
992         /*
993          * When adjusting the vnode filesize and its VM object we must
994          * also adjust our backing VM object (aobj).  The blocksize
995          * used must match the block sized we use for the buffer cache.
996          *
997          * The backing VM object contains no VM pages, only swap
998          * assignments.
999          */
1000         if (newsize < oldsize) {
1001                 vm_pindex_t osize;
1002                 vm_pindex_t nsize;
1003                 vm_object_t aobj;
1004
1005                 error = nvtruncbuf(vp, newsize, TMPFS_BLKSIZE, -1, 0);
1006                 aobj = node->tn_reg.tn_aobj;
1007                 if (aobj) {
1008                         osize = aobj->size;
1009                         nsize = vp->v_object->size;
1010                         if (nsize < osize) {
1011                                 aobj->size = osize;
1012                                 swap_pager_freespace(aobj, nsize,
1013                                                      osize - nsize);
1014                         }
1015                 }
1016         } else {
1017                 vm_object_t aobj;
1018
1019                 error = nvextendbuf(vp, oldsize, newsize,
1020                                     TMPFS_BLKSIZE, TMPFS_BLKSIZE,
1021                                     -1, -1, trivial);
1022                 aobj = node->tn_reg.tn_aobj;
1023                 if (aobj)
1024                         aobj->size = vp->v_object->size;
1025         }
1026
1027 out:
1028         return error;
1029 }
1030
1031 /* --------------------------------------------------------------------- */
1032
1033 /*
1034  * Change flags of the given vnode.
1035  * Caller should execute tmpfs_update on vp after a successful execution.
1036  * The vnode must be locked on entry and remain locked on exit.
1037  */
1038 int
1039 tmpfs_chflags(struct vnode *vp, int vaflags, struct ucred *cred)
1040 {
1041         int error;
1042         struct tmpfs_node *node;
1043         int flags;
1044
1045         KKASSERT(vn_islocked(vp));
1046
1047         node = VP_TO_TMPFS_NODE(vp);
1048         flags = node->tn_flags;
1049
1050         /* Disallow this operation if the file system is mounted read-only. */
1051         if (vp->v_mount->mnt_flag & MNT_RDONLY)
1052                 return EROFS;
1053         error = vop_helper_setattr_flags(&flags, vaflags, node->tn_uid, cred);
1054
1055         /* Actually change the flags on the node itself */
1056         if (error == 0) {
1057                 TMPFS_NODE_LOCK(node);
1058                 node->tn_flags = flags;
1059                 node->tn_status |= TMPFS_NODE_CHANGED;
1060                 TMPFS_NODE_UNLOCK(node);
1061         }
1062
1063         KKASSERT(vn_islocked(vp));
1064
1065         return error;
1066 }
1067
1068 /* --------------------------------------------------------------------- */
1069
1070 /*
1071  * Change access mode on the given vnode.
1072  * Caller should execute tmpfs_update on vp after a successful execution.
1073  * The vnode must be locked on entry and remain locked on exit.
1074  */
1075 int
1076 tmpfs_chmod(struct vnode *vp, mode_t vamode, struct ucred *cred)
1077 {
1078         struct tmpfs_node *node;
1079         mode_t cur_mode;
1080         int error;
1081
1082         KKASSERT(vn_islocked(vp));
1083
1084         node = VP_TO_TMPFS_NODE(vp);
1085
1086         /* Disallow this operation if the file system is mounted read-only. */
1087         if (vp->v_mount->mnt_flag & MNT_RDONLY)
1088                 return EROFS;
1089
1090         /* Immutable or append-only files cannot be modified, either. */
1091         if (node->tn_flags & (IMMUTABLE | APPEND))
1092                 return EPERM;
1093
1094         cur_mode = node->tn_mode;
1095         error = vop_helper_chmod(vp, vamode, cred, node->tn_uid, node->tn_gid,
1096                                  &cur_mode);
1097
1098         if (error == 0 &&
1099             (node->tn_mode & ALLPERMS) != (cur_mode & ALLPERMS)) {
1100                 TMPFS_NODE_LOCK(node);
1101                 node->tn_mode &= ~ALLPERMS;
1102                 node->tn_mode |= cur_mode & ALLPERMS;
1103
1104                 node->tn_status |= TMPFS_NODE_CHANGED;
1105                 TMPFS_NODE_UNLOCK(node);
1106         }
1107
1108         KKASSERT(vn_islocked(vp));
1109
1110         return 0;
1111 }
1112
1113 /* --------------------------------------------------------------------- */
1114
1115 /*
1116  * Change ownership of the given vnode.  At least one of uid or gid must
1117  * be different than VNOVAL.  If one is set to that value, the attribute
1118  * is unchanged.
1119  * Caller should execute tmpfs_update on vp after a successful execution.
1120  * The vnode must be locked on entry and remain locked on exit.
1121  */
1122 int
1123 tmpfs_chown(struct vnode *vp, uid_t uid, gid_t gid, struct ucred *cred)
1124 {
1125         mode_t cur_mode;
1126         uid_t cur_uid;
1127         gid_t cur_gid;
1128         struct tmpfs_node *node;
1129         int error;
1130
1131         KKASSERT(vn_islocked(vp));
1132         node = VP_TO_TMPFS_NODE(vp);
1133
1134         /* Disallow this operation if the file system is mounted read-only. */
1135         if (vp->v_mount->mnt_flag & MNT_RDONLY)
1136                 return EROFS;
1137
1138         /* Immutable or append-only files cannot be modified, either. */
1139         if (node->tn_flags & (IMMUTABLE | APPEND))
1140                 return EPERM;
1141
1142         cur_uid = node->tn_uid;
1143         cur_gid = node->tn_gid;
1144         cur_mode = node->tn_mode;
1145         error = vop_helper_chown(vp, uid, gid, cred,
1146                                  &cur_uid, &cur_gid, &cur_mode);
1147
1148         if (error == 0) {
1149                 TMPFS_NODE_LOCK(node);
1150                 if (cur_uid != node->tn_uid ||
1151                     cur_gid != node->tn_gid ||
1152                     cur_mode != node->tn_mode) {
1153                         node->tn_uid = cur_uid;
1154                         node->tn_gid = cur_gid;
1155                         node->tn_mode = cur_mode;
1156                         node->tn_status |= TMPFS_NODE_CHANGED;
1157                 }
1158                 TMPFS_NODE_UNLOCK(node);
1159         }
1160
1161         return error;
1162 }
1163
1164 /* --------------------------------------------------------------------- */
1165
1166 /*
1167  * Change size of the given vnode.
1168  * Caller should execute tmpfs_update on vp after a successful execution.
1169  * The vnode must be locked on entry and remain locked on exit.
1170  */
1171 int
1172 tmpfs_chsize(struct vnode *vp, u_quad_t size, struct ucred *cred)
1173 {
1174         int error;
1175         struct tmpfs_node *node;
1176
1177         KKASSERT(vn_islocked(vp));
1178
1179         node = VP_TO_TMPFS_NODE(vp);
1180
1181         /* Decide whether this is a valid operation based on the file type. */
1182         error = 0;
1183         switch (vp->v_type) {
1184         case VDIR:
1185                 return EISDIR;
1186
1187         case VREG:
1188                 if (vp->v_mount->mnt_flag & MNT_RDONLY)
1189                         return EROFS;
1190                 break;
1191
1192         case VBLK:
1193                 /* FALLTHROUGH */
1194         case VCHR:
1195                 /* FALLTHROUGH */
1196         case VFIFO:
1197                 /* Allow modifications of special files even if in the file
1198                  * system is mounted read-only (we are not modifying the
1199                  * files themselves, but the objects they represent). */
1200                 return 0;
1201
1202         default:
1203                 /* Anything else is unsupported. */
1204                 return EOPNOTSUPP;
1205         }
1206
1207         /* Immutable or append-only files cannot be modified, either. */
1208         if (node->tn_flags & (IMMUTABLE | APPEND))
1209                 return EPERM;
1210
1211         error = tmpfs_truncate(vp, size);
1212         /* tmpfs_truncate will raise the NOTE_EXTEND and NOTE_ATTRIB kevents
1213          * for us, as will update tn_status; no need to do that here. */
1214
1215         KKASSERT(vn_islocked(vp));
1216
1217         return error;
1218 }
1219
1220 /* --------------------------------------------------------------------- */
1221
1222 /*
1223  * Change access and modification times of the given vnode.
1224  * Caller should execute tmpfs_update on vp after a successful execution.
1225  * The vnode must be locked on entry and remain locked on exit.
1226  */
1227 int
1228 tmpfs_chtimes(struct vnode *vp, struct timespec *atime, struct timespec *mtime,
1229               int vaflags, struct ucred *cred)
1230 {
1231         struct tmpfs_node *node;
1232
1233         KKASSERT(vn_islocked(vp));
1234
1235         node = VP_TO_TMPFS_NODE(vp);
1236
1237         /* Disallow this operation if the file system is mounted read-only. */
1238         if (vp->v_mount->mnt_flag & MNT_RDONLY)
1239                 return EROFS;
1240
1241         /* Immutable or append-only files cannot be modified, either. */
1242         if (node->tn_flags & (IMMUTABLE | APPEND))
1243                 return EPERM;
1244
1245         TMPFS_NODE_LOCK(node);
1246         if (atime->tv_sec != VNOVAL && atime->tv_nsec != VNOVAL)
1247                 node->tn_status |= TMPFS_NODE_ACCESSED;
1248
1249         if (mtime->tv_sec != VNOVAL && mtime->tv_nsec != VNOVAL)
1250                 node->tn_status |= TMPFS_NODE_MODIFIED;
1251
1252         TMPFS_NODE_UNLOCK(node);
1253
1254         tmpfs_itimes(vp, atime, mtime);
1255
1256         KKASSERT(vn_islocked(vp));
1257
1258         return 0;
1259 }
1260
1261 /* --------------------------------------------------------------------- */
1262 /* Sync timestamps */
1263 void
1264 tmpfs_itimes(struct vnode *vp, const struct timespec *acc,
1265              const struct timespec *mod)
1266 {
1267         struct tmpfs_node *node;
1268         struct timespec now;
1269
1270         node = VP_TO_TMPFS_NODE(vp);
1271
1272         if ((node->tn_status & (TMPFS_NODE_ACCESSED | TMPFS_NODE_MODIFIED |
1273             TMPFS_NODE_CHANGED)) == 0)
1274                 return;
1275
1276         vfs_timestamp(&now);
1277
1278         TMPFS_NODE_LOCK(node);
1279         if (node->tn_status & TMPFS_NODE_ACCESSED) {
1280                 if (acc == NULL)
1281                          acc = &now;
1282                 node->tn_atime = acc->tv_sec;
1283                 node->tn_atimensec = acc->tv_nsec;
1284         }
1285         if (node->tn_status & TMPFS_NODE_MODIFIED) {
1286                 if (mod == NULL)
1287                         mod = &now;
1288                 node->tn_mtime = mod->tv_sec;
1289                 node->tn_mtimensec = mod->tv_nsec;
1290         }
1291         if (node->tn_status & TMPFS_NODE_CHANGED) {
1292                 node->tn_ctime = now.tv_sec;
1293                 node->tn_ctimensec = now.tv_nsec;
1294         }
1295         node->tn_status &=
1296             ~(TMPFS_NODE_ACCESSED | TMPFS_NODE_MODIFIED | TMPFS_NODE_CHANGED);
1297         TMPFS_NODE_UNLOCK(node);
1298 }
1299
1300 /* --------------------------------------------------------------------- */
1301
1302 void
1303 tmpfs_update(struct vnode *vp)
1304 {
1305         tmpfs_itimes(vp, NULL, NULL);
1306 }
1307
1308 /* --------------------------------------------------------------------- */
1309
1310 int
1311 tmpfs_truncate(struct vnode *vp, off_t length)
1312 {
1313         int error;
1314         struct tmpfs_node *node;
1315
1316         node = VP_TO_TMPFS_NODE(vp);
1317
1318         if (length < 0) {
1319                 error = EINVAL;
1320                 goto out;
1321         }
1322
1323         if (node->tn_size == length) {
1324                 error = 0;
1325                 goto out;
1326         }
1327
1328         if (length > VFS_TO_TMPFS(vp->v_mount)->tm_maxfilesize)
1329                 return (EFBIG);
1330
1331
1332         error = tmpfs_reg_resize(vp, length, 1);
1333
1334         if (error == 0) {
1335                 TMPFS_NODE_LOCK(node);
1336                 node->tn_status |= TMPFS_NODE_CHANGED | TMPFS_NODE_MODIFIED;
1337                 TMPFS_NODE_UNLOCK(node);
1338         }
1339
1340 out:
1341         tmpfs_update(vp);
1342
1343         return error;
1344 }
1345
1346 /* --------------------------------------------------------------------- */
1347
1348 static ino_t
1349 tmpfs_fetch_ino(struct tmpfs_mount *tmp)
1350 {
1351         ino_t ret;
1352
1353         ret = tmp->tm_ino++;
1354
1355         return (ret);
1356 }
1357
1358 static int
1359 tmpfs_dirtree_compare(struct tmpfs_dirent *a, struct tmpfs_dirent *b)
1360 {
1361         if (a->td_namelen > b->td_namelen)
1362                 return 1;
1363         else if (a->td_namelen < b->td_namelen)
1364                 return -1;
1365         else
1366                 return strncmp(a->td_name, b->td_name, a->td_namelen);
1367 }
1368
1369 static int
1370 tmpfs_dirtree_compare_cookie(struct tmpfs_dirent *a, struct tmpfs_dirent *b)
1371 {
1372         if (a < b)
1373                 return(-1);
1374         if (a > b)
1375                 return(1);
1376         return 0;
1377 }