sys/gnu/vfs/ext2fs: Fix coding style
[dragonfly.git] / sys / gnu / vfs / ext2fs / ext2_vfsops.c
1 /*
2  *  modified for EXT2FS support in Lites 1.1
3  *
4  *  Aug 1995, Godmar Back (gback@cs.utah.edu)
5  *  University of Utah, Department of Computer Science
6  */
7 /*
8  * Copyright (c) 1989, 1991, 1993, 1994
9  *      The Regents of the University of California.  All rights reserved.
10  *
11  * Redistribution and use in source and binary forms, with or without
12  * modification, are permitted provided that the following conditions
13  * are met:
14  * 1. Redistributions of source code must retain the above copyright
15  *    notice, this list of conditions and the following disclaimer.
16  * 2. Redistributions in binary form must reproduce the above copyright
17  *    notice, this list of conditions and the following disclaimer in the
18  *    documentation and/or other materials provided with the distribution.
19  * 3. All advertising materials mentioning features or use of this software
20  *    must display the following acknowledgement:
21  *      This product includes software developed by the University of
22  *      California, Berkeley and its contributors.
23  * 4. Neither the name of the University nor the names of its contributors
24  *    may be used to endorse or promote products derived from this software
25  *    without specific prior written permission.
26  *
27  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
28  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
29  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
30  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
31  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
32  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
33  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
34  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
35  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
36  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
37  * SUCH DAMAGE.
38  *
39  *      @(#)ffs_vfsops.c        8.8 (Berkeley) 4/18/94
40  *      $FreeBSD: src/sys/gnu/ext2fs/ext2_vfsops.c,v 1.63.2.7 2002/07/01 00:18:51 iedowse Exp $
41  */
42
43 #include "opt_quota.h"
44
45 #include <sys/param.h>
46 #include <sys/systm.h>
47 #include <sys/nlookup.h>
48 #include <sys/proc.h>
49 #include <sys/priv.h>
50 #include <sys/kernel.h>
51 #include <sys/vnode.h>
52 #include <sys/mount.h>
53 #include <sys/buf.h>
54 #include <sys/conf.h>
55 #include <sys/fcntl.h>
56 #include <sys/diskslice.h>
57 #include <sys/malloc.h>
58 #include <sys/stat.h>
59 #include <vm/vm_zone.h>
60
61 #include <sys/buf2.h>
62 #include <sys/thread2.h>
63
64 #include "quota.h"
65 #include "dinode.h"
66 #include "inode.h"
67 #include "ext2mount.h"
68 #include "ext2_extern.h"
69
70 #include "fs.h"
71 #include "ext2_fs.h"
72 #include "ext2_fs_sb.h"
73
74 extern struct vop_ops ext2_vnode_vops;
75 extern struct vop_ops ext2_spec_vops;
76 extern struct vop_ops ext2_fifo_vops;
77
78 static int ext2_fhtovp (struct mount *, struct vnode *,
79                                 struct fid *, struct vnode **);
80 static int ext2_flushfiles (struct mount *mp, int flags);
81 static int ext2_mount (struct mount *, char *, caddr_t, struct ucred *);
82 static int ext2_mountfs (struct vnode *, struct mount *, struct ucred *);
83 static int ext2_root(struct mount *, struct vnode **);
84 static int ext2_reload (struct mount *mountp, struct ucred *cred);
85 static int ext2_sbupdate (struct ext2mount *, int);
86 static int ext2_statfs (struct mount *, struct statfs *, struct ucred *);
87 static int ext2_sync (struct mount *, int);
88 static int ext2_unmount (struct mount *, int);
89 static int ext2_vget (struct mount *, struct vnode *, ino_t, struct vnode **);
90 static int ext2_init(struct vfsconf *);
91 static int ext2_vptofh (struct vnode *, struct fid *);
92
93 static MALLOC_DEFINE(M_EXT2NODE, "EXT2 node", "EXT2 vnode private part");
94 MALLOC_DEFINE(M_EXT2MNT, "EXT2 mount", "EXT2 mount structure");
95
96 static struct vfsops ext2fs_vfsops = {
97         .vfs_mount =            ext2_mount,
98         .vfs_unmount =          ext2_unmount,
99         .vfs_root =             ext2_root,      /* root inode via vget */
100         .vfs_quotactl =         ext2_quotactl,  /* quota operations */
101         .vfs_statfs =           ext2_statfs,
102         .vfs_sync =             ext2_sync,
103         .vfs_vget =             ext2_vget,
104         .vfs_fhtovp =           ext2_fhtovp,
105         .vfs_checkexp =         ext2_check_export,
106         .vfs_vptofh =           ext2_vptofh,
107         .vfs_init =             ext2_init,
108         .vfs_uninit =           ext2_uninit
109 };
110
111 VFS_SET(ext2fs_vfsops, ext2fs, 0);
112 MODULE_VERSION(ext2fs, 1);
113
114 static int ext2fs_inode_hash_lock;
115
116 static int      ext2_check_sb_compat (struct ext2_super_block *es,
117                                           cdev_t dev, int ronly);
118 static int      compute_sb_data (struct vnode *devvp,
119                                      struct ext2_super_block *es,
120                                      struct ext2_sb_info *fs);
121
122 static int
123 ext2_root(struct mount *mp, struct vnode **vpp)
124 {
125         struct vnode *nvp;
126         int error;
127
128         error = VFS_VGET(mp, NULL, (ino_t)EXT2_ROOTINO, &nvp);
129         if (error)
130                 return (error);
131         *vpp = nvp;
132         return (0);
133 }
134
135 /*
136  * Do operations associated with quotas
137  */
138 int
139 ext2_quotactl(struct mount *mp, int cmds, uid_t uid, caddr_t arg,
140              struct ucred *cred)
141 {
142 #ifndef QUOTA
143         return (EOPNOTSUPP);
144 #else
145         int cmd, type, error;
146
147         type = cmds & SUBCMDMASK;
148         cmd = cmds >> SUBCMDSHIFT;
149
150         if (uid == -1) {
151                 switch(type) {
152                         case USRQUOTA:
153                                 uid = cred->cr_ruid;
154                                 break;
155                         case GRPQUOTA:
156                                 uid = cred->cr_rgid;
157                                 break;
158                         default:
159                                 return (EINVAL);
160                 }
161         }
162
163         /*
164          * Check permissions.
165          */
166         switch (cmd) {
167
168         case Q_QUOTAON:
169                 error = priv_check_cred(cred, PRIV_UFS_QUOTAON, 0);
170                 break;
171
172         case Q_QUOTAOFF:
173                 error = priv_check_cred(cred, PRIV_UFS_QUOTAOFF, 0);
174                 break;
175
176         case Q_SETQUOTA:
177                 error = priv_check_cred(cred, PRIV_VFS_SETQUOTA, 0);
178                 break;
179
180         case Q_SETUSE:
181                 error = priv_check_cred(cred, PRIV_UFS_SETUSE, 0);
182                 break;
183
184         case Q_GETQUOTA:
185                 if (uid == cred->cr_ruid)
186                         error = 0;
187                 else
188                         error = priv_check_cred(cred, PRIV_VFS_GETQUOTA, 0);
189                 break;
190
191         case Q_SYNC:
192                 error = 0;
193                 break;
194
195         default:
196                 error = EINVAL;
197                 break;
198         }
199
200         if (error)
201                 return (error);
202
203
204         if ((uint)type >= MAXQUOTAS)
205                 return (EINVAL);
206         if (vfs_busy(mp, LK_NOWAIT))
207                 return (0);
208
209         switch (cmd) {
210
211         case Q_QUOTAON:
212                 error = ext2_quotaon(cred, mp, type, arg);
213                 break;
214
215         case Q_QUOTAOFF:
216                 error = ext2_quotaoff(mp, type);
217                 break;
218
219         case Q_SETQUOTA:
220                 error = ext2_setquota(mp, uid, type, arg);
221                 break;
222
223         case Q_SETUSE:
224                 error = ext2_setuse(mp, uid, type, arg);
225                 break;
226
227         case Q_GETQUOTA:
228                 error = ext2_getquota(mp, uid, type, arg);
229                 break;
230
231         case Q_SYNC:
232                 error = ext2_qsync(mp);
233                 break;
234
235         default:
236                 error = EINVAL;
237                 break;
238         }
239         vfs_unbusy(mp);
240         return (error);
241 #endif
242 }
243
244 /*
245  * Initial UFS filesystems, done only once.
246  */
247 int
248 ext2_init(struct vfsconf *vfsp)
249 {
250         static int done;
251
252         if (done)
253                 return (0);
254         done = 1;
255         ext2_ihashinit();
256 #ifdef QUOTA
257         ext2_dqinit();
258 #endif
259         return (0);
260 }
261
262 /*
263  * VFS Operations.
264  *
265  * mount system call
266  *
267  * Parameters:
268  *      data:   this is actually a (struct ext2_args *)
269  */
270 static int
271 ext2_mount(struct mount *mp, char *path, caddr_t data, struct ucred *cred)
272 {
273         struct vnode *devvp;
274         struct ext2_args args;
275         struct ext2mount *ump = NULL;
276         struct ext2_sb_info *fs;
277         size_t size;
278         int error, flags;
279         mode_t accessmode;
280         struct nlookupdata nd;
281
282         if ((error = copyin(data, (caddr_t)&args, sizeof (struct ext2_args))) != 0)
283                 return (error);
284
285         /*
286          * If updating, check whether changing from read-only to
287          * read/write; if there is no device name, that's all we do.
288          */
289         if (mp->mnt_flag & MNT_UPDATE) {
290                 ump = VFSTOEXT2(mp);
291                 fs = ump->um_e2fs;
292                 devvp = ump->um_devvp;
293                 error = 0;
294                 if (fs->s_rd_only == 0 && (mp->mnt_flag & MNT_RDONLY)) {
295                         flags = WRITECLOSE;
296                         if (mp->mnt_flag & MNT_FORCE)
297                                 flags |= FORCECLOSE;
298                         if (vfs_busy(mp, LK_NOWAIT))
299                                 return (EBUSY);
300                         error = ext2_flushfiles(mp, flags);
301                         vfs_unbusy(mp);
302                         if (!error && fs->s_wasvalid) {
303                                 fs->s_es->s_state |= EXT2_VALID_FS;
304                                 ext2_sbupdate(ump, MNT_WAIT);
305                         }
306                         fs->s_rd_only = 1;
307                         vn_lock(devvp, LK_EXCLUSIVE | LK_RETRY);
308                         VOP_OPEN(devvp, FREAD, FSCRED, NULL);
309                         VOP_CLOSE(devvp, FREAD|FWRITE, NULL);
310                         vn_unlock(devvp);
311                 }
312                 if (!error && (mp->mnt_flag & MNT_RELOAD))
313                         error = ext2_reload(mp, cred);
314                 if (error)
315                         return (error);
316                 if (ext2_check_sb_compat(fs->s_es, devvp->v_rdev,
317                     (mp->mnt_kern_flag & MNTK_WANTRDWR) == 0) != 0)
318                         return (EPERM);
319                 if (fs->s_rd_only && (mp->mnt_kern_flag & MNTK_WANTRDWR)) {
320                         /*
321                          * If upgrade to read-write by non-root, then verify
322                          * that user has necessary permissions on the device.
323                          */
324                         if (cred->cr_uid != 0) {
325                                 vn_lock(devvp, LK_EXCLUSIVE | LK_RETRY);
326                                 error = VOP_EACCESS(devvp, VREAD | VWRITE, cred);
327                                 if (error) {
328                                         vn_unlock(devvp);
329                                         return (error);
330                                 }
331                                 vn_unlock(devvp);
332                         }
333
334                         if ((fs->s_es->s_state & EXT2_VALID_FS) == 0 ||
335                             (fs->s_es->s_state & EXT2_ERROR_FS)) {
336                                 if (mp->mnt_flag & MNT_FORCE) {
337                                         kprintf(
338 "WARNING: %s was not properly dismounted\n",
339                                             fs->fs_fsmnt);
340                                 } else {
341                                         kprintf(
342 "WARNING: R/W mount of %s denied.  Filesystem is not clean - run fsck\n",
343                                             fs->fs_fsmnt);
344                                         return (EPERM);
345                                 }
346                         }
347                         fs->s_es->s_state &= ~EXT2_VALID_FS;
348                         ext2_sbupdate(ump, MNT_WAIT);
349                         fs->s_rd_only = 0;
350                         vn_lock(devvp, LK_EXCLUSIVE | LK_RETRY);
351                         VOP_OPEN(devvp, FREAD|FWRITE, FSCRED, NULL);
352                         VOP_CLOSE(devvp, FREAD, NULL);
353                         vn_unlock(devvp);
354                 }
355                 if (args.fspec == NULL) {
356                         /*
357                          * Process export requests.
358                          */
359                         return (vfs_export(mp, &ump->um_export, &args.export));
360                 }
361         }
362         /*
363          * Not an update, or updating the name: look up the name
364          * and verify that it refers to a sensible block device.
365          */
366         devvp = NULL;
367         error = nlookup_init(&nd, args.fspec, UIO_USERSPACE, NLC_FOLLOW);
368         if (error == 0)
369                 error = nlookup(&nd);
370         if (error == 0)
371                 error = cache_vref(&nd.nl_nch, nd.nl_cred, &devvp);
372         nlookup_done(&nd);
373         if (error)
374                 return (error);
375
376         if (!vn_isdisk(devvp, &error)) {
377                 vrele(devvp);
378                 return (error);
379         }
380
381         /*
382          * If mount by non-root, then verify that user has necessary
383          * permissions on the device.
384          */
385         if (cred->cr_uid != 0) {
386                 accessmode = VREAD;
387                 if ((mp->mnt_flag & MNT_RDONLY) == 0)
388                         accessmode |= VWRITE;
389                 vn_lock(devvp, LK_EXCLUSIVE | LK_RETRY);
390                 if ((error = VOP_EACCESS(devvp, accessmode, cred)) != 0) {
391                         vput(devvp);
392                         return (error);
393                 }
394                 vn_unlock(devvp);
395         }
396
397         if ((mp->mnt_flag & MNT_UPDATE) == 0) {
398                 error = ext2_mountfs(devvp, mp, cred);
399         } else {
400                 if (devvp != ump->um_devvp)
401                         error = EINVAL; /* needs translation */
402                 else
403                         vrele(devvp);
404         }
405         if (error) {
406                 vrele(devvp);
407                 return (error);
408         }
409         ump = VFSTOEXT2(mp);
410         fs = ump->um_e2fs;
411         copyinstr(path, fs->fs_fsmnt, sizeof(fs->fs_fsmnt) - 1, &size);
412         bzero(fs->fs_fsmnt + size, sizeof(fs->fs_fsmnt) - size);
413         copyinstr(args.fspec, mp->mnt_stat.f_mntfromname, MNAMELEN - 1, &size);
414         bzero(mp->mnt_stat.f_mntfromname + size, MNAMELEN - size);
415         ext2_statfs(mp, &mp->mnt_stat, cred);
416         return (0);
417 }
418
419 /*
420  * checks that the data in the descriptor blocks make sense
421  * this is taken from ext2/super.c
422  */
423 static int
424 ext2_check_descriptors(struct ext2_sb_info *sb)
425 {
426         int i;
427         int desc_block = 0;
428         unsigned long block = sb->s_es->s_first_data_block;
429         struct ext2_group_desc *gdp = NULL;
430
431         /* ext2_debug ("Checking group descriptors"); */
432
433         for (i = 0; i < sb->s_groups_count; i++)
434         {
435                 /* examine next descriptor block */
436                 if ((i % EXT2_DESC_PER_BLOCK(sb)) == 0)
437                         gdp = (struct ext2_group_desc *)
438                                 sb->s_group_desc[desc_block++]->b_data;
439                 if (gdp->bg_block_bitmap < block ||
440                     gdp->bg_block_bitmap >= block + EXT2_BLOCKS_PER_GROUP(sb))
441                 {
442                         kprintf ("ext2_check_descriptors: "
443                                     "Block bitmap for group %d"
444                                     " not in group (block %lu)!\n",
445                                     i, (unsigned long) gdp->bg_block_bitmap);
446                         return 0;
447                 }
448                 if (gdp->bg_inode_bitmap < block ||
449                     gdp->bg_inode_bitmap >= block + EXT2_BLOCKS_PER_GROUP(sb))
450                 {
451                         kprintf ("ext2_check_descriptors: "
452                                     "Inode bitmap for group %d"
453                                     " not in group (block %lu)!\n",
454                                     i, (unsigned long) gdp->bg_inode_bitmap);
455                         return 0;
456                 }
457                 if (gdp->bg_inode_table < block ||
458                     gdp->bg_inode_table + sb->s_itb_per_group >=
459                     block + EXT2_BLOCKS_PER_GROUP(sb))
460                 {
461                         kprintf ("ext2_check_descriptors: "
462                                     "Inode table for group %d"
463                                     " not in group (block %lu)!\n",
464                                     i, (unsigned long) gdp->bg_inode_table);
465                         return 0;
466                 }
467                 block += EXT2_BLOCKS_PER_GROUP(sb);
468                 gdp++;
469         }
470         return 1;
471 }
472
473 static int
474 ext2_check_sb_compat(struct ext2_super_block *es, cdev_t dev, int ronly)
475 {
476         if (es->s_magic != EXT2_SUPER_MAGIC) {
477                 kprintf("ext2fs: %s: wrong magic number %#x (expected %#x)\n",
478                     devtoname(dev), es->s_magic, EXT2_SUPER_MAGIC);
479                 return (1);
480         }
481         if (es->s_rev_level > EXT2_GOOD_OLD_REV) {
482                 if (es->s_feature_incompat & ~EXT2_FEATURE_INCOMPAT_SUPP) {
483                         kprintf(
484 "WARNING: mount of %s denied due to unsupported optional features\n",
485                             devtoname(dev));
486                         return (1);
487                 }
488                 if (!ronly &&
489                     (es->s_feature_ro_compat & ~EXT2_FEATURE_RO_COMPAT_SUPP)) {
490                         kprintf(
491 "WARNING: R/W mount of %s denied due to unsupported optional features\n",
492                             devtoname(dev));
493                         return (1);
494                 }
495         }
496         return (0);
497 }
498
499 /*
500  * this computes the fields of the  ext2_sb_info structure from the
501  * data in the ext2_super_block structure read in
502  */
503 static int
504 compute_sb_data(struct vnode *devvp, struct ext2_super_block *es,
505                 struct ext2_sb_info *fs)
506 {
507     int db_count, error;
508     int i, j;
509     int logic_sb_block = 1;     /* XXX for now */
510
511 #if 1
512 #define V(v)
513 #else
514 #define V(v)  kprintf(#v"= %d\n", fs->v);
515 #endif
516
517     fs->s_blocksize = EXT2_MIN_BLOCK_SIZE << es->s_log_block_size;
518     V(s_blocksize)
519     fs->s_bshift = EXT2_MIN_BLOCK_LOG_SIZE + es->s_log_block_size;
520     V(s_bshift)
521     fs->s_fsbtodb = es->s_log_block_size + 1;
522     V(s_fsbtodb)
523     fs->s_qbmask = fs->s_blocksize - 1;
524     V(s_bmask)
525     fs->s_blocksize_bits = EXT2_BLOCK_SIZE_BITS(es);
526     V(s_blocksize_bits)
527     fs->s_frag_size = EXT2_MIN_FRAG_SIZE << es->s_log_frag_size;
528     V(s_frag_size)
529     if (fs->s_frag_size)
530         fs->s_frags_per_block = fs->s_blocksize / fs->s_frag_size;
531     V(s_frags_per_block)
532     fs->s_blocks_per_group = es->s_blocks_per_group;
533     V(s_blocks_per_group)
534     fs->s_frags_per_group = es->s_frags_per_group;
535     V(s_frags_per_group)
536     fs->s_inodes_per_group = es->s_inodes_per_group;
537     V(s_inodes_per_group)
538     if (es->s_rev_level == EXT2_GOOD_OLD_REV) {
539         fs->s_first_ino = EXT2_GOOD_OLD_FIRST_INO;
540         fs->s_inode_size = EXT2_GOOD_OLD_INODE_SIZE;
541     } else {
542         fs->s_first_ino = es->s_first_ino;
543         fs->s_inode_size = es->s_inode_size;
544         /*
545          * Simple sanity check for superblock inode size value.
546          */
547         if (fs->s_inode_size < EXT2_GOOD_OLD_INODE_SIZE ||
548             fs->s_inode_size > fs->s_blocksize ||
549             (fs->s_inode_size & (fs->s_inode_size - 1)) != 0) {
550             kprintf("EXT2-fs: invalid inode size %d\n",
551                 fs->s_inode_size);
552             return (EIO);
553         }
554     }
555     V(s_first_ino)
556     V(s_inode_size)
557     fs->s_inodes_per_block = fs->s_blocksize / EXT2_INODE_SIZE(fs);
558     V(s_inodes_per_block)
559     fs->s_itb_per_group = fs->s_inodes_per_group /fs->s_inodes_per_block;
560     V(s_itb_per_group)
561     fs->s_desc_per_block = fs->s_blocksize / sizeof (struct ext2_group_desc);
562     V(s_desc_per_block)
563     /* s_resuid / s_resgid ? */
564     fs->s_groups_count = (es->s_blocks_count -
565                           es->s_first_data_block +
566                           EXT2_BLOCKS_PER_GROUP(fs) - 1) /
567                          EXT2_BLOCKS_PER_GROUP(fs);
568     V(s_groups_count)
569     db_count = (fs->s_groups_count + EXT2_DESC_PER_BLOCK(fs) - 1) /
570         EXT2_DESC_PER_BLOCK(fs);
571     fs->s_db_per_group = db_count;
572     V(s_db_per_group)
573
574     fs->s_group_desc = kmalloc(db_count * sizeof (struct buf *),
575                 M_EXT2MNT, M_WAITOK);
576
577     /* adjust logic_sb_block */
578     if(fs->s_blocksize > SBSIZE)
579         /* Godmar thinks: if the blocksize is greater than 1024, then
580            the superblock is logically part of block zero.
581          */
582         logic_sb_block = 0;
583
584     for (i = 0; i < db_count; i++) {
585         error = bread(devvp, fsbtodoff(fs, logic_sb_block + i + 1),
586                       fs->s_blocksize, &fs->s_group_desc[i]);
587         if(error) {
588             for (j = 0; j < i; j++)
589                 brelse(fs->s_group_desc[j]);
590             kfree(fs->s_group_desc, M_EXT2MNT);
591             kprintf("EXT2-fs: unable to read group descriptors (%d)\n", error);
592             return EIO;
593         }
594         /* Set the B_LOCKED flag on the buffer, then brelse() it */
595         LCK_BUF(fs->s_group_desc[i])
596     }
597     if(!ext2_check_descriptors(fs)) {
598             for (j = 0; j < db_count; j++)
599                     ULCK_BUF(fs->s_group_desc[j])
600             kfree(fs->s_group_desc, M_EXT2MNT);
601             kprintf("EXT2-fs: (ext2_check_descriptors failure) "
602                    "unable to read group descriptors\n");
603             return EIO;
604     }
605
606     for (i = 0; i < EXT2_MAX_GROUP_LOADED; i++) {
607             fs->s_inode_bitmap_number[i] = 0;
608             fs->s_inode_bitmap[i] = NULL;
609             fs->s_block_bitmap_number[i] = 0;
610             fs->s_block_bitmap[i] = NULL;
611     }
612     fs->s_loaded_inode_bitmaps = 0;
613     fs->s_loaded_block_bitmaps = 0;
614     return 0;
615 }
616
617 /*
618  * Reload all incore data for a filesystem (used after running fsck on
619  * the root filesystem and finding things to fix). The filesystem must
620  * be mounted read-only.
621  *
622  * Things to do to update the mount:
623  *      1) invalidate all cached meta-data.
624  *      2) re-read superblock from disk.
625  *      3) re-read summary information from disk.
626  *      4) invalidate all inactive vnodes.
627  *      5) invalidate all cached file data.
628  *      6) re-read inode data for all active vnodes.
629  */
630 static int ext2_reload_scan(struct mount *mp, struct vnode *vp, void *rescan);
631
632 struct scaninfo {
633         int rescan;
634         int allerror;
635         int waitfor;
636         struct vnode *devvp;
637         struct ext2_sb_info *fs;
638 };
639
640 static int
641 ext2_reload(struct mount *mountp, struct ucred *cred)
642 {
643         struct vnode *devvp;
644         struct buf *bp;
645         struct ext2_super_block *es;
646         struct ext2_sb_info *fs;
647         int error;
648         struct scaninfo scaninfo;
649
650         if ((mountp->mnt_flag & MNT_RDONLY) == 0)
651                 return (EINVAL);
652         /*
653          * Step 1: invalidate all cached meta-data.
654          */
655         devvp = VFSTOEXT2(mountp)->um_devvp;
656         if (vinvalbuf(devvp, 0, 0, 0))
657                 panic("ext2_reload: dirty1");
658         /*
659          * Step 2: re-read superblock from disk.
660          * constants have been adjusted for ext2
661          */
662         if ((error = bread(devvp, SBOFF, SBSIZE, &bp)) != 0)
663                 return (error);
664         es = (struct ext2_super_block *)bp->b_data;
665         if (ext2_check_sb_compat(es, devvp->v_rdev, 0) != 0) {
666                 brelse(bp);
667                 return (EIO);           /* XXX needs translation */
668         }
669         fs = VFSTOEXT2(mountp)->um_e2fs;
670         bcopy(bp->b_data, fs->s_es, sizeof(struct ext2_super_block));
671
672         if((error = compute_sb_data(devvp, es, fs)) != 0) {
673                 brelse(bp);
674                 return error;
675         }
676 #ifdef UNKLAR
677         if (fs->fs_sbsize < SBSIZE)
678                 bp->b_flags |= B_INVAL;
679 #endif
680         brelse(bp);
681
682         scaninfo.rescan = 1;
683         scaninfo.devvp = devvp;
684         scaninfo.fs = fs;
685         while (error == 0 && scaninfo.rescan) {
686             scaninfo.rescan = 0;
687             error = vmntvnodescan(mountp, VMSC_GETVX,
688                                   NULL, ext2_reload_scan, &scaninfo);
689         }
690         return(error);
691 }
692
693 static int
694 ext2_reload_scan(struct mount *mp, struct vnode *vp, void *data)
695 {
696         struct scaninfo *info = data;
697         struct inode *ip;
698         struct buf *bp;
699         int error;
700
701         /*
702          * Try to recycle
703          */
704         if (vrecycle(vp))
705                 return(0);
706
707         /*
708          * Step 5: invalidate all cached file data.
709          */
710         if (vinvalbuf(vp, 0, 0, 0))
711                 panic("ext2_reload: dirty2");
712         /*
713          * Step 6: re-read inode data for all active vnodes.
714          */
715         ip = VTOI(vp);
716         error = bread(info->devvp,
717                       fsbtodoff(info->fs, ino_to_fsba(info->fs, ip->i_number)),
718                       (int)info->fs->s_blocksize, &bp);
719         if (error)
720                 return (error);
721         ext2_ei2di((struct ext2_inode *) ((char *)bp->b_data +
722             EXT2_INODE_SIZE(info->fs) * ino_to_fsbo(info->fs, ip->i_number)),
723             &ip->i_din);
724         brelse(bp);
725         return(0);
726 }
727
728 /*
729  * Common code for mount and mountroot
730  */
731 static int
732 ext2_mountfs(struct vnode *devvp, struct mount *mp, struct ucred *cred)
733 {
734         struct ext2mount *ump;
735         struct buf *bp;
736         struct ext2_sb_info *fs;
737         struct ext2_super_block *es;
738         cdev_t dev;
739         struct partinfo dpart;
740         int error, i;
741         int ronly;
742
743         /*
744          * Disallow multiple mounts of the same device.
745          * Disallow mounting of a device that is currently in use
746          * (except for root, which might share swap device for miniroot).
747          * Flush out any old buffers remaining from a previous use.
748          */
749         if ((error = vfs_mountedon(devvp)) != 0)
750                 return (error);
751         if (vcount(devvp) > 0)
752                 return (EBUSY);
753         if ((error = vinvalbuf(devvp, V_SAVE, 0, 0)) != 0)
754                 return (error);
755 #ifdef READONLY
756 /* turn on this to force it to be read-only */
757         mp->mnt_flag |= MNT_RDONLY;
758 #endif
759
760         ronly = (mp->mnt_flag & MNT_RDONLY) != 0;
761         vn_lock(devvp, LK_EXCLUSIVE | LK_RETRY);
762         error = VOP_OPEN(devvp, ronly ? FREAD : FREAD|FWRITE, FSCRED, NULL);
763         vn_unlock(devvp);
764         if (error)
765                 return (error);
766         dev = devvp->v_rdev;
767         if (dev->si_iosize_max != 0)
768                 mp->mnt_iosize_max = dev->si_iosize_max;
769         if (mp->mnt_iosize_max > MAXPHYS)
770                 mp->mnt_iosize_max = MAXPHYS;
771         VOP_IOCTL(devvp, DIOCGPART, (caddr_t)&dpart, FREAD, cred, NULL);
772
773         bp = NULL;
774         ump = NULL;
775         if ((error = bread(devvp, SBOFF, SBSIZE, &bp)) != 0)
776                 goto out;
777         es = (struct ext2_super_block *)bp->b_data;
778         if (ext2_check_sb_compat(es, dev, ronly) != 0) {
779                 error = EINVAL;         /* XXX needs translation */
780                 goto out;
781         }
782         if ((es->s_state & EXT2_VALID_FS) == 0 ||
783             (es->s_state & EXT2_ERROR_FS)) {
784                 if (ronly || (mp->mnt_flag & MNT_FORCE)) {
785                         kprintf(
786 "WARNING: Filesystem was not properly dismounted\n");
787                 } else {
788                         kprintf(
789 "WARNING: R/W mount denied.  Filesystem is not clean - run fsck\n");
790                         error = EPERM;
791                         goto out;
792                 }
793         }
794         ump = kmalloc(sizeof *ump, M_EXT2MNT, M_WAITOK | M_ZERO);
795         ump->um_malloctype = M_EXT2NODE;
796         ump->um_blkatoff = ext2_blkatoff;
797         ump->um_truncate = ext2_truncate;
798         ump->um_update = ext2_update;
799         ump->um_valloc = ext2_valloc;
800         ump->um_vfree = ext2_vfree;
801         /* I don't know whether this is the right strategy. Note that
802            we dynamically allocate both a ext2_sb_info and a ext2_super_block
803            while Linux keeps the super block in a locked buffer
804          */
805         ump->um_e2fs = kmalloc(sizeof(struct ext2_sb_info),
806                 M_EXT2MNT, M_WAITOK);
807         ump->um_e2fs->s_es = kmalloc(sizeof(struct ext2_super_block),
808                 M_EXT2MNT, M_WAITOK);
809         bcopy(es, ump->um_e2fs->s_es, (u_int)sizeof(struct ext2_super_block));
810         if ((error = compute_sb_data(devvp, ump->um_e2fs->s_es, ump->um_e2fs)))
811                 goto out;
812         /*
813          * We don't free the group descriptors allocated by compute_sb_data()
814          * until ext2_unmount().  This is OK since the mount will succeed.
815          */
816         brelse(bp);
817         bp = NULL;
818         fs = ump->um_e2fs;
819         fs->s_rd_only = ronly;  /* ronly is set according to mnt_flags */
820         /* if the fs is not mounted read-only, make sure the super block is
821            always written back on a sync()
822          */
823         fs->s_wasvalid = fs->s_es->s_state & EXT2_VALID_FS ? 1 : 0;
824         if (ronly == 0) {
825                 fs->s_dirt = 1;         /* mark it modified */
826                 fs->s_es->s_state &= ~EXT2_VALID_FS;    /* set fs invalid */
827         }
828         mp->mnt_data = (qaddr_t)ump;
829         mp->mnt_stat.f_fsid.val[0] = dev2udev(dev);
830         mp->mnt_stat.f_fsid.val[1] = mp->mnt_vfc->vfc_typenum;
831         mp->mnt_maxsymlinklen = EXT2_MAXSYMLINKLEN;
832         mp->mnt_flag |= MNT_LOCAL;
833         ump->um_mountp = mp;
834         ump->um_dev = dev;
835         ump->um_devvp = devvp;
836         /* setting those two parameters allows us to use
837            ext2_bmap w/o changse !
838         */
839         ump->um_nindir = EXT2_ADDR_PER_BLOCK(fs);
840         ump->um_bptrtodb = fs->s_es->s_log_block_size + 1;
841         ump->um_seqinc = EXT2_FRAGS_PER_BLOCK(fs);
842         for (i = 0; i < MAXQUOTAS; i++)
843                 ump->um_quotas[i] = NULLVP;
844         dev->si_mountpoint = mp;
845
846         vfs_add_vnodeops(mp, &ext2_vnode_vops, &mp->mnt_vn_norm_ops);
847         vfs_add_vnodeops(mp, &ext2_spec_vops, &mp->mnt_vn_spec_ops);
848         vfs_add_vnodeops(mp, &ext2_fifo_vops, &mp->mnt_vn_fifo_ops);
849
850         if (ronly == 0)
851                 ext2_sbupdate(ump, MNT_WAIT);
852         return (0);
853 out:
854         if (bp)
855                 brelse(bp);
856         vn_lock(devvp, LK_EXCLUSIVE | LK_RETRY);
857         VOP_CLOSE(devvp, ronly ? FREAD : FREAD|FWRITE, NULL);
858         vn_unlock(devvp);
859         if (ump) {
860                 kfree(ump->um_e2fs->s_es, M_EXT2MNT);
861                 kfree(ump->um_e2fs, M_EXT2MNT);
862                 kfree(ump, M_EXT2MNT);
863                 mp->mnt_data = (qaddr_t)0;
864         }
865         return (error);
866 }
867
868 /*
869  * unmount system call
870  */
871 static int
872 ext2_unmount(struct mount *mp, int mntflags)
873 {
874         struct ext2mount *ump;
875         struct ext2_sb_info *fs;
876         int error, flags, ronly, i;
877
878         flags = 0;
879         if (mntflags & MNT_FORCE) {
880                 if (mp->mnt_flag & MNT_ROOTFS)
881                         return (EINVAL);
882                 flags |= FORCECLOSE;
883         }
884         if ((error = ext2_flushfiles(mp, flags)) != 0)
885                 return (error);
886         ump = VFSTOEXT2(mp);
887         fs = ump->um_e2fs;
888         ronly = fs->s_rd_only;
889         if (ronly == 0) {
890                 if (fs->s_wasvalid)
891                         fs->s_es->s_state |= EXT2_VALID_FS;
892                 ext2_sbupdate(ump, MNT_WAIT);
893         }
894
895         /* release buffers containing group descriptors */
896         for(i = 0; i < fs->s_db_per_group; i++)
897                 ULCK_BUF(fs->s_group_desc[i])
898         kfree(fs->s_group_desc, M_EXT2MNT);
899
900         /* release cached inode/block bitmaps */
901         for (i = 0; i < EXT2_MAX_GROUP_LOADED; i++)
902                 if (fs->s_inode_bitmap[i])
903                         ULCK_BUF(fs->s_inode_bitmap[i])
904
905         for (i = 0; i < EXT2_MAX_GROUP_LOADED; i++)
906                 if (fs->s_block_bitmap[i])
907                         ULCK_BUF(fs->s_block_bitmap[i])
908
909         ump->um_devvp->v_rdev->si_mountpoint = NULL;
910
911         vn_lock(ump->um_devvp, LK_EXCLUSIVE | LK_RETRY);
912         error = VOP_CLOSE(ump->um_devvp, ronly ? FREAD : FREAD|FWRITE, NULL);
913         vn_unlock(ump->um_devvp);
914
915         vrele(ump->um_devvp);
916         kfree(fs->s_es, M_EXT2MNT);
917         kfree(fs, M_EXT2MNT);
918         kfree(ump, M_EXT2MNT);
919         mp->mnt_data = (qaddr_t)0;
920         mp->mnt_flag &= ~MNT_LOCAL;
921         return (error);
922 }
923
924 /*
925  * Flush out all the files in a filesystem.
926  */
927 static int
928 ext2_flushfiles(struct mount *mp, int flags)
929 {
930         struct ext2mount *ump;
931         int error;
932 #if QUOTA
933         int i;
934 #endif
935
936         ump = VFSTOEXT2(mp);
937 #if QUOTA
938         if (mp->mnt_flag & MNT_QUOTA) {
939                 if ((error = vflush(mp, 0, SKIPSYSTEM|flags)) != 0)
940                         return (error);
941                 for (i = 0; i < MAXQUOTAS; i++) {
942                         if (ump->um_quotas[i] == NULLVP)
943                                 continue;
944                         ext2_quotaoff(mp, i);
945                 }
946                 /*
947                  * Here we fall through to vflush again to ensure
948                  * that we have gotten rid of all the system vnodes.
949                  */
950         }
951 #endif
952         error = vflush(mp, 0, flags);
953         return (error);
954 }
955
956 /*
957  * Get file system statistics.
958  * taken from ext2/super.c ext2_statfs
959  */
960 static int
961 ext2_statfs(struct mount *mp, struct statfs *sbp, struct ucred *cred)
962 {
963         unsigned long overhead;
964         struct ext2mount *ump;
965         struct ext2_sb_info *fs;
966         struct ext2_super_block *es;
967         int i, nsb;
968
969         ump = VFSTOEXT2(mp);
970         fs = ump->um_e2fs;
971         es = fs->s_es;
972
973         if (es->s_magic != EXT2_SUPER_MAGIC)
974                 panic("ext2_statfs - magic number spoiled");
975
976         /*
977          * Compute the overhead (FS structures)
978          */
979         if (es->s_feature_ro_compat & EXT2_FEATURE_RO_COMPAT_SPARSE_SUPER) {
980                 nsb = 0;
981                 for (i = 0 ; i < fs->s_groups_count; i++)
982                         if (ext2_group_sparse(i))
983                                 nsb++;
984         } else
985                 nsb = fs->s_groups_count;
986         overhead = es->s_first_data_block +
987             /* Superblocks and block group descriptors: */
988             nsb * (1 + fs->s_db_per_group) +
989             /* Inode bitmap, block bitmap, and inode table: */
990             fs->s_groups_count * (1 + 1 + fs->s_itb_per_group);
991
992         sbp->f_bsize = EXT2_FRAG_SIZE(fs);
993         sbp->f_iosize = EXT2_BLOCK_SIZE(fs);
994         sbp->f_blocks = es->s_blocks_count - overhead;
995         sbp->f_bfree = es->s_free_blocks_count;
996         sbp->f_bavail = sbp->f_bfree - es->s_r_blocks_count;
997         sbp->f_files = es->s_inodes_count;
998         sbp->f_ffree = es->s_free_inodes_count;
999         if (sbp != &mp->mnt_stat) {
1000                 sbp->f_type = mp->mnt_vfc->vfc_typenum;
1001                 bcopy((caddr_t)mp->mnt_stat.f_mntfromname,
1002                         (caddr_t)&sbp->f_mntfromname[0], MNAMELEN);
1003         }
1004         return (0);
1005 }
1006
1007 /*
1008  * Go through the disk queues to initiate sandbagged IO;
1009  * go through the inodes to write those that have been modified;
1010  * initiate the writing of the super block if it has been modified.
1011  *
1012  * Note: we are always called with the filesystem marked `MPBUSY'.
1013  */
1014
1015 static int ext2_sync_scan(struct mount *mp, struct vnode *vp, void *data);
1016
1017 static int
1018 ext2_sync(struct mount *mp, int waitfor)
1019 {
1020         struct ext2mount *ump = VFSTOEXT2(mp);
1021         struct ext2_sb_info *fs;
1022         struct scaninfo scaninfo;
1023         int error;
1024
1025         fs = ump->um_e2fs;
1026         if (fs->s_dirt != 0 && fs->s_rd_only != 0) {            /* XXX */
1027                 kprintf("fs = %s\n", fs->fs_fsmnt);
1028                 panic("ext2_sync: rofs mod");
1029         }
1030
1031         /*
1032          * Write back each (modified) inode.
1033          */
1034         scaninfo.allerror = 0;
1035         scaninfo.rescan = 1;
1036         scaninfo.waitfor = waitfor;
1037         while (scaninfo.rescan) {
1038                 scaninfo.rescan = 0;
1039                 vmntvnodescan(mp, VMSC_GETVP|VMSC_NOWAIT,
1040                               NULL, ext2_sync_scan, &scaninfo);
1041         }
1042
1043         /*
1044          * Force stale file system control information to be flushed.
1045          */
1046         if ((waitfor & MNT_LAZY) == 0) {
1047                 vn_lock(ump->um_devvp, LK_EXCLUSIVE | LK_RETRY);
1048                 if ((error = VOP_FSYNC(ump->um_devvp, waitfor, 0)) != 0)
1049                         scaninfo.allerror = error;
1050                 vn_unlock(ump->um_devvp);
1051         }
1052 #if QUOTA
1053         ext2_qsync(mp);
1054 #endif
1055         /*
1056          * Write back modified superblock.
1057          */
1058         if (fs->s_dirt != 0) {
1059                 fs->s_dirt = 0;
1060                 fs->s_es->s_wtime = time_second;
1061                 if ((error = ext2_sbupdate(ump, waitfor)) != 0)
1062                         scaninfo.allerror = error;
1063         }
1064         return (scaninfo.allerror);
1065 }
1066
1067 static int
1068 ext2_sync_scan(struct mount *mp, struct vnode *vp, void *data)
1069 {
1070         struct scaninfo *info = data;
1071         struct inode *ip;
1072         int error;
1073
1074         ip = VTOI(vp);
1075         if (vp->v_type == VNON ||
1076             ((ip->i_flag &
1077             (IN_ACCESS | IN_CHANGE | IN_MODIFIED | IN_UPDATE)) == 0 &&
1078             (RB_EMPTY(&vp->v_rbdirty_tree) || (info->waitfor & MNT_LAZY)))) {
1079                 return(0);
1080         }
1081         if ((error = VOP_FSYNC(vp, info->waitfor, 0)) != 0)
1082                 info->allerror = error;
1083         return(0);
1084 }
1085
1086 /*
1087  * Look up a EXT2FS dinode number to find its incore vnode, otherwise read it
1088  * in from disk.  If it is in core, wait for the lock bit to clear, then
1089  * return the inode locked.  Detection and handling of mount points must be
1090  * done by the calling routine.
1091  */
1092 static int
1093 ext2_vget(struct mount *mp, struct vnode *dvp, ino_t ino, struct vnode **vpp)
1094 {
1095         struct ext2_sb_info *fs;
1096         struct inode *ip;
1097         struct ext2mount *ump;
1098         struct buf *bp;
1099         struct vnode *vp;
1100         cdev_t dev;
1101         int i, error;
1102         int used_blocks;
1103
1104         ump = VFSTOEXT2(mp);
1105         dev = ump->um_dev;
1106 restart:
1107         if ((*vpp = ext2_ihashget(dev, ino)) != NULL)
1108                 return (0);
1109
1110         /*
1111          * Lock out the creation of new entries in the FFS hash table in
1112          * case getnewvnode() or MALLOC() blocks, otherwise a duplicate
1113          * may occur!
1114          */
1115         if (ext2fs_inode_hash_lock) {
1116                 while (ext2fs_inode_hash_lock) {
1117                         ext2fs_inode_hash_lock = -1;
1118                         tsleep(&ext2fs_inode_hash_lock, 0, "e2vget", 0);
1119                 }
1120                 goto restart;
1121         }
1122         ext2fs_inode_hash_lock = 1;
1123
1124         /*
1125          * If this MALLOC() is performed after the getnewvnode()
1126          * it might block, leaving a vnode with a NULL v_data to be
1127          * found by ext2_sync() if a sync happens to fire right then,
1128          * which will cause a panic because ext2_sync() blindly
1129          * dereferences vp->v_data (as well it should).
1130          */
1131         ip = kmalloc(sizeof(struct inode), M_EXT2NODE, M_WAITOK);
1132
1133         /* Allocate a new vnode/inode. */
1134         if ((error = getnewvnode(VT_EXT2FS, mp, &vp, 0, LK_CANRECURSE)) != 0) {
1135                 if (ext2fs_inode_hash_lock < 0)
1136                         wakeup(&ext2fs_inode_hash_lock);
1137                 ext2fs_inode_hash_lock = 0;
1138                 *vpp = NULL;
1139                 kfree(ip, M_EXT2NODE);
1140                 return (error);
1141         }
1142         bzero((caddr_t)ip, sizeof(struct inode));
1143         vp->v_data = ip;
1144         ip->i_vnode = vp;
1145         ip->i_e2fs = fs = ump->um_e2fs;
1146         ip->i_dev = dev;
1147         ip->i_number = ino;
1148 #if QUOTA
1149         for (i = 0; i < MAXQUOTAS; i++)
1150                 ip->i_dquot[i] = NODQUOT;
1151 #endif
1152         /*
1153          * Put it onto its hash chain.  Since our vnode is locked, other
1154          * requests for this inode will block if they arrive while we are
1155          * sleeping waiting for old data structures to be purged or for the
1156          * contents of the disk portion of this inode to be read.
1157          */
1158         ext2_ihashins(ip);
1159
1160         if (ext2fs_inode_hash_lock < 0)
1161                 wakeup(&ext2fs_inode_hash_lock);
1162         ext2fs_inode_hash_lock = 0;
1163
1164         /* Read in the disk contents for the inode, copy into the inode. */
1165 #if 0
1166 kprintf("ext2_vget(%d) dbn= %d ", ino, fsbtodb(fs, ino_to_fsba(fs, ino)));
1167 #endif
1168         error = bread(ump->um_devvp, fsbtodoff(fs, ino_to_fsba(fs, ino)),
1169                       (int)fs->s_blocksize, &bp);
1170         if (error) {
1171                 /*
1172                  * The inode does not contain anything useful, so it would
1173                  * be misleading to leave it on its hash chain. With mode
1174                  * still zero, it will be unlinked and returned to the free
1175                  * list by vput().
1176                  */
1177                 brelse(bp);
1178                 vx_put(vp);
1179                 *vpp = NULL;
1180                 return (error);
1181         }
1182         /* convert ext2 inode to dinode */
1183         ext2_ei2di((struct ext2_inode *) ((char *)bp->b_data + EXT2_INODE_SIZE(fs) *
1184                         ino_to_fsbo(fs, ino)), &ip->i_din);
1185         ip->i_block_group = ino_to_cg(fs, ino);
1186         ip->i_next_alloc_block = 0;
1187         ip->i_next_alloc_goal = 0;
1188         ip->i_prealloc_count = 0;
1189         ip->i_prealloc_block = 0;
1190         /* now we want to make sure that block pointers for unused
1191            blocks are zeroed out - ext2_balloc depends on this
1192            although for regular files and directories only
1193         */
1194         if(S_ISDIR(ip->i_mode) || S_ISREG(ip->i_mode)) {
1195                 used_blocks = (ip->i_size+fs->s_blocksize-1) / fs->s_blocksize;
1196                 for(i = used_blocks; i < EXT2_NDIR_BLOCKS; i++)
1197                         ip->i_db[i] = 0;
1198         }
1199 #if 0
1200         ext2_print_inode(ip);
1201 #endif
1202         bqrelse(bp);
1203
1204         /*
1205          * Initialize the vnode from the inode, check for aliases.
1206          * Note that the underlying vnode may have changed.
1207          */
1208         if ((error = ext2_vinit(mp, &vp)) != 0) {
1209                 vx_put(vp);
1210                 *vpp = NULL;
1211                 return (error);
1212         }
1213
1214         /*
1215          * Finish inode initialization now that aliasing has been resolved.
1216          */
1217         ip->i_devvp = ump->um_devvp;
1218         vref(ip->i_devvp);
1219         /*
1220          * Set up a generation number for this inode if it does not
1221          * already have one. This should only happen on old filesystems.
1222          */
1223         if (ip->i_gen == 0) {
1224                 ip->i_gen = krandom() / 2 + 1;
1225                 if ((vp->v_mount->mnt_flag & MNT_RDONLY) == 0)
1226                         ip->i_flag |= IN_MODIFIED;
1227         }
1228         /*
1229          * Return the locked and refd vnode.
1230          */
1231         *vpp = vp;
1232         return (0);
1233 }
1234
1235 /*
1236  * File handle to vnode
1237  *
1238  * Have to be really careful about stale file handles:
1239  * - check that the inode number is valid
1240  * - call ext2_vget() to get the locked inode
1241  * - check for an unallocated inode (i_mode == 0)
1242  * - check that the given client host has export rights and return
1243  *   those rights via. exflagsp and credanonp
1244  */
1245 static int
1246 ext2_fhtovp(struct mount *mp, struct vnode *rootvp,
1247             struct fid *fhp, struct vnode **vpp)
1248 {
1249         struct ufid *ufhp;
1250         struct ext2_sb_info *fs;
1251         struct inode *ip;
1252         struct vnode *nvp;
1253         int error;
1254
1255         ufhp = (struct ufid *)fhp;
1256         fs = VFSTOEXT2(mp)->um_e2fs;
1257         if (ufhp->ufid_ino < EXT2_ROOTINO ||
1258             ufhp->ufid_ino > fs->s_groups_count * fs->s_es->s_inodes_per_group)
1259                 return (ESTALE);
1260
1261         error = VFS_VGET(mp, rootvp, ufhp->ufid_ino, &nvp);
1262         if (error) {
1263                 *vpp = NULLVP;
1264                 return (error);
1265         }
1266         ip = VTOI(nvp);
1267         if (ip->i_mode == 0 ||
1268             ip->i_gen != ufhp->ufid_gen ||
1269             (VFSTOEXT2(mp)->um_i_effnlink_valid ? ip->i_effnlink :
1270             ip->i_nlink) <= 0) {
1271                 vput(nvp);
1272                 *vpp = NULLVP;
1273                 return (ESTALE);
1274         }
1275         *vpp = nvp;
1276         return (0);
1277 }
1278
1279 /*
1280  * Vnode pointer to File handle
1281  */
1282 /* ARGSUSED */
1283 static int
1284 ext2_vptofh(struct vnode *vp, struct fid *fhp)
1285 {
1286         struct inode *ip;
1287         struct ufid *ufhp;
1288
1289         ip = VTOI(vp);
1290         ufhp = (struct ufid *)fhp;
1291         ufhp->ufid_len = sizeof(struct ufid);
1292         ufhp->ufid_ino = ip->i_number;
1293         ufhp->ufid_gen = ip->i_gen;
1294         return (0);
1295 }
1296
1297 /*
1298  * This is the generic part of fhtovp called after the underlying
1299  * filesystem has validated the file handle.
1300  *
1301  * Verify that a host should have access to a filesystem.
1302  */
1303 int
1304 ext2_check_export(struct mount *mp, struct sockaddr *nam, int *exflagsp,
1305                  struct ucred **credanonp)
1306 {
1307         struct netcred *np;
1308         struct ext2mount *ump;
1309
1310         ump = VFSTOEXT2(mp);
1311         /*
1312          * Get the export permission structure for this <mp, client> tuple.
1313          */
1314         np = vfs_export_lookup(mp, &ump->um_export, nam);
1315         if (np == NULL)
1316                 return (EACCES);
1317
1318         *exflagsp = np->netc_exflags;
1319         *credanonp = &np->netc_anon;
1320         return (0);
1321 }
1322
1323 /*
1324  * Write a superblock and associated information back to disk.
1325  */
1326 static int
1327 ext2_sbupdate(struct ext2mount *mp, int waitfor)
1328 {
1329         struct ext2_sb_info *fs = mp->um_e2fs;
1330         struct ext2_super_block *es = fs->s_es;
1331         struct buf *bp;
1332         int error = 0;
1333 /*
1334 kprintf("\nupdating superblock, waitfor=%s\n", waitfor == MNT_WAIT ? "yes":"no");
1335 */
1336         bp = getblk(mp->um_devvp, SBOFF, SBSIZE, 0, 0);
1337         bcopy((caddr_t)es, bp->b_data, (u_int)sizeof(struct ext2_super_block));
1338         if (waitfor == MNT_WAIT)
1339                 error = bwrite(bp);
1340         else
1341                 bawrite(bp);
1342
1343         /*
1344          * The buffers for group descriptors, inode bitmaps and block bitmaps
1345          * are not busy at this point and are (hopefully) written by the
1346          * usual sync mechanism. No need to write them here
1347          */
1348
1349         return (error);
1350 }