proc->thread stage 4: rework the VFS and DEVICE subsystems to take thread
[dragonfly.git] / sys / vfs / coda / coda_vfsops.c
1 /*
2  * 
3  *             Coda: an Experimental Distributed File System
4  *                              Release 3.1
5  * 
6  *           Copyright (c) 1987-1998 Carnegie Mellon University
7  *                          All Rights Reserved
8  * 
9  * Permission  to  use, copy, modify and distribute this software and its
10  * documentation is hereby granted,  provided  that  both  the  copyright
11  * notice  and  this  permission  notice  appear  in  all  copies  of the
12  * software, derivative works or  modified  versions,  and  any  portions
13  * thereof, and that both notices appear in supporting documentation, and
14  * that credit is given to Carnegie Mellon University  in  all  documents
15  * and publicity pertaining to direct or indirect use of this code or its
16  * derivatives.
17  * 
18  * CODA IS AN EXPERIMENTAL SOFTWARE SYSTEM AND IS  KNOWN  TO  HAVE  BUGS,
19  * SOME  OF  WHICH MAY HAVE SERIOUS CONSEQUENCES.  CARNEGIE MELLON ALLOWS
20  * FREE USE OF THIS SOFTWARE IN ITS "AS IS" CONDITION.   CARNEGIE  MELLON
21  * DISCLAIMS  ANY  LIABILITY  OF  ANY  KIND  FOR  ANY  DAMAGES WHATSOEVER
22  * RESULTING DIRECTLY OR INDIRECTLY FROM THE USE OF THIS SOFTWARE  OR  OF
23  * ANY DERIVATIVE WORK.
24  * 
25  * Carnegie  Mellon  encourages  users  of  this  software  to return any
26  * improvements or extensions that  they  make,  and  to  grant  Carnegie
27  * Mellon the rights to redistribute these changes without encumbrance.
28  * 
29  *      @(#) src/sys/cfs/coda_vfsops.c,v 1.1.1.1 1998/08/29 21:14:52 rvb Exp $
30  * $FreeBSD: src/sys/coda/coda_vfsops.c,v 1.24.2.1 2001/07/26 20:36:45 iedowse Exp $
31  * $DragonFly: src/sys/vfs/coda/Attic/coda_vfsops.c,v 1.4 2003/06/25 03:55:44 dillon Exp $
32  * 
33  */
34
35 /* 
36  * Mach Operating System
37  * Copyright (c) 1989 Carnegie-Mellon University
38  * All rights reserved.  The CMU software License Agreement specifies
39  * the terms and conditions for use and redistribution.
40  */
41
42 /*
43  * This code was written for the Coda file system at Carnegie Mellon
44  * University.  Contributers include David Steere, James Kistler, and
45  * M. Satyanarayanan.  
46  */
47
48 #include <vcoda.h>
49
50 #include <sys/param.h>
51 #include <sys/systm.h>
52 #include <sys/kernel.h>
53 #include <sys/proc.h>
54 #include <sys/malloc.h>
55 #include <sys/conf.h>
56 #include <sys/namei.h>
57 #include <sys/mount.h>
58 #include <sys/select.h>
59
60 #include <vm/vm_zone.h>
61
62 #include <coda/coda.h>
63 #include <coda/cnode.h>
64 #include <coda/coda_vfsops.h>
65 #include <coda/coda_venus.h>
66 #include <coda/coda_subr.h>
67 #include <coda/coda_opstats.h>
68
69 MALLOC_DEFINE(M_CODA, "CODA storage", "Various Coda Structures");
70
71 int codadebug = 0;
72 int coda_vfsop_print_entry = 0;
73 #define ENTRY    if(coda_vfsop_print_entry) myprintf(("Entered %s\n",__FUNCTION__))
74
75 struct vnode *coda_ctlvp;
76 struct coda_mntinfo coda_mnttbl[NVCODA]; /* indexed by minor device number */
77
78 /* structure to keep statistics of internally generated/satisfied calls */
79
80 struct coda_op_stats coda_vfsopstats[CODA_VFSOPS_SIZE];
81
82 #define MARK_ENTRY(op) (coda_vfsopstats[op].entries++)
83 #define MARK_INT_SAT(op) (coda_vfsopstats[op].sat_intrn++)
84 #define MARK_INT_FAIL(op) (coda_vfsopstats[op].unsat_intrn++)
85 #define MRAK_INT_GEN(op) (coda_vfsopstats[op].gen_intrn++)
86
87 extern int coda_nc_initialized;     /* Set if cache has been initialized */
88 extern int vc_nb_open __P((dev_t, int, int, d_thread_t *));
89
90 int
91 coda_vfsopstats_init(void)
92 {
93         register int i;
94         
95         for (i=0;i<CODA_VFSOPS_SIZE;i++) {
96                 coda_vfsopstats[i].opcode = i;
97                 coda_vfsopstats[i].entries = 0;
98                 coda_vfsopstats[i].sat_intrn = 0;
99                 coda_vfsopstats[i].unsat_intrn = 0;
100                 coda_vfsopstats[i].gen_intrn = 0;
101         }
102         
103         return 0;
104 }
105
106 /*
107  * cfs mount vfsop
108  * Set up mount info record and attach it to vfs struct.
109  */
110 /*ARGSUSED*/
111 int
112 coda_mount(vfsp, path, data, ndp, td)
113     struct mount *vfsp;         /* Allocated and initialized by mount(2) */
114     char *path;                 /* path covered: ignored by the fs-layer */
115     caddr_t data;               /* Need to define a data type for this in netbsd? */
116     struct nameidata *ndp;      /* Clobber this to lookup the device name */
117     struct thread *td;          /* The ever-famous proc pointer */
118 {
119     struct vnode *dvp;
120     struct cnode *cp;
121     dev_t dev;
122     struct coda_mntinfo *mi;
123     struct vnode *rootvp;
124     ViceFid rootfid;
125     ViceFid ctlfid;
126     int error;
127
128     ENTRY;
129
130     coda_vfsopstats_init();
131     coda_vnodeopstats_init();
132     
133     MARK_ENTRY(CODA_MOUNT_STATS);
134     if (CODA_MOUNTED(vfsp)) {
135         MARK_INT_FAIL(CODA_MOUNT_STATS);
136         return(EBUSY);
137     }
138     
139     /* Validate mount device.  Similar to getmdev(). */
140     NDINIT(ndp, LOOKUP, FOLLOW, UIO_USERSPACE, data, td);
141     error = namei(ndp);
142     dvp = ndp->ni_vp;
143
144     if (error) {
145         MARK_INT_FAIL(CODA_MOUNT_STATS);
146         return (error);
147     }
148     if (dvp->v_type != VCHR) {
149         MARK_INT_FAIL(CODA_MOUNT_STATS);
150         vrele(dvp);
151         NDFREE(ndp, NDF_ONLY_PNBUF);
152         return(ENXIO);
153     }
154     dev = dvp->v_rdev;
155     vrele(dvp);
156     NDFREE(ndp, NDF_ONLY_PNBUF);
157
158     /*
159      * See if the device table matches our expectations.
160      */
161     if (devsw(dev)->d_open != vc_nb_open)
162     {
163         MARK_INT_FAIL(CODA_MOUNT_STATS);
164         return(ENXIO);
165     }
166     
167     if (minor(dev) >= NVCODA || minor(dev) < 0) {
168         MARK_INT_FAIL(CODA_MOUNT_STATS);
169         return(ENXIO);
170     }
171     
172     /*
173      * Initialize the mount record and link it to the vfs struct
174      */
175     mi = &coda_mnttbl[minor(dev)];
176     
177     if (!VC_OPEN(&mi->mi_vcomm)) {
178         MARK_INT_FAIL(CODA_MOUNT_STATS);
179         return(ENODEV);
180     }
181     
182     /* No initialization (here) of mi_vcomm! */
183     vfsp->mnt_data = (qaddr_t)mi;
184     vfs_getnewfsid (vfsp);
185
186     mi->mi_vfsp = vfsp;
187     
188     /*
189      * Make a root vnode to placate the Vnode interface, but don't
190      * actually make the CODA_ROOT call to venus until the first call
191      * to coda_root in case a server is down while venus is starting.
192      */
193     rootfid.Volume = 0;
194     rootfid.Vnode = 0;
195     rootfid.Unique = 0;
196     cp = make_coda_node(&rootfid, vfsp, VDIR);
197     rootvp = CTOV(cp);
198     rootvp->v_flag |= VROOT;
199         
200     ctlfid.Volume = CTL_VOL;
201     ctlfid.Vnode = CTL_VNO;
202     ctlfid.Unique = CTL_UNI;
203 /*  cp = make_coda_node(&ctlfid, vfsp, VCHR);
204     The above code seems to cause a loop in the cnode links.
205     I don't totally understand when it happens, it is caught
206     when closing down the system.
207  */
208     cp = make_coda_node(&ctlfid, 0, VCHR);
209
210     coda_ctlvp = CTOV(cp);
211
212     /* Add vfs and rootvp to chain of vfs hanging off mntinfo */
213     mi->mi_vfsp = vfsp;
214     mi->mi_rootvp = rootvp;
215     
216     /* set filesystem block size */
217     vfsp->mnt_stat.f_bsize = 8192;          /* XXX -JJK */
218
219     /* Set f_iosize.  XXX -- inamura@isl.ntt.co.jp. 
220        For vnode_pager_haspage() references. The value should be obtained 
221        from underlying UFS. */
222     /* Checked UFS. iosize is set as 8192 */
223     vfsp->mnt_stat.f_iosize = 8192;
224
225     /* error is currently guaranteed to be zero, but in case some
226        code changes... */
227     CODADEBUG(1,
228              myprintf(("coda_mount returned %d\n",error)););
229     if (error)
230         MARK_INT_FAIL(CODA_MOUNT_STATS);
231     else
232         MARK_INT_SAT(CODA_MOUNT_STATS);
233     
234     return(error);
235 }
236
237 int
238 coda_unmount(vfsp, mntflags, td)
239     struct mount *vfsp;
240     int mntflags;
241     struct thread *td;
242 {
243     struct coda_mntinfo *mi = vftomi(vfsp);
244     int active, error = 0;
245     
246     ENTRY;
247     MARK_ENTRY(CODA_UMOUNT_STATS);
248     if (!CODA_MOUNTED(vfsp)) {
249         MARK_INT_FAIL(CODA_UMOUNT_STATS);
250         return(EINVAL);
251     }
252     
253     if (mi->mi_vfsp == vfsp) {  /* We found the victim */
254         if (!IS_UNMOUNTING(VTOC(mi->mi_rootvp)))
255             return (EBUSY);     /* Venus is still running */
256
257 #ifdef  DEBUG
258         printf("coda_unmount: ROOT: vp %p, cp %p\n", mi->mi_rootvp, VTOC(mi->mi_rootvp));
259 #endif
260         vrele(mi->mi_rootvp);
261
262         active = coda_kill(vfsp, NOT_DOWNCALL);
263         mi->mi_rootvp->v_flag &= ~VROOT;
264         error = vflush(mi->mi_vfsp, 0, FORCECLOSE);
265         printf("coda_unmount: active = %d, vflush active %d\n", active, error);
266         error = 0;
267         /* I'm going to take this out to allow lookups to go through. I'm
268          * not sure it's important anyway. -- DCS 2/2/94
269          */
270         /* vfsp->VFS_DATA = NULL; */
271
272         /* No more vfsp's to hold onto */
273         mi->mi_vfsp = NULL;
274         mi->mi_rootvp = NULL;
275
276         if (error)
277             MARK_INT_FAIL(CODA_UMOUNT_STATS);
278         else
279             MARK_INT_SAT(CODA_UMOUNT_STATS);
280
281         return(error);
282     }
283     return (EINVAL);
284 }
285
286 /*
287  * find root of cfs
288  */
289 int
290 coda_root(vfsp, vpp)
291         struct mount *vfsp;
292         struct vnode **vpp;
293 {
294     struct coda_mntinfo *mi = vftomi(vfsp);
295     struct vnode **result;
296     int error;
297     struct thread *td = curthread;    /* XXX - bnoble */
298     struct ucred *cred;
299     ViceFid VFid;
300
301     KKASSERT(td->td_proc);
302     cred = td->td_proc->p_ucred;
303
304     ENTRY;
305     MARK_ENTRY(CODA_ROOT_STATS);
306     result = NULL;
307     
308     if (vfsp == mi->mi_vfsp) {
309         if ((VTOC(mi->mi_rootvp)->c_fid.Volume != 0) ||
310             (VTOC(mi->mi_rootvp)->c_fid.Vnode != 0) ||
311             (VTOC(mi->mi_rootvp)->c_fid.Unique != 0))
312             { /* Found valid root. */
313                 *vpp = mi->mi_rootvp;
314                 /* On Mach, this is vref.  On NetBSD, VOP_LOCK */
315 #if     1
316                 vref(*vpp);
317                 vn_lock(*vpp, LK_EXCLUSIVE, td);
318 #else
319                 vget(*vpp, LK_EXCLUSIVE, td);
320 #endif
321                 MARK_INT_SAT(CODA_ROOT_STATS);
322                 return(0);
323             }
324     }
325
326     error = venus_root(vftomi(vfsp), cred, td, &VFid);
327
328     if (!error) {
329         /*
330          * Save the new rootfid in the cnode, and rehash the cnode into the
331          * cnode hash with the new fid key.
332          */
333         coda_unsave(VTOC(mi->mi_rootvp));
334         VTOC(mi->mi_rootvp)->c_fid = VFid;
335         coda_save(VTOC(mi->mi_rootvp));
336
337         *vpp = mi->mi_rootvp;
338 #if     1
339         vref(*vpp);
340         vn_lock(*vpp, LK_EXCLUSIVE, td);
341 #else
342         vget(*vpp, LK_EXCLUSIVE, td);
343 #endif
344
345         MARK_INT_SAT(CODA_ROOT_STATS);
346         goto exit;
347     } else if (error == ENODEV || error == EINTR) {
348         /* Gross hack here! */
349         /*
350          * If Venus fails to respond to the CODA_ROOT call, coda_call returns
351          * ENODEV. Return the uninitialized root vnode to allow vfs
352          * operations such as unmount to continue. Without this hack,
353          * there is no way to do an unmount if Venus dies before a 
354          * successful CODA_ROOT call is done. All vnode operations 
355          * will fail.
356          */
357         *vpp = mi->mi_rootvp;
358 #if     1
359         vref(*vpp);
360         vn_lock(*vpp, LK_EXCLUSIVE, td);
361 #else
362         vget(*vpp, LK_EXCLUSIVE, td);
363 #endif
364
365         MARK_INT_FAIL(CODA_ROOT_STATS);
366         error = 0;
367         goto exit;
368     } else {
369         CODADEBUG( CODA_ROOT, myprintf(("error %d in CODA_ROOT\n", error)); );
370         MARK_INT_FAIL(CODA_ROOT_STATS);
371                 
372         goto exit;
373     }
374
375  exit:
376     return(error);
377 }
378
379 /*
380  * Get file system statistics.
381  */
382 int
383 coda_nb_statfs(vfsp, sbp, td)
384     register struct mount *vfsp;
385     struct statfs *sbp;
386     struct thread *td;
387 {
388     ENTRY;
389 /*  MARK_ENTRY(CODA_STATFS_STATS); */
390     if (!CODA_MOUNTED(vfsp)) {
391 /*      MARK_INT_FAIL(CODA_STATFS_STATS);*/
392         return(EINVAL);
393     }
394     
395     bzero(sbp, sizeof(struct statfs));
396     /* XXX - what to do about f_flags, others? --bnoble */
397     /* Below This is what AFS does
398         #define NB_SFS_SIZ 0x895440
399      */
400     /* Note: Normal fs's have a bsize of 0x400 == 1024 */
401     sbp->f_type = vfsp->mnt_vfc->vfc_typenum;
402     sbp->f_bsize = 8192; /* XXX */
403     sbp->f_iosize = 8192; /* XXX */
404 #define NB_SFS_SIZ 0x8AB75D
405     sbp->f_blocks = NB_SFS_SIZ;
406     sbp->f_bfree = NB_SFS_SIZ;
407     sbp->f_bavail = NB_SFS_SIZ;
408     sbp->f_files = NB_SFS_SIZ;
409     sbp->f_ffree = NB_SFS_SIZ;
410     bcopy((caddr_t)&(vfsp->mnt_stat.f_fsid), (caddr_t)&(sbp->f_fsid), sizeof (fsid_t));
411     snprintf(sbp->f_mntonname, sizeof(sbp->f_mntonname), "/coda");
412     snprintf(sbp->f_mntfromname, sizeof(sbp->f_mntfromname), "CODA");
413 /*  MARK_INT_SAT(CODA_STATFS_STATS); */
414     return(0);
415 }
416
417 /*
418  * Flush any pending I/O.
419  */
420 int
421 coda_sync(vfsp, waitfor, cred, td)
422     struct mount *vfsp;
423     int    waitfor;
424     struct ucred *cred;
425     struct thread *td;
426 {
427     ENTRY;
428     MARK_ENTRY(CODA_SYNC_STATS);
429     MARK_INT_SAT(CODA_SYNC_STATS);
430     return(0);
431 }
432
433 /* 
434  * fhtovp is now what vget used to be in 4.3-derived systems.  For
435  * some silly reason, vget is now keyed by a 32 bit ino_t, rather than
436  * a type-specific fid.  
437  */
438 int
439 coda_fhtovp(vfsp, fhp, nam, vpp, exflagsp, creadanonp)
440     register struct mount *vfsp;    
441     struct fid *fhp;
442     struct mbuf *nam;
443     struct vnode **vpp;
444     int *exflagsp;
445     struct ucred **creadanonp;
446 {
447     struct cfid *cfid = (struct cfid *)fhp;
448     struct cnode *cp = 0;
449     int error;
450     struct thread *td = curthread; /* XXX -mach */
451     struct ucred *cred;
452     ViceFid VFid;
453     int vtype;
454
455     KKASSERT(td->td_proc);
456     cred = td->td_proc->p_ucred;
457
458     ENTRY;
459     
460     MARK_ENTRY(CODA_VGET_STATS);
461     /* Check for vget of control object. */
462     if (IS_CTL_FID(&cfid->cfid_fid)) {
463         *vpp = coda_ctlvp;
464         vref(coda_ctlvp);
465         MARK_INT_SAT(CODA_VGET_STATS);
466         return(0);
467     }
468     
469     error = venus_fhtovp(vftomi(vfsp), &cfid->cfid_fid, cred, td, &VFid, &vtype);
470     
471     if (error) {
472         CODADEBUG(CODA_VGET, myprintf(("vget error %d\n",error));)
473             *vpp = (struct vnode *)0;
474     } else {
475         CODADEBUG(CODA_VGET, 
476                  myprintf(("vget: vol %lx vno %lx uni %lx type %d result %d\n",
477                         VFid.Volume, VFid.Vnode, VFid.Unique, vtype, error)); )
478             
479         cp = make_coda_node(&VFid, vfsp, vtype);
480         *vpp = CTOV(cp);
481     }
482     return(error);
483 }
484
485 /*
486  * To allow for greater ease of use, some vnodes may be orphaned when
487  * Venus dies.  Certain operations should still be allowed to go
488  * through, but without propagating ophan-ness.  So this function will
489  * get a new vnode for the file from the current run of Venus.  */
490  
491 int
492 getNewVnode(vpp)
493      struct vnode **vpp;
494 {
495     struct cfid cfid;
496     struct coda_mntinfo *mi = vftomi((*vpp)->v_mount);
497     
498     ENTRY;
499
500     cfid.cfid_len = (short)sizeof(ViceFid);
501     cfid.cfid_fid = VTOC(*vpp)->c_fid;  /* Structure assignment. */
502     /* XXX ? */
503
504     /* We're guessing that if set, the 1st element on the list is a
505      * valid vnode to use. If not, return ENODEV as venus is dead.
506      */
507     if (mi->mi_vfsp == NULL)
508         return ENODEV;
509     
510     return coda_fhtovp(mi->mi_vfsp, (struct fid*)&cfid, NULL, vpp,
511                       NULL, NULL);
512 }
513
514 #include <ufs/ufs/quota.h>
515 #include <ufs/ufs/ufsmount.h>
516 /* get the mount structure corresponding to a given device.  Assume 
517  * device corresponds to a UFS. Return NULL if no device is found.
518  */ 
519 struct mount *devtomp(dev)
520     dev_t dev;
521 {
522     struct mount *mp;
523    
524     TAILQ_FOREACH(mp, &mountlist, mnt_list) {
525         if (((VFSTOUFS(mp))->um_dev == dev)) {
526             /* mount corresponds to UFS and the device matches one we want */
527             return(mp); 
528         }
529     }
530     /* mount structure wasn't found */ 
531     return(NULL); 
532 }
533
534 struct vfsops coda_vfsops = {
535     coda_mount,
536     vfs_stdstart,
537     coda_unmount,
538     coda_root,
539     vfs_stdquotactl,
540     coda_nb_statfs,
541     coda_sync,
542     vfs_stdvget,
543     vfs_stdfhtovp,
544     vfs_stdcheckexp,
545     vfs_stdvptofh,
546     vfs_stdinit,
547     vfs_stduninit,
548     vfs_stdextattrctl,
549 };
550
551 VFS_SET(coda_vfsops, coda, VFCF_NETWORK);