proc->thread stage 4: rework the VFS and DEVICE subsystems to take thread
[dragonfly.git] / sys / vfs / ufs / ufs_quota.c
1 /*
2  * Copyright (c) 1982, 1986, 1990, 1993, 1995
3  *      The Regents of the University of California.  All rights reserved.
4  *
5  * This code is derived from software contributed to Berkeley by
6  * Robert Elz at The University of Melbourne.
7  *
8  * Redistribution and use in source and binary forms, with or without
9  * modification, are permitted provided that the following conditions
10  * are met:
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer.
13  * 2. Redistributions in binary form must reproduce the above copyright
14  *    notice, this list of conditions and the following disclaimer in the
15  *    documentation and/or other materials provided with the distribution.
16  * 3. All advertising materials mentioning features or use of this software
17  *    must display the following acknowledgement:
18  *      This product includes software developed by the University of
19  *      California, Berkeley and its contributors.
20  * 4. Neither the name of the University nor the names of its contributors
21  *    may be used to endorse or promote products derived from this software
22  *    without specific prior written permission.
23  *
24  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
25  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
26  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
27  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
28  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
29  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
30  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
31  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
32  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
33  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
34  * SUCH DAMAGE.
35  *
36  *      @(#)ufs_quota.c 8.5 (Berkeley) 5/20/95
37  * $FreeBSD: src/sys/ufs/ufs/ufs_quota.c,v 1.27.2.3 2002/01/15 10:33:32 phk Exp $
38  * $DragonFly: src/sys/vfs/ufs/ufs_quota.c,v 1.3 2003/06/25 03:56:12 dillon Exp $
39  */
40
41 #include <sys/param.h>
42 #include <sys/systm.h>
43 #include <sys/kernel.h>
44 #include <sys/malloc.h>
45 #include <sys/fcntl.h>
46 #include <sys/proc.h>
47 #include <sys/namei.h>
48 #include <sys/vnode.h>
49 #include <sys/mount.h>
50 #include <vm/vm_zone.h>
51
52 #include <ufs/ufs/quota.h>
53 #include <ufs/ufs/inode.h>
54 #include <ufs/ufs/ufsmount.h>
55
56 static MALLOC_DEFINE(M_DQUOT, "UFS quota", "UFS quota entries");
57
58 /*
59  * Quota name to error message mapping.
60  */
61 static char *quotatypes[] = INITQFNAMES;
62
63 static int chkdqchg __P((struct inode *, long, struct ucred *, int));
64 static int chkiqchg __P((struct inode *, long, struct ucred *, int));
65 static int dqget __P((struct vnode *,
66                 u_long, struct ufsmount *, int, struct dquot **));
67 static int dqsync __P((struct vnode *, struct dquot *));
68 static void dqflush __P((struct vnode *));
69
70 #ifdef DIAGNOSTIC
71 static void dqref __P((struct dquot *));
72 static void chkdquot __P((struct inode *));
73 #endif
74
75 /*
76  * Set up the quotas for an inode.
77  *
78  * This routine completely defines the semantics of quotas.
79  * If other criterion want to be used to establish quotas, the
80  * MAXQUOTAS value in quotas.h should be increased, and the
81  * additional dquots set up here.
82  */
83 int
84 getinoquota(ip)
85         register struct inode *ip;
86 {
87         struct ufsmount *ump;
88         struct vnode *vp = ITOV(ip);
89         int error;
90
91         ump = VFSTOUFS(vp->v_mount);
92         /*
93          * Set up the user quota based on file uid.
94          * EINVAL means that quotas are not enabled.
95          */
96         if (ip->i_dquot[USRQUOTA] == NODQUOT &&
97             (error =
98                 dqget(vp, ip->i_uid, ump, USRQUOTA, &ip->i_dquot[USRQUOTA])) &&
99             error != EINVAL)
100                 return (error);
101         /*
102          * Set up the group quota based on file gid.
103          * EINVAL means that quotas are not enabled.
104          */
105         if (ip->i_dquot[GRPQUOTA] == NODQUOT &&
106             (error =
107                 dqget(vp, ip->i_gid, ump, GRPQUOTA, &ip->i_dquot[GRPQUOTA])) &&
108             error != EINVAL)
109                 return (error);
110         return (0);
111 }
112
113 /*
114  * Update disk usage, and take corrective action.
115  */
116 int
117 chkdq(ip, change, cred, flags)
118         register struct inode *ip;
119         long change;
120         struct ucred *cred;
121         int flags;
122 {
123         register struct dquot *dq;
124         register int i;
125         int ncurblocks, error;
126
127 #ifdef DIAGNOSTIC
128         if ((flags & CHOWN) == 0)
129                 chkdquot(ip);
130 #endif
131         if (change == 0)
132                 return (0);
133         if (change < 0) {
134                 for (i = 0; i < MAXQUOTAS; i++) {
135                         if ((dq = ip->i_dquot[i]) == NODQUOT)
136                                 continue;
137                         while (dq->dq_flags & DQ_LOCK) {
138                                 dq->dq_flags |= DQ_WANT;
139                                 (void) tsleep((caddr_t)dq, PINOD+1, "chkdq1", 0);
140                         }
141                         ncurblocks = dq->dq_curblocks + change;
142                         if (ncurblocks >= 0)
143                                 dq->dq_curblocks = ncurblocks;
144                         else
145                                 dq->dq_curblocks = 0;
146                         dq->dq_flags &= ~DQ_BLKS;
147                         dq->dq_flags |= DQ_MOD;
148                 }
149                 return (0);
150         }
151         if ((flags & FORCE) == 0 && cred->cr_uid != 0) {
152                 for (i = 0; i < MAXQUOTAS; i++) {
153                         if ((dq = ip->i_dquot[i]) == NODQUOT)
154                                 continue;
155                         error = chkdqchg(ip, change, cred, i);
156                         if (error)
157                                 return (error);
158                 }
159         }
160         for (i = 0; i < MAXQUOTAS; i++) {
161                 if ((dq = ip->i_dquot[i]) == NODQUOT)
162                         continue;
163                 while (dq->dq_flags & DQ_LOCK) {
164                         dq->dq_flags |= DQ_WANT;
165                         (void) tsleep((caddr_t)dq, PINOD+1, "chkdq2", 0);
166                 }
167                 /* Reset timer when crossing soft limit */
168                 if (dq->dq_curblocks + change >= dq->dq_bsoftlimit &&
169                     dq->dq_curblocks < dq->dq_bsoftlimit)
170                         dq->dq_btime = time_second +
171                             VFSTOUFS(ITOV(ip)->v_mount)->um_btime[i];
172                 dq->dq_curblocks += change;
173                 dq->dq_flags |= DQ_MOD;
174         }
175         return (0);
176 }
177
178 /*
179  * Check for a valid change to a users allocation.
180  * Issue an error message if appropriate.
181  */
182 static int
183 chkdqchg(ip, change, cred, type)
184         struct inode *ip;
185         long change;
186         struct ucred *cred;
187         int type;
188 {
189         register struct dquot *dq = ip->i_dquot[type];
190         long ncurblocks = dq->dq_curblocks + change;
191
192         /*
193          * If user would exceed their hard limit, disallow space allocation.
194          */
195         if (ncurblocks >= dq->dq_bhardlimit && dq->dq_bhardlimit) {
196                 if ((dq->dq_flags & DQ_BLKS) == 0 &&
197                     ip->i_uid == cred->cr_uid) {
198                         uprintf("\n%s: write failed, %s disk limit reached\n",
199                             ITOV(ip)->v_mount->mnt_stat.f_mntonname,
200                             quotatypes[type]);
201                         dq->dq_flags |= DQ_BLKS;
202                 }
203                 return (EDQUOT);
204         }
205         /*
206          * If user is over their soft limit for too long, disallow space
207          * allocation. Reset time limit as they cross their soft limit.
208          */
209         if (ncurblocks >= dq->dq_bsoftlimit && dq->dq_bsoftlimit) {
210                 if (dq->dq_curblocks < dq->dq_bsoftlimit) {
211                         dq->dq_btime = time_second +
212                             VFSTOUFS(ITOV(ip)->v_mount)->um_btime[type];
213                         if (ip->i_uid == cred->cr_uid)
214                                 uprintf("\n%s: warning, %s %s\n",
215                                     ITOV(ip)->v_mount->mnt_stat.f_mntonname,
216                                     quotatypes[type], "disk quota exceeded");
217                         return (0);
218                 }
219                 if (time_second > dq->dq_btime) {
220                         if ((dq->dq_flags & DQ_BLKS) == 0 &&
221                             ip->i_uid == cred->cr_uid) {
222                                 uprintf("\n%s: write failed, %s %s\n",
223                                     ITOV(ip)->v_mount->mnt_stat.f_mntonname,
224                                     quotatypes[type],
225                                     "disk quota exceeded for too long");
226                                 dq->dq_flags |= DQ_BLKS;
227                         }
228                         return (EDQUOT);
229                 }
230         }
231         return (0);
232 }
233
234 /*
235  * Check the inode limit, applying corrective action.
236  */
237 int
238 chkiq(ip, change, cred, flags)
239         register struct inode *ip;
240         long change;
241         struct ucred *cred;
242         int flags;
243 {
244         register struct dquot *dq;
245         register int i;
246         int ncurinodes, error;
247
248 #ifdef DIAGNOSTIC
249         if ((flags & CHOWN) == 0)
250                 chkdquot(ip);
251 #endif
252         if (change == 0)
253                 return (0);
254         if (change < 0) {
255                 for (i = 0; i < MAXQUOTAS; i++) {
256                         if ((dq = ip->i_dquot[i]) == NODQUOT)
257                                 continue;
258                         while (dq->dq_flags & DQ_LOCK) {
259                                 dq->dq_flags |= DQ_WANT;
260                                 (void) tsleep((caddr_t)dq, PINOD+1, "chkiq1", 0);
261                         }
262                         ncurinodes = dq->dq_curinodes + change;
263                         if (ncurinodes >= 0)
264                                 dq->dq_curinodes = ncurinodes;
265                         else
266                                 dq->dq_curinodes = 0;
267                         dq->dq_flags &= ~DQ_INODS;
268                         dq->dq_flags |= DQ_MOD;
269                 }
270                 return (0);
271         }
272         if ((flags & FORCE) == 0 && cred->cr_uid != 0) {
273                 for (i = 0; i < MAXQUOTAS; i++) {
274                         if ((dq = ip->i_dquot[i]) == NODQUOT)
275                                 continue;
276                         error = chkiqchg(ip, change, cred, i);
277                         if (error)
278                                 return (error);
279                 }
280         }
281         for (i = 0; i < MAXQUOTAS; i++) {
282                 if ((dq = ip->i_dquot[i]) == NODQUOT)
283                         continue;
284                 while (dq->dq_flags & DQ_LOCK) {
285                         dq->dq_flags |= DQ_WANT;
286                         (void) tsleep((caddr_t)dq, PINOD+1, "chkiq2", 0);
287                 }
288                 /* Reset timer when crossing soft limit */
289                 if (dq->dq_curinodes + change >= dq->dq_isoftlimit &&
290                     dq->dq_curinodes < dq->dq_isoftlimit)
291                         dq->dq_itime = time_second +
292                             VFSTOUFS(ITOV(ip)->v_mount)->um_itime[i];
293                 dq->dq_curinodes += change;
294                 dq->dq_flags |= DQ_MOD;
295         }
296         return (0);
297 }
298
299 /*
300  * Check for a valid change to a users allocation.
301  * Issue an error message if appropriate.
302  */
303 static int
304 chkiqchg(ip, change, cred, type)
305         struct inode *ip;
306         long change;
307         struct ucred *cred;
308         int type;
309 {
310         register struct dquot *dq = ip->i_dquot[type];
311         long ncurinodes = dq->dq_curinodes + change;
312
313         /*
314          * If user would exceed their hard limit, disallow inode allocation.
315          */
316         if (ncurinodes >= dq->dq_ihardlimit && dq->dq_ihardlimit) {
317                 if ((dq->dq_flags & DQ_INODS) == 0 &&
318                     ip->i_uid == cred->cr_uid) {
319                         uprintf("\n%s: write failed, %s inode limit reached\n",
320                             ITOV(ip)->v_mount->mnt_stat.f_mntonname,
321                             quotatypes[type]);
322                         dq->dq_flags |= DQ_INODS;
323                 }
324                 return (EDQUOT);
325         }
326         /*
327          * If user is over their soft limit for too long, disallow inode
328          * allocation. Reset time limit as they cross their soft limit.
329          */
330         if (ncurinodes >= dq->dq_isoftlimit && dq->dq_isoftlimit) {
331                 if (dq->dq_curinodes < dq->dq_isoftlimit) {
332                         dq->dq_itime = time_second +
333                             VFSTOUFS(ITOV(ip)->v_mount)->um_itime[type];
334                         if (ip->i_uid == cred->cr_uid)
335                                 uprintf("\n%s: warning, %s %s\n",
336                                     ITOV(ip)->v_mount->mnt_stat.f_mntonname,
337                                     quotatypes[type], "inode quota exceeded");
338                         return (0);
339                 }
340                 if (time_second > dq->dq_itime) {
341                         if ((dq->dq_flags & DQ_INODS) == 0 &&
342                             ip->i_uid == cred->cr_uid) {
343                                 uprintf("\n%s: write failed, %s %s\n",
344                                     ITOV(ip)->v_mount->mnt_stat.f_mntonname,
345                                     quotatypes[type],
346                                     "inode quota exceeded for too long");
347                                 dq->dq_flags |= DQ_INODS;
348                         }
349                         return (EDQUOT);
350                 }
351         }
352         return (0);
353 }
354
355 #ifdef DIAGNOSTIC
356 /*
357  * On filesystems with quotas enabled, it is an error for a file to change
358  * size and not to have a dquot structure associated with it.
359  */
360 static void
361 chkdquot(ip)
362         register struct inode *ip;
363 {
364         struct ufsmount *ump = VFSTOUFS(ITOV(ip)->v_mount);
365         register int i;
366
367         for (i = 0; i < MAXQUOTAS; i++) {
368                 if (ump->um_quotas[i] == NULLVP ||
369                     (ump->um_qflags[i] & (QTF_OPENING|QTF_CLOSING)))
370                         continue;
371                 if (ip->i_dquot[i] == NODQUOT) {
372                         vprint("chkdquot: missing dquot", ITOV(ip));
373                         panic("chkdquot: missing dquot");
374                 }
375         }
376 }
377 #endif
378
379 /*
380  * Code to process quotactl commands.
381  */
382
383 /*
384  * Q_QUOTAON - set up a quota file for a particular file system.
385  */
386 int
387 quotaon(td, mp, type, fname)
388         struct thread *td;
389         struct mount *mp;
390         register int type;
391         caddr_t fname;
392 {
393         struct ufsmount *ump = VFSTOUFS(mp);
394         struct vnode *vp, **vpp;
395         struct vnode *nextvp;
396         struct dquot *dq;
397         int error;
398         struct nameidata nd;
399         struct ucred *cred;
400
401         KKASSERT(td->td_proc);
402         cred = td->td_proc->p_ucred;
403
404         vpp = &ump->um_quotas[type];
405         NDINIT(&nd, LOOKUP, FOLLOW, UIO_USERSPACE, fname, td);
406         error = vn_open(&nd, FREAD|FWRITE, 0);
407         if (error)
408                 return (error);
409         NDFREE(&nd, NDF_ONLY_PNBUF);
410         vp = nd.ni_vp;
411         VOP_UNLOCK(vp, 0, td);
412         if (vp->v_type != VREG) {
413                 (void) vn_close(vp, FREAD|FWRITE, cred, td);
414                 return (EACCES);
415         }
416         if (*vpp != vp)
417                 quotaoff(td, mp, type);
418         ump->um_qflags[type] |= QTF_OPENING;
419         mp->mnt_flag |= MNT_QUOTA;
420         vp->v_flag |= VSYSTEM;
421         *vpp = vp;
422         /*
423          * Save the credential of the process that turned on quotas.
424          * Set up the time limits for this quota.
425          */
426         crhold(cred);
427         ump->um_cred[type] = cred;
428         ump->um_btime[type] = MAX_DQ_TIME;
429         ump->um_itime[type] = MAX_IQ_TIME;
430         if (dqget(NULLVP, 0, ump, type, &dq) == 0) {
431                 if (dq->dq_btime > 0)
432                         ump->um_btime[type] = dq->dq_btime;
433                 if (dq->dq_itime > 0)
434                         ump->um_itime[type] = dq->dq_itime;
435                 dqrele(NULLVP, dq);
436         }
437         /*
438          * Search vnodes associated with this mount point,
439          * adding references to quota file being opened.
440          * NB: only need to add dquot's for inodes being modified.
441          */
442 again:
443         for (vp = TAILQ_FIRST(&mp->mnt_nvnodelist); vp != NULL; vp = nextvp) {
444                 nextvp = TAILQ_NEXT(vp, v_nmntvnodes);
445                 if (vp->v_type == VNON || vp->v_writecount == 0)
446                         continue;
447                 if (vget(vp, LK_EXCLUSIVE, td))
448                         goto again;
449                 error = getinoquota(VTOI(vp));
450                 if (error) {
451                         vput(vp);
452                         break;
453                 }
454                 vput(vp);
455                 if (TAILQ_NEXT(vp, v_nmntvnodes) != nextvp || vp->v_mount != mp)
456                         goto again;
457         }
458         ump->um_qflags[type] &= ~QTF_OPENING;
459         if (error)
460                 quotaoff(td, mp, type);
461         return (error);
462 }
463
464 /*
465  * Q_QUOTAOFF - turn off disk quotas for a filesystem.
466  */
467 int
468 quotaoff(struct thread *td, struct mount *mp, int type)
469 {
470         struct vnode *vp;
471         struct vnode *qvp, *nextvp;
472         struct ufsmount *ump = VFSTOUFS(mp);
473         struct dquot *dq;
474         struct inode *ip;
475         struct ucred *cred;
476         int error;
477
478         KKASSERT(td->td_proc);
479         cred = td->td_proc->p_ucred;
480
481         if ((qvp = ump->um_quotas[type]) == NULLVP)
482                 return (0);
483         ump->um_qflags[type] |= QTF_CLOSING;
484         /*
485          * Search vnodes associated with this mount point,
486          * deleting any references to quota file being closed.
487          */
488 again:
489         for (vp = TAILQ_FIRST(&mp->mnt_nvnodelist); vp != NULL; vp = nextvp) {
490                 nextvp = TAILQ_NEXT(vp, v_nmntvnodes);
491                 if (vp->v_type == VNON)
492                         continue;
493                 if (vget(vp, LK_EXCLUSIVE, td))
494                         goto again;
495                 ip = VTOI(vp);
496                 dq = ip->i_dquot[type];
497                 ip->i_dquot[type] = NODQUOT;
498                 dqrele(vp, dq);
499                 vput(vp);
500                 if (TAILQ_NEXT(vp, v_nmntvnodes) != nextvp || vp->v_mount != mp)
501                         goto again;
502         }
503         dqflush(qvp);
504         qvp->v_flag &= ~VSYSTEM;
505         error = vn_close(qvp, FREAD|FWRITE, cred, td);
506         ump->um_quotas[type] = NULLVP;
507         crfree(ump->um_cred[type]);
508         ump->um_cred[type] = NOCRED;
509         ump->um_qflags[type] &= ~QTF_CLOSING;
510         for (type = 0; type < MAXQUOTAS; type++)
511                 if (ump->um_quotas[type] != NULLVP)
512                         break;
513         if (type == MAXQUOTAS)
514                 mp->mnt_flag &= ~MNT_QUOTA;
515         return (error);
516 }
517
518 /*
519  * Q_GETQUOTA - return current values in a dqblk structure.
520  */
521 int
522 getquota(mp, id, type, addr)
523         struct mount *mp;
524         u_long id;
525         int type;
526         caddr_t addr;
527 {
528         struct dquot *dq;
529         int error;
530
531         error = dqget(NULLVP, id, VFSTOUFS(mp), type, &dq);
532         if (error)
533                 return (error);
534         error = copyout((caddr_t)&dq->dq_dqb, addr, sizeof (struct dqblk));
535         dqrele(NULLVP, dq);
536         return (error);
537 }
538
539 /*
540  * Q_SETQUOTA - assign an entire dqblk structure.
541  */
542 int
543 setquota(mp, id, type, addr)
544         struct mount *mp;
545         u_long id;
546         int type;
547         caddr_t addr;
548 {
549         register struct dquot *dq;
550         struct dquot *ndq;
551         struct ufsmount *ump = VFSTOUFS(mp);
552         struct dqblk newlim;
553         int error;
554
555         error = copyin(addr, (caddr_t)&newlim, sizeof (struct dqblk));
556         if (error)
557                 return (error);
558         error = dqget(NULLVP, id, ump, type, &ndq);
559         if (error)
560                 return (error);
561         dq = ndq;
562         while (dq->dq_flags & DQ_LOCK) {
563                 dq->dq_flags |= DQ_WANT;
564                 (void) tsleep((caddr_t)dq, PINOD+1, "setqta", 0);
565         }
566         /*
567          * Copy all but the current values.
568          * Reset time limit if previously had no soft limit or were
569          * under it, but now have a soft limit and are over it.
570          */
571         newlim.dqb_curblocks = dq->dq_curblocks;
572         newlim.dqb_curinodes = dq->dq_curinodes;
573         if (dq->dq_id != 0) {
574                 newlim.dqb_btime = dq->dq_btime;
575                 newlim.dqb_itime = dq->dq_itime;
576         }
577         if (newlim.dqb_bsoftlimit &&
578             dq->dq_curblocks >= newlim.dqb_bsoftlimit &&
579             (dq->dq_bsoftlimit == 0 || dq->dq_curblocks < dq->dq_bsoftlimit))
580                 newlim.dqb_btime = time_second + ump->um_btime[type];
581         if (newlim.dqb_isoftlimit &&
582             dq->dq_curinodes >= newlim.dqb_isoftlimit &&
583             (dq->dq_isoftlimit == 0 || dq->dq_curinodes < dq->dq_isoftlimit))
584                 newlim.dqb_itime = time_second + ump->um_itime[type];
585         dq->dq_dqb = newlim;
586         if (dq->dq_curblocks < dq->dq_bsoftlimit)
587                 dq->dq_flags &= ~DQ_BLKS;
588         if (dq->dq_curinodes < dq->dq_isoftlimit)
589                 dq->dq_flags &= ~DQ_INODS;
590         if (dq->dq_isoftlimit == 0 && dq->dq_bsoftlimit == 0 &&
591             dq->dq_ihardlimit == 0 && dq->dq_bhardlimit == 0)
592                 dq->dq_flags |= DQ_FAKE;
593         else
594                 dq->dq_flags &= ~DQ_FAKE;
595         dq->dq_flags |= DQ_MOD;
596         dqrele(NULLVP, dq);
597         return (0);
598 }
599
600 /*
601  * Q_SETUSE - set current inode and block usage.
602  */
603 int
604 setuse(mp, id, type, addr)
605         struct mount *mp;
606         u_long id;
607         int type;
608         caddr_t addr;
609 {
610         register struct dquot *dq;
611         struct ufsmount *ump = VFSTOUFS(mp);
612         struct dquot *ndq;
613         struct dqblk usage;
614         int error;
615
616         error = copyin(addr, (caddr_t)&usage, sizeof (struct dqblk));
617         if (error)
618                 return (error);
619         error = dqget(NULLVP, id, ump, type, &ndq);
620         if (error)
621                 return (error);
622         dq = ndq;
623         while (dq->dq_flags & DQ_LOCK) {
624                 dq->dq_flags |= DQ_WANT;
625                 (void) tsleep((caddr_t)dq, PINOD+1, "setuse", 0);
626         }
627         /*
628          * Reset time limit if have a soft limit and were
629          * previously under it, but are now over it.
630          */
631         if (dq->dq_bsoftlimit && dq->dq_curblocks < dq->dq_bsoftlimit &&
632             usage.dqb_curblocks >= dq->dq_bsoftlimit)
633                 dq->dq_btime = time_second + ump->um_btime[type];
634         if (dq->dq_isoftlimit && dq->dq_curinodes < dq->dq_isoftlimit &&
635             usage.dqb_curinodes >= dq->dq_isoftlimit)
636                 dq->dq_itime = time_second + ump->um_itime[type];
637         dq->dq_curblocks = usage.dqb_curblocks;
638         dq->dq_curinodes = usage.dqb_curinodes;
639         if (dq->dq_curblocks < dq->dq_bsoftlimit)
640                 dq->dq_flags &= ~DQ_BLKS;
641         if (dq->dq_curinodes < dq->dq_isoftlimit)
642                 dq->dq_flags &= ~DQ_INODS;
643         dq->dq_flags |= DQ_MOD;
644         dqrele(NULLVP, dq);
645         return (0);
646 }
647
648 /*
649  * Q_SYNC - sync quota files to disk.
650  */
651 int
652 qsync(struct mount *mp)
653 {
654         struct ufsmount *ump = VFSTOUFS(mp);
655         struct thread *td = curthread;          /* XXX */
656         struct vnode *vp, *nextvp;
657         struct dquot *dq;
658         int i, error;
659
660         /*
661          * Check if the mount point has any quotas.
662          * If not, simply return.
663          */
664         for (i = 0; i < MAXQUOTAS; i++)
665                 if (ump->um_quotas[i] != NULLVP)
666                         break;
667         if (i == MAXQUOTAS)
668                 return (0);
669         /*
670          * Search vnodes associated with this mount point,
671          * synchronizing any modified dquot structures.
672          */
673         simple_lock(&mntvnode_slock);
674 again:
675         for (vp = TAILQ_FIRST(&mp->mnt_nvnodelist); vp != NULL; vp = nextvp) {
676                 if (vp->v_mount != mp)
677                         goto again;
678                 nextvp = TAILQ_NEXT(vp, v_nmntvnodes);
679                 if (vp->v_type == VNON)
680                         continue;
681                 simple_lock(&vp->v_interlock);
682                 simple_unlock(&mntvnode_slock);
683                 error = vget(vp, LK_EXCLUSIVE | LK_NOWAIT | LK_INTERLOCK, td);
684                 if (error) {
685                         simple_lock(&mntvnode_slock);
686                         if (error == ENOENT)
687                                 goto again;
688                         continue;
689                 }
690                 for (i = 0; i < MAXQUOTAS; i++) {
691                         dq = VTOI(vp)->i_dquot[i];
692                         if (dq != NODQUOT && (dq->dq_flags & DQ_MOD))
693                                 dqsync(vp, dq);
694                 }
695                 vput(vp);
696                 simple_lock(&mntvnode_slock);
697                 if (TAILQ_NEXT(vp, v_nmntvnodes) != nextvp)
698                         goto again;
699         }
700         simple_unlock(&mntvnode_slock);
701         return (0);
702 }
703
704 /*
705  * Code pertaining to management of the in-core dquot data structures.
706  */
707 #define DQHASH(dqvp, id) \
708         (&dqhashtbl[((((intptr_t)(dqvp)) >> 8) + id) & dqhash])
709 static LIST_HEAD(dqhash, dquot) *dqhashtbl;
710 static u_long dqhash;
711
712 /*
713  * Dquot free list.
714  */
715 #define DQUOTINC        5       /* minimum free dquots desired */
716 static TAILQ_HEAD(dqfreelist, dquot) dqfreelist;
717 static long numdquot, desireddquot = DQUOTINC;
718
719 /*
720  * Initialize the quota system.
721  */
722 void
723 dqinit()
724 {
725
726         dqhashtbl = hashinit(desiredvnodes, M_DQUOT, &dqhash);
727         TAILQ_INIT(&dqfreelist);
728 }
729
730 /*
731  * Obtain a dquot structure for the specified identifier and quota file
732  * reading the information from the file if necessary.
733  */
734 static int
735 dqget(vp, id, ump, type, dqp)
736         struct vnode *vp;
737         u_long id;
738         register struct ufsmount *ump;
739         register int type;
740         struct dquot **dqp;
741 {
742         struct thread *td = curthread;          /* XXX */
743         struct dquot *dq;
744         struct dqhash *dqh;
745         struct vnode *dqvp;
746         struct iovec aiov;
747         struct uio auio;
748         int error;
749
750         dqvp = ump->um_quotas[type];
751         if (dqvp == NULLVP || (ump->um_qflags[type] & QTF_CLOSING)) {
752                 *dqp = NODQUOT;
753                 return (EINVAL);
754         }
755         /*
756          * Check the cache first.
757          */
758         dqh = DQHASH(dqvp, id);
759         for (dq = dqh->lh_first; dq; dq = dq->dq_hash.le_next) {
760                 if (dq->dq_id != id ||
761                     dq->dq_ump->um_quotas[dq->dq_type] != dqvp)
762                         continue;
763                 /*
764                  * Cache hit with no references.  Take
765                  * the structure off the free list.
766                  */
767                 if (dq->dq_cnt == 0)
768                         TAILQ_REMOVE(&dqfreelist, dq, dq_freelist);
769                 DQREF(dq);
770                 *dqp = dq;
771                 return (0);
772         }
773         /*
774          * Not in cache, allocate a new one.
775          */
776         if (dqfreelist.tqh_first == NODQUOT &&
777             numdquot < MAXQUOTAS * desiredvnodes)
778                 desireddquot += DQUOTINC;
779         if (numdquot < desireddquot) {
780                 dq = (struct dquot *)malloc(sizeof *dq, M_DQUOT, M_WAITOK);
781                 bzero((char *)dq, sizeof *dq);
782                 numdquot++;
783         } else {
784                 if ((dq = dqfreelist.tqh_first) == NULL) {
785                         tablefull("dquot");
786                         *dqp = NODQUOT;
787                         return (EUSERS);
788                 }
789                 if (dq->dq_cnt || (dq->dq_flags & DQ_MOD))
790                         panic("dqget: free dquot isn't");
791                 TAILQ_REMOVE(&dqfreelist, dq, dq_freelist);
792                 if (dq->dq_ump != NULL)
793                         LIST_REMOVE(dq, dq_hash);
794         }
795         /*
796          * Initialize the contents of the dquot structure.
797          */
798         if (vp != dqvp)
799                 vn_lock(dqvp, LK_EXCLUSIVE | LK_RETRY, td);
800         LIST_INSERT_HEAD(dqh, dq, dq_hash);
801         DQREF(dq);
802         dq->dq_flags = DQ_LOCK;
803         dq->dq_id = id;
804         dq->dq_ump = ump;
805         dq->dq_type = type;
806         auio.uio_iov = &aiov;
807         auio.uio_iovcnt = 1;
808         aiov.iov_base = (caddr_t)&dq->dq_dqb;
809         aiov.iov_len = sizeof (struct dqblk);
810         auio.uio_resid = sizeof (struct dqblk);
811         auio.uio_offset = (off_t)(id * sizeof (struct dqblk));
812         auio.uio_segflg = UIO_SYSSPACE;
813         auio.uio_rw = UIO_READ;
814         auio.uio_td = NULL;
815         error = VOP_READ(dqvp, &auio, 0, ump->um_cred[type]);
816         if (auio.uio_resid == sizeof(struct dqblk) && error == 0)
817                 bzero((caddr_t)&dq->dq_dqb, sizeof(struct dqblk));
818         if (vp != dqvp)
819                 VOP_UNLOCK(dqvp, 0, td);
820         if (dq->dq_flags & DQ_WANT)
821                 wakeup((caddr_t)dq);
822         dq->dq_flags = 0;
823         /*
824          * I/O error in reading quota file, release
825          * quota structure and reflect problem to caller.
826          */
827         if (error) {
828                 LIST_REMOVE(dq, dq_hash);
829                 dqrele(vp, dq);
830                 *dqp = NODQUOT;
831                 return (error);
832         }
833         /*
834          * Check for no limit to enforce.
835          * Initialize time values if necessary.
836          */
837         if (dq->dq_isoftlimit == 0 && dq->dq_bsoftlimit == 0 &&
838             dq->dq_ihardlimit == 0 && dq->dq_bhardlimit == 0)
839                 dq->dq_flags |= DQ_FAKE;
840         if (dq->dq_id != 0) {
841                 if (dq->dq_btime == 0)
842                         dq->dq_btime = time_second + ump->um_btime[type];
843                 if (dq->dq_itime == 0)
844                         dq->dq_itime = time_second + ump->um_itime[type];
845         }
846         *dqp = dq;
847         return (0);
848 }
849
850 #ifdef DIAGNOSTIC
851 /*
852  * Obtain a reference to a dquot.
853  */
854 static void
855 dqref(dq)
856         struct dquot *dq;
857 {
858
859         dq->dq_cnt++;
860 }
861 #endif
862
863 /*
864  * Release a reference to a dquot.
865  */
866 void
867 dqrele(vp, dq)
868         struct vnode *vp;
869         register struct dquot *dq;
870 {
871
872         if (dq == NODQUOT)
873                 return;
874         if (dq->dq_cnt > 1) {
875                 dq->dq_cnt--;
876                 return;
877         }
878         if (dq->dq_flags & DQ_MOD)
879                 (void) dqsync(vp, dq);
880         if (--dq->dq_cnt > 0)
881                 return;
882         TAILQ_INSERT_TAIL(&dqfreelist, dq, dq_freelist);
883 }
884
885 /*
886  * Update the disk quota in the quota file.
887  */
888 static int
889 dqsync(struct vnode *vp, struct dquot *dq)
890 {
891         struct thread *td = curthread;          /* XXX */
892         struct vnode *dqvp;
893         struct iovec aiov;
894         struct uio auio;
895         int error;
896
897         if (dq == NODQUOT)
898                 panic("dqsync: dquot");
899         if ((dq->dq_flags & DQ_MOD) == 0)
900                 return (0);
901         if ((dqvp = dq->dq_ump->um_quotas[dq->dq_type]) == NULLVP)
902                 panic("dqsync: file");
903         if (vp != dqvp)
904                 vn_lock(dqvp, LK_EXCLUSIVE | LK_RETRY, td);
905         while (dq->dq_flags & DQ_LOCK) {
906                 dq->dq_flags |= DQ_WANT;
907                 (void) tsleep((caddr_t)dq, PINOD+2, "dqsync", 0);
908                 if ((dq->dq_flags & DQ_MOD) == 0) {
909                         if (vp != dqvp)
910                                 VOP_UNLOCK(dqvp, 0, td);
911                         return (0);
912                 }
913         }
914         dq->dq_flags |= DQ_LOCK;
915         auio.uio_iov = &aiov;
916         auio.uio_iovcnt = 1;
917         aiov.iov_base = (caddr_t)&dq->dq_dqb;
918         aiov.iov_len = sizeof (struct dqblk);
919         auio.uio_resid = sizeof (struct dqblk);
920         auio.uio_offset = (off_t)(dq->dq_id * sizeof (struct dqblk));
921         auio.uio_segflg = UIO_SYSSPACE;
922         auio.uio_rw = UIO_WRITE;
923         auio.uio_td = NULL;
924         error = VOP_WRITE(dqvp, &auio, 0, dq->dq_ump->um_cred[dq->dq_type]);
925         if (auio.uio_resid && error == 0)
926                 error = EIO;
927         if (dq->dq_flags & DQ_WANT)
928                 wakeup((caddr_t)dq);
929         dq->dq_flags &= ~(DQ_MOD|DQ_LOCK|DQ_WANT);
930         if (vp != dqvp)
931                 VOP_UNLOCK(dqvp, 0, td);
932         return (error);
933 }
934
935 /*
936  * Flush all entries from the cache for a particular vnode.
937  */
938 static void
939 dqflush(vp)
940         register struct vnode *vp;
941 {
942         register struct dquot *dq, *nextdq;
943         struct dqhash *dqh;
944
945         /*
946          * Move all dquot's that used to refer to this quota
947          * file off their hash chains (they will eventually
948          * fall off the head of the free list and be re-used).
949          */
950         for (dqh = &dqhashtbl[dqhash]; dqh >= dqhashtbl; dqh--) {
951                 for (dq = dqh->lh_first; dq; dq = nextdq) {
952                         nextdq = dq->dq_hash.le_next;
953                         if (dq->dq_ump->um_quotas[dq->dq_type] != vp)
954                                 continue;
955                         if (dq->dq_cnt)
956                                 panic("dqflush: stray dquot");
957                         LIST_REMOVE(dq, dq_hash);
958                         dq->dq_ump = (struct ufsmount *)0;
959                 }
960         }
961 }