procfs_validfile does have a public prototyp, but doesn't seemed to be used.
[dragonfly.git] / sys / vfs / ufs / ufs_quota.c
1 /*
2  * Copyright (c) 1982, 1986, 1990, 1993, 1995
3  *      The Regents of the University of California.  All rights reserved.
4  *
5  * This code is derived from software contributed to Berkeley by
6  * Robert Elz at The University of Melbourne.
7  *
8  * Redistribution and use in source and binary forms, with or without
9  * modification, are permitted provided that the following conditions
10  * are met:
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer.
13  * 2. Redistributions in binary form must reproduce the above copyright
14  *    notice, this list of conditions and the following disclaimer in the
15  *    documentation and/or other materials provided with the distribution.
16  * 3. All advertising materials mentioning features or use of this software
17  *    must display the following acknowledgement:
18  *      This product includes software developed by the University of
19  *      California, Berkeley and its contributors.
20  * 4. Neither the name of the University nor the names of its contributors
21  *    may be used to endorse or promote products derived from this software
22  *    without specific prior written permission.
23  *
24  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
25  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
26  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
27  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
28  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
29  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
30  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
31  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
32  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
33  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
34  * SUCH DAMAGE.
35  *
36  *      @(#)ufs_quota.c 8.5 (Berkeley) 5/20/95
37  * $FreeBSD: src/sys/ufs/ufs/ufs_quota.c,v 1.27.2.3 2002/01/15 10:33:32 phk Exp $
38  * $DragonFly: src/sys/vfs/ufs/ufs_quota.c,v 1.13 2004/05/18 00:16:46 cpressey Exp $
39  */
40
41 #include <sys/param.h>
42 #include <sys/systm.h>
43 #include <sys/kernel.h>
44 #include <sys/malloc.h>
45 #include <sys/fcntl.h>
46 #include <sys/proc.h>
47 #include <sys/namei.h>
48 #include <sys/vnode.h>
49 #include <sys/mount.h>
50 #include <vm/vm_zone.h>
51
52 #include "quota.h"
53 #include "inode.h"
54 #include "ufsmount.h"
55
56 static MALLOC_DEFINE(M_DQUOT, "UFS quota", "UFS quota entries");
57
58 /*
59  * Quota name to error message mapping.
60  */
61 static char *quotatypes[] = INITQFNAMES;
62
63 static int chkdqchg (struct inode *, long, struct ucred *, int);
64 static int chkiqchg (struct inode *, long, struct ucred *, int);
65 static int dqget (struct vnode *,
66                 u_long, struct ufsmount *, int, struct dquot **);
67 static int dqsync (struct vnode *, struct dquot *);
68 static void dqflush (struct vnode *);
69
70 #ifdef DIAGNOSTIC
71 static void dqref (struct dquot *);
72 static void chkdquot (struct inode *);
73 #endif
74
75 /*
76  * Set up the quotas for an inode.
77  *
78  * This routine completely defines the semantics of quotas.
79  * If other criterion want to be used to establish quotas, the
80  * MAXQUOTAS value in quotas.h should be increased, and the
81  * additional dquots set up here.
82  */
83 int
84 getinoquota(struct inode *ip)
85 {
86         struct ufsmount *ump;
87         struct vnode *vp = ITOV(ip);
88         int error;
89
90         ump = VFSTOUFS(vp->v_mount);
91         /*
92          * Set up the user quota based on file uid.
93          * EINVAL means that quotas are not enabled.
94          */
95         if (ip->i_dquot[USRQUOTA] == NODQUOT &&
96             (error =
97                 dqget(vp, ip->i_uid, ump, USRQUOTA, &ip->i_dquot[USRQUOTA])) &&
98             error != EINVAL)
99                 return (error);
100         /*
101          * Set up the group quota based on file gid.
102          * EINVAL means that quotas are not enabled.
103          */
104         if (ip->i_dquot[GRPQUOTA] == NODQUOT &&
105             (error =
106                 dqget(vp, ip->i_gid, ump, GRPQUOTA, &ip->i_dquot[GRPQUOTA])) &&
107             error != EINVAL)
108                 return (error);
109         return (0);
110 }
111
112 /*
113  * Update disk usage, and take corrective action.
114  */
115 int
116 chkdq(struct inode *ip, long change, struct ucred *cred, int flags)
117 {
118         struct dquot *dq;
119         int i;
120         int ncurblocks, error;
121
122 #ifdef DIAGNOSTIC
123         if ((flags & CHOWN) == 0)
124                 chkdquot(ip);
125 #endif
126         if (change == 0)
127                 return (0);
128         if (change < 0) {
129                 for (i = 0; i < MAXQUOTAS; i++) {
130                         if ((dq = ip->i_dquot[i]) == NODQUOT)
131                                 continue;
132                         while (dq->dq_flags & DQ_LOCK) {
133                                 dq->dq_flags |= DQ_WANT;
134                                 (void) tsleep((caddr_t)dq, 0, "chkdq1", 0);
135                         }
136                         ncurblocks = dq->dq_curblocks + change;
137                         if (ncurblocks >= 0)
138                                 dq->dq_curblocks = ncurblocks;
139                         else
140                                 dq->dq_curblocks = 0;
141                         dq->dq_flags &= ~DQ_BLKS;
142                         dq->dq_flags |= DQ_MOD;
143                 }
144                 return (0);
145         }
146         if ((flags & FORCE) == 0 && cred->cr_uid != 0) {
147                 for (i = 0; i < MAXQUOTAS; i++) {
148                         if ((dq = ip->i_dquot[i]) == NODQUOT)
149                                 continue;
150                         error = chkdqchg(ip, change, cred, i);
151                         if (error)
152                                 return (error);
153                 }
154         }
155         for (i = 0; i < MAXQUOTAS; i++) {
156                 if ((dq = ip->i_dquot[i]) == NODQUOT)
157                         continue;
158                 while (dq->dq_flags & DQ_LOCK) {
159                         dq->dq_flags |= DQ_WANT;
160                         (void) tsleep((caddr_t)dq, 0, "chkdq2", 0);
161                 }
162                 /* Reset timer when crossing soft limit */
163                 if (dq->dq_curblocks + change >= dq->dq_bsoftlimit &&
164                     dq->dq_curblocks < dq->dq_bsoftlimit)
165                         dq->dq_btime = time_second +
166                             VFSTOUFS(ITOV(ip)->v_mount)->um_btime[i];
167                 dq->dq_curblocks += change;
168                 dq->dq_flags |= DQ_MOD;
169         }
170         return (0);
171 }
172
173 /*
174  * Check for a valid change to a users allocation.
175  * Issue an error message if appropriate.
176  */
177 static int
178 chkdqchg(struct inode *ip, long change, struct ucred *cred, int type)
179 {
180         struct dquot *dq = ip->i_dquot[type];
181         long ncurblocks = dq->dq_curblocks + change;
182
183         /*
184          * If user would exceed their hard limit, disallow space allocation.
185          */
186         if (ncurblocks >= dq->dq_bhardlimit && dq->dq_bhardlimit) {
187                 if ((dq->dq_flags & DQ_BLKS) == 0 &&
188                     ip->i_uid == cred->cr_uid) {
189                         uprintf("\n%s: write failed, %s disk limit reached\n",
190                             ITOV(ip)->v_mount->mnt_stat.f_mntonname,
191                             quotatypes[type]);
192                         dq->dq_flags |= DQ_BLKS;
193                 }
194                 return (EDQUOT);
195         }
196         /*
197          * If user is over their soft limit for too long, disallow space
198          * allocation. Reset time limit as they cross their soft limit.
199          */
200         if (ncurblocks >= dq->dq_bsoftlimit && dq->dq_bsoftlimit) {
201                 if (dq->dq_curblocks < dq->dq_bsoftlimit) {
202                         dq->dq_btime = time_second +
203                             VFSTOUFS(ITOV(ip)->v_mount)->um_btime[type];
204                         if (ip->i_uid == cred->cr_uid)
205                                 uprintf("\n%s: warning, %s %s\n",
206                                     ITOV(ip)->v_mount->mnt_stat.f_mntonname,
207                                     quotatypes[type], "disk quota exceeded");
208                         return (0);
209                 }
210                 if (time_second > dq->dq_btime) {
211                         if ((dq->dq_flags & DQ_BLKS) == 0 &&
212                             ip->i_uid == cred->cr_uid) {
213                                 uprintf("\n%s: write failed, %s %s\n",
214                                     ITOV(ip)->v_mount->mnt_stat.f_mntonname,
215                                     quotatypes[type],
216                                     "disk quota exceeded for too long");
217                                 dq->dq_flags |= DQ_BLKS;
218                         }
219                         return (EDQUOT);
220                 }
221         }
222         return (0);
223 }
224
225 /*
226  * Check the inode limit, applying corrective action.
227  */
228 int
229 chkiq(struct inode *ip, long change, struct ucred *cred, int flags)
230 {
231         struct dquot *dq;
232         int i;
233         int ncurinodes, error;
234
235 #ifdef DIAGNOSTIC
236         if ((flags & CHOWN) == 0)
237                 chkdquot(ip);
238 #endif
239         if (change == 0)
240                 return (0);
241         if (change < 0) {
242                 for (i = 0; i < MAXQUOTAS; i++) {
243                         if ((dq = ip->i_dquot[i]) == NODQUOT)
244                                 continue;
245                         while (dq->dq_flags & DQ_LOCK) {
246                                 dq->dq_flags |= DQ_WANT;
247                                 (void) tsleep((caddr_t)dq, 0, "chkiq1", 0);
248                         }
249                         ncurinodes = dq->dq_curinodes + change;
250                         if (ncurinodes >= 0)
251                                 dq->dq_curinodes = ncurinodes;
252                         else
253                                 dq->dq_curinodes = 0;
254                         dq->dq_flags &= ~DQ_INODS;
255                         dq->dq_flags |= DQ_MOD;
256                 }
257                 return (0);
258         }
259         if ((flags & FORCE) == 0 && cred->cr_uid != 0) {
260                 for (i = 0; i < MAXQUOTAS; i++) {
261                         if ((dq = ip->i_dquot[i]) == NODQUOT)
262                                 continue;
263                         error = chkiqchg(ip, change, cred, i);
264                         if (error)
265                                 return (error);
266                 }
267         }
268         for (i = 0; i < MAXQUOTAS; i++) {
269                 if ((dq = ip->i_dquot[i]) == NODQUOT)
270                         continue;
271                 while (dq->dq_flags & DQ_LOCK) {
272                         dq->dq_flags |= DQ_WANT;
273                         (void) tsleep((caddr_t)dq, 0, "chkiq2", 0);
274                 }
275                 /* Reset timer when crossing soft limit */
276                 if (dq->dq_curinodes + change >= dq->dq_isoftlimit &&
277                     dq->dq_curinodes < dq->dq_isoftlimit)
278                         dq->dq_itime = time_second +
279                             VFSTOUFS(ITOV(ip)->v_mount)->um_itime[i];
280                 dq->dq_curinodes += change;
281                 dq->dq_flags |= DQ_MOD;
282         }
283         return (0);
284 }
285
286 /*
287  * Check for a valid change to a users allocation.
288  * Issue an error message if appropriate.
289  */
290 static int
291 chkiqchg(struct inode *ip, long change, struct ucred *cred, int type)
292 {
293         struct dquot *dq = ip->i_dquot[type];
294         long ncurinodes = dq->dq_curinodes + change;
295
296         /*
297          * If user would exceed their hard limit, disallow inode allocation.
298          */
299         if (ncurinodes >= dq->dq_ihardlimit && dq->dq_ihardlimit) {
300                 if ((dq->dq_flags & DQ_INODS) == 0 &&
301                     ip->i_uid == cred->cr_uid) {
302                         uprintf("\n%s: write failed, %s inode limit reached\n",
303                             ITOV(ip)->v_mount->mnt_stat.f_mntonname,
304                             quotatypes[type]);
305                         dq->dq_flags |= DQ_INODS;
306                 }
307                 return (EDQUOT);
308         }
309         /*
310          * If user is over their soft limit for too long, disallow inode
311          * allocation. Reset time limit as they cross their soft limit.
312          */
313         if (ncurinodes >= dq->dq_isoftlimit && dq->dq_isoftlimit) {
314                 if (dq->dq_curinodes < dq->dq_isoftlimit) {
315                         dq->dq_itime = time_second +
316                             VFSTOUFS(ITOV(ip)->v_mount)->um_itime[type];
317                         if (ip->i_uid == cred->cr_uid)
318                                 uprintf("\n%s: warning, %s %s\n",
319                                     ITOV(ip)->v_mount->mnt_stat.f_mntonname,
320                                     quotatypes[type], "inode quota exceeded");
321                         return (0);
322                 }
323                 if (time_second > dq->dq_itime) {
324                         if ((dq->dq_flags & DQ_INODS) == 0 &&
325                             ip->i_uid == cred->cr_uid) {
326                                 uprintf("\n%s: write failed, %s %s\n",
327                                     ITOV(ip)->v_mount->mnt_stat.f_mntonname,
328                                     quotatypes[type],
329                                     "inode quota exceeded for too long");
330                                 dq->dq_flags |= DQ_INODS;
331                         }
332                         return (EDQUOT);
333                 }
334         }
335         return (0);
336 }
337
338 #ifdef DIAGNOSTIC
339 /*
340  * On filesystems with quotas enabled, it is an error for a file to change
341  * size and not to have a dquot structure associated with it.
342  */
343 static void
344 chkdquot(struct inode *ip)
345 {
346         struct ufsmount *ump = VFSTOUFS(ITOV(ip)->v_mount);
347         int i;
348
349         for (i = 0; i < MAXQUOTAS; i++) {
350                 if (ump->um_quotas[i] == NULLVP ||
351                     (ump->um_qflags[i] & (QTF_OPENING|QTF_CLOSING)))
352                         continue;
353                 if (ip->i_dquot[i] == NODQUOT) {
354                         vprint("chkdquot: missing dquot", ITOV(ip));
355                         panic("chkdquot: missing dquot");
356                 }
357         }
358 }
359 #endif
360
361 /*
362  * Code to process quotactl commands.
363  */
364
365 struct scaninfo {
366         thread_t td;
367         int rescan;
368         int type;
369 };
370
371 /*
372  * Q_QUOTAON - set up a quota file for a particular file system.
373  */
374 static int quotaon_scan(struct mount *mp, struct vnode *vp,
375                 lwkt_tokref_t vlock, void *data);
376
377 int
378 quotaon(struct thread *td, struct mount *mp, int type, caddr_t fname)
379 {
380         struct ufsmount *ump = VFSTOUFS(mp);
381         struct vnode *vp, **vpp;
382         struct dquot *dq;
383         int error;
384         struct nameidata nd;
385         struct ucred *cred;
386         struct scaninfo scaninfo;
387
388         KKASSERT(td->td_proc);
389         cred = td->td_proc->p_ucred;
390
391         vpp = &ump->um_quotas[type];
392         NDINIT(&nd, NAMEI_LOOKUP, CNP_FOLLOW, UIO_USERSPACE, fname, td);
393         error = vn_open(&nd, FREAD|FWRITE, 0);
394         if (error)
395                 return (error);
396         NDFREE(&nd, NDF_ONLY_PNBUF);
397         vp = nd.ni_vp;
398         VOP_UNLOCK(vp, NULL, 0, td);
399         if (vp->v_type != VREG) {
400                 (void) vn_close(vp, FREAD|FWRITE, td);
401                 return (EACCES);
402         }
403         if (*vpp != vp)
404                 quotaoff(td, mp, type);
405         ump->um_qflags[type] |= QTF_OPENING;
406         mp->mnt_flag |= MNT_QUOTA;
407         vp->v_flag |= VSYSTEM;
408         *vpp = vp;
409         /*
410          * Save the credential of the process that turned on quotas.
411          * Set up the time limits for this quota.
412          */
413         ump->um_cred[type] = crhold(cred);
414         ump->um_btime[type] = MAX_DQ_TIME;
415         ump->um_itime[type] = MAX_IQ_TIME;
416         if (dqget(NULLVP, 0, ump, type, &dq) == 0) {
417                 if (dq->dq_btime > 0)
418                         ump->um_btime[type] = dq->dq_btime;
419                 if (dq->dq_itime > 0)
420                         ump->um_itime[type] = dq->dq_itime;
421                 dqrele(NULLVP, dq);
422         }
423         /*
424          * Search vnodes associated with this mount point,
425          * adding references to quota file being opened.
426          * NB: only need to add dquot's for inodes being modified.
427          */
428         scaninfo.rescan = 1;
429         scaninfo.td = td;
430         while (scaninfo.rescan) {
431                 scaninfo.rescan = 0;
432                 error = vmntvnodescan(mp, NULL, quotaon_scan, &scaninfo);
433                 if (error)
434                         break;
435         }
436         ump->um_qflags[type] &= ~QTF_OPENING;
437         if (error)
438                 quotaoff(td, mp, type);
439         return (error);
440 }
441
442 static
443 int
444 quotaon_scan(struct mount *mp, struct vnode *vp,
445              lwkt_tokref_t vlock, void *data)
446 {
447         int error;
448         struct scaninfo *info = data;
449
450         if (vp->v_type == VNON || vp->v_writecount == 0) {
451                 lwkt_reltoken(vlock);
452                 return(0);
453         }
454         if (vget(vp, vlock, LK_INTERLOCK|LK_EXCLUSIVE, info->td)) {
455                 info->rescan = 1;
456                 return(0);
457         }
458         error = getinoquota(VTOI(vp));
459         vput(vp);
460         return(error);
461 }
462
463 /*
464  * Q_QUOTAOFF - turn off disk quotas for a filesystem.
465  */
466
467 static int quotaoff_scan(struct mount *mp, struct vnode *vp,
468                          lwkt_tokref_t vlock, void *data);
469
470 int
471 quotaoff(struct thread *td, struct mount *mp, int type)
472 {
473         struct vnode *qvp;
474         struct ufsmount *ump = VFSTOUFS(mp);
475         struct ucred *cred;
476         int error;
477         struct scaninfo scaninfo;
478
479         KKASSERT(td->td_proc);
480         cred = td->td_proc->p_ucred;
481
482         if ((qvp = ump->um_quotas[type]) == NULLVP)
483                 return (0);
484         ump->um_qflags[type] |= QTF_CLOSING;
485
486         /*
487          * Search vnodes associated with this mount point,
488          * deleting any references to quota file being closed.
489          */
490         scaninfo.rescan = 1;
491         scaninfo.td = td;
492         scaninfo.type = type;
493         while (scaninfo.rescan) {
494                 scaninfo.rescan = 0;
495                 vmntvnodescan(mp, NULL, quotaoff_scan, &scaninfo);
496         }
497         dqflush(qvp);
498         qvp->v_flag &= ~VSYSTEM;
499         error = vn_close(qvp, FREAD|FWRITE, td);
500         ump->um_quotas[type] = NULLVP;
501         crfree(ump->um_cred[type]);
502         ump->um_cred[type] = NOCRED;
503         ump->um_qflags[type] &= ~QTF_CLOSING;
504         for (type = 0; type < MAXQUOTAS; type++) {
505                 if (ump->um_quotas[type] != NULLVP)
506                         break;
507         }
508         if (type == MAXQUOTAS)
509                 mp->mnt_flag &= ~MNT_QUOTA;
510         return (error);
511 }
512
513 static
514 int
515 quotaoff_scan(struct mount *mp, struct vnode *vp,
516               lwkt_tokref_t vlock, void *data)
517 {
518         struct scaninfo *info = data;
519         struct dquot *dq;
520         struct inode *ip;
521
522         if (vp->v_type == VNON) {
523                 lwkt_reltoken(vlock);
524                 return(0);
525         }
526         if (vget(vp, vlock, LK_INTERLOCK|LK_EXCLUSIVE, info->td)) {
527                 info->rescan = 1;
528                 return(0);
529         }
530         ip = VTOI(vp);
531         dq = ip->i_dquot[info->type];
532         ip->i_dquot[info->type] = NODQUOT;
533         dqrele(vp, dq);
534         vput(vp);
535         return(0);
536 }
537
538 /*
539  * Q_GETQUOTA - return current values in a dqblk structure.
540  */
541 int
542 getquota(struct mount *mp, u_long id, int type, caddr_t addr)
543 {
544         struct dquot *dq;
545         int error;
546
547         error = dqget(NULLVP, id, VFSTOUFS(mp), type, &dq);
548         if (error)
549                 return (error);
550         error = copyout((caddr_t)&dq->dq_dqb, addr, sizeof (struct dqblk));
551         dqrele(NULLVP, dq);
552         return (error);
553 }
554
555 /*
556  * Q_SETQUOTA - assign an entire dqblk structure.
557  */
558 int
559 setquota(struct mount *mp, u_long id, int type, caddr_t addr)
560 {
561         struct dquot *dq;
562         struct dquot *ndq;
563         struct ufsmount *ump = VFSTOUFS(mp);
564         struct dqblk newlim;
565         int error;
566
567         error = copyin(addr, (caddr_t)&newlim, sizeof (struct dqblk));
568         if (error)
569                 return (error);
570         error = dqget(NULLVP, id, ump, type, &ndq);
571         if (error)
572                 return (error);
573         dq = ndq;
574         while (dq->dq_flags & DQ_LOCK) {
575                 dq->dq_flags |= DQ_WANT;
576                 (void) tsleep((caddr_t)dq, 0, "setqta", 0);
577         }
578         /*
579          * Copy all but the current values.
580          * Reset time limit if previously had no soft limit or were
581          * under it, but now have a soft limit and are over it.
582          */
583         newlim.dqb_curblocks = dq->dq_curblocks;
584         newlim.dqb_curinodes = dq->dq_curinodes;
585         if (dq->dq_id != 0) {
586                 newlim.dqb_btime = dq->dq_btime;
587                 newlim.dqb_itime = dq->dq_itime;
588         }
589         if (newlim.dqb_bsoftlimit &&
590             dq->dq_curblocks >= newlim.dqb_bsoftlimit &&
591             (dq->dq_bsoftlimit == 0 || dq->dq_curblocks < dq->dq_bsoftlimit))
592                 newlim.dqb_btime = time_second + ump->um_btime[type];
593         if (newlim.dqb_isoftlimit &&
594             dq->dq_curinodes >= newlim.dqb_isoftlimit &&
595             (dq->dq_isoftlimit == 0 || dq->dq_curinodes < dq->dq_isoftlimit))
596                 newlim.dqb_itime = time_second + ump->um_itime[type];
597         dq->dq_dqb = newlim;
598         if (dq->dq_curblocks < dq->dq_bsoftlimit)
599                 dq->dq_flags &= ~DQ_BLKS;
600         if (dq->dq_curinodes < dq->dq_isoftlimit)
601                 dq->dq_flags &= ~DQ_INODS;
602         if (dq->dq_isoftlimit == 0 && dq->dq_bsoftlimit == 0 &&
603             dq->dq_ihardlimit == 0 && dq->dq_bhardlimit == 0)
604                 dq->dq_flags |= DQ_FAKE;
605         else
606                 dq->dq_flags &= ~DQ_FAKE;
607         dq->dq_flags |= DQ_MOD;
608         dqrele(NULLVP, dq);
609         return (0);
610 }
611
612 /*
613  * Q_SETUSE - set current inode and block usage.
614  */
615 int
616 setuse(struct mount *mp, u_long id, int type, caddr_t addr)
617 {
618         struct dquot *dq;
619         struct ufsmount *ump = VFSTOUFS(mp);
620         struct dquot *ndq;
621         struct dqblk usage;
622         int error;
623
624         error = copyin(addr, (caddr_t)&usage, sizeof (struct dqblk));
625         if (error)
626                 return (error);
627         error = dqget(NULLVP, id, ump, type, &ndq);
628         if (error)
629                 return (error);
630         dq = ndq;
631         while (dq->dq_flags & DQ_LOCK) {
632                 dq->dq_flags |= DQ_WANT;
633                 (void) tsleep((caddr_t)dq, 0, "setuse", 0);
634         }
635         /*
636          * Reset time limit if have a soft limit and were
637          * previously under it, but are now over it.
638          */
639         if (dq->dq_bsoftlimit && dq->dq_curblocks < dq->dq_bsoftlimit &&
640             usage.dqb_curblocks >= dq->dq_bsoftlimit)
641                 dq->dq_btime = time_second + ump->um_btime[type];
642         if (dq->dq_isoftlimit && dq->dq_curinodes < dq->dq_isoftlimit &&
643             usage.dqb_curinodes >= dq->dq_isoftlimit)
644                 dq->dq_itime = time_second + ump->um_itime[type];
645         dq->dq_curblocks = usage.dqb_curblocks;
646         dq->dq_curinodes = usage.dqb_curinodes;
647         if (dq->dq_curblocks < dq->dq_bsoftlimit)
648                 dq->dq_flags &= ~DQ_BLKS;
649         if (dq->dq_curinodes < dq->dq_isoftlimit)
650                 dq->dq_flags &= ~DQ_INODS;
651         dq->dq_flags |= DQ_MOD;
652         dqrele(NULLVP, dq);
653         return (0);
654 }
655
656 /*
657  * Q_SYNC - sync quota files to disk.
658  */
659
660 static int qsync_scan(struct mount *mp, struct vnode *vp,
661                 lwkt_tokref_t vlock, void *data);
662 int
663 qsync(struct mount *mp)
664 {
665         struct ufsmount *ump = VFSTOUFS(mp);
666         struct thread *td = curthread;          /* XXX */
667         struct scaninfo scaninfo;
668         int i;
669
670         /*
671          * Check if the mount point has any quotas.
672          * If not, simply return.
673          */
674         for (i = 0; i < MAXQUOTAS; i++)
675                 if (ump->um_quotas[i] != NULLVP)
676                         break;
677         if (i == MAXQUOTAS)
678                 return (0);
679         /*
680          * Search vnodes associated with this mount point,
681          * synchronizing any modified dquot structures.
682          */
683         scaninfo.rescan = 1;
684         scaninfo.td = td;
685         while (scaninfo.rescan) {
686                 scaninfo.rescan = 0;
687                 vmntvnodescan(mp, NULL, qsync_scan, &scaninfo);
688         }
689         return (0);
690 }
691
692 static
693 int
694 qsync_scan(struct mount *mp, struct vnode *vp,
695            lwkt_tokref_t vlock, void *data)
696 {
697         struct scaninfo *info = data;
698         struct dquot *dq;
699         int error;
700         int i;
701
702         if (vp->v_type == VNON) {
703                 lwkt_reltoken(vlock);
704                 return(0);
705         }
706         error = vget(vp, vlock, LK_EXCLUSIVE | LK_NOWAIT | LK_INTERLOCK, info->td);
707         if (error) {
708                 if (error == ENOENT)
709                         info->rescan = 1;
710                 return(0);
711         }
712         for (i = 0; i < MAXQUOTAS; i++) {
713                 dq = VTOI(vp)->i_dquot[i];
714                 if (dq != NODQUOT && (dq->dq_flags & DQ_MOD))
715                         dqsync(vp, dq);
716         }
717         vput(vp);
718         return(0);
719 }
720
721 /*
722  * Code pertaining to management of the in-core dquot data structures.
723  */
724 #define DQHASH(dqvp, id) \
725         (&dqhashtbl[((((intptr_t)(dqvp)) >> 8) + id) & dqhash])
726 static LIST_HEAD(dqhash, dquot) *dqhashtbl;
727 static u_long dqhash;
728
729 /*
730  * Dquot free list.
731  */
732 #define DQUOTINC        5       /* minimum free dquots desired */
733 static TAILQ_HEAD(dqfreelist, dquot) dqfreelist;
734 static long numdquot, desireddquot = DQUOTINC;
735
736 /*
737  * Initialize the quota system.
738  */
739 void
740 dqinit(void)
741 {
742
743         dqhashtbl = hashinit(desiredvnodes, M_DQUOT, &dqhash);
744         TAILQ_INIT(&dqfreelist);
745 }
746
747 /*
748  * Obtain a dquot structure for the specified identifier and quota file
749  * reading the information from the file if necessary.
750  */
751 static int
752 dqget(struct vnode *vp, u_long id, struct ufsmount *ump, int type,
753       struct dquot **dqp)
754 {
755         struct thread *td = curthread;          /* XXX */
756         struct dquot *dq;
757         struct dqhash *dqh;
758         struct vnode *dqvp;
759         struct iovec aiov;
760         struct uio auio;
761         int error;
762
763         dqvp = ump->um_quotas[type];
764         if (dqvp == NULLVP || (ump->um_qflags[type] & QTF_CLOSING)) {
765                 *dqp = NODQUOT;
766                 return (EINVAL);
767         }
768         /*
769          * Check the cache first.
770          */
771         dqh = DQHASH(dqvp, id);
772         for (dq = dqh->lh_first; dq; dq = dq->dq_hash.le_next) {
773                 if (dq->dq_id != id ||
774                     dq->dq_ump->um_quotas[dq->dq_type] != dqvp)
775                         continue;
776                 /*
777                  * Cache hit with no references.  Take
778                  * the structure off the free list.
779                  */
780                 if (dq->dq_cnt == 0)
781                         TAILQ_REMOVE(&dqfreelist, dq, dq_freelist);
782                 DQREF(dq);
783                 *dqp = dq;
784                 return (0);
785         }
786         /*
787          * Not in cache, allocate a new one.
788          */
789         if (dqfreelist.tqh_first == NODQUOT &&
790             numdquot < MAXQUOTAS * desiredvnodes)
791                 desireddquot += DQUOTINC;
792         if (numdquot < desireddquot) {
793                 dq = (struct dquot *)malloc(sizeof *dq, M_DQUOT, M_WAITOK);
794                 bzero((char *)dq, sizeof *dq);
795                 numdquot++;
796         } else {
797                 if ((dq = dqfreelist.tqh_first) == NULL) {
798                         tablefull("dquot");
799                         *dqp = NODQUOT;
800                         return (EUSERS);
801                 }
802                 if (dq->dq_cnt || (dq->dq_flags & DQ_MOD))
803                         panic("dqget: free dquot isn't");
804                 TAILQ_REMOVE(&dqfreelist, dq, dq_freelist);
805                 if (dq->dq_ump != NULL)
806                         LIST_REMOVE(dq, dq_hash);
807         }
808         /*
809          * Initialize the contents of the dquot structure.
810          */
811         if (vp != dqvp)
812                 vn_lock(dqvp, NULL, LK_EXCLUSIVE | LK_RETRY, td);
813         LIST_INSERT_HEAD(dqh, dq, dq_hash);
814         DQREF(dq);
815         dq->dq_flags = DQ_LOCK;
816         dq->dq_id = id;
817         dq->dq_ump = ump;
818         dq->dq_type = type;
819         auio.uio_iov = &aiov;
820         auio.uio_iovcnt = 1;
821         aiov.iov_base = (caddr_t)&dq->dq_dqb;
822         aiov.iov_len = sizeof (struct dqblk);
823         auio.uio_resid = sizeof (struct dqblk);
824         auio.uio_offset = (off_t)(id * sizeof (struct dqblk));
825         auio.uio_segflg = UIO_SYSSPACE;
826         auio.uio_rw = UIO_READ;
827         auio.uio_td = NULL;
828         error = VOP_READ(dqvp, &auio, 0, ump->um_cred[type]);
829         if (auio.uio_resid == sizeof(struct dqblk) && error == 0)
830                 bzero((caddr_t)&dq->dq_dqb, sizeof(struct dqblk));
831         if (vp != dqvp)
832                 VOP_UNLOCK(dqvp, NULL, 0, td);
833         if (dq->dq_flags & DQ_WANT)
834                 wakeup((caddr_t)dq);
835         dq->dq_flags = 0;
836         /*
837          * I/O error in reading quota file, release
838          * quota structure and reflect problem to caller.
839          */
840         if (error) {
841                 LIST_REMOVE(dq, dq_hash);
842                 dqrele(vp, dq);
843                 *dqp = NODQUOT;
844                 return (error);
845         }
846         /*
847          * Check for no limit to enforce.
848          * Initialize time values if necessary.
849          */
850         if (dq->dq_isoftlimit == 0 && dq->dq_bsoftlimit == 0 &&
851             dq->dq_ihardlimit == 0 && dq->dq_bhardlimit == 0)
852                 dq->dq_flags |= DQ_FAKE;
853         if (dq->dq_id != 0) {
854                 if (dq->dq_btime == 0)
855                         dq->dq_btime = time_second + ump->um_btime[type];
856                 if (dq->dq_itime == 0)
857                         dq->dq_itime = time_second + ump->um_itime[type];
858         }
859         *dqp = dq;
860         return (0);
861 }
862
863 #ifdef DIAGNOSTIC
864 /*
865  * Obtain a reference to a dquot.
866  */
867 static void
868 dqref(struct dquot *dq)
869 {
870         dq->dq_cnt++;
871 }
872 #endif
873
874 /*
875  * Release a reference to a dquot.
876  */
877 void
878 dqrele(struct vnode *vp, struct dquot *dq)
879 {
880         if (dq == NODQUOT)
881                 return;
882         if (dq->dq_cnt > 1) {
883                 dq->dq_cnt--;
884                 return;
885         }
886         if (dq->dq_flags & DQ_MOD)
887                 (void) dqsync(vp, dq);
888         if (--dq->dq_cnt > 0)
889                 return;
890         TAILQ_INSERT_TAIL(&dqfreelist, dq, dq_freelist);
891 }
892
893 /*
894  * Update the disk quota in the quota file.
895  */
896 static int
897 dqsync(struct vnode *vp, struct dquot *dq)
898 {
899         struct thread *td = curthread;          /* XXX */
900         struct vnode *dqvp;
901         struct iovec aiov;
902         struct uio auio;
903         int error;
904
905         if (dq == NODQUOT)
906                 panic("dqsync: dquot");
907         if ((dq->dq_flags & DQ_MOD) == 0)
908                 return (0);
909         if ((dqvp = dq->dq_ump->um_quotas[dq->dq_type]) == NULLVP)
910                 panic("dqsync: file");
911         if (vp != dqvp)
912                 vn_lock(dqvp, NULL, LK_EXCLUSIVE | LK_RETRY, td);
913         while (dq->dq_flags & DQ_LOCK) {
914                 dq->dq_flags |= DQ_WANT;
915                 (void) tsleep((caddr_t)dq, 0, "dqsync", 0);
916                 if ((dq->dq_flags & DQ_MOD) == 0) {
917                         if (vp != dqvp)
918                                 VOP_UNLOCK(dqvp, NULL, 0, td);
919                         return (0);
920                 }
921         }
922         dq->dq_flags |= DQ_LOCK;
923         auio.uio_iov = &aiov;
924         auio.uio_iovcnt = 1;
925         aiov.iov_base = (caddr_t)&dq->dq_dqb;
926         aiov.iov_len = sizeof (struct dqblk);
927         auio.uio_resid = sizeof (struct dqblk);
928         auio.uio_offset = (off_t)(dq->dq_id * sizeof (struct dqblk));
929         auio.uio_segflg = UIO_SYSSPACE;
930         auio.uio_rw = UIO_WRITE;
931         auio.uio_td = NULL;
932         error = VOP_WRITE(dqvp, &auio, 0, dq->dq_ump->um_cred[dq->dq_type]);
933         if (auio.uio_resid && error == 0)
934                 error = EIO;
935         if (dq->dq_flags & DQ_WANT)
936                 wakeup((caddr_t)dq);
937         dq->dq_flags &= ~(DQ_MOD|DQ_LOCK|DQ_WANT);
938         if (vp != dqvp)
939                 VOP_UNLOCK(dqvp, NULL, 0, td);
940         return (error);
941 }
942
943 /*
944  * Flush all entries from the cache for a particular vnode.
945  */
946 static void
947 dqflush(struct vnode *vp)
948 {
949         struct dquot *dq, *nextdq;
950         struct dqhash *dqh;
951
952         /*
953          * Move all dquot's that used to refer to this quota
954          * file off their hash chains (they will eventually
955          * fall off the head of the free list and be re-used).
956          */
957         for (dqh = &dqhashtbl[dqhash]; dqh >= dqhashtbl; dqh--) {
958                 for (dq = dqh->lh_first; dq; dq = nextdq) {
959                         nextdq = dq->dq_hash.le_next;
960                         if (dq->dq_ump->um_quotas[dq->dq_type] != vp)
961                                 continue;
962                         if (dq->dq_cnt)
963                                 panic("dqflush: stray dquot");
964                         LIST_REMOVE(dq, dq_hash);
965                         dq->dq_ump = (struct ufsmount *)0;
966                 }
967         }
968 }