kernel: Replace all usage of MALLOC()/FREE() with kmalloc()/kfree().
[dragonfly.git] / sys / gnu / vfs / ext2fs / ext2_inode.c
1 /*
2  *  modified for Lites 1.1
3  *
4  *  Aug 1995, Godmar Back (gback@cs.utah.edu)
5  *  University of Utah, Department of Computer Science
6  */
7 /*
8  * Copyright (c) 1982, 1986, 1989, 1993
9  *      The Regents of the University of California.  All rights reserved.
10  *
11  * Redistribution and use in source and binary forms, with or without
12  * modification, are permitted provided that the following conditions
13  * are met:
14  * 1. Redistributions of source code must retain the above copyright
15  *    notice, this list of conditions and the following disclaimer.
16  * 2. Redistributions in binary form must reproduce the above copyright
17  *    notice, this list of conditions and the following disclaimer in the
18  *    documentation and/or other materials provided with the distribution.
19  * 3. All advertising materials mentioning features or use of this software
20  *    must display the following acknowledgement:
21  *      This product includes software developed by the University of
22  *      California, Berkeley and its contributors.
23  * 4. Neither the name of the University nor the names of its contributors
24  *    may be used to endorse or promote products derived from this software
25  *    without specific prior written permission.
26  *
27  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
28  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
29  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
30  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
31  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
32  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
33  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
34  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
35  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
36  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
37  * SUCH DAMAGE.
38  *
39  *      @(#)ext2_inode.c        8.5 (Berkeley) 12/30/93
40  * $FreeBSD: src/sys/gnu/ext2fs/ext2_inode.c,v 1.24.2.1 2000/08/03 00:52:57 peter Exp $
41  */
42
43 #include "opt_quota.h"
44
45 #include <sys/param.h>
46 #include <sys/systm.h>
47 #include <sys/mount.h>
48 #include <sys/buf.h>
49 #include <sys/vnode.h>
50 #include <sys/malloc.h>
51
52 #include <vm/vm.h>
53 #include <vm/vm_extern.h>
54
55 #include <sys/buf2.h>
56
57 #include "quota.h"
58 #include "inode.h"
59 #include "ext2mount.h"
60
61 #include "ext2_fs.h"
62 #include "ext2_fs_sb.h"
63 #include "fs.h"
64 #include "ext2_extern.h"
65
66 static int ext2_indirtrunc (struct inode *, daddr_t, off_t, daddr_t,
67                             int, long *);
68
69 /*
70  * Update the access, modified, and inode change times as specified by the
71  * IN_ACCESS, IN_UPDATE, and IN_CHANGE flags respectively.  Write the inode
72  * to disk if the IN_MODIFIED flag is set (it may be set initially, or by
73  * the timestamp update).  The IN_LAZYMOD flag is set to force a write
74  * later if not now.  If we write now, then clear both IN_MODIFIED and
75  * IN_LAZYMOD to reflect the presumably successful write, and if waitfor is
76  * set, then wait for the write to complete.
77  */
78 int
79 ext2_update(struct vnode *vp, int waitfor)
80 {
81         struct ext2_sb_info *fs;
82         struct buf *bp;
83         struct inode *ip;
84         int error;
85
86         ext2_itimes(vp);
87         ip = VTOI(vp);
88         if ((ip->i_flag & IN_MODIFIED) == 0)
89                 return (0);
90         ip->i_flag &= ~(IN_LAZYMOD | IN_MODIFIED);
91         if (vp->v_mount->mnt_flag & MNT_RDONLY)
92                 return (0);
93         fs = ip->i_e2fs;
94         error = bread(ip->i_devvp,
95                       fsbtodoff(fs, ino_to_fsba(fs, ip->i_number)),
96                       (int)fs->s_blocksize, &bp);
97         if (error) {
98                 brelse(bp);
99                 return (error);
100         }
101         ext2_di2ei( &ip->i_din, (struct ext2_inode *) ((char *)bp->b_data + EXT2_INODE_SIZE(fs) *
102             ino_to_fsbo(fs, ip->i_number)));
103 /*
104         if (waitfor && (vp->v_mount->mnt_flag & MNT_ASYNC) == 0)
105                 return (bwrite(bp));
106         else {
107 */
108                 bdwrite(bp);
109                 return (0);
110 /*
111         }
112 */
113 }
114
115 #define SINGLE  0       /* index of single indirect block */
116 #define DOUBLE  1       /* index of double indirect block */
117 #define TRIPLE  2       /* index of triple indirect block */
118 /*
119  * Truncate the inode oip to at most length size, freeing the
120  * disk blocks.
121  */
122 int
123 ext2_truncate(struct vnode *vp, off_t length, int flags, struct ucred *cred)
124 {
125         struct vnode *ovp = vp;
126         daddr_t lastblock;
127         struct inode *oip;
128         daddr_t bn, lbn, lastiblock[NIADDR], indir_lbn[NIADDR];
129         daddr_t oldblks[NDADDR + NIADDR], newblks[NDADDR + NIADDR];
130         struct ext2_sb_info *fs;
131         struct buf *bp;
132         int offset, size, level;
133         long count, nblocks, blocksreleased = 0;
134         int i;
135         int aflags, error, allerror;
136         off_t osize;
137 /*
138 kprintf("ext2_truncate called %d to %d\n", VTOI(ovp)->i_number, length);
139 */      /*
140          * negative file sizes will totally break the code below and
141          * are not meaningful anyways.
142          */
143         if (length < 0)
144             return EFBIG;
145
146         oip = VTOI(ovp);
147         if (ovp->v_type == VLNK &&
148             oip->i_size < ovp->v_mount->mnt_maxsymlinklen) {
149 #if DIAGNOSTIC
150                 if (length != 0)
151                         panic("ext2_truncate: partial truncate of symlink");
152 #endif
153                 bzero((char *)&oip->i_shortlink, (u_int)oip->i_size);
154                 oip->i_size = 0;
155                 oip->i_flag |= IN_CHANGE | IN_UPDATE;
156                 return (EXT2_UPDATE(ovp, 1));
157         }
158         if (oip->i_size == length) {
159                 oip->i_flag |= IN_CHANGE | IN_UPDATE;
160                 return (EXT2_UPDATE(ovp, 0));
161         }
162 #if QUOTA
163         if ((error = ext2_getinoquota(oip)) != 0)
164                 return (error);
165 #endif
166         fs = oip->i_e2fs;
167         osize = oip->i_size;
168         ext2_discard_prealloc(oip);
169         /*
170          * Lengthen the size of the file. We must ensure that the
171          * last byte of the file is allocated. Since the smallest
172          * value of osize is 0, length will be at least 1.
173          */
174         if (osize < length) {
175                 offset = blkoff(fs, length - 1);
176                 lbn = lblkno(fs, length - 1);
177                 aflags = B_CLRBUF;
178                 if (flags & IO_SYNC)
179                         aflags |= B_SYNC;
180                 vnode_pager_setsize(ovp, length);
181                 error = ext2_balloc(oip, lbn, offset + 1, cred, &bp, aflags);
182                 if (error) {
183                         vnode_pager_setsize(ovp, osize);
184                         return (error);
185                 }
186                 oip->i_size = length;
187                 if (aflags & IO_SYNC)
188                         bwrite(bp);
189                 else
190                         bawrite(bp);
191                 oip->i_flag |= IN_CHANGE | IN_UPDATE;
192                 return (EXT2_UPDATE(ovp, 1));
193         }
194         /*
195          * Shorten the size of the file. If the file is not being
196          * truncated to a block boundry, the contents of the
197          * partial block following the end of the file must be
198          * zero'ed in case it ever become accessable again because
199          * of subsequent file growth.
200          */
201         /* I don't understand the comment above */
202         offset = blkoff(fs, length);
203         if (offset == 0) {
204                 oip->i_size = length;
205         } else {
206                 lbn = lblkno(fs, length);
207                 aflags = B_CLRBUF;
208                 if (flags & IO_SYNC)
209                         aflags |= B_SYNC;
210                 error = ext2_balloc(oip, lbn, offset, cred, &bp, aflags);
211                 if (error)
212                         return (error);
213                 oip->i_size = length;
214                 size = blksize(fs, oip, lbn);
215                 bzero((char *)bp->b_data + offset, (u_int)(size - offset));
216                 allocbuf(bp, size);
217                 if (aflags & IO_SYNC)
218                         bwrite(bp);
219                 else
220                         bawrite(bp);
221         }
222         /*
223          * Calculate index into inode's block list of
224          * last direct and indirect blocks (if any)
225          * which we want to keep.  Lastblock is -1 when
226          * the file is truncated to 0.
227          */
228         lastblock = lblkno(fs, length + fs->s_blocksize - 1) - 1;
229         lastiblock[SINGLE] = lastblock - NDADDR;
230         lastiblock[DOUBLE] = lastiblock[SINGLE] - NINDIR(fs);
231         lastiblock[TRIPLE] = lastiblock[DOUBLE] - NINDIR(fs) * NINDIR(fs);
232         nblocks = btodb(fs->s_blocksize);
233         /*
234          * Update file and block pointers on disk before we start freeing
235          * blocks.  If we crash before free'ing blocks below, the blocks
236          * will be returned to the free list.  lastiblock values are also
237          * normalized to -1 for calls to ext2_indirtrunc below.
238          */
239         bcopy((caddr_t)&oip->i_db[0], (caddr_t)oldblks, sizeof oldblks);
240         for (level = TRIPLE; level >= SINGLE; level--)
241                 if (lastiblock[level] < 0) {
242                         oip->i_ib[level] = 0;
243                         lastiblock[level] = -1;
244                 }
245         for (i = NDADDR - 1; i > lastblock; i--)
246                 oip->i_db[i] = 0;
247         oip->i_flag |= IN_CHANGE | IN_UPDATE;
248         allerror = EXT2_UPDATE(ovp, 1);
249
250         /*
251          * Having written the new inode to disk, save its new configuration
252          * and put back the old block pointers long enough to process them.
253          * Note that we save the new block configuration so we can check it
254          * when we are done.
255          */
256         bcopy((caddr_t)&oip->i_db[0], (caddr_t)newblks, sizeof newblks);
257         bcopy((caddr_t)oldblks, (caddr_t)&oip->i_db[0], sizeof oldblks);
258         oip->i_size = osize;
259         error = vtruncbuf(ovp, length, (int)fs->s_blocksize);
260         if (error && (allerror == 0))
261                 allerror = error;
262
263         /*
264          * Indirect blocks first.
265          */
266         indir_lbn[SINGLE] = -NDADDR;
267         indir_lbn[DOUBLE] = indir_lbn[SINGLE] - NINDIR(fs) - 1;
268         indir_lbn[TRIPLE] = indir_lbn[DOUBLE] - NINDIR(fs) * NINDIR(fs) - 1;
269         for (level = TRIPLE; level >= SINGLE; level--) {
270                 bn = oip->i_ib[level];
271                 if (bn != 0) {
272                         error = ext2_indirtrunc(oip, indir_lbn[level],
273                             fsbtodoff(fs, bn), lastiblock[level], level, &count);
274                         if (error)
275                                 allerror = error;
276                         blocksreleased += count;
277                         if (lastiblock[level] < 0) {
278                                 oip->i_ib[level] = 0;
279                                 ext2_blkfree(oip, bn, fs->s_frag_size);
280                                 blocksreleased += nblocks;
281                         }
282                 }
283                 if (lastiblock[level] >= 0)
284                         goto done;
285         }
286
287         /*
288          * All whole direct blocks or frags.
289          */
290         for (i = NDADDR - 1; i > lastblock; i--) {
291                 long bsize;
292
293                 bn = oip->i_db[i];
294                 if (bn == 0)
295                         continue;
296                 oip->i_db[i] = 0;
297                 bsize = blksize(fs, oip, i);
298                 ext2_blkfree(oip, bn, bsize);
299                 blocksreleased += btodb(bsize);
300         }
301         if (lastblock < 0)
302                 goto done;
303
304         /*
305          * Finally, look for a change in size of the
306          * last direct block; release any frags.
307          */
308         bn = oip->i_db[lastblock];
309         if (bn != 0) {
310                 long oldspace, newspace;
311
312                 /*
313                  * Calculate amount of space we're giving
314                  * back as old block size minus new block size.
315                  */
316                 oldspace = blksize(fs, oip, lastblock);
317                 oip->i_size = length;
318                 newspace = blksize(fs, oip, lastblock);
319                 if (newspace == 0)
320                         panic("itrunc: newspace");
321                 if (oldspace - newspace > 0) {
322                         /*
323                          * Block number of space to be free'd is
324                          * the old block # plus the number of frags
325                          * required for the storage we're keeping.
326                          */
327                         bn += numfrags(fs, newspace);
328                         ext2_blkfree(oip, bn, oldspace - newspace);
329                         blocksreleased += btodb(oldspace - newspace);
330                 }
331         }
332 done:
333 #if DIAGNOSTIC
334         for (level = SINGLE; level <= TRIPLE; level++)
335                 if (newblks[NDADDR + level] != oip->i_ib[level])
336                         panic("itrunc1");
337         for (i = 0; i < NDADDR; i++)
338                 if (newblks[i] != oip->i_db[i])
339                         panic("itrunc2");
340         if (length == 0 && (!RB_EMPTY(&ovp->v_rbdirty_tree) ||
341                             !RB_EMPTY(&ovp->v_rbclean_tree)))
342                 panic("itrunc3");
343 #endif /* DIAGNOSTIC */
344         /*
345          * Put back the real size.
346          */
347         oip->i_size = length;
348         oip->i_blocks -= blocksreleased;
349         if (oip->i_blocks < 0)                  /* sanity */
350                 oip->i_blocks = 0;
351         oip->i_flag |= IN_CHANGE;
352         vnode_pager_setsize(ovp, length);
353 #if QUOTA
354         ext2_chkdq(oip, -blocksreleased, NOCRED, 0);
355 #endif
356         return (allerror);
357 }
358
359 /*
360  * Release blocks associated with the inode ip and stored in the indirect
361  * block bn.  Blocks are free'd in LIFO order up to (but not including)
362  * lastbn.  If level is greater than SINGLE, the block is an indirect block
363  * and recursive calls to indirtrunc must be used to cleanse other indirect
364  * blocks.
365  *
366  * NB: triple indirect blocks are untested.
367  */
368
369 static int
370 ext2_indirtrunc(struct inode *ip, daddr_t lbn, off_t doffset, daddr_t lastbn,
371                 int level, long *countp)
372 {
373         int i;
374         struct buf *bp;
375         struct ext2_sb_info *fs = ip->i_e2fs;
376         daddr_t *bap;
377         struct vnode *vp;
378         daddr_t *copy, nb, nlbn, last;
379         long blkcount, factor;
380         int nblocks, blocksreleased = 0;
381         int error = 0, allerror = 0;
382
383         /*
384          * Calculate index in current block of last
385          * block to be kept.  -1 indicates the entire
386          * block so we need not calculate the index.
387          */
388         factor = 1;
389         for (i = SINGLE; i < level; i++)
390                 factor *= NINDIR(fs);
391         last = lastbn;
392         if (lastbn > 0)
393                 last /= factor;
394         nblocks = btodb(fs->s_blocksize);
395         /*
396          * Get buffer of block pointers, zero those entries corresponding
397          * to blocks to be free'd, and update on disk copy first.  Since
398          * double(triple) indirect before single(double) indirect, calls
399          * to bmap on these blocks will fail.  However, we already have
400          * the on disk address, so we have to set the bio_offset field
401          * explicitly instead of letting bread do everything for us.
402          */
403         vp = ITOV(ip);
404         bp = getblk(vp, lblktodoff(fs, lbn), (int)fs->s_blocksize, 0, 0);
405         if ((bp->b_flags & B_CACHE) == 0) {
406                 bp->b_flags &= ~(B_ERROR | B_INVAL);
407                 bp->b_cmd = BUF_CMD_READ;
408                 if (bp->b_bcount > bp->b_bufsize)
409                         panic("ext2_indirtrunc: bad buffer size");
410                 bp->b_bio2.bio_offset = doffset;
411                 bp->b_bio1.bio_done = biodone_sync;
412                 bp->b_bio1.bio_flags |= BIO_SYNC;
413                 vfs_busy_pages(bp->b_vp, bp);
414                 vn_strategy(vp, &bp->b_bio1);
415                 error = biowait(&bp->b_bio1, "biord");
416         }
417         if (error) {
418                 brelse(bp);
419                 *countp = 0;
420                 return (error);
421         }
422
423         bap = (daddr_t *)bp->b_data;
424         copy = kmalloc(fs->s_blocksize, M_TEMP, M_WAITOK);
425         bcopy((caddr_t)bap, (caddr_t)copy, (u_int)fs->s_blocksize);
426         bzero((caddr_t)&bap[last + 1],
427           (u_int)(NINDIR(fs) - (last + 1)) * sizeof (daddr_t));
428         if (last == -1)
429                 bp->b_flags |= B_INVAL;
430         error = bwrite(bp);
431         if (error)
432                 allerror = error;
433         bap = copy;
434
435         /*
436          * Recursively free totally unused blocks.
437          */
438         for (i = NINDIR(fs) - 1, nlbn = lbn + 1 - i * factor; i > last;
439             i--, nlbn += factor) {
440                 nb = bap[i];
441                 if (nb == 0)
442                         continue;
443                 if (level > SINGLE) {
444                         if ((error = ext2_indirtrunc(ip, nlbn,
445                             fsbtodoff(fs, nb), (daddr_t)-1, level - 1, &blkcount)) != 0)
446                                 allerror = error;
447                         blocksreleased += blkcount;
448                 }
449                 ext2_blkfree(ip, nb, fs->s_blocksize);
450                 blocksreleased += nblocks;
451         }
452
453         /*
454          * Recursively free last partial block.
455          */
456         if (level > SINGLE && lastbn >= 0) {
457                 last = lastbn % factor;
458                 nb = bap[i];
459                 if (nb != 0) {
460                         error = ext2_indirtrunc(ip, nlbn, fsbtodoff(fs, nb),
461                                                 last, level - 1, &blkcount);
462                         if (error)
463                                 allerror = error;
464                         blocksreleased += blkcount;
465                 }
466         }
467         kfree(copy, M_TEMP);
468         *countp = blocksreleased;
469         return (allerror);
470 }
471
472 /*
473  * Last reference to an inode.  If necessary, write or delete it.
474  *
475  * ext2_inactive(struct vnode *a_vp)
476  */
477 int
478 ext2_inactive(struct vop_inactive_args *ap)
479 {
480         struct vnode *vp = ap->a_vp;
481         struct inode *ip = VTOI(vp);
482         int mode, error = 0;
483
484         ext2_discard_prealloc(ip);
485         if (prtactive && vp->v_sysref.refcnt > 1)
486                 vprint("ext2_inactive: pushing active", vp);
487
488         /*
489          * Ignore inodes related to stale file handles.
490          */
491         if (ip == NULL || ip->i_mode == 0)
492                 goto out;
493         if (ip->i_nlink <= 0 && (vp->v_mount->mnt_flag & MNT_RDONLY) == 0) {
494 #ifdef QUOTA
495                 if (!ext2_getinoquota(ip))
496                         (void)ext2_chkiq(ip, -1, NOCRED, FORCE);
497 #endif
498                 error = EXT2_TRUNCATE(vp, (off_t)0, 0, NOCRED);
499                 ip->i_rdev = 0;
500                 mode = ip->i_mode;
501                 ip->i_mode = 0;
502                 ip->i_flag |= IN_CHANGE | IN_UPDATE;
503                 EXT2_VFREE(vp, ip->i_number, mode);
504         }
505         if (ip->i_flag & (IN_ACCESS | IN_CHANGE | IN_MODIFIED | IN_UPDATE))
506                 EXT2_UPDATE(vp, 0);
507 out:
508         /*
509          * If we are done with the inode, reclaim it
510          * so that it can be reused immediately.
511          */
512         if (ip == NULL || ip->i_mode == 0)
513                 vrecycle(vp);
514         return (error);
515 }
516
517 /*
518  * Reclaim an inode so that it can be used for other purposes.
519  *
520  * ext2_reclaim(struct vnode *a_vp)
521  */
522 int
523 ext2_reclaim(struct vop_reclaim_args *ap)
524 {
525         struct inode *ip;
526         struct vnode *vp = ap->a_vp;
527 #ifdef QUOTA
528         int i;
529 #endif
530
531         if (prtactive && vp->v_sysref.refcnt > 1)
532                 vprint("ext2_reclaim: pushing active", vp);
533         ip = VTOI(vp);
534
535         /*
536          * Lazy updates.
537          */
538         if (ip) {
539                 if (ip->i_flag & IN_LAZYMOD) {
540                         ip->i_flag |= IN_MODIFIED;
541                         EXT2_UPDATE(vp, 0);
542                 }
543         }
544 #ifdef INVARIANTS
545         if (ip && (ip->i_flag & (IN_ACCESS | IN_CHANGE | IN_MODIFIED | IN_UPDATE))) {
546                 kprintf("WARNING: INODE %ld flags %08x: modified inode being released!\n", (long)ip->i_number, (int)ip->i_flag);
547                 ip->i_flag |= IN_MODIFIED;
548                 EXT2_UPDATE(vp, 0);
549         }
550 #endif
551         /*
552          * Remove the inode from its hash chain and purge namecache
553          * data associated with the vnode.
554          */
555         vp->v_data = NULL;
556         if (ip) {
557                 ext2_ihashrem(ip);
558                 if (ip->i_devvp) {
559                         vrele(ip->i_devvp);
560                         ip->i_devvp = 0;
561                 }
562 #ifdef QUOTA
563                 for (i = 0; i < MAXQUOTAS; i++) {
564                         if (ip->i_dquot[i] != NODQUOT) {
565                                 ext2_dqrele(vp, ip->i_dquot[i]);
566                                 ip->i_dquot[i] = NODQUOT;
567                         }
568                 }
569 #endif
570 #ifdef UFS_DIRHASH
571                 if (ip->i_dirhash != NULL)
572                         ext2dirhash_free(ip);
573 #endif
574                 kfree(ip, VFSTOEXT2(vp->v_mount)->um_malloctype);
575         }
576         return (0);
577 }