Merge from vendor branch SENDMAIL:
[dragonfly.git] / sys / vfs / udf / udf_vnops.c
1 /*-
2  * Copyright (c) 2001, 2002 Scott Long <scottl@freebsd.org>
3  * All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  * 1. Redistributions of source code must retain the above copyright
9  *    notice, this list of conditions and the following disclaimer.
10  * 2. Redistributions in binary form must reproduce the above copyright
11  *    notice, this list of conditions and the following disclaimer in the
12  *    documentation and/or other materials provided with the distribution.
13  *
14  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
15  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
16  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
17  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
18  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
19  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
20  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
21  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
22  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
23  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
24  * SUCH DAMAGE.
25  *
26  * $FreeBSD: src/sys/fs/udf/udf_vnops.c,v 1.33 2003/12/07 05:04:49 scottl Exp $
27  * $DragonFly: src/sys/vfs/udf/udf_vnops.c,v 1.22 2006/05/26 16:56:32 dillon Exp $
28  */
29
30 /* udf_vnops.c */
31 /* Take care of the vnode side of things */
32
33 #include <sys/param.h>
34 #include <sys/systm.h>
35 #include <sys/namei.h>
36 #include <sys/kernel.h>
37 #include <sys/malloc.h>
38 #include <sys/stat.h>
39 #include <sys/module.h>
40 #include <sys/buf.h>
41 #include <sys/iconv.h>
42 #include <sys/mount.h>
43 #include <sys/vnode.h>
44 #include <sys/dirent.h>
45 #include <sys/queue.h>
46 #include <sys/unistd.h>
47
48 #include <machine/inttypes.h>
49
50 #include <vfs/udf/ecma167-udf.h>
51 #include <vfs/udf/osta.h>
52 #include <vfs/udf/udf.h>
53 #include <vfs/udf/udf_mount.h>
54
55 static int udf_access(struct vop_access_args *);
56 static int udf_getattr(struct vop_getattr_args *);
57 static int udf_ioctl(struct vop_ioctl_args *);
58 static int udf_pathconf(struct vop_pathconf_args *);
59 static int udf_read(struct vop_read_args *);
60 static int udf_readdir(struct vop_readdir_args *);
61 static int udf_readlink(struct vop_readlink_args *ap);
62 static int udf_strategy(struct vop_strategy_args *);
63 static int udf_bmap(struct vop_bmap_args *);
64 static int udf_lookup(struct vop_old_lookup_args *);
65 static int udf_reclaim(struct vop_reclaim_args *);
66 static int udf_readatoffset(struct udf_node *, int *, int, struct buf **, uint8_t **);
67 static int udf_bmap_internal(struct udf_node *, uint32_t, daddr_t *, uint32_t *);
68
69 struct vnodeopv_entry_desc udf_vnodeop_entries[] = {
70         { &vop_default_desc,            vop_defaultop },
71         { &vop_access_desc,             (vnodeopv_entry_t) udf_access },
72         { &vop_bmap_desc,               (vnodeopv_entry_t) udf_bmap },
73         { &vop_old_lookup_desc,         (vnodeopv_entry_t) udf_lookup },
74         { &vop_getattr_desc,            (vnodeopv_entry_t) udf_getattr },
75         { &vop_ioctl_desc,              (vnodeopv_entry_t) udf_ioctl },
76         { &vop_pathconf_desc,           (vnodeopv_entry_t) udf_pathconf },
77         { &vop_read_desc,               (vnodeopv_entry_t) udf_read },
78         { &vop_readdir_desc,            (vnodeopv_entry_t) udf_readdir },
79         { &vop_readlink_desc,           (vnodeopv_entry_t) udf_readlink },
80         { &vop_reclaim_desc,            (vnodeopv_entry_t) udf_reclaim },
81         { &vop_strategy_desc,           (vnodeopv_entry_t) udf_strategy },
82         { NULL, NULL }
83 };
84
85 MALLOC_DEFINE(M_UDFFID, "UDF FID", "UDF FileId structure");
86 MALLOC_DEFINE(M_UDFDS, "UDF DS", "UDF Dirstream structure");
87
88 #define UDF_INVALID_BMAP        -1
89
90 /* Look up a udf_node based on the ino_t passed in and return it's vnode */
91 int
92 udf_hashlookup(struct udf_mnt *udfmp, ino_t id, struct vnode **vpp)
93 {
94         struct udf_node *node;
95         struct udf_hash_lh *lh;
96         struct vnode *vp;
97         lwkt_tokref hashlock;
98
99         *vpp = NULL;
100
101         lwkt_gettoken(&hashlock, &udfmp->hash_token);
102 loop:
103         lh = &udfmp->hashtbl[id % udfmp->hashsz];
104         if (lh == NULL) {
105                 lwkt_reltoken(&hashlock);
106                 return(ENOENT);
107         }
108         LIST_FOREACH(node, lh, le) {
109                 if (node->hash_id != id)
110                         continue;
111                 vp = node->i_vnode;
112                 if (vget(vp, LK_EXCLUSIVE))
113                         goto loop;
114                 /*
115                  * We must check to see if the inode has been ripped
116                  * out from under us after blocking.
117                  */
118                 lh = &udfmp->hashtbl[id % udfmp->hashsz];
119                 LIST_FOREACH(node, lh, le) {
120                         if (node->hash_id == id)
121                                 break;
122                 }
123                 if (node == NULL || vp != node->i_vnode) {
124                         vput(vp);
125                         goto loop;
126                 }
127                 lwkt_reltoken(&hashlock);
128                 *vpp = vp;
129                 return(0);
130         }
131
132         lwkt_reltoken(&hashlock);
133         return(0);
134 }
135
136 int
137 udf_hashins(struct udf_node *node)
138 {
139         struct udf_mnt *udfmp;
140         struct udf_hash_lh *lh;
141         lwkt_tokref hashlock;
142
143         udfmp = node->udfmp;
144
145         lwkt_gettoken(&hashlock, &udfmp->hash_token);
146         lh = &udfmp->hashtbl[node->hash_id % udfmp->hashsz];
147         if (lh == NULL)
148                 LIST_INIT(lh);
149         LIST_INSERT_HEAD(lh, node, le);
150         lwkt_reltoken(&hashlock);
151
152         return(0);
153 }
154
155 int
156 udf_hashrem(struct udf_node *node)
157 {
158         struct udf_mnt *udfmp;
159         struct udf_hash_lh *lh;
160         lwkt_tokref hashlock;
161
162         udfmp = node->udfmp;
163
164         lwkt_gettoken(&hashlock, &udfmp->hash_token);
165         lh = &udfmp->hashtbl[node->hash_id % udfmp->hashsz];
166         if (lh == NULL)
167                 panic("hash entry is NULL, node->hash_id= %"PRId64"\n", node->hash_id);
168         LIST_REMOVE(node, le);
169         lwkt_reltoken(&hashlock);
170
171         return(0);
172 }
173
174 int
175 udf_allocv(struct mount *mp, struct vnode **vpp)
176 {
177         int error;
178         struct vnode *vp;
179
180         error = getnewvnode(VT_UDF, mp, &vp, 0, 0);
181         if (error) {
182                 printf("udf_allocv: failed to allocate new vnode\n");
183                 return(error);
184         }
185
186         *vpp = vp;
187         return(0);
188 }
189
190 /* Convert file entry permission (5 bits per owner/group/user) to a mode_t */
191 static mode_t
192 udf_permtomode(struct udf_node *node)
193 {
194         uint32_t perm;
195         uint32_t flags;
196         mode_t mode;
197
198         perm = node->fentry->perm;
199         flags = node->fentry->icbtag.flags;
200
201         mode = perm & UDF_FENTRY_PERM_USER_MASK;
202         mode |= ((perm & UDF_FENTRY_PERM_GRP_MASK) >> 2);
203         mode |= ((perm & UDF_FENTRY_PERM_OWNER_MASK) >> 4);
204         mode |= ((flags & UDF_ICB_TAG_FLAGS_STICKY) << 4);
205         mode |= ((flags & UDF_ICB_TAG_FLAGS_SETGID) << 6);
206         mode |= ((flags & UDF_ICB_TAG_FLAGS_SETUID) << 8);
207
208         return(mode);
209 }
210
211 static int
212 udf_access(struct vop_access_args *a)
213 {
214         struct vnode *vp;
215         struct udf_node *node;
216         mode_t a_mode, mode, mask;
217         struct ucred *cred = a->a_cred;
218         gid_t *gp;
219         int i;
220
221         vp = a->a_vp;
222         node = VTON(vp);
223         a_mode = a->a_mode;
224
225         if (a_mode & VWRITE) {
226                 switch (vp->v_type) {
227                 case VDIR:
228                 case VLNK:
229                 case VREG:
230                         return(EROFS);
231                         /* NOT REACHED */
232                 default:
233                         break;
234                 }
235         }
236
237         mode = udf_permtomode(node);
238
239         if (cred->cr_uid == 0)
240                 return(0);
241
242         mask = 0;
243
244         /* Otherwise, check the owner. */
245         if (cred->cr_uid == node->fentry->uid) {
246                 if (a_mode & VEXEC)
247                         mask |= S_IXUSR;
248                 if (a_mode & VREAD)
249                         mask |= S_IRUSR;
250                 if (a_mode & VWRITE)
251                         mask |= S_IWUSR;
252                 return((mode & mask) == mask ? 0 : EACCES);
253         }
254
255         /* Otherwise, check the groups. */
256         for (i = 0, gp = cred->cr_groups; i < cred->cr_ngroups; i++, gp++)
257                 if (node->fentry->gid == *gp) {
258                         if (a_mode & VEXEC)
259                                 mask |= S_IXGRP;
260                         if (a_mode & VREAD)
261                                 mask |= S_IRGRP;
262                         if (a_mode & VWRITE)
263                                 mask |= S_IWGRP;
264                         return((mode & mask) == mask ? 0 : EACCES);
265                 }
266
267         /* Otherwise, check everyone else. */
268         if (a_mode & VEXEC)
269                 mask |= S_IXOTH;
270         if (a_mode & VREAD)
271                 mask |= S_IROTH;
272         if (a_mode & VWRITE)
273                 mask |= S_IWOTH;
274         return((mode & mask) == mask ? 0 : EACCES);
275 }
276
277 static int mon_lens[2][12] = {
278         {31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31},
279         {31, 29, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31}
280 };
281
282 static int
283 udf_isaleapyear(int year)
284 {
285         int i;
286
287         i = (year % 4) ? 0 : 1;
288         i &= (year % 100) ? 1 : 0;
289         i |= (year % 400) ? 0 : 1;
290
291         return(i);
292 }
293
294 /*
295  * XXX This is just a rough hack.  Daylight savings isn't calculated and tv_nsec
296  * is ignored.
297  * Timezone calculation compliments of Julian Elischer <julian@elischer.org>.
298  */
299 static void
300 udf_timetotimespec(struct timestamp *time, struct timespec *t)
301 {
302         int i, lpyear, daysinyear;
303         union {
304                 uint16_t        u_tz_offset;
305                 int16_t         s_tz_offset;
306         } tz;
307
308         t->tv_nsec = 0;
309
310         /* DirectCD seems to like using bogus year values */
311         if (time->year < 1970) {
312                 t->tv_sec = 0;
313                 return;
314         }
315
316         /* Calculate the time and day */
317         t->tv_sec = time->second;
318         t->tv_sec += time->minute * 60;
319         t->tv_sec += time->hour * 3600;
320         t->tv_sec += time->day * 3600 * 24;
321
322         /* Calclulate the month */
323         lpyear = udf_isaleapyear(time->year);
324         for (i = 1; i < time->month; i++)
325                 t->tv_sec += mon_lens[lpyear][i] * 3600 * 24;
326
327         /* Speed up the calculation */
328         if (time->year > 1979)
329                 t->tv_sec += 315532800;
330         if (time->year > 1989)
331                 t->tv_sec += 315619200;
332         if (time->year > 1999)
333                 t->tv_sec += 315532800;
334         for (i = 2000; i < time->year; i++) {
335                 daysinyear = udf_isaleapyear(i) + 365 ;
336                 t->tv_sec += daysinyear * 3600 * 24;
337         }
338
339         /*
340          * Calculate the time zone.  The timezone is 12 bit signed 2's
341          * compliment, so we gotta do some extra magic to handle it right.
342          */
343         tz.u_tz_offset = time->type_tz;
344         tz.u_tz_offset &= 0x0fff;
345         if (tz.u_tz_offset & 0x0800)
346                 tz.u_tz_offset |= 0xf000;       /* extend the sign to 16 bits */
347         if ((time->type_tz & 0x1000) && (tz.s_tz_offset != -2047))
348                 t->tv_sec -= tz.s_tz_offset * 60;
349
350         return;
351 }
352
353 static int
354 udf_getattr(struct vop_getattr_args *a)
355 {
356         struct vnode *vp;
357         struct udf_node *node;
358         struct vattr *vap;
359         struct file_entry *fentry;
360         struct timespec ts;
361
362         ts.tv_sec = 0;
363
364         vp = a->a_vp;
365         vap = a->a_vap;
366         node = VTON(vp);
367         fentry = node->fentry;
368
369         vap->va_fsid = dev2udev(node->i_dev);
370         vap->va_fileid = node->hash_id;
371         vap->va_mode = udf_permtomode(node);
372         vap->va_nlink = fentry->link_cnt;
373         /*
374          * XXX The spec says that -1 is valid for uid/gid and indicates an
375          * invalid uid/gid.  How should this be represented?
376          */
377         vap->va_uid = (fentry->uid == 0xffffffff) ? 0 : fentry->uid;
378         vap->va_gid = (fentry->gid == 0xffffffff) ? 0 : fentry->gid;
379         udf_timetotimespec(&fentry->atime, &vap->va_atime);
380         udf_timetotimespec(&fentry->mtime, &vap->va_mtime);
381         vap->va_ctime = vap->va_mtime; /* XXX Stored as an Extended Attribute */
382         vap->va_rdev = 0; /* XXX */
383         if (vp->v_type & VDIR) {
384                 /*
385                  * Directories that are recorded within their ICB will show
386                  * as having 0 blocks recorded.  Since tradition dictates
387                  * that directories consume at least one logical block,
388                  * make it appear so.
389                  */
390                 if (fentry->logblks_rec != 0)
391                         vap->va_size = fentry->logblks_rec * node->udfmp->bsize;
392                 else
393                         vap->va_size = node->udfmp->bsize;
394         } else
395                 vap->va_size = fentry->inf_len;
396         vap->va_flags = 0;
397         vap->va_gen = 1;
398         vap->va_blocksize = node->udfmp->bsize;
399         vap->va_bytes = fentry->inf_len;
400         vap->va_type = vp->v_type;
401         vap->va_filerev = 0; /* XXX */
402         return(0);
403 }
404
405 /*
406  * File specific ioctls.  DeCSS candidate?
407  */
408 static int
409 udf_ioctl(struct vop_ioctl_args *a)
410 {
411         printf("%s called\n", __func__);
412         return(ENOTTY);
413 }
414
415 /*
416  * I'm not sure that this has much value in a read-only filesystem, but
417  * cd9660 has it too.
418  */
419 static int
420 udf_pathconf(struct vop_pathconf_args *a)
421 {
422
423         switch (a->a_name) {
424         case _PC_LINK_MAX:
425                 *a->a_retval = 65535;
426                 return(0);
427         case _PC_NAME_MAX:
428                 *a->a_retval = NAME_MAX;
429                 return(0);
430         case _PC_PATH_MAX:
431                 *a->a_retval = PATH_MAX;
432                 return(0);
433         case _PC_NO_TRUNC:
434                 *a->a_retval = 1;
435                 return(0);
436         default:
437                 return(EINVAL);
438         }
439 }
440
441 static int
442 udf_read(struct vop_read_args *a)
443 {
444         struct vnode *vp = a->a_vp;
445         struct uio *uio = a->a_uio;
446         struct udf_node *node = VTON(vp);
447         struct buf *bp;
448         uint8_t *data;
449         int error = 0;
450         int size, fsize, offset;
451
452         if (uio->uio_offset < 0)
453                 return(EINVAL);
454
455         fsize = node->fentry->inf_len;
456
457         while (uio->uio_offset < fsize && uio->uio_resid > 0) {
458                 offset = uio->uio_offset;
459                 size = uio->uio_resid;
460                 error = udf_readatoffset(node, &size, offset, &bp, &data);
461                 if (error == 0)
462                         error = uiomove(data, size, uio);
463                 if (bp != NULL)
464                         brelse(bp);
465                 if (error)
466                         break;
467         }
468
469         return(error);
470 }
471
472 /*
473  * Call the OSTA routines to translate the name from a CS0 dstring to a
474  * 16-bit Unicode String.  Hooks need to be placed in here to translate from
475  * Unicode to the encoding that the kernel/user expects.  Return the length
476  * of the translated string.
477  */
478 static int
479 udf_transname(char *cs0string, char *destname, int len, struct udf_mnt *udfmp)
480 {
481         unicode_t *transname;
482         int i, unilen = 0, destlen;
483
484         /* Convert 16-bit Unicode to destname */
485         /* allocate a buffer big enough to hold an 8->16 bit expansion */
486         transname = malloc(NAME_MAX * sizeof(unicode_t), M_TEMP, M_WAITOK | M_ZERO);
487
488         if ((unilen = udf_UncompressUnicode(len, cs0string, transname)) == -1) {
489                 printf("udf: Unicode translation failed\n");
490                 free(transname, M_TEMP);
491                 return(0);
492         }
493
494         for (i = 0; i < unilen ; i++)
495                 if (transname[i] & 0xff00)
496                         destname[i] = '.';      /* Fudge the 16bit chars */
497                 else
498                         destname[i] = transname[i] & 0xff;
499         free(transname, M_TEMP);
500         destname[unilen] = 0;
501         destlen = unilen;
502
503         return(destlen);
504 }
505
506 /*
507  * Compare a CS0 dstring with a name passed in from the VFS layer.  Return
508  * 0 on a successful match, nonzero therwise.  Unicode work may need to be done
509  * here also.
510  */
511 static int
512 udf_cmpname(char *cs0string, char *cmpname, int cs0len, int cmplen, struct udf_mnt *udfmp)
513 {
514         char *transname;
515         int error = 0;
516
517         /* This is overkill, but not worth creating a new zone */
518         
519         transname = malloc(NAME_MAX * sizeof(unicode_t), M_TEMP,
520                            M_WAITOK | M_ZERO);
521
522         cs0len = udf_transname(cs0string, transname, cs0len, udfmp);
523
524         /* Easy check.  If they aren't the same length, they aren't equal */
525         if ((cs0len == 0) || (cs0len != cmplen))
526                 error = -1;
527         else
528                 error = bcmp(transname, cmpname, cmplen);
529
530         free(transname, M_TEMP);
531         return(error);
532 }
533
534 struct udf_uiodir {
535         struct dirent *dirent;
536         u_long *cookies;
537         int ncookies;
538         int acookies;
539         int eofflag;
540 };
541
542 static struct udf_dirstream *
543 udf_opendir(struct udf_node *node, int offset, int fsize, struct udf_mnt *udfmp)
544 {
545         struct udf_dirstream *ds;
546
547         ds = malloc(sizeof(*ds), M_UDFDS, M_WAITOK | M_ZERO);
548
549         ds->node = node;
550         ds->offset = offset;
551         ds->udfmp = udfmp;
552         ds->fsize = fsize;
553
554         return(ds);
555 }
556
557 static struct fileid_desc *
558 udf_getfid(struct udf_dirstream *ds)
559 {
560         struct fileid_desc *fid;
561         int error, frag_size = 0, total_fid_size;
562
563         /* End of directory? */
564         if (ds->offset + ds->off >= ds->fsize) {
565                 ds->error = 0;
566                 return(NULL);
567         }
568
569         /* Grab the first extent of the directory */
570         if (ds->off == 0) {
571                 ds->size = 0;
572                 if (ds->bp != NULL)
573                         brelse(ds->bp);
574                 error = udf_readatoffset(ds->node, &ds->size, ds->offset,
575                     &ds->bp, &ds->data);
576                 if (error) {
577                         ds->error = error;
578                         return(NULL);
579                 }
580         }
581
582         /*
583          * Clean up from a previous fragmented FID.
584          * XXX Is this the right place for this?
585          */
586         if (ds->fid_fragment && ds->buf != NULL) {
587                 ds->fid_fragment = 0;
588                 free(ds->buf, M_UDFFID);
589         }
590
591         fid = (struct fileid_desc*)&ds->data[ds->off];
592
593         /*
594          * Check to see if the fid is fragmented. The first test
595          * ensures that we don't wander off the end of the buffer
596          * looking for the l_iu and l_fi fields.
597          */
598         if (ds->off + UDF_FID_SIZE > ds->size ||
599             ds->off + fid->l_iu + fid->l_fi + UDF_FID_SIZE > ds->size) {
600
601                 /* Copy what we have of the fid into a buffer */
602                 frag_size = ds->size - ds->off;
603                 if (frag_size >= ds->udfmp->bsize) {
604                         printf("udf: invalid FID fragment\n");
605                         ds->error = EINVAL;
606                         return(NULL);
607                 }
608
609                 /*
610                  * File ID descriptors can only be at most one
611                  * logical sector in size.
612                  */
613                 ds->buf = malloc(ds->udfmp->bsize, M_UDFFID, M_WAITOK | M_ZERO);
614                 bcopy(fid, ds->buf, frag_size);
615
616                 /* Reduce all of the casting magic */
617                 fid = (struct fileid_desc*)ds->buf;
618
619                 if (ds->bp != NULL)
620                         brelse(ds->bp);
621
622                 /* Fetch the next allocation */
623                 ds->offset += ds->size;
624                 ds->size = 0;
625                 error = udf_readatoffset(ds->node, &ds->size, ds->offset,
626                     &ds->bp, &ds->data);
627                 if (error) {
628                         ds->error = error;
629                         return(NULL);
630                 }
631
632                 /*
633                  * If the fragment was so small that we didn't get
634                  * the l_iu and l_fi fields, copy those in.
635                  */
636                 if (frag_size < UDF_FID_SIZE)
637                         bcopy(ds->data, &ds->buf[frag_size],
638                             UDF_FID_SIZE - frag_size);
639
640                 /*
641                  * Now that we have enough of the fid to work with,
642                  * copy in the rest of the fid from the new
643                  * allocation.
644                  */
645                 total_fid_size = UDF_FID_SIZE + fid->l_iu + fid->l_fi;
646                 if (total_fid_size > ds->udfmp->bsize) {
647                         printf("udf: invalid FID\n");
648                         ds->error = EIO;
649                         return(NULL);
650                 }
651                 bcopy(ds->data, &ds->buf[frag_size],
652                     total_fid_size - frag_size);
653
654                 ds->fid_fragment = 1;
655         } else
656                 total_fid_size = fid->l_iu + fid->l_fi + UDF_FID_SIZE;
657
658         /*
659          * Update the offset. Align on a 4 byte boundary because the
660          * UDF spec says so.
661          */
662         ds->this_off = ds->off;
663         if (!ds->fid_fragment)
664                 ds->off += (total_fid_size + 3) & ~0x03;
665         else
666                 ds->off = (total_fid_size - frag_size + 3) & ~0x03;
667
668         return(fid);
669 }
670
671 static void
672 udf_closedir(struct udf_dirstream *ds)
673 {
674
675         if (ds->bp != NULL)
676                 brelse(ds->bp);
677
678         if (ds->fid_fragment && ds->buf != NULL)
679                 free(ds->buf, M_UDFFID);
680
681         free(ds, M_UDFDS);
682 }
683
684 static int
685 udf_readdir(struct vop_readdir_args *a)
686 {
687         struct vnode *vp;
688         struct uio *uio;
689         struct udf_node *node;
690         struct udf_mnt *udfmp;
691         struct fileid_desc *fid;
692         struct udf_uiodir uiodir;
693         struct udf_dirstream *ds;
694         u_long *cookies = NULL;
695         int ncookies;
696         int error = 0;
697         char *name;
698
699         vp = a->a_vp;
700         uio = a->a_uio;
701         node = VTON(vp);
702         udfmp = node->udfmp;
703         uiodir.eofflag = 1;
704
705         if (a->a_ncookies != NULL) {
706                 /*
707                  * Guess how many entries are needed.  If we run out, this
708                  * function will be called again and thing will pick up were
709                  * it left off.
710                  */
711                 ncookies = uio->uio_resid / 8 + 1;
712                 if (ncookies > 1024)
713                         ncookies = 1024;
714                 cookies = malloc(sizeof(u_long) * ncookies, M_TEMP, M_WAITOK);
715                 uiodir.ncookies = ncookies;
716                 uiodir.cookies = cookies;
717                 uiodir.acookies = 0;
718         } else
719                 uiodir.cookies = NULL;
720
721         /*
722          * Iterate through the file id descriptors.  Give the parent dir
723          * entry special attention.
724          */
725         ds = udf_opendir(node, uio->uio_offset, node->fentry->inf_len,
726                          node->udfmp);
727
728         name = malloc(NAME_MAX, M_TEMP, M_WAITOK);
729
730         while ((fid = udf_getfid(ds)) != NULL) {
731
732                 /* XXX Should we return an error on a bad fid? */
733                 if (udf_checktag(&fid->tag, TAGID_FID)) {
734                         printf("Invalid FID tag\n");
735                         error = EIO;
736                         break;
737                 }
738
739                 /* Is this a deleted file? */
740                 if (fid->file_char & UDF_FILE_CHAR_DEL)
741                         continue;
742
743                 if ((fid->l_fi == 0) && (fid->file_char & UDF_FILE_CHAR_PAR)) {
744                         /* Do up the '.' and '..' entries.  Dummy values are
745                          * used for the cookies since the offset here is
746                          * usually zero, and NFS doesn't like that value
747                          */
748                         if (uiodir.cookies != NULL) {
749                                 if (++uiodir.acookies > uiodir.ncookies) {
750                                         uiodir.eofflag = 0;
751                                         break;
752                                 }
753                                 *uiodir.cookies++ = 1;
754                         }
755                         if (vop_write_dirent(&error, uio, node->hash_id, DT_DIR,
756                                              1, ".")) {
757                                 uiodir.eofflag = 0;
758                                 break;
759                         }
760                         if (error) {
761                                 uiodir.eofflag = 0;
762                                 break;
763                         }
764                         if (uiodir.cookies != NULL) {
765                                 if (++uiodir.acookies > uiodir.ncookies) {
766                                         uiodir.eofflag = 0;
767                                         break;
768                                 }
769                                 *uiodir.cookies++ = 2;
770                         }
771                         if (vop_write_dirent(&error, uio, udf_getid(&fid->icb),
772                                              DT_DIR, 2, "..")) {
773                                 uiodir.eofflag = 0;
774                                 break;
775                         }
776                         if (error) {
777                                 uiodir.eofflag = 0;
778                                 break;
779                         }
780                 } else {
781                         uint8_t d_type = (fid->file_char & UDF_FILE_CHAR_DIR) ?
782                             DT_DIR : DT_UNKNOWN;
783                         uint16_t namelen = udf_transname(&fid->data[fid->l_iu],
784                             name, fid->l_fi, udfmp);
785
786                         if (uiodir.cookies != NULL) {
787                                 if (++uiodir.acookies > uiodir.ncookies) {
788                                         uiodir.eofflag = 0;
789                                         break;
790                                 }
791                                 *uiodir.cookies++ = ds->this_off;
792                         }
793                         if (vop_write_dirent(&error, uio, udf_getid(&fid->icb),
794                                          d_type, namelen, name)) {
795                                 uiodir.eofflag = 0;
796                                 break;
797                         }
798                         if (error) {
799                                 uiodir.eofflag = 0;
800                                 break;
801                         }
802                 }
803                 if (error) {
804                         printf("uiomove returned %d\n", error);
805                         break;
806                 }
807
808         }
809
810         free(name, M_TEMP);
811
812         /* tell the calling layer whether we need to be called again */
813         *a->a_eofflag = uiodir.eofflag;
814         uio->uio_offset = ds->offset + ds->off;
815
816         if (!error)
817                 error = ds->error;
818
819         udf_closedir(ds);
820
821         if (a->a_ncookies != NULL) {
822                 if (error)
823                         free(cookies, M_TEMP);
824                 else {
825                         *a->a_ncookies = uiodir.acookies;
826                         *a->a_cookies = cookies;
827                 }
828         }
829
830         return(error);
831 }
832
833 /* Are there any implementations out there that do soft-links? */
834 static int
835 udf_readlink(struct vop_readlink_args *ap)
836 {
837         printf("%s called\n", __func__);
838         return(EOPNOTSUPP);
839 }
840
841 static int
842 udf_strategy(struct vop_strategy_args *ap)
843 {
844         struct bio *bio;
845         struct bio *nbio;
846         struct buf *bp;
847         struct vnode *vp;
848         struct udf_node *node;
849         int maxsize;
850         daddr_t dblkno;
851
852         bio = ap->a_bio;
853         bp = bio->bio_buf;
854         vp = ap->a_vp;
855         node = VTON(vp);
856
857         nbio = push_bio(bio);
858         if (nbio->bio_offset == NOOFFSET) {
859                 /*
860                  * Files that are embedded in the fentry don't translate well
861                  * to a block number.  Reject.
862                  */
863                 if (udf_bmap_internal(node, 
864                                      bio->bio_offset,
865                                      &dblkno, &maxsize)) {
866                         clrbuf(bp);
867                         nbio->bio_offset = NOOFFSET;
868                 } else {
869                         nbio->bio_offset = dbtob(dblkno);
870                 }
871         }
872         if (nbio->bio_offset == NOOFFSET) {
873                 /* I/O was never started on nbio, must biodone(bio) */
874                 biodone(bio);
875                 return(0);
876         }
877         vn_strategy(node->i_devvp, nbio);
878         return(0);
879 }
880
881 static int
882 udf_bmap(struct vop_bmap_args *a)
883 {
884         struct udf_node *node;
885         uint32_t max_size;
886         daddr_t lsector;
887         int error;
888
889         node = VTON(a->a_vp);
890
891         if (a->a_vpp != NULL)
892                 *a->a_vpp = node->i_devvp;
893         if (a->a_doffsetp == NULL)
894                 return(0);
895
896         KKASSERT(a->a_loffset % node->udfmp->bsize == 0);
897
898         error = udf_bmap_internal(node, a->a_loffset, &lsector, &max_size);
899         if (error)
900                 return(error);
901
902         /* Translate logical to physical sector number */
903         *a->a_doffsetp = (off_t)lsector << node->udfmp->bshift;
904
905         /* Punt on read-ahead for now */
906         if (a->a_runp)
907                 *a->a_runp = 0;
908         if (a->a_runb)
909                 *a->a_runb = 0;
910         return(0);
911 }
912
913 /*
914  * The all powerful VOP_LOOKUP().
915  */
916 static int
917 udf_lookup(struct vop_old_lookup_args *a)
918 {
919         struct vnode *dvp;
920         struct vnode *tdp = NULL;
921         struct vnode **vpp = a->a_vpp;
922         struct udf_node *node;
923         struct udf_mnt *udfmp;
924         struct fileid_desc *fid = NULL;
925         struct udf_dirstream *ds;
926         struct thread *td;
927         globaldata_t gd = mycpu;
928         u_long nameiop;
929         u_long flags;
930         char *nameptr;
931         long namelen;
932         ino_t id = 0;
933         int offset, error = 0;
934         int numdirpasses, fsize;
935
936         dvp = a->a_dvp;
937         node = VTON(dvp);
938         udfmp = node->udfmp;
939         nameiop = a->a_cnp->cn_nameiop;
940         flags = a->a_cnp->cn_flags;
941         nameptr = a->a_cnp->cn_nameptr;
942         namelen = a->a_cnp->cn_namelen;
943         fsize = node->fentry->inf_len;
944         td = a->a_cnp->cn_td;
945
946         /*
947          * If this is a LOOKUP and we've already partially searched through
948          * the directory, pick up where we left off and flag that the
949          * directory may need to be searched twice.  For a full description,
950          * see /sys/isofs/cd9660/cd9660_lookup.c:cd9660_lookup()
951          */
952         if (nameiop != NAMEI_LOOKUP || node->diroff == 0 ||
953             node->diroff > fsize) {
954                 offset = 0;
955                 numdirpasses = 1;
956         } else {
957                 offset = node->diroff;
958                 numdirpasses = 2;
959                 gd->gd_nchstats->ncs_2passes++;
960         }
961
962 lookloop:
963         ds = udf_opendir(node, offset, fsize, udfmp);
964
965         while ((fid = udf_getfid(ds)) != NULL) {
966                 /* XXX Should we return an error on a bad fid? */
967                 if (udf_checktag(&fid->tag, TAGID_FID)) {
968                         printf("udf_lookup: Invalid tag\n");
969                         error = EIO;
970                         break;
971                 }
972
973                 /* Is this a deleted file? */
974                 if (fid->file_char & UDF_FILE_CHAR_DEL)
975                         continue;
976
977                 if ((fid->l_fi == 0) && (fid->file_char & UDF_FILE_CHAR_PAR)) {
978                         if (flags & CNP_ISDOTDOT) {
979                                 id = udf_getid(&fid->icb);
980                                 break;
981                         }
982                 } else {
983                         if (!(udf_cmpname(&fid->data[fid->l_iu],
984                                           nameptr, fid->l_fi, namelen, udfmp))) {
985                                 id = udf_getid(&fid->icb);
986                                 break;
987                         }
988                 }
989         }
990
991         if (!error)
992                 error = ds->error;
993
994         /* XXX Bail out here? */
995         if (error) {
996                 udf_closedir(ds);
997                 return (error);
998         }
999
1000         /* Did we have a match? */
1001         if (id) {
1002                 error = udf_vget(udfmp->im_mountp, id, &tdp);
1003                 if (!error) {
1004                         /*
1005                          * Remember where this entry was if it's the final
1006                          * component.
1007                          */
1008                         if (nameiop == NAMEI_LOOKUP)
1009                                 node->diroff = ds->offset + ds->off;
1010                         if (numdirpasses == 2)
1011                                 gd->gd_nchstats->ncs_pass2++;
1012                         if ((flags & CNP_LOCKPARENT) == 0) {
1013                                 a->a_cnp->cn_flags |= CNP_PDIRUNLOCK;
1014                                 VOP_UNLOCK(dvp, 0);
1015                         }
1016
1017                         *vpp = tdp;
1018                 }
1019         } else {
1020                 /* Name wasn't found on this pass.  Do another pass? */
1021                 if (numdirpasses == 2) {
1022                         numdirpasses--;
1023                         offset = 0;
1024                         udf_closedir(ds);
1025                         goto lookloop;
1026                 }
1027                 if (nameiop == NAMEI_CREATE || nameiop == NAMEI_RENAME) {
1028                         error = EROFS;
1029                 } else {
1030                         error = ENOENT;
1031                 }
1032         }
1033
1034         udf_closedir(ds);
1035         return(error);
1036 }
1037
1038 static int
1039 udf_reclaim(struct vop_reclaim_args *a)
1040 {
1041         struct vnode *vp;
1042         struct udf_node *unode;
1043
1044         vp = a->a_vp;
1045         unode = VTON(vp);
1046
1047         if (unode != NULL) {
1048                 udf_hashrem(unode);
1049                 if (unode->i_devvp) {
1050                         vrele(unode->i_devvp);
1051                         unode->i_devvp = 0;
1052                 }
1053
1054                 if (unode->fentry != NULL)
1055                         free(unode->fentry, M_UDFFENTRY);
1056                 free(unode, M_UDFNODE);
1057                 vp->v_data = NULL;
1058         }
1059
1060         return(0);
1061 }
1062
1063 /*
1064  * Read the block and then set the data pointer to correspond with the
1065  * offset passed in.  Only read in at most 'size' bytes, and then set 'size'
1066  * to the number of bytes pointed to.  If 'size' is zero, try to read in a
1067  * whole extent.
1068  *
1069  * Note that *bp may be assigned error or not.
1070  *
1071  * XXX 'size' is limited to the logical block size for now due to problems
1072  * with udf_read()
1073  */
1074 static int
1075 udf_readatoffset(struct udf_node *node, int *size, int offset, struct buf **bp,
1076                  uint8_t **data)
1077 {
1078         struct udf_mnt *udfmp;
1079         struct file_entry *fentry = NULL;
1080         struct buf *bp1;
1081         uint32_t max_size;
1082         daddr_t sector;
1083         int error;
1084
1085         udfmp = node->udfmp;
1086
1087         *bp = NULL;
1088         error = udf_bmap_internal(node, offset, &sector, &max_size);
1089         if (error == UDF_INVALID_BMAP) {
1090                 /*
1091                  * This error means that the file *data* is stored in the
1092                  * allocation descriptor field of the file entry.
1093                  */
1094                 fentry = node->fentry;
1095                 *data = &fentry->data[fentry->l_ea];
1096                 *size = fentry->l_ad;
1097                 return(0);
1098         } else if (error != 0) {
1099                 return(error);
1100         }
1101
1102         /* Adjust the size so that it is within range */
1103         if (*size == 0 || *size > max_size)
1104                 *size = max_size;
1105         *size = min(*size, MAXBSIZE);
1106
1107         if ((error = udf_readlblks(udfmp, sector, *size, bp))) {
1108                 printf("warning: udf_readlblks returned error %d\n", error);
1109                 /* note: *bp may be non-NULL */
1110                 return(error);
1111         }
1112
1113         bp1 = *bp;
1114         *data = (uint8_t *)&bp1->b_data[offset % udfmp->bsize];
1115         return(0);
1116 }
1117
1118 /*
1119  * Translate a file offset into a logical block and then into a physical
1120  * block.
1121  */
1122 static int
1123 udf_bmap_internal(struct udf_node *node, uint32_t offset, daddr_t *sector, uint32_t *max_size)
1124 {
1125         struct udf_mnt *udfmp;
1126         struct file_entry *fentry;
1127         void *icb;
1128         struct icb_tag *tag;
1129         uint32_t icblen = 0;
1130         daddr_t lsector;
1131         int ad_offset, ad_num = 0;
1132         int i, p_offset;
1133
1134         udfmp = node->udfmp;
1135         fentry = node->fentry;
1136         tag = &fentry->icbtag;
1137
1138         switch (tag->strat_type) {
1139         case 4:
1140                 break;
1141
1142         case 4096:
1143                 printf("Cannot deal with strategy4096 yet!\n");
1144                 return(ENODEV);
1145
1146         default:
1147                 printf("Unknown strategy type %d\n", tag->strat_type);
1148                 return(ENODEV);
1149         }
1150
1151         switch (tag->flags & 0x7) {
1152         case 0:
1153                 /*
1154                  * The allocation descriptor field is filled with short_ad's.
1155                  * If the offset is beyond the current extent, look for the
1156                  * next extent.
1157                  */
1158                 do {
1159                         offset -= icblen;
1160                         ad_offset = sizeof(struct short_ad) * ad_num;
1161                         if (ad_offset > fentry->l_ad) {
1162                                 printf("File offset out of bounds\n");
1163                                 return(EINVAL);
1164                         }
1165                         icb = GETICB(long_ad, fentry, fentry->l_ea + ad_offset);
1166                         icblen = GETICBLEN(short_ad, icb);
1167                         ad_num++;
1168                 } while(offset >= icblen);
1169
1170                 lsector = (offset  >> udfmp->bshift) +
1171                     ((struct short_ad *)(icb))->pos;
1172
1173                 *max_size = GETICBLEN(short_ad, icb);
1174
1175                 break;
1176         case 1:
1177                 /*
1178                  * The allocation descriptor field is filled with long_ad's
1179                  * If the offset is beyond the current extent, look for the
1180                  * next extent.
1181                  */
1182                 do {
1183                         offset -= icblen;
1184                         ad_offset = sizeof(struct long_ad) * ad_num;
1185                         if (ad_offset > fentry->l_ad) {
1186                                 printf("File offset out of bounds\n");
1187                                 return(EINVAL);
1188                         }
1189                         icb = GETICB(long_ad, fentry, fentry->l_ea + ad_offset);
1190                         icblen = GETICBLEN(long_ad, icb);
1191                         ad_num++;
1192                 } while(offset >= icblen);
1193
1194                 lsector = (offset >> udfmp->bshift) +
1195                     ((struct long_ad *)(icb))->loc.lb_num;
1196
1197                 *max_size = GETICBLEN(long_ad, icb);
1198
1199                 break;
1200         case 3:
1201                 /*
1202                  * This type means that the file *data* is stored in the
1203                  * allocation descriptor field of the file entry.
1204                  */
1205                 *max_size = 0;
1206                 *sector = node->hash_id + udfmp->part_start;
1207
1208                 return(UDF_INVALID_BMAP);
1209         case 2:
1210                 /* DirectCD does not use extended_ad's */
1211         default:
1212                 printf("Unsupported allocation descriptor %d\n",
1213                        tag->flags & 0x7);
1214                 return(ENODEV);
1215         }
1216
1217         *sector = lsector + udfmp->part_start;
1218
1219         /*
1220          * Check the sparing table.  Each entry represents the beginning of
1221          * a packet.
1222          */
1223         if (udfmp->s_table != NULL) {
1224                 for (i = 0; i< udfmp->s_table_entries; i++) {
1225                         p_offset = lsector - udfmp->s_table->entries[i].org;
1226                         if ((p_offset < udfmp->p_sectors) && (p_offset >= 0)) {
1227                                 *sector = udfmp->s_table->entries[i].map +
1228                                     p_offset;
1229                                 break;
1230                         }
1231                 }
1232         }
1233
1234         return(0);
1235 }