Merge branch 'vendor/NVI2'
[dragonfly.git] / sys / boot / pc32 / libi386 / biosdisk.c
1 /*-
2  * Copyright (c) 1998 Michael Smith <msmith@freebsd.org>
3  * All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  * 1. Redistributions of source code must retain the above copyright
9  *    notice, this list of conditions and the following disclaimer.
10  * 2. Redistributions in binary form must reproduce the above copyright
11  *    notice, this list of conditions and the following disclaimer in the
12  *    documentation and/or other materials provided with the distribution.
13  *
14  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
15  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
16  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
17  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
18  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
19  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
20  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
21  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
22  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
23  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
24  * SUCH DAMAGE.
25  *
26  * $FreeBSD: src/sys/boot/i386/libi386/biosdisk.c,v 1.45 2004/09/21 06:46:44 wes Exp $
27  */
28
29 /*
30  * BIOS disk device handling.
31  * 
32  * Ideas and algorithms from:
33  *
34  * - NetBSD libi386/biosdisk.c
35  * - FreeBSD biosboot/disk.c
36  *
37  */
38
39 #include <stand.h>
40
41 #include <sys/disklabel32.h>
42 #include <sys/disklabel64.h>
43 #include <sys/diskmbr.h>
44 #include <sys/dtype.h>
45 #include <machine/bootinfo.h>
46
47 #include <stdarg.h>
48
49 #include <bootstrap.h>
50 #include <btxv86.h>
51 #include "libi386.h"
52
53 #define BIOS_NUMDRIVES          0x475
54 #define BIOSDISK_SECSIZE        512
55 #define BUFSIZE                 (4 * BIOSDISK_SECSIZE)
56 #define MAXBDDEV                MAXDEV
57
58 #define DT_ATAPI                0x10            /* disk type for ATAPI floppies */
59 #define WDMAJOR                 0               /* major numbers for devices we frontend for */
60 #define WFDMAJOR                1
61 #define FDMAJOR                 2
62 #define DAMAJOR                 4
63
64 #ifdef DISK_DEBUG
65 # define DEBUG(fmt, args...)    printf("%s: " fmt "\n" , __func__ , ## args)
66 #else
67 # define DEBUG(fmt, args...)
68 #endif
69
70 struct open_disk {
71     int                 od_dkunit;              /* disk unit number */
72     int                 od_unit;                /* BIOS unit number */
73     int                 od_cyl;                 /* BIOS geometry */
74     int                 od_hds;
75     int                 od_sec;
76     int                 od_boff;                /* block offset from beginning of BIOS disk */
77     int                 od_flags;
78 #define BD_MODEINT13            0x0000
79 #define BD_MODEEDD1             0x0001
80 #define BD_MODEEDD3             0x0002
81 #define BD_MODEMASK             0x0003
82 #define BD_FLOPPY               0x0004
83 #define BD_LABELOK              0x0008
84 #define BD_PARTTABOK            0x0010
85     union {
86         struct disklabel32              od_disklabel;
87         struct disklabel64              od_disklabel64;
88     };
89     int                         od_nslices;     /* slice count */
90     struct dos_partition        od_slicetab[NEXTDOSPART];
91 };
92
93 /*
94  * List of BIOS devices, translation from disk unit number to
95  * BIOS unit number.
96  */
97 static struct bdinfo
98 {
99     int         bd_unit;                /* BIOS unit number */
100     int         bd_flags;
101     int         bd_type;                /* BIOS 'drive type' (floppy only) */
102 } bdinfo [MAXBDDEV];
103 static int nbdinfo = 0;
104
105 static int      bd_getgeom(struct open_disk *od);
106 static int      bd_read(struct open_disk *od, daddr_t dblk, int blks,
107                     caddr_t dest);
108 static int      bd_write(struct open_disk *od, daddr_t dblk, int blks,
109                     caddr_t dest);
110
111 static int      bd_int13probe(struct bdinfo *bd);
112
113 static void     bd_printslice(struct open_disk *od, struct dos_partition *dp,
114                     char *prefix, int verbose);
115 static void     bd_printbsdslice(struct open_disk *od, daddr_t offset,
116                     char *prefix, int verbose);
117
118 static int      bd_init(void);
119 static int      bd_strategy(void *devdata, int flag, daddr_t dblk,
120                     size_t size, char *buf, size_t *rsize);
121 static int      bd_realstrategy(void *devdata, int flag, daddr_t dblk,
122                     size_t size, char *buf, size_t *rsize);
123 static int      bd_open(struct open_file *f, ...);
124 static int      bd_close(struct open_file *f);
125 static void     bd_print(int verbose);
126
127 /*
128  * Max number of sectors to bounce-buffer if the request crosses a 64k boundary
129  */
130 #define BOUNCEBUF_SIZE  8192
131 #define BOUNCEBUF_SECTS (BOUNCEBUF_SIZE / BIOSDISK_SECSIZE)
132
133 struct devsw biosdisk = {
134     "disk", 
135     DEVT_DISK, 
136     bd_init,
137     bd_strategy, 
138     bd_open, 
139     bd_close, 
140     noioctl,
141     bd_print,
142     NULL
143 };
144
145 static int      bd_opendisk(struct open_disk **odp, struct i386_devdesc *dev);
146 static void     bd_closedisk(struct open_disk *od);
147 static int      bd_bestslice(struct open_disk *od);
148 static void     bd_chainextended(struct open_disk *od, u_int32_t base,
149                                         u_int32_t offset);
150
151 /*
152  * Bounce buffers can no longer be malloc()'d because the malloc pool
153  * now uses high memory.  Declare statically.
154  */
155 static char     bounce_base[BOUNCEBUF_SIZE];
156
157 /*
158  * Translate between BIOS device numbers and our private unit numbers.
159  */
160 int
161 bd_bios2unit(int biosdev)
162 {
163     int         i;
164     
165     DEBUG("looking for bios device 0x%x", biosdev);
166     for (i = 0; i < nbdinfo; i++) {
167         DEBUG("bd unit %d is BIOS device 0x%x", i, bdinfo[i].bd_unit);
168         if (bdinfo[i].bd_unit == biosdev)
169             return(i);
170     }
171     return(-1);
172 }
173
174 int
175 bd_unit2bios(int unit)
176 {
177     if ((unit >= 0) && (unit < nbdinfo))
178         return(bdinfo[unit].bd_unit);
179     return(-1);
180 }
181
182 /*    
183  * Quiz the BIOS for disk devices, save a little info about them.
184  */
185 static int
186 bd_init(void) 
187 {
188     int base, unit, nfd = 0;
189
190     /* sequence 0, 0x80 */
191     for (base = 0; base <= 0x80; base += 0x80) {
192         for (unit = base; (nbdinfo < MAXBDDEV); unit++) {
193             /* check the BIOS equipment list for number of fixed disks */
194             if((base == 0x80) &&
195                (nfd >= *(unsigned char *)PTOV(BIOS_NUMDRIVES)))
196                 break;
197
198             bdinfo[nbdinfo].bd_unit = unit;
199             bdinfo[nbdinfo].bd_flags = (unit < 0x80) ? BD_FLOPPY : 0;
200
201             if (!bd_int13probe(&bdinfo[nbdinfo]))
202                 break;
203
204             /* XXX we need "disk aliases" to make this simpler */
205             printf("BIOS drive %c: is disk%d\n", 
206                    (unit < 0x80) ? ('A' + unit) : ('C' + unit - 0x80), nbdinfo);
207             nbdinfo++;
208             if (base == 0x80)
209                 nfd++;
210         }
211     }
212     return(0);
213 }
214
215 /*
216  * Try to detect a device supported by the legacy int13 BIOS
217  */
218 static int
219 bd_int13probe(struct bdinfo *bd)
220 {
221     v86.ctl = V86_FLAGS;
222     v86.addr = 0x13;
223     v86.eax = 0x800;
224     v86.edx = bd->bd_unit;
225     v86int();
226     
227     if (!(v86.efl & 0x1) &&                             /* carry clear */
228         ((v86.edx & 0xff) > ((unsigned)bd->bd_unit & 0x7f))) {  /* unit # OK */
229
230         /*
231          * Ignore devices with an absurd sector size.
232          */
233         if ((v86.ecx & 0x3f) == 0) {
234                 DEBUG("Invalid geometry for unit %d", bd->bd_unit);
235                 return(0);
236         }
237         bd->bd_flags |= BD_MODEINT13;
238         bd->bd_type = v86.ebx & 0xff;
239
240         /* Determine if we can use EDD with this device. */
241         v86.ctl = V86_FLAGS;
242         v86.addr = 0x13;
243         v86.eax = 0x4100;
244         v86.edx = bd->bd_unit;
245         v86.ebx = 0x55aa;
246         v86int();
247         if (!(v86.efl & 0x1) &&                         /* carry clear */
248             ((v86.ebx & 0xffff) == 0xaa55) &&           /* signature */
249             (v86.ecx & 0x1)) {                          /* packets mode ok */
250             bd->bd_flags |= BD_MODEEDD1;
251             if((v86.eax & 0xff00) > 0x300)
252                 bd->bd_flags |= BD_MODEEDD3;
253         }
254         return(1);
255     }
256     return(0);
257 }
258
259 /*
260  * Print information about disks
261  */
262 static void
263 bd_print(int verbose)
264 {
265     int                         i, j;
266     char                        line[80];
267     struct i386_devdesc         dev;
268     struct open_disk            *od;
269     struct dos_partition        *dptr;
270     
271     for (i = 0; i < nbdinfo; i++) {
272         sprintf(line, "    disk%d:   BIOS drive %c:\n", i, 
273                 (bdinfo[i].bd_unit < 0x80) ? ('A' + bdinfo[i].bd_unit) : ('C' + bdinfo[i].bd_unit - 0x80));
274         pager_output(line);
275
276         /* try to open the whole disk */
277         dev.d_kind.biosdisk.unit = i;
278         dev.d_kind.biosdisk.slice = -1;
279         dev.d_kind.biosdisk.partition = -1;
280         
281         if (!bd_opendisk(&od, &dev)) {
282
283             /* Do we have a partition table? */
284             if (od->od_flags & BD_PARTTABOK) {
285                 dptr = &od->od_slicetab[0];
286
287                 /* Check for a "dedicated" disk */
288                 if (((dptr[3].dp_typ == DOSPTYP_386BSD) ||
289                         (dptr[3].dp_typ == DOSPTYP_NETBSD)) &&
290                     (dptr[3].dp_start == 0) &&
291                     (dptr[3].dp_size == 50000)) {
292                     sprintf(line, "      disk%d", i);
293                     bd_printbsdslice(od, 0, line, verbose);
294                 } else {
295                     for (j = 0; j < od->od_nslices; j++) {
296                         sprintf(line, "      disk%ds%d", i, j + 1);
297                         bd_printslice(od, &dptr[j], line, verbose);
298                     }
299                 }
300             }
301             bd_closedisk(od);
302         }
303     }
304 }
305
306 /*
307  * Print information about slices on a disk.  For the size calculations we
308  * assume a 512 byte sector.
309  */
310 static void
311 bd_printslice(struct open_disk *od, struct dos_partition *dp, char *prefix,
312         int verbose)
313 {
314         char line[80];
315
316         switch (dp->dp_typ) {
317         case DOSPTYP_386BSD:
318         case DOSPTYP_NETBSD:
319         /* XXX: possibly add types 0 and 1, as in subr_disk, for gpt magic */
320                 bd_printbsdslice(od, (daddr_t)dp->dp_start, prefix, verbose);
321                 return;
322         case DOSPTYP_LINSWP:
323                 if (verbose)
324                         sprintf(line, "%s: Linux swap %.6dMB (%d - %d)\n",
325                             prefix, dp->dp_size / 2048,
326                             dp->dp_start, dp->dp_start + dp->dp_size);
327                 else
328                         sprintf(line, "%s: Linux swap\n", prefix);
329                 break;
330         case DOSPTYP_LINUX:
331                 /*
332                  * XXX
333                  * read the superblock to confirm this is an ext2fs partition?
334                  */
335                 if (verbose)
336                         sprintf(line, "%s: ext2fs  %.6dMB (%d - %d)\n", prefix,
337                             dp->dp_size / 2048, dp->dp_start,
338                             dp->dp_start + dp->dp_size);
339                 else
340                         sprintf(line, "%s: ext2fs\n", prefix);
341                 break;
342         case 0x00:                              /* unused partition */
343         case DOSPTYP_EXT:
344                 return;
345         case 0x01:
346                 if (verbose)
347                         sprintf(line, "%s: FAT-12  %.6dMB (%d - %d)\n", prefix,
348                             dp->dp_size / 2048, dp->dp_start,
349                             dp->dp_start + dp->dp_size);
350                 else
351                         sprintf(line, "%s: FAT-12\n", prefix);
352                 break;
353         case 0x04:
354         case 0x06:
355         case 0x0e:
356                 if (verbose)
357                         sprintf(line, "%s: FAT-16  %.6dMB (%d - %d)\n", prefix,
358                             dp->dp_size / 2048, dp->dp_start,
359                             dp->dp_start + dp->dp_size);
360                 else
361                         sprintf(line, "%s: FAT-16\n", prefix);
362                 break;
363         case 0x0b:
364         case 0x0c:
365                 if (verbose)
366                         sprintf(line, "%s: FAT-32  %.6dMB (%d - %d)\n", prefix,
367                             dp->dp_size / 2048, dp->dp_start,
368                             dp->dp_start + dp->dp_size);
369                 else
370                         sprintf(line, "%s: FAT-32\n", prefix);
371                 break;
372         default:
373                 if (verbose)
374                         sprintf(line, "%s: Unknown fs: 0x%x  %.6dMB (%d - %d)\n",
375                             prefix, dp->dp_typ, dp->dp_size / 2048,
376                             dp->dp_start, dp->dp_start + dp->dp_size);
377                 else
378                         sprintf(line, "%s: Unknown fs: 0x%x\n", prefix,
379                             dp->dp_typ);
380         }
381         pager_output(line);
382 }
383
384 static void
385 print_partition(u_int8_t fstype, unsigned long long offset,
386                 unsigned long long size, int i, int od_flags,
387                 char *prefix, int verbose, int type)
388 {
389         char    line[80];
390
391         /*
392          * For each partition, make sure we know what type of fs it is.  If
393          * not, then skip it.  However, since floppies often have bogus
394          * fstypes, print the 'a' partition on a floppy even if it is marked
395          * unused.
396          */
397         if ((fstype == FS_SWAP) ||
398             (fstype == FS_VINUM) ||
399             (fstype == FS_HAMMER) ||
400             (fstype == FS_HAMMER2) ||
401             (fstype == FS_BSDFFS) ||
402             (fstype == FS_ZFS) ||
403             (fstype == FS_JFS2) ||
404             ((fstype == FS_UNUSED) &&
405              (od_flags & BD_FLOPPY) && (i == 0))) {
406
407                 /* Only print out statistics in verbose mode */
408                 if (verbose) {
409                         sprintf(line, "%c %s%c: %s  %.6lluMB (%llu - %llu)\n",
410                             /* prefix disks that can be used to load modules with '*' */
411                             ((fstype == FS_BSDFFS) || (fstype == FS_UNUSED) ||
412                             (fstype == FS_VINUM)) ? '*' : ' ',
413                             prefix, 'a' + i,
414                             (fstype == FS_SWAP) ? "swap" :
415                             (fstype == FS_VINUM) ? "vinum" :
416                             (fstype == FS_HAMMER) ? "HAMMER" :
417                             (fstype == FS_HAMMER2) ? "HAMMER2" :
418                             (fstype == FS_JFS2) ? "JFS2" :
419                             (fstype == FS_ZFS) ? "ZFS" :
420                             (fstype == FS_BSDFFS) ? "FFS" :
421                             "(unknown)",
422                             (type==32)?(size / 2048):(size/1024/1024),
423                             offset,
424                             offset + size);
425                 } else {
426                         sprintf(line, "%c %s%c: %s\n",
427                             /* prefix disks that can be used to load modules with '*' */
428                             ((fstype == FS_BSDFFS) || (fstype == FS_UNUSED) ||
429                             (fstype == FS_VINUM)) ? '*' : ' ',
430                             prefix, 'a' + i,
431                             (fstype == FS_SWAP) ? "swap" :
432                             (fstype == FS_VINUM) ? "vinum" :
433                             (fstype == FS_HAMMER) ? "HAMMER" :
434                             (fstype == FS_HAMMER2) ? "HAMMER2" :
435                             (fstype == FS_JFS2) ? "JFS2" :
436                             (fstype == FS_ZFS) ? "ZFS" :
437                             (fstype == FS_BSDFFS) ? "FFS" :
438                             "(unknown)");
439                 }
440
441                 pager_output(line);
442         }
443 }
444
445 /*
446  * Print out each valid partition in the disklabel of a FreeBSD slice.
447  * For size calculations, we assume a 512 byte sector size.
448  */
449 static void
450 bd_printbsdslice(struct open_disk *od, daddr_t offset, char *prefix,
451     int verbose)
452 {
453         char            line[80];
454         char            buf[BIOSDISK_SECSIZE*2];
455         struct disklabel32      *lp = NULL;
456         struct disklabel64      *lp64 = NULL;
457         int                     i;
458
459         /* read disklabel */
460         if (bd_read(od, offset + LABELSECTOR32, 1, buf))
461                 return;
462         lp =(struct disklabel32 *)(&buf[0]);
463         if (lp->d_magic != DISKMAGIC32) {
464                 if (bd_read(od, offset, 2, buf))
465                         return;
466
467                 lp64 =(struct disklabel64 *)(&buf[0]);
468                 if (lp64->d_magic != DISKMAGIC64) {
469                         sprintf(line, "%s: bad disklabel\n", prefix);
470                         pager_output(line);
471                         return;
472                 }
473                 lp = NULL; /* PARANOID */
474         }
475         if (lp64) {
476                 /* We got ourselves a disklabel64 here */
477                 for (i = 0; i < lp64->d_npartitions; i++) {
478                         if (lp64->d_partitions[i].p_bsize == 0)
479                                 continue;
480
481                         print_partition(lp64->d_partitions[i].p_fstype,
482                                         lp64->d_partitions[i].p_boffset,
483                                         lp64->d_partitions[i].p_bsize,
484                                         i, od->od_flags, prefix, verbose, 64);
485                 }
486         } else if (lp) {
487                 /* Print partitions */
488                 for (i = 0; i < lp->d_npartitions; i++) {
489                         print_partition(lp->d_partitions[i].p_fstype,
490                                         lp->d_partitions[i].p_offset,
491                                         lp->d_partitions[i].p_size,
492                                         i, od->od_flags, prefix, verbose, 32);
493                 }
494         }
495 }
496
497
498 /*
499  * Attempt to open the disk described by (dev) for use by (f).
500  *
501  * Note that the philosophy here is "give them exactly what
502  * they ask for".  This is necessary because being too "smart"
503  * about what the user might want leads to complications.
504  * (eg. given no slice or partition value, with a disk that is
505  *  sliced - are they after the first BSD slice, or the DOS
506  *  slice before it?)
507  */
508 static int 
509 bd_open(struct open_file *f, ...)
510 {
511     va_list                     ap;
512     struct i386_devdesc         *dev;
513     struct open_disk            *od;
514     int                         error;
515
516     va_start(ap, f);
517     dev = va_arg(ap, struct i386_devdesc *);
518     va_end(ap);
519     if ((error = bd_opendisk(&od, dev)))
520         return(error);
521     
522     /*
523      * Save our context
524      */
525     ((struct i386_devdesc *)(f->f_devdata))->d_kind.biosdisk.data = od;
526     DEBUG("open_disk %p, partition at 0x%x", od, od->od_boff);
527     return(0);
528 }
529
530 static int
531 bd_opendisk(struct open_disk **odp, struct i386_devdesc *dev)
532 {
533     struct dos_partition        *dptr;
534     struct disklabel32          *lp;
535     struct disklabel64          *lp64;
536     struct open_disk            *od;
537     int                         sector, slice, i;
538     int                         error;
539     static char                 buf[BUFSIZE];
540
541     if (dev->d_kind.biosdisk.unit >= nbdinfo) {
542         DEBUG("attempt to open nonexistent disk");
543         return(ENXIO);
544     }
545     
546     od = (struct open_disk *)malloc(sizeof(struct open_disk));
547     if (!od) {
548         DEBUG("no memory");
549         return (ENOMEM);
550     }
551
552     /* Look up BIOS unit number, intialise open_disk structure */
553     od->od_dkunit = dev->d_kind.biosdisk.unit;
554     od->od_unit = bdinfo[od->od_dkunit].bd_unit;
555     od->od_flags = bdinfo[od->od_dkunit].bd_flags;
556     od->od_boff = 0;
557     od->od_nslices = 0;
558     error = 0;
559     DEBUG("open '%s', unit 0x%x slice %d partition %c",
560              i386_fmtdev(dev), dev->d_kind.biosdisk.unit, 
561              dev->d_kind.biosdisk.slice, dev->d_kind.biosdisk.partition + 'a');
562
563     /* Get geometry for this open (removable device may have changed) */
564     if (bd_getgeom(od)) {
565         DEBUG("can't get geometry");
566         error = ENXIO;
567         goto out;
568     }
569
570     /*
571      * Following calculations attempt to determine the correct value
572      * for d->od_boff by looking for the slice and partition specified,
573      * or searching for reasonable defaults.
574      */
575
576     /*
577      * Find the slice in the DOS slice table.
578      */
579     if (bd_read(od, 0, 1, buf)) {
580         DEBUG("error reading MBR");
581         error = EIO;
582         goto out;
583     }
584
585     /* 
586      * Check the slice table magic.
587      */
588     if (((u_char)buf[0x1fe] != 0x55) || ((u_char)buf[0x1ff] != 0xaa)) {
589         /* If a slice number was explicitly supplied, this is an error */
590         if (dev->d_kind.biosdisk.slice > 0) {
591             DEBUG("no slice table/MBR (no magic)");
592             error = ENOENT;
593             goto out;
594         }
595         sector = 0;
596         goto unsliced;          /* may be a floppy */
597     }
598
599     /*
600      * copy the partition table, then pick up any extended partitions.  The
601      * base partition table always has four entries, even if some of them
602      * represented extended partitions.  However, any additional sub-extended
603      * partitions will be silently recursed and not included in the slice
604      * table.
605      */
606     bcopy(buf + DOSPARTOFF, &od->od_slicetab,
607       sizeof(struct dos_partition) * NDOSPART);
608     od->od_nslices = NDOSPART;
609
610     dptr = &od->od_slicetab[0];
611     for (i = 0; i < NDOSPART; i++, dptr++) {
612         if ((dptr->dp_typ == DOSPTYP_EXT) || (dptr->dp_typ == DOSPTYP_EXTLBA))
613             bd_chainextended(od, dptr->dp_start, 0); /* 1st offset is zero */
614     }
615     od->od_flags |= BD_PARTTABOK;
616     dptr = &od->od_slicetab[0];
617
618     /*
619      * Overflow entries are not loaded into memory but we still keep
620      * track of the count.  Fix it up now.
621      */
622     if (od->od_nslices > NEXTDOSPART)
623         od->od_nslices = NEXTDOSPART;
624
625     /* 
626      * Is this a request for the whole disk? 
627      */
628     if (dev->d_kind.biosdisk.slice == -1) {
629         sector = 0;
630         goto unsliced;
631     }
632
633     /*
634      * if a slice number was supplied but not found, this is an error.
635      */
636     if (dev->d_kind.biosdisk.slice > 0) {
637         slice = dev->d_kind.biosdisk.slice - 1;
638         if (slice >= od->od_nslices) {
639             DEBUG("slice %d not found", slice);
640             error = ENOENT;
641             goto out;
642         }
643     }
644
645     /*
646      * Check for the historically bogus MBR found on true dedicated disks
647      */
648     if ((dptr[3].dp_typ == DOSPTYP_386BSD) &&
649       (dptr[3].dp_start == 0) &&
650       (dptr[3].dp_size == 50000)) {
651         sector = 0;
652         goto unsliced;
653     }
654
655     /* Try to auto-detect the best slice; this should always give a slice number */
656     if (dev->d_kind.biosdisk.slice == 0) {
657         slice = bd_bestslice(od);
658         if (slice == -1) {
659             error = ENOENT;
660             goto out;
661         }
662         dev->d_kind.biosdisk.slice = slice;
663     }
664
665     dptr = &od->od_slicetab[0];
666     /*
667      * Accept the supplied slice number unequivocally (we may be looking
668      * at a DOS partition).
669      */
670     dptr += (dev->d_kind.biosdisk.slice - 1);   /* we number 1-4, offsets are 0-3 */
671     sector = dptr->dp_start;
672     DEBUG("slice entry %d at %d, %d sectors", dev->d_kind.biosdisk.slice - 1, sector, dptr->dp_size);
673
674     /*
675      * If we are looking at a BSD slice, and the partition is < 0, assume the 'a' partition
676      */
677     if ((dptr->dp_typ == DOSPTYP_386BSD) && (dev->d_kind.biosdisk.partition < 0))
678         dev->d_kind.biosdisk.partition = 0;
679
680 unsliced:
681     /* 
682      * Now we have the slice offset, look for the partition in the disklabel if we have
683      * a partition to start with.
684      *
685      * XXX we might want to check the label checksum.
686      */
687     if (dev->d_kind.biosdisk.partition < 0) {
688         od->od_boff = sector;           /* no partition, must be after the slice */
689         DEBUG("opening raw slice");
690     } else {
691         
692         if (bd_read(od, sector + LABELSECTOR32, 1, buf)) {
693             DEBUG("error reading disklabel");
694             error = EIO;
695             goto out;
696         }
697         DEBUG("copy %d bytes of label from %p to %p", sizeof(struct disklabel32), buf + LABELOFFSET32, &od->od_disklabel);
698         bcopy(buf + LABELOFFSET32, &od->od_disklabel, sizeof(struct disklabel32));
699         lp = &od->od_disklabel;
700
701         if (lp->d_magic == DISKMAGIC32) {
702             od->od_flags |= BD_LABELOK;
703
704             if (dev->d_kind.biosdisk.partition >= lp->d_npartitions) {
705                 DEBUG("partition '%c' exceeds partitions in table (a-'%c')",
706                       'a' + dev->d_kind.biosdisk.partition, 'a' + lp->d_npartitions);
707                 error = EPART;
708                 goto out;
709
710             }
711
712 #ifdef DISK_DEBUG
713             /* Complain if the partition is unused unless this is a floppy. */
714             if ((lp->d_partitions[dev->d_kind.biosdisk.partition].p_fstype == FS_UNUSED) &&
715                 !(od->od_flags & BD_FLOPPY))
716                 DEBUG("warning, partition marked as unused");
717 #endif
718             
719             od->od_boff = 
720                     lp->d_partitions[dev->d_kind.biosdisk.partition].p_offset -
721                     lp->d_partitions[RAW_PART].p_offset +
722                     sector;
723
724             goto out;
725         }
726
727         /* else maybe DISKLABEL64? */
728
729         if (bd_read(od, sector, (sizeof(od->od_disklabel64) + 511) / 512, buf)) {
730             DEBUG("error reading disklabel");
731             error = EIO;
732             goto out;
733         }
734         DEBUG("copy %d bytes of label from %p to %p", sizeof(od->od_disklabel64), buf, &od->od_disklabel64);
735         bcopy(buf, &od->od_disklabel64, sizeof(od->od_disklabel64));
736         lp64 = &od->od_disklabel64;
737
738         if (lp64->d_magic == DISKMAGIC64) {
739             od->od_flags |= BD_LABELOK;
740
741             if (dev->d_kind.biosdisk.partition >= lp64->d_npartitions ||
742                 lp64->d_partitions[dev->d_kind.biosdisk.partition].p_bsize == 0) {
743                 DEBUG("partition '%c' exceeds partitions in table (a-'%c')",
744                       'a' + dev->d_kind.biosdisk.partition, 'a' + lp64->d_npartitions);
745                 error = EPART;
746                 goto out;
747
748             }
749
750             od->od_boff = 
751                     lp64->d_partitions[dev->d_kind.biosdisk.partition].p_boffset / 512 +
752                     sector;
753
754             DEBUG("disklabel64 slice at %d", od->od_boff);
755
756         } else {
757             DEBUG("no disklabel");
758             error = ENOENT;
759         }
760     }
761
762  out:
763     if (error) {
764         free(od);
765     } else {
766         *odp = od;      /* return the open disk */
767     }
768     return(error);
769 }
770
771
772 static void
773 bd_chainextended(struct open_disk *od, u_int32_t base, u_int32_t offset)
774 {
775         char   buf[BIOSDISK_SECSIZE];
776         struct dos_partition *dp1, *dp2;
777         int i;
778
779         if (bd_read(od, (daddr_t)(base + offset), 1, buf)) {
780                 printf("\nerror reading extended partition table");
781                 return;
782         }
783
784         /*
785          * dp1 points to the first record in the on-disk XPT,
786          * dp2 points to the next entry in the in-memory parition table.
787          *
788          * NOTE: dp2 may be out of bounds if od_nslices >= NEXTDOSPART.
789          *
790          * NOTE: unlike the extended partitions in our primary dos partition
791          * table, we do not record recursed extended partitions themselves 
792          * in our in-memory partition table.
793          *
794          * NOTE: recording within our in-memory table must be breadth first
795          * ot match what the kernel does.  Thus, two passes are required.
796          *
797          * NOTE: partitioning programs which support extended partitions seem
798          * to always use the first entry for the user partition and the
799          * second entry to chain, and also appear to disallow more then one
800          * extended partition at each level.  Nevertheless we make our code
801          * somewhat more generic (and the same as the kernel's own slice
802          * scan).
803          */
804         dp1 = (struct dos_partition *)(&buf[DOSPARTOFF]);
805         dp2 = &od->od_slicetab[od->od_nslices];
806
807         for (i = 0; i < NDOSPART; ++i, ++dp1) {
808                 if (dp1->dp_scyl == 0 && dp1->dp_shd == 0 &&
809                     dp1->dp_ssect == 0 && dp1->dp_start == 0 && 
810                     dp1->dp_size == 0) {
811                         continue;
812                 }
813                 if ((dp1->dp_typ == DOSPTYP_EXT) || 
814                     (dp1->dp_typ == DOSPTYP_EXTLBA)) {
815                         /*
816                          * breadth first traversal, must skip in the 
817                          * first pass
818                          */
819                         continue;
820                 }
821
822                 /*
823                  * Only load up the in-memory data if we haven't overflowed
824                  * our in-memory array.
825                  */
826                 if (od->od_nslices < NEXTDOSPART) {
827                         dp2->dp_typ = dp1->dp_typ;
828                         dp2->dp_start = base + offset + dp1->dp_start;
829                         dp2->dp_size = dp1->dp_size;
830                 }
831                 ++od->od_nslices;
832                 ++dp2;
833         }
834
835         /*
836          * Pass 2 - handle extended partitions.  Note that the extended
837          * slice itself is not stored in the slice array when we recurse,
838          * but any 'original' top-level extended slices are.  This is to
839          * match what the kernel does.
840          */
841         dp1 -= NDOSPART;
842         for (i = 0; i < NDOSPART; ++i, ++dp1) {
843                 if (dp1->dp_scyl == 0 && dp1->dp_shd == 0 &&
844                     dp1->dp_ssect == 0 && dp1->dp_start == 0 && 
845                     dp1->dp_size == 0) {
846                         continue;
847                 }
848                 if ((dp1->dp_typ == DOSPTYP_EXT) || 
849                     (dp1->dp_typ == DOSPTYP_EXTLBA))
850                         bd_chainextended(od, base, dp1->dp_start);
851         }
852 }
853
854 /*
855  * Search for a slice with the following preferences:
856  *
857  * 1: Active FreeBSD slice
858  * 2: Non-active FreeBSD slice
859  * 3: Active Linux slice
860  * 4: non-active Linux slice
861  * 5: Active FAT/FAT32 slice
862  * 6: non-active FAT/FAT32 slice
863  */
864 #define PREF_RAWDISK    0
865 #define PREF_FBSD_ACT   1
866 #define PREF_FBSD       2
867 #define PREF_LINUX_ACT  3
868 #define PREF_LINUX      4
869 #define PREF_DOS_ACT    5
870 #define PREF_DOS        6
871 #define PREF_NONE       7
872
873 /*
874  * slicelimit is in the range 0 .. NDOSPART
875  */
876 static int
877 bd_bestslice(struct open_disk *od)
878 {
879         struct dos_partition *dp;
880         int pref, preflevel;
881         int i, prefslice;
882         
883         prefslice = 0;
884         preflevel = PREF_NONE;
885
886         dp = &od->od_slicetab[0];
887         for (i = 0; i < od->od_nslices; i++, dp++) {
888                 switch (dp->dp_typ) {
889                 case DOSPTYP_386BSD:            /* FreeBSD */
890                         pref = dp->dp_flag & 0x80 ? PREF_FBSD_ACT : PREF_FBSD;
891                         break;
892
893                 case DOSPTYP_LINUX:
894                         pref = dp->dp_flag & 0x80 ? PREF_LINUX_ACT : PREF_LINUX;
895                         break;
896     
897                 case 0x01:              /* DOS/Windows */
898                 case 0x04:
899                 case 0x06:
900                 case 0x0b:
901                 case 0x0c:
902                 case 0x0e:
903                         pref = dp->dp_flag & 0x80 ? PREF_DOS_ACT : PREF_DOS;
904                         break;
905
906                 default:
907                         pref = PREF_NONE;
908                 }
909                 if (pref < preflevel) {
910                         preflevel = pref;
911                         prefslice = i + 1;
912                 }
913         }
914         return (prefslice);
915 }
916  
917 static int 
918 bd_close(struct open_file *f)
919 {
920     struct open_disk    *od = (struct open_disk *)(((struct i386_devdesc *)(f->f_devdata))->d_kind.biosdisk.data);
921
922     bd_closedisk(od);
923     return(0);
924 }
925
926 static void
927 bd_closedisk(struct open_disk *od)
928 {
929     DEBUG("open_disk %p", od);
930 #if 0
931     /* XXX is this required? (especially if disk already open...) */
932     if (od->od_flags & BD_FLOPPY)
933         delay(3000000);
934 #endif
935     free(od);
936 }
937
938 static int 
939 bd_strategy(void *devdata, int rw, daddr_t dblk, size_t size, char *buf, size_t *rsize)
940 {
941     struct bcache_devdata       bcd;
942     struct open_disk    *od = (struct open_disk *)(((struct i386_devdesc *)devdata)->d_kind.biosdisk.data);
943
944     bcd.dv_strategy = bd_realstrategy;
945     bcd.dv_devdata = devdata;
946     return(bcache_strategy(&bcd, od->od_unit, rw, dblk+od->od_boff, size, buf, rsize));
947 }
948
949 static int 
950 bd_realstrategy(void *devdata, int rw, daddr_t dblk, size_t size, char *buf, size_t *rsize)
951 {
952     struct open_disk    *od = (struct open_disk *)(((struct i386_devdesc *)devdata)->d_kind.biosdisk.data);
953     int                 blks;
954 #ifdef BD_SUPPORT_FRAGS
955     char                fragbuf[BIOSDISK_SECSIZE];
956     size_t              fragsize;
957
958     fragsize = size % BIOSDISK_SECSIZE;
959 #else
960     if (size % BIOSDISK_SECSIZE)
961         panic("bd_strategy: %d bytes I/O not multiple of block size", size);
962 #endif
963
964     DEBUG("open_disk %p", od);
965
966     switch(rw){
967     case F_READ:
968         blks = size / BIOSDISK_SECSIZE;
969         DEBUG("read %d from %d to %p", blks, dblk, buf);
970
971         if (rsize)
972             *rsize = 0;
973         if (blks && bd_read(od, dblk, blks, buf)) {
974             DEBUG("read error");
975             return (EIO);
976         }
977 #ifdef BD_SUPPORT_FRAGS
978         DEBUG("bd_strategy: frag read %d from %d+%d to %p", 
979              fragsize, dblk, blks, buf + (blks * BIOSDISK_SECSIZE));
980         if (fragsize && bd_read(od, dblk + blks, 1, fragsize)) {
981             DEBUG("frag read error");
982             return(EIO);
983         }
984         bcopy(fragbuf, buf + (blks * BIOSDISK_SECSIZE), fragsize);
985 #endif
986         if (rsize)
987             *rsize = size;
988         return (0);
989     case F_WRITE :
990         blks = size / BIOSDISK_SECSIZE;
991         DEBUG("write %d from %d to %p", blks, dblk, buf);
992
993         if (rsize)
994             *rsize = 0;
995         if (blks && bd_write(od, dblk, blks, buf)) {
996             DEBUG("write error");
997             return (EIO);
998         }
999 #ifdef BD_SUPPORT_FRAGS
1000         if(fragsize) {
1001             DEBUG("Attempted to write a frag");
1002             return (EIO);
1003         }
1004 #endif
1005         if (rsize)
1006             *rsize = size;
1007         return (0);
1008     default:
1009         break; /* DO NOTHING */
1010     }
1011     return EROFS;
1012 }
1013
1014 static int
1015 bd_read(struct open_disk *od, daddr_t dblk, int blks, caddr_t dest)
1016 {
1017     u_int       x, bpc, cyl, hd, sec, result, resid, retry, maxfer;
1018     caddr_t     p, xp, bbuf, breg;
1019     
1020     /* Just in case some idiot actually tries to read -1 blocks... */
1021     if (blks < 0)
1022         return (-1);
1023
1024     bpc = (od->od_sec * od->od_hds);            /* blocks per cylinder */
1025     resid = blks;
1026     p = dest;
1027
1028     /*
1029      * Always bounce.  Our buffer is probably not segment-addressable.
1030      */
1031     if (1) {
1032
1033         /* 
1034          * There is a 64k physical boundary somewhere in the destination
1035          * buffer, so we have to arrange a suitable bounce buffer.  Allocate
1036          * a buffer twice as large as we need to.  Use the bottom half unless
1037          * there is a break there, in which case we use the top half.
1038          */
1039         bbuf = bounce_base;
1040         x = min(BOUNCEBUF_SECTS, (unsigned)blks);
1041
1042         if (((u_int32_t)VTOP(bbuf) & 0xffff8000) ==
1043             ((u_int32_t)VTOP(bbuf + x * BIOSDISK_SECSIZE - 1) & 0xffff8000)) {
1044             breg = bbuf;
1045         } else {
1046             breg = bbuf + x * BIOSDISK_SECSIZE;
1047         }
1048         maxfer = x;             /* limit transfers to bounce region size */
1049     } else {
1050         breg = bbuf = NULL;
1051         maxfer = 0;
1052     }
1053     
1054     while (resid > 0) {
1055         x = dblk;
1056         cyl = x / bpc;                  /* block # / blocks per cylinder */
1057         x %= bpc;                       /* block offset into cylinder */
1058         hd = x / od->od_sec;            /* offset / blocks per track */
1059         sec = x % od->od_sec;           /* offset into track */
1060
1061         /* play it safe and don't cross track boundaries (XXX this is probably unnecessary) */
1062         x = szmin(od->od_sec - sec, resid);
1063         if (maxfer > 0)
1064             x = min(x, maxfer);         /* fit bounce buffer */
1065
1066         /* where do we transfer to? */
1067         xp = (bbuf == NULL ? p : breg);
1068
1069         /* correct sector number for 1-based BIOS numbering */
1070         sec++;
1071
1072         /*
1073          * Loop retrying the operation a couple of times.  The BIOS may also
1074          * retry.
1075          */
1076         for (retry = 0; retry < 3; retry++) {
1077             /*
1078              * If retrying, reset the drive.
1079              */
1080             if (retry > 0) {
1081                 v86.ctl = V86_FLAGS;
1082                 v86.addr = 0x13;
1083                 v86.eax = 0;
1084                 v86.edx = od->od_unit;
1085                 v86int();
1086             }
1087             
1088             /*
1089              * Always use EDD if the disk supports it, otherwise fall back
1090              * to CHS mode (returning an error if the cylinder number is
1091              * too large).
1092              */
1093             if (od->od_flags & BD_MODEEDD1) {
1094                 static unsigned short packet[8];
1095
1096                 packet[0] = 0x10;
1097                 packet[1] = x;
1098                 packet[2] = VTOPOFF(xp);
1099                 packet[3] = VTOPSEG(xp);
1100                 packet[4] = dblk & 0xffff;
1101                 packet[5] = dblk >> 16;
1102                 packet[6] = 0;
1103                 packet[7] = 0;
1104                 v86.ctl = V86_FLAGS;
1105                 v86.addr = 0x13;
1106                 v86.eax = 0x4200;
1107                 v86.edx = od->od_unit;
1108                 v86.ds = VTOPSEG(packet);
1109                 v86.esi = VTOPOFF(packet);
1110                 v86int();
1111                 result = (v86.efl & 0x1);
1112                 if (result == 0)
1113                     break;
1114             } else if (cyl < 1024) {
1115                 /* Use normal CHS addressing */
1116                 v86.ctl = V86_FLAGS;
1117                 v86.addr = 0x13;
1118                 v86.eax = 0x200 | x;
1119                 v86.ecx = ((cyl & 0xff) << 8) | ((cyl & 0x300) >> 2) | sec;
1120                 v86.edx = (hd << 8) | od->od_unit;
1121                 v86.es = VTOPSEG(xp);
1122                 v86.ebx = VTOPOFF(xp);
1123                 v86int();
1124                 result = (v86.efl & 0x1);
1125                 if (result == 0)
1126                     break;
1127             } else {
1128                 result = 1;
1129                 break;
1130             }
1131         }
1132         
1133         DEBUG("%u sectors from %u/%u/%d to %p (0x%x) %s",
1134               x, cyl, hd, sec - 1, p, VTOP(p), result ? "failed" : "ok");
1135         /* BUG here, cannot use v86 in printf because putchar uses it too */
1136         DEBUG("ax = 0x%04x cx = 0x%04x dx = 0x%04x status 0x%x", 
1137               0x200 | x,
1138               ((cyl & 0xff) << 8) | ((cyl & 0x300) >> 2) | sec,
1139               (hd << 8) | od->od_unit,
1140               (v86.eax >> 8) & 0xff);
1141         if (result)
1142             return(-1);
1143         if (bbuf != NULL)
1144             bcopy(breg, p, x * BIOSDISK_SECSIZE);
1145         p += (x * BIOSDISK_SECSIZE);
1146         dblk += x;
1147         resid -= x;
1148     }
1149         
1150 /*    hexdump(dest, (blks * BIOSDISK_SECSIZE)); */
1151     return(0);
1152 }
1153
1154
1155 static int
1156 bd_write(struct open_disk *od, daddr_t dblk, int blks, caddr_t dest)
1157 {
1158     u_int       x, bpc, cyl, hd, sec, result, resid, retry, maxfer;
1159     caddr_t     p, xp, bbuf, breg;
1160     
1161     /* Just in case some idiot actually tries to read -1 blocks... */
1162     if (blks < 0)
1163         return (-1);
1164
1165     bpc = (od->od_sec * od->od_hds);            /* blocks per cylinder */
1166     resid = blks;
1167     p = dest;
1168
1169     /*
1170      * Always bounce.  Our buffer is probably not segment-addressable.
1171      */
1172     if (1) {
1173         /* 
1174          * There is a 64k physical boundary somewhere in the destination
1175          * buffer, so we have to arrange a suitable bounce buffer.  Allocate
1176          * a buffer twice as large as we need to.  Use the bottom half
1177          * unless there is a break there, in which case we use the top half.
1178          */
1179         bbuf = bounce_base;
1180         x = min(BOUNCEBUF_SECTS, (unsigned)blks);
1181
1182         if (((u_int32_t)VTOP(bbuf) & 0xffff0000) ==
1183             ((u_int32_t)VTOP(bbuf + x * BIOSDISK_SECSIZE - 1) & 0xffff0000)) {
1184             breg = bbuf;
1185         } else {
1186             breg = bbuf + x * BIOSDISK_SECSIZE;
1187         }
1188         maxfer = x;             /* limit transfers to bounce region size */
1189     } else {
1190         breg = bbuf = NULL;
1191         maxfer = 0;
1192     }
1193
1194     while (resid > 0) {
1195         x = dblk;
1196         cyl = x / bpc;                  /* block # / blocks per cylinder */
1197         x %= bpc;                       /* block offset into cylinder */
1198         hd = x / od->od_sec;            /* offset / blocks per track */
1199         sec = x % od->od_sec;           /* offset into track */
1200
1201         /* play it safe and don't cross track boundaries (XXX this is probably unnecessary) */
1202         x = szmin(od->od_sec - sec, resid);
1203         if (maxfer > 0)
1204             x = szmin(x, maxfer);               /* fit bounce buffer */
1205
1206         /* where do we transfer to? */
1207         xp = (bbuf == NULL ? p : breg);
1208
1209         /* correct sector number for 1-based BIOS numbering */
1210         sec++;
1211
1212
1213         /* Put your Data In, Put your Data out,
1214            Put your Data In, and shake it all about 
1215         */
1216         if (bbuf != NULL)
1217             bcopy(p, breg, x * BIOSDISK_SECSIZE);
1218         p += (x * BIOSDISK_SECSIZE);
1219         dblk += x;
1220         resid -= x;
1221
1222         /*
1223          * Loop retrying the operation a couple of times.  The BIOS may also
1224          * retry.
1225          */
1226         for (retry = 0; retry < 3; retry++) {
1227             /*
1228              * If retrying, reset the drive.
1229              */
1230             if (retry > 0) {
1231                 v86.ctl = V86_FLAGS;
1232                 v86.addr = 0x13;
1233                 v86.eax = 0;
1234                 v86.edx = od->od_unit;
1235                 v86int();
1236             }
1237
1238             /*
1239              * Always use EDD if the disk supports it, otherwise fall back
1240              * to CHS mode (returning an error if the cylinder number is
1241              * too large).
1242              */
1243             if (od->od_flags & BD_MODEEDD1) {
1244                 static unsigned short packet[8];
1245
1246                 packet[0] = 0x10;
1247                 packet[1] = x;
1248                 packet[2] = VTOPOFF(xp);
1249                 packet[3] = VTOPSEG(xp);
1250                 packet[4] = dblk & 0xffff;
1251                 packet[5] = dblk >> 16;
1252                 packet[6] = 0;
1253                 packet[7] = 0;
1254                 v86.ctl = V86_FLAGS;
1255                 v86.addr = 0x13;
1256                     /* Should we Write with verify ?? 0x4302 ? */
1257                 v86.eax = 0x4300;
1258                 v86.edx = od->od_unit;
1259                 v86.ds = VTOPSEG(packet);
1260                 v86.esi = VTOPOFF(packet);
1261                 v86int();
1262                 result = (v86.efl & 0x1);
1263                 if (result == 0)
1264                     break;
1265             } else if (cyl < 1024) {
1266                 /* Use normal CHS addressing */
1267                 v86.ctl = V86_FLAGS;
1268                 v86.addr = 0x13;
1269                 v86.eax = 0x300 | x;
1270                 v86.ecx = ((cyl & 0xff) << 8) | ((cyl & 0x300) >> 2) | sec;
1271                 v86.edx = (hd << 8) | od->od_unit;
1272                 v86.es = VTOPSEG(xp);
1273                 v86.ebx = VTOPOFF(xp);
1274                 v86int();
1275                 result = (v86.efl & 0x1);
1276                 if (result == 0)
1277                     break;
1278             } else {
1279                 result = 1;
1280                 break;
1281             }
1282         }
1283         
1284         DEBUG("%u sectors from %u/%u/%d to %p (0x%x) %s", x, cyl, hd, sec - 1, p, VTOP(p), result ? "failed" : "ok");
1285         /* BUG here, cannot use v86 in printf because putchar uses it too */
1286         DEBUG("ax = 0x%04x cx = 0x%04x dx = 0x%04x status 0x%x", 
1287               0x200 | x, ((cyl & 0xff) << 8) | ((cyl & 0x300) >> 2) | sec, (hd << 8) | od->od_unit, (v86.eax >> 8) & 0xff);
1288         if (result)
1289             return(-1);
1290     }
1291         
1292     /* hexdump(dest, (blks * BIOSDISK_SECSIZE)); */
1293     return(0);
1294 }
1295 static int
1296 bd_getgeom(struct open_disk *od)
1297 {
1298
1299     v86.ctl = V86_FLAGS;
1300     v86.addr = 0x13;
1301     v86.eax = 0x800;
1302     v86.edx = od->od_unit;
1303     v86int();
1304
1305     if ((v86.efl & 0x1) ||                              /* carry set */
1306         ((v86.edx & 0xff) <= (unsigned)(od->od_unit & 0x7f)))   /* unit # bad */
1307         return(1);
1308     
1309     /* convert max cyl # -> # of cylinders */
1310     od->od_cyl = ((v86.ecx & 0xc0) << 2) + ((v86.ecx & 0xff00) >> 8) + 1;
1311     /* convert max head # -> # of heads */
1312     od->od_hds = ((v86.edx & 0xff00) >> 8) + 1;
1313     od->od_sec = v86.ecx & 0x3f;
1314
1315     DEBUG("unit 0x%x geometry %d/%d/%d", od->od_unit, od->od_cyl, od->od_hds, od->od_sec);
1316     return(0);
1317 }
1318
1319 /*
1320  * Return the BIOS geometry of a given "fixed drive" in a format
1321  * suitable for the legacy bootinfo structure.  Since the kernel is
1322  * expecting raw int 0x13/0x8 values for N_BIOS_GEOM drives, we
1323  * prefer to get the information directly, rather than rely on being
1324  * able to put it together from information already maintained for
1325  * different purposes and for a probably different number of drives.
1326  *
1327  * For valid drives, the geometry is expected in the format (31..0)
1328  * "000000cc cccccccc hhhhhhhh 00ssssss"; and invalid drives are
1329  * indicated by returning the geometry of a "1.2M" PC-format floppy
1330  * disk.  And, incidentally, what is returned is not the geometry as
1331  * such but the highest valid cylinder, head, and sector numbers.
1332  */
1333 u_int32_t
1334 bd_getbigeom(int bunit)
1335 {
1336
1337     v86.ctl = V86_FLAGS;
1338     v86.addr = 0x13;
1339     v86.eax = 0x800;
1340     v86.edx = 0x80 + bunit;
1341     v86int();
1342     if (v86.efl & 0x1)
1343         return 0x4f010f;
1344     return ((v86.ecx & 0xc0) << 18) | ((v86.ecx & 0xff00) << 8) |
1345            (v86.edx & 0xff00) | (v86.ecx & 0x3f);
1346 }
1347
1348 /*
1349  * Return a suitable cdev_t value for (dev).
1350  *
1351  * In the case where it looks like (dev) is a SCSI disk, we allow the number of
1352  * IDE disks to be specified in $num_ide_disks.  There should be a Better Way.
1353  */
1354 int
1355 bd_getdev(struct i386_devdesc *dev)
1356 {
1357     struct open_disk            *od;
1358     int                         biosdev;
1359     int                         major;
1360     int                         rootdev;
1361     char                        *nip, *cp;
1362     int                         unitofs = 0, i, unit;
1363
1364     biosdev = bd_unit2bios(dev->d_kind.biosdisk.unit);
1365     DEBUG("unit %d BIOS device %d", dev->d_kind.biosdisk.unit, biosdev);
1366     if (biosdev == -1)                          /* not a BIOS device */
1367         return(-1);
1368     if (bd_opendisk(&od, dev) != 0)             /* oops, not a viable device */
1369         return(-1);
1370
1371     if (biosdev < 0x80) {
1372         /* floppy (or emulated floppy) or ATAPI device */
1373         if (bdinfo[dev->d_kind.biosdisk.unit].bd_type == DT_ATAPI) {
1374             /* is an ATAPI disk */
1375             major = WFDMAJOR;
1376         } else {
1377             /* is a floppy disk */
1378             major = FDMAJOR;
1379         }
1380     } else {
1381         /* harddisk */
1382         if ((od->od_flags & BD_LABELOK) && (od->od_disklabel.d_type == DTYPE_SCSI)) {
1383             /* label OK, disk labelled as SCSI */
1384             major = DAMAJOR;
1385             /* check for unit number correction hint, now deprecated */
1386             if ((nip = getenv("num_ide_disks")) != NULL) {
1387                 i = strtol(nip, &cp, 0);
1388                 /* check for parse error */
1389                 if ((cp != nip) && (*cp == 0))
1390                     unitofs = i;
1391             }
1392         } else {
1393             /* assume an IDE disk */
1394             major = WDMAJOR;
1395         }
1396     }
1397     /* default root disk unit number */
1398     unit = (biosdev & 0x7f) - unitofs;
1399
1400     /* XXX a better kludge to set the root disk unit number */
1401     if ((nip = getenv("root_disk_unit")) != NULL) {
1402         i = strtol(nip, &cp, 0);
1403         /* check for parse error */
1404         if ((cp != nip) && (*cp == 0))
1405             unit = i;
1406     }
1407
1408     rootdev = MAKEBOOTDEV(major,
1409                           (dev->d_kind.biosdisk.slice + 1) >> 4,        /* XXX slices may be wrong here */
1410                           (dev->d_kind.biosdisk.slice + 1) & 0xf, 
1411                           unit,
1412                           dev->d_kind.biosdisk.partition);
1413     DEBUG("dev is 0x%x\n", rootdev);
1414     return(rootdev);
1415 }