Merge from vendor branch CVS:
[dragonfly.git] / sys / platform / pc32 / i386 / autoconf.c
1 /*-
2  * Copyright (c) 1990 The Regents of the University of California.
3  * All rights reserved.
4  *
5  * This code is derived from software contributed to Berkeley by
6  * William Jolitz.
7  *
8  * Redistribution and use in source and binary forms, with or without
9  * modification, are permitted provided that the following conditions
10  * are met:
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer.
13  * 2. Redistributions in binary form must reproduce the above copyright
14  *    notice, this list of conditions and the following disclaimer in the
15  *    documentation and/or other materials provided with the distribution.
16  * 3. All advertising materials mentioning features or use of this software
17  *    must display the following acknowledgement:
18  *      This product includes software developed by the University of
19  *      California, Berkeley and its contributors.
20  * 4. Neither the name of the University nor the names of its contributors
21  *    may be used to endorse or promote products derived from this software
22  *    without specific prior written permission.
23  *
24  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
25  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
26  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
27  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
28  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
29  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
30  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
31  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
32  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
33  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
34  * SUCH DAMAGE.
35  *
36  *      from: @(#)autoconf.c    7.1 (Berkeley) 5/9/91
37  * $FreeBSD: src/sys/i386/i386/autoconf.c,v 1.146.2.2 2001/06/07 06:05:58 dd Exp $
38  * $DragonFly: src/sys/platform/pc32/i386/autoconf.c,v 1.13 2004/07/28 06:04:41 dillon Exp $
39  */
40
41 /*
42  * Setup the system to run on the current machine.
43  *
44  * Configure() is called at boot time and initializes the vba
45  * device tables and the memory controller monitoring.  Available
46  * devices are determined (from possibilities mentioned in ioconf.c),
47  * and the drivers are initialized.
48  */
49 #include "opt_bootp.h"
50 #include "opt_ffs.h"
51 #include "opt_cd9660.h"
52 #include "opt_nfs.h"
53 #include "opt_nfsroot.h"
54 #include "opt_bus.h"
55 #include "opt_rootdevname.h"
56
57 #include "use_isa.h"
58
59 #include <sys/param.h>
60 #include <sys/systm.h>
61 #include <sys/bootmaj.h>
62 #include <sys/bus.h>
63 #include <sys/conf.h>
64 #include <sys/disklabel.h>
65 #include <sys/diskslice.h>
66 #include <sys/reboot.h>
67 #include <sys/kernel.h>
68 #include <sys/malloc.h>
69 #include <sys/mount.h>
70 #include <sys/cons.h>
71 #include <sys/thread.h>
72 #include <sys/device.h>
73
74 #include <machine/bootinfo.h>
75 #include <machine/ipl.h>
76 #include <machine/md_var.h>
77 #ifdef APIC_IO
78 #include <machine/smp.h>
79 #else
80 #include <i386/isa/icu.h>
81 #endif /* APIC_IO */
82
83 #include <machine/pcb.h>
84 #include <machine/pcb_ext.h>
85 #include <machine/vm86.h>
86 #include <machine/globaldata.h>
87
88 #if NISA > 0
89 #include <bus/isa/isavar.h>
90
91 device_t isa_bus_device = 0;
92 #endif
93
94 static void     configure_first (void *);
95 static void     configure (void *);
96 static void     configure_final (void *);
97
98 #if defined(FFS) && defined(FFS_ROOT)
99 static void     setroot (void);
100 #endif
101
102 #if defined(NFS) && defined(NFS_ROOT)
103 #if !defined(BOOTP_NFSROOT)
104 static void     pxe_setup_nfsdiskless(void);
105 #endif
106 #endif
107
108 SYSINIT(configure1, SI_SUB_CONFIGURE, SI_ORDER_FIRST, configure_first, NULL);
109 /* SI_ORDER_SECOND is hookable */
110 SYSINIT(configure2, SI_SUB_CONFIGURE, SI_ORDER_THIRD, configure, NULL);
111 /* SI_ORDER_MIDDLE is hookable */
112 SYSINIT(configure3, SI_SUB_CONFIGURE, SI_ORDER_ANY, configure_final, NULL);
113
114 dev_t   rootdev = NODEV;
115 dev_t   dumpdev = NODEV;
116
117 device_t nexus_dev;
118
119 /*
120  * Determine i/o configuration for a machine.
121  */
122 static void
123 configure_first(dummy)
124         void *dummy;
125 {
126 }
127
128 static void
129 configure(dummy)
130         void *dummy;
131 {
132
133         /*
134          * Activate the ICU's.  Note that we are explicitly at splhigh()
135          * at present as we have no way to disable stray PCI level triggered
136          * interrupts until the devices have had a driver attached.  This
137          * is particularly a problem when the interrupts are shared.  For
138          * example, if IRQ 10 is shared between a disk and network device
139          * and the disk device generates an interrupt, if we "activate"
140          * IRQ 10 when the network driver is set up, then we will get
141          * recursive interrupt 10's as nothing will know how to turn off
142          * the disk device's interrupt.
143          *
144          * Having the ICU's active means we can probe interrupt routing to
145          * see if a device causes the corresponding pending bit to be set.
146          *
147          * This is all rather inconvenient.
148          */
149 #ifdef APIC_IO
150         bsp_apic_configure();
151         cpu_enable_intr();
152 #else
153         cpu_enable_intr();
154         INTREN(IRQ_SLAVE);
155 #endif /* APIC_IO */
156
157         /* nexus0 is the top of the i386 device tree */
158         device_add_child(root_bus, "nexus", 0);
159
160         /* initialize new bus architecture */
161         root_bus_configure();
162
163 #if NISA > 0
164         /*
165          * Explicitly probe and attach ISA last.  The isa bus saves
166          * it's device node at attach time for us here.
167          */
168         if (isa_bus_device)
169                 isa_probe_children(isa_bus_device);
170 #endif
171
172         /*
173          * Now we're ready to handle (pending) interrupts.
174          * XXX this is slightly misplaced.
175          */
176         spl0();
177
178         /*
179          * Allow lowering of the ipl to the lowest kernel level if we
180          * panic (or call tsleep() before clearing `cold').  No level is
181          * completely safe (since a panic may occur in a critical region
182          * at splhigh()), but we want at least bio interrupts to work.
183          */
184         safepri = curthread->td_cpl;
185 }
186
187 static void
188 configure_final(dummy)
189         void *dummy;
190 {
191         int i;
192
193         cninit_finish();
194
195         if (bootverbose) {
196
197 #ifdef APIC_IO
198                 imen_dump();
199 #endif /* APIC_IO */
200
201                 /*
202                  * Print out the BIOS's idea of the disk geometries.
203                  */
204                 printf("BIOS Geometries:\n");
205                 for (i = 0; i < N_BIOS_GEOM; i++) {
206                         unsigned long bios_geom;
207                         int max_cylinder, max_head, max_sector;
208
209                         bios_geom = bootinfo.bi_bios_geom[i];
210
211                         /*
212                          * XXX the bootstrap punts a 1200K floppy geometry
213                          * when the get-disk-geometry interrupt fails.  Skip
214                          * drives that have this geometry.
215                          */
216                         if (bios_geom == 0x4f010f)
217                                 continue;
218
219                         printf(" %x:%08lx ", i, bios_geom);
220                         max_cylinder = bios_geom >> 16;
221                         max_head = (bios_geom >> 8) & 0xff;
222                         max_sector = bios_geom & 0xff;
223                         printf(
224                 "0..%d=%d cylinders, 0..%d=%d heads, 1..%d=%d sectors\n",
225                                max_cylinder, max_cylinder + 1,
226                                max_head, max_head + 1,
227                                max_sector, max_sector);
228                 }
229                 printf(" %d accounted for\n", bootinfo.bi_n_bios_used);
230
231                 printf("Device configuration finished.\n");
232         }
233         cold = 0;
234 }
235
236 #ifdef BOOTP
237 void bootpc_init(void);
238 #endif
239 /*
240  * Do legacy root filesystem discovery.
241  */
242 void
243 cpu_rootconf()
244 {
245 #ifdef BOOTP
246         bootpc_init();
247 #endif
248 #if defined(NFS) && defined(NFS_ROOT)
249 #if !defined(BOOTP_NFSROOT)
250         pxe_setup_nfsdiskless();
251         if (nfs_diskless_valid)
252 #endif
253                 rootdevnames[0] = "nfs:";
254 #endif
255 #if defined(FFS) && defined(FFS_ROOT)
256         if (!rootdevnames[0])
257                 setroot();
258 #endif
259 }
260 SYSINIT(cpu_rootconf, SI_SUB_ROOT_CONF, SI_ORDER_FIRST, cpu_rootconf, NULL)
261
262 u_long  bootdev = 0;            /* not a dev_t - encoding is different */
263
264 #if defined(FFS) && defined(FFS_ROOT)
265 #define FDMAJOR         2
266 #define FDUNITSHIFT     6
267
268 /*
269  * The boot code uses old block device major numbers to pass bootdev to
270  * us.  We have to translate these to character device majors because
271  * we don't have block devices any more.
272  */
273 static int
274 boot_translate_majdev(int bmajor)
275 {
276         static int conv[] = { BOOTMAJOR_CONVARY };
277
278         if (bmajor >= 0 && bmajor < sizeof(conv)/sizeof(conv[0]))
279                 return(conv[bmajor]);
280         return(-1);
281 }
282
283 /*
284  * Attempt to find the device from which we were booted.
285  * If we can do so, and not instructed not to do so,
286  * set rootdevs[] and rootdevnames[] to correspond to the
287  * boot device(s).
288  *
289  * This code survives in order to allow the system to be 
290  * booted from legacy environments that do not correctly
291  * populate the kernel environment. There are significant
292  * restrictions on the bootability of the system in this
293  * situation; it can only be mounting root from a 'da'
294  * 'wd' or 'fd' device, and the root filesystem must be ufs.
295  */
296 static void
297 setroot()
298 {
299         int majdev, mindev, unit, slice, part;
300         dev_t newrootdev, dev;
301         char partname[2];
302         char *sname;
303
304         if ((bootdev & B_MAGICMASK) != B_DEVMAGIC) {
305                 printf("no B_DEVMAGIC (bootdev=%#lx)\n", bootdev);
306                 return;
307         }
308         majdev = boot_translate_majdev(B_TYPE(bootdev));
309         if (bootverbose) {
310                 printf("bootdev: %08lx type=%ld unit=%ld "
311                         "slice=%ld part=%ld major=%d\n",
312                         bootdev, B_TYPE(bootdev), B_UNIT(bootdev),
313                         B_SLICE(bootdev), B_PARTITION(bootdev), majdev);
314         }
315         dev = udev2dev(makeudev(majdev, 0), 0);
316         if (!dev_is_good(dev))
317                 return;
318         unit = B_UNIT(bootdev);
319         slice = B_SLICE(bootdev);
320         if (slice == WHOLE_DISK_SLICE)
321                 slice = COMPATIBILITY_SLICE;
322         if (slice < 0 || slice >= MAX_SLICES) {
323                 printf("bad slice\n");
324                 return;
325         }
326
327         /*
328          * XXX kludge for inconsistent unit numbering and lack of slice
329          * support for floppies.
330          */
331         if (majdev == FD_CDEV_MAJOR) {
332                 slice = COMPATIBILITY_SLICE;
333                 part = RAW_PART;
334                 mindev = unit << FDUNITSHIFT;
335         } else {
336                 part = B_PARTITION(bootdev);
337                 mindev = dkmakeminor(unit, slice, part);
338         }
339         newrootdev = udev2dev(makeudev(majdev, mindev), 0);
340         if (!dev_is_good(newrootdev))
341                 return;
342         sname = dsname(newrootdev, unit, slice, part, partname);
343         rootdevnames[0] = malloc(strlen(sname) + 6, M_DEVBUF, M_NOWAIT);
344         sprintf(rootdevnames[0], "ufs:%s%s", sname, partname);
345
346         /*
347          * For properly dangerously dedicated disks (ones with a historical
348          * bogus partition table), the boot blocks will give slice = 4, but
349          * the kernel will only provide the compatibility slice since it
350          * knows that slice 4 is not a real slice.  Arrange to try mounting
351          * the compatibility slice as root if mounting the slice passed by
352          * the boot blocks fails.  This handles the dangerously dedicated
353          * case and perhaps others.
354          */
355         if (slice == COMPATIBILITY_SLICE)
356                 return;
357         slice = COMPATIBILITY_SLICE;
358         sname = dsname(newrootdev, unit, slice, part, partname);
359         rootdevnames[1] = malloc(strlen(sname) + 6, M_DEVBUF, M_NOWAIT);
360         sprintf(rootdevnames[1], "ufs:%s%s", sname, partname);
361 }
362 #endif
363
364 #if defined(NFS) && defined(NFS_ROOT)
365 #if !defined(BOOTP_NFSROOT)
366
367 #include <sys/socket.h>
368 #include <net/if.h>
369 #include <net/if_dl.h>
370 #include <net/if_types.h>
371 #include <net/if_var.h>
372 #include <net/ethernet.h>
373 #include <netinet/in.h>
374 #include <vfs/nfs/rpcv2.h>
375 #include <vfs/nfs/nfsproto.h>
376 #include <vfs/nfs/nfs.h>
377 #include <vfs/nfs/nfsdiskless.h>
378
379 extern struct nfs_diskless      nfs_diskless;
380
381 static int
382 inaddr_to_sockaddr(char *ev, struct sockaddr_in *sa)
383 {
384         u_int32_t       a[4];
385         char            *cp;
386
387         bzero(sa, sizeof(*sa));
388         sa->sin_len = sizeof(*sa);
389         sa->sin_family = AF_INET;
390
391         if ((cp = getenv(ev)) == NULL)
392                 return(1);
393         if (sscanf(cp, "%d.%d.%d.%d", &a[0], &a[1], &a[2], &a[3]) != 4)
394                 return(1);
395         /* XXX is this ordering correct? */
396         sa->sin_addr.s_addr = (a[3] << 24) + (a[2] << 16) + (a[1] << 8) + a[0];
397         return(0);
398 }
399
400 static int
401 hwaddr_to_sockaddr(char *ev, struct sockaddr_dl *sa)
402 {
403         char            *cp;
404         u_int32_t       a[6];
405
406         bzero(sa, sizeof(*sa));
407         sa->sdl_len = sizeof(*sa);
408         sa->sdl_family = AF_LINK;
409         sa->sdl_type = IFT_ETHER;
410         sa->sdl_alen = ETHER_ADDR_LEN;
411         if ((cp = getenv(ev)) == NULL)
412                 return(1);
413         if (sscanf(cp, "%x:%x:%x:%x:%x:%x", &a[0], &a[1], &a[2], &a[3], &a[4], &a[5]) != 6)
414                 return(1);
415         sa->sdl_data[0] = a[0];
416         sa->sdl_data[1] = a[1];
417         sa->sdl_data[2] = a[2];
418         sa->sdl_data[3] = a[3];
419         sa->sdl_data[4] = a[4];
420         sa->sdl_data[5] = a[5];
421         return(0);
422 }
423
424 static int
425 decode_nfshandle(char *ev, u_char *fh) 
426 {
427         u_char  *cp;
428         int     len, val;
429
430         if (((cp = getenv(ev)) == NULL) || (strlen(cp) < 2) || (*cp != 'X'))
431                 return(0);
432         len = 0;
433         cp++;
434         for (;;) {
435                 if (*cp == 'X')
436                         return(len);
437                 if ((sscanf(cp, "%2x", &val) != 1) || (val > 0xff))
438                         return(0);
439                 *(fh++) = val;
440                 len++;
441                 cp += 2;
442                 if (len > NFSX_V2FH)
443                     return(0);
444         }
445 }
446
447 /*
448  * Populate the essential fields in the nfsv3_diskless structure.
449  *
450  * The loader is expected to export the following environment variables:
451  *
452  * boot.netif.ip                IP address on boot interface
453  * boot.netif.netmask           netmask on boot interface
454  * boot.netif.gateway           default gateway (optional)
455  * boot.netif.hwaddr            hardware address of boot interface
456  * boot.nfsroot.server          IP address of root filesystem server
457  * boot.nfsroot.path            path of the root filesystem on server
458  * boot.nfsroot.nfshandle       NFS handle for root filesystem on server
459  */
460 static void
461 pxe_setup_nfsdiskless()
462 {
463         struct nfs_diskless     *nd = &nfs_diskless;
464         struct ifnet            *ifp;
465         struct ifaddr           *ifa;
466         struct sockaddr_dl      *sdl, ourdl;
467         struct sockaddr_in      myaddr, netmask;
468         char                    *cp;
469
470         /* set up interface */
471         if (inaddr_to_sockaddr("boot.netif.ip", &myaddr))
472                 return;
473         if (inaddr_to_sockaddr("boot.netif.netmask", &netmask)) {
474                 printf("PXE: no netmask\n");
475                 return;
476         }
477         bcopy(&myaddr, &nd->myif.ifra_addr, sizeof(myaddr));
478         bcopy(&myaddr, &nd->myif.ifra_broadaddr, sizeof(myaddr));
479         ((struct sockaddr_in *) &nd->myif.ifra_broadaddr)->sin_addr.s_addr =
480                 myaddr.sin_addr.s_addr | ~ netmask.sin_addr.s_addr;
481         bcopy(&netmask, &nd->myif.ifra_mask, sizeof(netmask));
482
483         if (hwaddr_to_sockaddr("boot.netif.hwaddr", &ourdl)) {
484                 printf("PXE: no hardware address\n");
485                 return;
486         }
487         ifa = NULL;
488         ifp = TAILQ_FIRST(&ifnet);
489         TAILQ_FOREACH(ifp, &ifnet, if_link) {
490                 TAILQ_FOREACH(ifa, &ifp->if_addrhead, ifa_link) {
491                         if ((ifa->ifa_addr->sa_family == AF_LINK) &&
492                             (sdl = ((struct sockaddr_dl *)ifa->ifa_addr))) {
493                                 if ((sdl->sdl_type == ourdl.sdl_type) &&
494                                     (sdl->sdl_alen == ourdl.sdl_alen) &&
495                                     !bcmp(sdl->sdl_data + sdl->sdl_nlen,
496                                           ourdl.sdl_data + ourdl.sdl_nlen, 
497                                           sdl->sdl_alen))
498                                     goto match_done;
499                         }
500                 }
501         }
502         printf("PXE: no interface\n");
503         return; /* no matching interface */
504 match_done:
505         strlcpy(nd->myif.ifra_name, ifp->if_xname, sizeof(nd->myif.ifra_name));
506         
507         /* set up gateway */
508         inaddr_to_sockaddr("boot.netif.gateway", &nd->mygateway);
509
510         /* XXX set up swap? */
511
512         /* set up root mount */
513         nd->root_args.rsize = 8192;             /* XXX tunable? */
514         nd->root_args.wsize = 8192;
515         nd->root_args.sotype = SOCK_DGRAM;
516         nd->root_args.flags = (NFSMNT_WSIZE | NFSMNT_RSIZE | NFSMNT_RESVPORT);
517         if (inaddr_to_sockaddr("boot.nfsroot.server", &nd->root_saddr)) {
518                 printf("PXE: no server\n");
519                 return;
520         }
521         nd->root_saddr.sin_port = htons(NFS_PORT);
522         if (decode_nfshandle("boot.nfsroot.nfshandle", &nd->root_fh[0]) == 0) {
523                 printf("PXE: no NFS handle\n");
524                 return;
525         }
526         if ((cp = getenv("boot.nfsroot.path")) != NULL)
527                 strncpy(nd->root_hostnam, cp, MNAMELEN - 1);
528
529         nfs_diskless_valid = 1;
530 }
531
532 #endif
533 #endif