e6e0bc1f64c1bbb991de16b4594d43ee3e45f4e0
[dragonfly.git] / sys / platform / vkernel / i386 / autoconf.c
1 /*-
2  * Copyright (c) 1990 The Regents of the University of California.
3  * All rights reserved.
4  *
5  * This code is derived from software contributed to Berkeley by
6  * William Jolitz.
7  *
8  * Redistribution and use in source and binary forms, with or without
9  * modification, are permitted provided that the following conditions
10  * are met:
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer.
13  * 2. Redistributions in binary form must reproduce the above copyright
14  *    notice, this list of conditions and the following disclaimer in the
15  *    documentation and/or other materials provided with the distribution.
16  * 3. All advertising materials mentioning features or use of this software
17  *    must display the following acknowledgement:
18  *      This product includes software developed by the University of
19  *      California, Berkeley and its contributors.
20  * 4. Neither the name of the University nor the names of its contributors
21  *    may be used to endorse or promote products derived from this software
22  *    without specific prior written permission.
23  *
24  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
25  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
26  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
27  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
28  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
29  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
30  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
31  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
32  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
33  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
34  * SUCH DAMAGE.
35  *
36  *      from: @(#)autoconf.c    7.1 (Berkeley) 5/9/91
37  * $FreeBSD: src/sys/i386/i386/autoconf.c,v 1.146.2.2 2001/06/07 06:05:58 dd Exp $
38  * $DragonFly: src/sys/platform/vkernel/i386/autoconf.c,v 1.9 2007/05/01 00:05:18 dillon Exp $
39  */
40
41 /*
42  * Setup the system to run on the current machine.
43  *
44  * Configure() is called at boot time and initializes the vba
45  * device tables and the memory controller monitoring.  Available
46  * devices are determined (from possibilities mentioned in ioconf.c),
47  * and the drivers are initialized.
48  */
49 #include "opt_bootp.h"
50 #include "opt_ffs.h"
51 #include "opt_cd9660.h"
52 #include "opt_nfs.h"
53 #include "opt_nfsroot.h"
54 #include "opt_bus.h"
55 #include "opt_rootdevname.h"
56
57 #include "use_isa.h"
58
59 #include <sys/param.h>
60 #include <sys/systm.h>
61 #include <sys/bootmaj.h>
62 #include <sys/bus.h>
63 #include <sys/buf.h>
64 #include <sys/conf.h>
65 #include <sys/disklabel.h>
66 #include <sys/diskslice.h>
67 #include <sys/reboot.h>
68 #include <sys/kernel.h>
69 #include <sys/malloc.h>
70 #include <sys/mount.h>
71 #include <sys/cons.h>
72 #include <sys/thread.h>
73 #include <sys/device.h>
74 #include <sys/machintr.h>
75
76 #include <vm/pmap.h>
77 #include <vm/vm_kern.h>
78 #include <vm/vm_extern.h>
79 #include <vm/vm_pager.h>
80
81 #if 0
82 #include <machine/pcb.h>
83 #include <machine/pcb_ext.h>
84 #include <machine/vm86.h>
85 #endif
86 #include <machine/globaldata.h>
87 #include <machine/md_var.h>
88
89 #if NISA > 0
90 #include <bus/isa/isavar.h>
91
92 device_t isa_bus_device = 0;
93 #endif
94
95 static void cpu_startup (void *);
96 static void configure_first (void *);
97 static void configure (void *);
98 static void configure_final (void *);
99
100 #if defined(FFS) && defined(FFS_ROOT)
101 static void     setroot (void);
102 #endif
103
104 #if defined(NFS) && defined(NFS_ROOT)
105 #if !defined(BOOTP_NFSROOT)
106 static void     pxe_setup_nfsdiskless(void);
107 #endif
108 #endif
109
110 SYSINIT(cpu, SI_BOOT2_SMP, SI_ORDER_FIRST, cpu_startup, NULL);
111 SYSINIT(configure1, SI_SUB_CONFIGURE, SI_ORDER_FIRST, configure_first, NULL);
112 /* SI_ORDER_SECOND is hookable */
113 SYSINIT(configure2, SI_SUB_CONFIGURE, SI_ORDER_THIRD, configure, NULL);
114 /* SI_ORDER_MIDDLE is hookable */
115 SYSINIT(configure3, SI_SUB_CONFIGURE, SI_ORDER_ANY, configure_final, NULL);
116
117 cdev_t  rootdev = NOCDEV;
118 cdev_t  dumpdev = NOCDEV;
119
120 /*
121  * 
122  */
123 static void
124 cpu_startup(void *dummy)
125 {
126         vm_offset_t buffer_sva;
127         vm_offset_t buffer_eva;
128         vm_offset_t pager_sva;
129         vm_offset_t pager_eva;
130         vm_offset_t minaddr;
131         vm_offset_t maxaddr;
132
133         kprintf("%s", version);
134         kprintf("real memory = %llu (%lluK bytes)\n",
135                 ptoa(Maxmem), ptoa(Maxmem) / 1024);
136
137         if (nbuf == 0) {
138                 int factor = 4 * BKVASIZE / 1024;
139                 int kbytes = Maxmem * (PAGE_SIZE / 1024);
140
141                 nbuf = 50;
142                 if (kbytes > 4096)
143                         nbuf += min((kbytes - 4096) / factor, 65536 / factor);
144                 if (kbytes > 65536)
145                         nbuf += (kbytes - 65536) * 2 / (factor * 5);
146                 if (maxbcache && nbuf > maxbcache / BKVASIZE)
147                         nbuf = maxbcache / BKVASIZE;
148         }
149         if (nbuf > (virtual_end - virtual_start) / (BKVASIZE * 2)) {
150                 nbuf = (virtual_end - virtual_start) / (BKVASIZE * 2);
151                 kprintf("Warning: nbufs capped at %d\n", nbuf);
152         }
153
154         nswbuf = max(min(nbuf/4, 256), 16);
155 #ifdef NSWBUF_MIN
156         if (nswbuf < NSWBUF_MIN)
157                 nswbuf = NSWBUF_MIN;
158 #endif
159
160         /*
161          * Allocate memory for the buffer cache
162          */
163         buf = (void *)kmem_alloc(&kernel_map, nbuf * sizeof(struct buf));
164         swbuf = (void *)kmem_alloc(&kernel_map, nswbuf * sizeof(struct buf));
165
166
167 #ifdef DIRECTIO
168         ffs_rawread_setup();
169 #endif
170         kmem_suballoc(&kernel_map, &clean_map, &clean_sva, &clean_eva,
171                       (nbuf*BKVASIZE) + (nswbuf*MAXPHYS) + pager_map_size);
172         kmem_suballoc(&clean_map, &buffer_map, &buffer_sva, &buffer_eva,
173                       (nbuf*BKVASIZE));
174         buffer_map.system_map = 1;
175         kmem_suballoc(&clean_map, &pager_map, &pager_sva, &pager_eva,
176                       (nswbuf*MAXPHYS) + pager_map_size);
177         pager_map.system_map = 1;
178         kmem_suballoc(&kernel_map, &exec_map, &minaddr, &maxaddr,
179                       (16*(ARG_MAX+(PAGE_SIZE*3))));
180 #if defined(USERCONFIG)
181         userconfig();
182         cninit();               /* the preferred console may have changed */
183 #endif
184         kprintf("avail memory = %u (%uK bytes)\n", ptoa(vmstats.v_free_count),
185                 ptoa(vmstats.v_free_count) / 1024);
186         bufinit();
187         vm_pager_bufferinit();
188 #ifdef SMP
189         mp_start();
190         mp_announce();
191 #endif
192         cpu_setregs();
193 }
194
195 /*
196  * Determine i/o configuration for a machine.
197  */
198 static void
199 configure_first(void *dummy)
200 {
201 }
202
203 static void
204 configure(void *dummy)
205 {
206         /*
207          * Final interrupt support acviation, then enable hardware interrupts.
208          */
209         MachIntrABI.finalize();
210         cpu_enable_intr();
211
212         /*
213          * This will configure all devices, generally starting with the
214          * nexus (i386/i386/nexus.c).  The nexus ISA code explicitly
215          * dummies up the attach in order to delay legacy initialization
216          * until after all other busses/subsystems have had a chance
217          * at those resources.
218          */
219         root_bus_configure();
220
221 #if NISA > 0
222         /*
223          * Explicitly probe and attach ISA last.  The isa bus saves
224          * it's device node at attach time for us here.
225          */
226         if (isa_bus_device)
227                 isa_probe_children(isa_bus_device);
228 #endif
229
230         /*
231          * Allow lowering of the ipl to the lowest kernel level if we
232          * panic (or call tsleep() before clearing `cold').  No level is
233          * completely safe (since a panic may occur in a critical region
234          * at splhigh()), but we want at least bio interrupts to work.
235          */
236         safepri = TDPRI_KERN_USER;
237 }
238
239 static void
240 configure_final(void *dummy)
241 {
242         cninit_finish();
243
244         if (bootverbose)
245                 kprintf("Device configuration finished.\n");
246 }
247
248 #ifdef BOOTP
249 void bootpc_init(void);
250 #endif
251 /*
252  * Do legacy root filesystem discovery.
253  */
254 void
255 cpu_rootconf(void)
256 {
257 #ifdef BOOTP
258         bootpc_init();
259 #endif
260 #if defined(NFS) && defined(NFS_ROOT)
261 #if !defined(BOOTP_NFSROOT)
262         pxe_setup_nfsdiskless();
263         if (nfs_diskless_valid)
264 #endif
265                 rootdevnames[0] = "nfs:";
266 #endif
267 #if defined(FFS) && defined(FFS_ROOT)
268         if (!rootdevnames[0])
269                 setroot();
270 #endif
271 }
272 SYSINIT(cpu_rootconf, SI_SUB_ROOT_CONF, SI_ORDER_FIRST, cpu_rootconf, NULL)
273
274 u_long  bootdev = 0;            /* not a cdev_t - encoding is different */
275
276 #if defined(FFS) && defined(FFS_ROOT)
277
278 /*
279  * The boot code uses old block device major numbers to pass bootdev to
280  * us.  We have to translate these to character device majors because
281  * we don't have block devices any more.
282  */
283 static int
284 boot_translate_majdev(int bmajor)
285 {
286         static int conv[] = { BOOTMAJOR_CONVARY };
287
288         if (bmajor >= 0 && bmajor < sizeof(conv)/sizeof(conv[0]))
289                 return(conv[bmajor]);
290         return(-1);
291 }
292
293 /*
294  * Attempt to find the device from which we were booted.
295  * If we can do so, and not instructed not to do so,
296  * set rootdevs[] and rootdevnames[] to correspond to the
297  * boot device(s).
298  *
299  * This code survives in order to allow the system to be 
300  * booted from legacy environments that do not correctly
301  * populate the kernel environment. There are significant
302  * restrictions on the bootability of the system in this
303  * situation; it can only be mounting root from a 'da'
304  * 'wd' or 'fd' device, and the root filesystem must be ufs.
305  */
306 static void
307 setroot(void)
308 {
309         int majdev, mindev, unit, slice, part;
310         cdev_t newrootdev, dev;
311         char partname[2];
312         char *sname;
313
314         if ((bootdev & B_MAGICMASK) != B_DEVMAGIC) {
315                 kprintf("no B_DEVMAGIC (bootdev=%#lx)\n", bootdev);
316                 return;
317         }
318         majdev = boot_translate_majdev(B_TYPE(bootdev));
319         if (bootverbose) {
320                 kprintf("bootdev: %08lx type=%ld unit=%ld "
321                         "slice=%ld part=%ld major=%d\n",
322                         bootdev, B_TYPE(bootdev), B_UNIT(bootdev),
323                         B_SLICE(bootdev), B_PARTITION(bootdev), majdev);
324         }
325         dev = udev2dev(makeudev(majdev, 0), 0);
326         if (!dev_is_good(dev))
327                 return;
328         unit = B_UNIT(bootdev);
329         slice = B_SLICE(bootdev);
330         if (slice == WHOLE_DISK_SLICE)
331                 slice = COMPATIBILITY_SLICE;
332         if (slice < 0 || slice >= MAX_SLICES) {
333                 kprintf("bad slice\n");
334                 return;
335         }
336
337         part = B_PARTITION(bootdev);
338         mindev = dkmakeminor(unit, slice, part);
339         newrootdev = udev2dev(makeudev(majdev, mindev), 0);
340         if (!dev_is_good(newrootdev))
341                 return;
342         sname = dsname(newrootdev, unit, slice, part, partname);
343         rootdevnames[0] = kmalloc(strlen(sname) + 6, M_DEVBUF, M_WAITOK);
344         ksprintf(rootdevnames[0], "ufs:%s%s", sname, partname);
345
346         /*
347          * For properly dangerously dedicated disks (ones with a historical
348          * bogus partition table), the boot blocks will give slice = 4, but
349          * the kernel will only provide the compatibility slice since it
350          * knows that slice 4 is not a real slice.  Arrange to try mounting
351          * the compatibility slice as root if mounting the slice passed by
352          * the boot blocks fails.  This handles the dangerously dedicated
353          * case and perhaps others.
354          */
355         if (slice == COMPATIBILITY_SLICE)
356                 return;
357         slice = COMPATIBILITY_SLICE;
358         sname = dsname(newrootdev, unit, slice, part, partname);
359         rootdevnames[1] = kmalloc(strlen(sname) + 6, M_DEVBUF, M_WAITOK);
360         ksprintf(rootdevnames[1], "ufs:%s%s", sname, partname);
361 }
362 #endif
363
364 #if defined(NFS) && defined(NFS_ROOT)
365 #if !defined(BOOTP_NFSROOT)
366
367 #include <sys/socket.h>
368 #include <net/if.h>
369 #include <net/if_dl.h>
370 #include <net/if_types.h>
371 #include <net/if_var.h>
372 #include <net/ethernet.h>
373 #include <netinet/in.h>
374 #include <vfs/nfs/rpcv2.h>
375 #include <vfs/nfs/nfsproto.h>
376 #include <vfs/nfs/nfs.h>
377 #include <vfs/nfs/nfsdiskless.h>
378
379 extern struct nfs_diskless      nfs_diskless;
380
381 /*
382  * Convert a kenv variable to a sockaddr.  If the kenv variable does not
383  * exist the sockaddr will remain zerod out (callers typically just check
384  * sin_len).  A network address of 0.0.0.0 is equivalent to failure.
385  */
386 static int
387 inaddr_to_sockaddr(char *ev, struct sockaddr_in *sa)
388 {
389         u_int32_t       a[4];
390         char            *cp;
391
392         bzero(sa, sizeof(*sa));
393
394         if ((cp = kgetenv(ev)) == NULL)
395                 return(1);
396         if (ksscanf(cp, "%d.%d.%d.%d", &a[0], &a[1], &a[2], &a[3]) != 4)
397                 return(1);
398         if (a[0] == 0 && a[1] == 0 && a[2] == 0 && a[3] == 0)
399                 return(1);
400         /* XXX is this ordering correct? */
401         sa->sin_addr.s_addr = (a[3] << 24) + (a[2] << 16) + (a[1] << 8) + a[0];
402         sa->sin_len = sizeof(*sa);
403         sa->sin_family = AF_INET;
404         return(0);
405 }
406
407 static int
408 hwaddr_to_sockaddr(char *ev, struct sockaddr_dl *sa)
409 {
410         char            *cp;
411         u_int32_t       a[6];
412
413         bzero(sa, sizeof(*sa));
414         sa->sdl_len = sizeof(*sa);
415         sa->sdl_family = AF_LINK;
416         sa->sdl_type = IFT_ETHER;
417         sa->sdl_alen = ETHER_ADDR_LEN;
418         if ((cp = kgetenv(ev)) == NULL)
419                 return(1);
420         if (ksscanf(cp, "%x:%x:%x:%x:%x:%x", &a[0], &a[1], &a[2], &a[3], &a[4], &a[5]) != 6)
421                 return(1);
422         sa->sdl_data[0] = a[0];
423         sa->sdl_data[1] = a[1];
424         sa->sdl_data[2] = a[2];
425         sa->sdl_data[3] = a[3];
426         sa->sdl_data[4] = a[4];
427         sa->sdl_data[5] = a[5];
428         return(0);
429 }
430
431 static int
432 decode_nfshandle(char *ev, u_char *fh) 
433 {
434         u_char  *cp;
435         int     len, val;
436
437         if (((cp = kgetenv(ev)) == NULL) || (strlen(cp) < 2) || (*cp != 'X'))
438                 return(0);
439         len = 0;
440         cp++;
441         for (;;) {
442                 if (*cp == 'X')
443                         return(len);
444                 if ((ksscanf(cp, "%2x", &val) != 1) || (val > 0xff))
445                         return(0);
446                 *(fh++) = val;
447                 len++;
448                 cp += 2;
449                 if (len > NFSX_V2FH)
450                     return(0);
451         }
452 }
453
454 /*
455  * Populate the essential fields in the nfsv3_diskless structure.
456  *
457  * The loader is expected to export the following environment variables:
458  *
459  * boot.netif.ip                IP address on boot interface
460  * boot.netif.netmask           netmask on boot interface
461  * boot.netif.gateway           default gateway (optional)
462  * boot.netif.hwaddr            hardware address of boot interface
463  * boot.nfsroot.server          IP address of root filesystem server
464  * boot.nfsroot.path            path of the root filesystem on server
465  * boot.nfsroot.nfshandle       NFS handle for root filesystem on server
466  */
467 static void
468 pxe_setup_nfsdiskless(void)
469 {
470         struct nfs_diskless     *nd = &nfs_diskless;
471         struct ifnet            *ifp;
472         struct ifaddr           *ifa;
473         struct sockaddr_dl      *sdl, ourdl;
474         struct sockaddr_in      myaddr, netmask;
475         char                    *cp;
476
477         /* set up interface */
478         if (inaddr_to_sockaddr("boot.netif.ip", &myaddr))
479                 return;
480         if (inaddr_to_sockaddr("boot.netif.netmask", &netmask)) {
481                 kprintf("PXE: no netmask\n");
482                 return;
483         }
484         bcopy(&myaddr, &nd->myif.ifra_addr, sizeof(myaddr));
485         bcopy(&myaddr, &nd->myif.ifra_broadaddr, sizeof(myaddr));
486         ((struct sockaddr_in *) &nd->myif.ifra_broadaddr)->sin_addr.s_addr =
487                 myaddr.sin_addr.s_addr | ~ netmask.sin_addr.s_addr;
488         bcopy(&netmask, &nd->myif.ifra_mask, sizeof(netmask));
489
490         if (hwaddr_to_sockaddr("boot.netif.hwaddr", &ourdl)) {
491                 kprintf("PXE: no hardware address\n");
492                 return;
493         }
494         ifa = NULL;
495         ifp = TAILQ_FIRST(&ifnet);
496         TAILQ_FOREACH(ifp, &ifnet, if_link) {
497                 TAILQ_FOREACH(ifa, &ifp->if_addrhead, ifa_link) {
498                         if ((ifa->ifa_addr->sa_family == AF_LINK) &&
499                             (sdl = ((struct sockaddr_dl *)ifa->ifa_addr))) {
500                                 if ((sdl->sdl_type == ourdl.sdl_type) &&
501                                     (sdl->sdl_alen == ourdl.sdl_alen) &&
502                                     !bcmp(sdl->sdl_data + sdl->sdl_nlen,
503                                           ourdl.sdl_data + ourdl.sdl_nlen, 
504                                           sdl->sdl_alen))
505                                     goto match_done;
506                         }
507                 }
508         }
509         kprintf("PXE: no interface\n");
510         return; /* no matching interface */
511 match_done:
512         strlcpy(nd->myif.ifra_name, ifp->if_xname, sizeof(nd->myif.ifra_name));
513         
514         /* set up gateway */
515         inaddr_to_sockaddr("boot.netif.gateway", &nd->mygateway);
516
517         /* XXX set up swap? */
518
519         /* set up root mount */
520         nd->root_args.rsize = 8192;             /* XXX tunable? */
521         nd->root_args.wsize = 8192;
522         nd->root_args.sotype = SOCK_DGRAM;
523         nd->root_args.flags = (NFSMNT_WSIZE | NFSMNT_RSIZE | NFSMNT_RESVPORT);
524         if (inaddr_to_sockaddr("boot.nfsroot.server", &nd->root_saddr)) {
525                 kprintf("PXE: no server\n");
526                 return;
527         }
528         nd->root_saddr.sin_port = htons(NFS_PORT);
529
530         /*
531          * A tftp-only loader may pass NFS path information without a 
532          * root handle.  Generate a warning but continue configuring.
533          */
534         if (decode_nfshandle("boot.nfsroot.nfshandle", &nd->root_fh[0]) == 0) {
535                 kprintf("PXE: Warning, no NFS handle passed from loader\n");
536         }
537         if ((cp = kgetenv("boot.nfsroot.path")) != NULL)
538                 strncpy(nd->root_hostnam, cp, MNAMELEN - 1);
539
540         nfs_diskless_valid = 1;
541 }
542
543 #endif
544 #endif