amd64: Fixes for the vkernel.
[dragonfly.git] / sys / platform / vkernel64 / amd64 / autoconf.c
1 /*-
2  * Copyright (c) 1990 The Regents of the University of California.
3  * Copyright (c) 2008 The DragonFly Project.
4  * All rights reserved.
5  *
6  * This code is derived from software contributed to Berkeley by
7  * William Jolitz.
8  *
9  * Redistribution and use in source and binary forms, with or without
10  * modification, are permitted provided that the following conditions
11  * are met:
12  * 1. Redistributions of source code must retain the above copyright
13  *    notice, this list of conditions and the following disclaimer.
14  * 2. Redistributions in binary form must reproduce the above copyright
15  *    notice, this list of conditions and the following disclaimer in the
16  *    documentation and/or other materials provided with the distribution.
17  * 3. All advertising materials mentioning features or use of this software
18  *    must display the following acknowledgement:
19  *      This product includes software developed by the University of
20  *      California, Berkeley and its contributors.
21  * 4. Neither the name of the University nor the names of its contributors
22  *    may be used to endorse or promote products derived from this software
23  *    without specific prior written permission.
24  *
25  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
26  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
27  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
28  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
29  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
30  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
31  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
32  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
33  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
34  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
35  * SUCH DAMAGE.
36  *
37  *      from: @(#)autoconf.c    7.1 (Berkeley) 5/9/91
38  * $FreeBSD: src/sys/i386/i386/autoconf.c,v 1.146.2.2 2001/06/07 06:05:58 dd Exp $
39  * $DragonFly: src/sys/platform/pc64/amd64/autoconf.c,v 1.3 2008/08/29 17:07:10 dillon Exp $
40  */
41
42 /*
43  * Setup the system to run on the current machine.
44  *
45  * Configure() is called at boot time and initializes the vba
46  * device tables and the memory controller monitoring.  Available
47  * devices are determined (from possibilities mentioned in ioconf.c),
48  * and the drivers are initialized.
49  */
50 #include "opt_bootp.h"
51 #include "opt_ffs.h"
52 #include "opt_cd9660.h"
53 #include "opt_nfs.h"
54 #include "opt_nfsroot.h"
55 #include "opt_bus.h"
56 #include "opt_rootdevname.h"
57
58 #include "use_isa.h"
59
60 #include <sys/param.h>
61 #include <sys/systm.h>
62 #include <sys/bootmaj.h>
63 #include <sys/bus.h>
64 #include <sys/buf.h>
65 #include <sys/conf.h>
66 #include <sys/diskslice.h>
67 #include <sys/reboot.h>
68 #include <sys/kernel.h>
69 #include <sys/malloc.h>
70 #include <sys/mount.h>
71 #include <sys/cons.h>
72 #include <sys/thread.h>
73 #include <sys/device.h>
74 #include <sys/machintr.h>
75
76 #include <vm/vm_kern.h>
77 #include <vm/vm_extern.h>
78 #include <vm/vm_pager.h>
79
80 #if 0
81 #include <machine/pcb.h>
82 #include <machine/pcb_ext.h>
83 #endif
84 #include <machine/smp.h>
85 #include <machine/globaldata.h>
86 #include <machine/md_var.h>
87
88 #if NISA > 0
89 #include <bus/isa/isavar.h>
90
91 device_t isa_bus_device = 0;
92 #endif
93
94 static void cpu_startup (void *);
95 static void configure_first (void *);
96 static void configure (void *);
97 static void configure_final (void *);
98
99 #if defined(FFS) && defined(FFS_ROOT)
100 static void     setroot (void);
101 #endif
102
103 #if defined(NFS) && defined(NFS_ROOT)
104 #if !defined(BOOTP_NFSROOT)
105 static void     pxe_setup_nfsdiskless(void);
106 #endif
107 #endif
108
109 SYSINIT(cpu, SI_BOOT2_SMP, SI_ORDER_FIRST, cpu_startup, NULL);
110 SYSINIT(configure1, SI_SUB_CONFIGURE, SI_ORDER_FIRST, configure_first, NULL);
111 /* SI_ORDER_SECOND is hookable */
112 SYSINIT(configure2, SI_SUB_CONFIGURE, SI_ORDER_THIRD, configure, NULL);
113 /* SI_ORDER_MIDDLE is hookable */
114 SYSINIT(configure3, SI_SUB_CONFIGURE, SI_ORDER_ANY, configure_final, NULL);
115
116 cdev_t  rootdev = NULL;
117 cdev_t  dumpdev = NULL;
118
119 /*
120  *
121  */
122 static void
123 cpu_startup(void *dummy)
124 {
125         vm_offset_t buffer_sva;
126         vm_offset_t buffer_eva;
127         vm_offset_t pager_sva;
128         vm_offset_t pager_eva;
129
130         kprintf("%s", version);
131         kprintf("real memory = %llu (%lluK bytes)\n",
132                 ptoa(Maxmem), ptoa(Maxmem) / 1024);
133
134         if (nbuf == 0) {
135                 int factor = 4 * BKVASIZE / 1024;
136                 int kbytes = Maxmem * (PAGE_SIZE / 1024);
137
138                 nbuf = 50;
139                 if (kbytes > 4096)
140                         nbuf += min((kbytes - 4096) / factor, 65536 / factor);
141                 if (kbytes > 65536)
142                         nbuf += (kbytes - 65536) * 2 / (factor * 5);
143                 if (maxbcache && nbuf > maxbcache / BKVASIZE)
144                         nbuf = maxbcache / BKVASIZE;
145         }
146         if (nbuf > (virtual_end - virtual_start) / (BKVASIZE * 2)) {
147                 nbuf = (virtual_end - virtual_start) / (BKVASIZE * 2);
148                 kprintf("Warning: nbufs capped at %d\n", nbuf);
149         }
150
151         nswbuf = max(min(nbuf/4, 256), 16);
152 #ifdef NSWBUF_MIN
153         if (nswbuf < NSWBUF_MIN)
154                 nswbuf = NSWBUF_MIN;
155 #endif
156
157         /*
158          * Allocate memory for the buffer cache
159          */
160         buf = (void *)kmem_alloc(&kernel_map, nbuf * sizeof(struct buf));
161         swbuf = (void *)kmem_alloc(&kernel_map, nswbuf * sizeof(struct buf));
162
163
164 #ifdef DIRECTIO
165         ffs_rawread_setup();
166 #endif
167         kmem_suballoc(&kernel_map, &clean_map, &clean_sva, &clean_eva,
168                       (nbuf*BKVASIZE) + (nswbuf*MAXPHYS) + pager_map_size);
169         kmem_suballoc(&clean_map, &buffer_map, &buffer_sva, &buffer_eva,
170                       (nbuf*BKVASIZE));
171         buffer_map.system_map = 1;
172         kmem_suballoc(&clean_map, &pager_map, &pager_sva, &pager_eva,
173                       (nswbuf*MAXPHYS) + pager_map_size);
174         pager_map.system_map = 1;
175 #if defined(USERCONFIG)
176         userconfig();
177         cninit();               /* the preferred console may have changed */
178 #endif
179         kprintf("avail memory = %lu (%luK bytes)\n", ptoa(vmstats.v_free_count),
180                 ptoa(vmstats.v_free_count) / 1024);
181         bufinit();
182         vm_pager_bufferinit();
183 #ifdef SMP
184         mp_start();
185         mp_announce();
186 #endif
187         cpu_setregs();
188 }
189
190 /*
191  * Determine i/o configuration for a machine.
192  */
193 static void
194 configure_first(void *dummy)
195 {
196 }
197
198 static void
199 configure(void *dummy)
200 {
201         /*
202          * Final interrupt support acviation, then enable hardware interrupts.
203          */
204         MachIntrABI.finalize();
205         cpu_enable_intr();
206
207         /*
208          * This will configure all devices, generally starting with the
209          * nexus (i386/i386/nexus.c).  The nexus ISA code explicitly
210          * dummies up the attach in order to delay legacy initialization
211          * until after all other busses/subsystems have had a chance
212          * at those resources.
213          */
214         root_bus_configure();
215
216 #if NISA > 0
217         /*
218          * Explicitly probe and attach ISA last.  The isa bus saves
219          * it's device node at attach time for us here.
220          */
221         if (isa_bus_device)
222                 isa_probe_children(isa_bus_device);
223 #endif
224
225         /*
226          * Allow lowering of the ipl to the lowest kernel level if we
227          * panic (or call tsleep() before clearing `cold').  No level is
228          * completely safe (since a panic may occur in a critical region
229          * at splhigh()), but we want at least bio interrupts to work.
230          */
231         safepri = TDPRI_KERN_USER;
232 }
233
234 static void
235 configure_final(void *dummy)
236 {
237         cninit_finish();
238
239         if (bootverbose)
240                 kprintf("Device configuration finished.\n");
241 }
242
243 #ifdef BOOTP
244 void bootpc_init(void);
245 #endif
246 /*
247  * Do legacy root filesystem discovery.
248  */
249 void
250 cpu_rootconf(void)
251 {
252 #ifdef BOOTP
253         bootpc_init();
254 #endif
255 #if defined(NFS) && defined(NFS_ROOT)
256 #if !defined(BOOTP_NFSROOT)
257         pxe_setup_nfsdiskless();
258         if (nfs_diskless_valid)
259 #endif
260                 rootdevnames[0] = "nfs:";
261 #endif
262 #if defined(FFS) && defined(FFS_ROOT)
263         if (!rootdevnames[0])
264                 setroot();
265 #endif
266 }
267 SYSINIT(cpu_rootconf, SI_SUB_ROOT_CONF, SI_ORDER_FIRST, cpu_rootconf, NULL)
268
269 u_long  bootdev = 0;            /* not a cdev_t - encoding is different */
270
271 #if defined(FFS) && defined(FFS_ROOT)
272
273 /*
274  * The boot code uses old block device major numbers to pass bootdev to
275  * us.  We have to translate these to character device majors because
276  * we don't have block devices any more.
277  */
278 static int
279 boot_translate_majdev(int bmajor)
280 {
281         static int conv[] = { BOOTMAJOR_CONVARY };
282
283         if (bmajor >= 0 && bmajor < sizeof(conv)/sizeof(conv[0]))
284                 return(conv[bmajor]);
285         return(-1);
286 }
287
288 /*
289  * Attempt to find the device from which we were booted.
290  * If we can do so, and not instructed not to do so,
291  * set rootdevs[] and rootdevnames[] to correspond to the
292  * boot device(s).
293  *
294  * This code survives in order to allow the system to be
295  * booted from legacy environments that do not correctly
296  * populate the kernel environment. There are significant
297  * restrictions on the bootability of the system in this
298  * situation; it can only be mounting root from a 'da'
299  * 'wd' or 'fd' device, and the root filesystem must be ufs.
300  */
301 static void
302 setroot(void)
303 {
304         int majdev, mindev, unit, slice, part;
305         cdev_t newrootdev, dev;
306         char partname[2];
307         char *sname;
308
309         if ((bootdev & B_MAGICMASK) != B_DEVMAGIC) {
310                 kprintf("no B_DEVMAGIC (bootdev=%#lx)\n", bootdev);
311                 return;
312         }
313         majdev = boot_translate_majdev(B_TYPE(bootdev));
314         if (bootverbose) {
315                 kprintf("bootdev: %08lx type=%ld unit=%ld "
316                         "slice=%ld part=%ld major=%d\n",
317                         bootdev, B_TYPE(bootdev), B_UNIT(bootdev),
318                         B_SLICE(bootdev), B_PARTITION(bootdev), majdev);
319         }
320         dev = udev2dev(makeudev(majdev, 0), 0);
321         if (!dev_is_good(dev))
322                 return;
323         unit = B_UNIT(bootdev);
324         slice = B_SLICE(bootdev);
325         if (slice == WHOLE_DISK_SLICE)
326                 slice = COMPATIBILITY_SLICE;
327         if (slice < 0 || slice >= MAX_SLICES) {
328                 kprintf("bad slice\n");
329                 return;
330         }
331
332         part = B_PARTITION(bootdev);
333         mindev = dkmakeminor(unit, slice, part);
334         newrootdev = udev2dev(makeudev(majdev, mindev), 0);
335         if (!dev_is_good(newrootdev))
336                 return;
337         sname = dsname(newrootdev, unit, slice, part, partname);
338         rootdevnames[0] = kmalloc(strlen(sname) + 6, M_DEVBUF, M_WAITOK);
339         ksprintf(rootdevnames[0], "ufs:%s%s", sname, partname);
340
341         /*
342          * For properly dangerously dedicated disks (ones with a historical
343          * bogus partition table), the boot blocks will give slice = 4, but
344          * the kernel will only provide the compatibility slice since it
345          * knows that slice 4 is not a real slice.  Arrange to try mounting
346          * the compatibility slice as root if mounting the slice passed by
347          * the boot blocks fails.  This handles the dangerously dedicated
348          * case and perhaps others.
349          */
350         if (slice == COMPATIBILITY_SLICE)
351                 return;
352         slice = COMPATIBILITY_SLICE;
353         sname = dsname(newrootdev, unit, slice, part, partname);
354         rootdevnames[1] = kmalloc(strlen(sname) + 6, M_DEVBUF, M_WAITOK);
355         ksprintf(rootdevnames[1], "ufs:%s%s", sname, partname);
356 }
357 #endif
358
359 #if defined(NFS) && defined(NFS_ROOT)
360 #if !defined(BOOTP_NFSROOT)
361
362 #include <sys/socket.h>
363 #include <net/if.h>
364 #include <net/if_dl.h>
365 #include <net/if_types.h>
366 #include <net/if_var.h>
367 #include <net/ethernet.h>
368 #include <netinet/in.h>
369 #include <vfs/nfs/rpcv2.h>
370 #include <vfs/nfs/nfsproto.h>
371 #include <vfs/nfs/nfs.h>
372 #include <vfs/nfs/nfsdiskless.h>
373
374 extern struct nfs_diskless      nfs_diskless;
375
376 /*
377  * Convert a kenv variable to a sockaddr.  If the kenv variable does not
378  * exist the sockaddr will remain zerod out (callers typically just check
379  * sin_len).  A network address of 0.0.0.0 is equivalent to failure.
380  */
381 static int
382 inaddr_to_sockaddr(char *ev, struct sockaddr_in *sa)
383 {
384         u_int32_t       a[4];
385         char            *cp;
386
387         bzero(sa, sizeof(*sa));
388
389         if ((cp = kgetenv(ev)) == NULL)
390                 return(1);
391         if (ksscanf(cp, "%d.%d.%d.%d", &a[0], &a[1], &a[2], &a[3]) != 4)
392                 return(1);
393         if (a[0] == 0 && a[1] == 0 && a[2] == 0 && a[3] == 0)
394                 return(1);
395         /* XXX is this ordering correct? */
396         sa->sin_addr.s_addr = (a[3] << 24) + (a[2] << 16) + (a[1] << 8) + a[0];
397         sa->sin_len = sizeof(*sa);
398         sa->sin_family = AF_INET;
399         return(0);
400 }
401
402 static int
403 hwaddr_to_sockaddr(char *ev, struct sockaddr_dl *sa)
404 {
405         char            *cp;
406         u_int32_t       a[6];
407
408         bzero(sa, sizeof(*sa));
409         sa->sdl_len = sizeof(*sa);
410         sa->sdl_family = AF_LINK;
411         sa->sdl_type = IFT_ETHER;
412         sa->sdl_alen = ETHER_ADDR_LEN;
413         if ((cp = kgetenv(ev)) == NULL)
414                 return(1);
415         if (ksscanf(cp, "%x:%x:%x:%x:%x:%x", &a[0], &a[1], &a[2], &a[3], &a[4], &a[5]) != 6)
416                 return(1);
417         sa->sdl_data[0] = a[0];
418         sa->sdl_data[1] = a[1];
419         sa->sdl_data[2] = a[2];
420         sa->sdl_data[3] = a[3];
421         sa->sdl_data[4] = a[4];
422         sa->sdl_data[5] = a[5];
423         return(0);
424 }
425
426 static int
427 decode_nfshandle(char *ev, u_char *fh)
428 {
429         u_char  *cp;
430         int     len, val;
431
432         if (((cp = kgetenv(ev)) == NULL) || (strlen(cp) < 2) || (*cp != 'X'))
433                 return(0);
434         len = 0;
435         cp++;
436         for (;;) {
437                 if (*cp == 'X')
438                         return(len);
439                 if ((ksscanf(cp, "%2x", &val) != 1) || (val > 0xff))
440                         return(0);
441                 *(fh++) = val;
442                 len++;
443                 cp += 2;
444                 if (len > NFSX_V2FH)
445                     return(0);
446         }
447 }
448
449 /*
450  * Populate the essential fields in the nfsv3_diskless structure.
451  *
452  * The loader is expected to export the following environment variables:
453  *
454  * boot.netif.ip                IP address on boot interface
455  * boot.netif.netmask           netmask on boot interface
456  * boot.netif.gateway           default gateway (optional)
457  * boot.netif.hwaddr            hardware address of boot interface
458  * boot.netif.name              name of boot interface (instead of hw addr)
459  * boot.nfsroot.server          IP address of root filesystem server
460  * boot.nfsroot.path            path of the root filesystem on server
461  * boot.nfsroot.nfshandle       NFS handle for root filesystem on server
462  */
463 static void
464 pxe_setup_nfsdiskless(void)
465 {
466         struct nfs_diskless     *nd = &nfs_diskless;
467         struct ifnet            *ifp;
468         struct ifaddr           *ifa;
469         struct sockaddr_dl      *sdl, ourdl;
470         struct sockaddr_in      myaddr, netmask;
471         char                    *cp;
472
473         /* set up interface */
474         if (inaddr_to_sockaddr("boot.netif.ip", &myaddr))
475                 return;
476         if (inaddr_to_sockaddr("boot.netif.netmask", &netmask)) {
477                 kprintf("PXE: no netmask\n");
478                 return;
479         }
480         bcopy(&myaddr, &nd->myif.ifra_addr, sizeof(myaddr));
481         bcopy(&myaddr, &nd->myif.ifra_broadaddr, sizeof(myaddr));
482         ((struct sockaddr_in *) &nd->myif.ifra_broadaddr)->sin_addr.s_addr =
483                 myaddr.sin_addr.s_addr | ~ netmask.sin_addr.s_addr;
484         bcopy(&netmask, &nd->myif.ifra_mask, sizeof(netmask));
485
486         if ((cp = kgetenv("boot.netif.name")) != NULL) {
487                 TAILQ_FOREACH(ifp, &ifnet, if_link) {
488                         if (strcmp(cp, ifp->if_xname) == 0)
489                                 break;
490                 }
491                 if (ifp)
492                         goto match_done;
493                 kprintf("PXE: cannot find interface %s\n", cp);
494                 return;
495         }
496
497         if (hwaddr_to_sockaddr("boot.netif.hwaddr", &ourdl)) {
498                 kprintf("PXE: no hardware address\n");
499                 return;
500         }
501         ifa = NULL;
502         ifp = TAILQ_FIRST(&ifnet);
503         TAILQ_FOREACH(ifp, &ifnet, if_link) {
504                 struct ifaddr_container *ifac;
505
506                 TAILQ_FOREACH(ifac, &ifp->if_addrheads[mycpuid], ifa_link) {
507                         ifa = ifac->ifa;
508
509                         if ((ifa->ifa_addr->sa_family == AF_LINK) &&
510                             (sdl = ((struct sockaddr_dl *)ifa->ifa_addr))) {
511                                 if ((sdl->sdl_type == ourdl.sdl_type) &&
512                                     (sdl->sdl_alen == ourdl.sdl_alen) &&
513                                     !bcmp(sdl->sdl_data + sdl->sdl_nlen,
514                                           ourdl.sdl_data + ourdl.sdl_nlen,
515                                           sdl->sdl_alen))
516                                     goto match_done;
517                         }
518                 }
519         }
520         kprintf("PXE: no interface\n");
521         return; /* no matching interface */
522 match_done:
523         strlcpy(nd->myif.ifra_name, ifp->if_xname, sizeof(nd->myif.ifra_name));
524
525         /* set up gateway */
526         inaddr_to_sockaddr("boot.netif.gateway", &nd->mygateway);
527
528         /* XXX set up swap? */
529
530         /* set up root mount */
531         nd->root_args.rsize = 8192;             /* XXX tunable? */
532         nd->root_args.wsize = 8192;
533         nd->root_args.sotype = SOCK_STREAM;
534         nd->root_args.flags = NFSMNT_WSIZE | NFSMNT_RSIZE | NFSMNT_RESVPORT;
535         if (inaddr_to_sockaddr("boot.nfsroot.server", &nd->root_saddr)) {
536                 kprintf("PXE: no server\n");
537                 return;
538         }
539         nd->root_saddr.sin_port = htons(NFS_PORT);
540
541         /*
542          * A tftp-only loader may pass NFS path information without a
543          * root handle.  Generate a warning but continue configuring.
544          */
545         if (decode_nfshandle("boot.nfsroot.nfshandle", &nd->root_fh[0]) == 0) {
546                 kprintf("PXE: Warning, no NFS handle passed from loader\n");
547         }
548         if ((cp = kgetenv("boot.nfsroot.path")) != NULL)
549                 strncpy(nd->root_hostnam, cp, MNAMELEN - 1);
550
551         nfs_diskless_valid = 1;
552 }
553
554 #endif
555 #endif