cb1c887eb6f1487bdcbfe2dfd5cb3c8f196085f0
[dragonfly.git] / sys / platform / pc64 / apic / mpapic.c
1 /*
2  * Copyright (c) 1996, by Steve Passe
3  * All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  * 1. Redistributions of source code must retain the above copyright
9  *    notice, this list of conditions and the following disclaimer.
10  * 2. The name of the developer may NOT be used to endorse or promote products
11  *    derived from this software without specific prior written permission.
12  *
13  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
14  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
15  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
16  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
17  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
18  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
19  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
20  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
21  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
22  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
23  * SUCH DAMAGE.
24  *
25  * $FreeBSD: src/sys/i386/i386/mpapic.c,v 1.37.2.7 2003/01/25 02:31:47 peter Exp $
26  * $DragonFly: src/sys/platform/pc32/apic/mpapic.c,v 1.22 2008/04/20 13:44:26 swildner Exp $
27  */
28
29 #include <sys/param.h>
30 #include <sys/systm.h>
31 #include <sys/kernel.h>
32 #include <machine/globaldata.h>
33 #include <machine/smp.h>
34 #include <machine/md_var.h>
35 #include <machine/pmap.h>
36 #include <machine_base/apic/mpapic.h>
37 #include <machine/segments.h>
38 #include <sys/thread2.h>
39
40 #include <machine_base/isa/intr_machdep.h>      /* Xspuriousint() */
41
42 #include "apicvar.h"
43
44 /* EISA Edge/Level trigger control registers */
45 #define ELCR0   0x4d0                   /* eisa irq 0-7 */
46 #define ELCR1   0x4d1                   /* eisa irq 8-15 */
47
48 volatile lapic_t *lapic;
49
50 static void     lapic_timer_calibrate(void);
51 static void     lapic_timer_set_divisor(int);
52 static void     lapic_timer_fixup_handler(void *);
53 static void     lapic_timer_restart_handler(void *);
54
55 void            lapic_timer_process(void);
56 void            lapic_timer_process_frame(struct intrframe *);
57
58 static int      lapic_timer_enable = 1;
59 TUNABLE_INT("hw.lapic_timer_enable", &lapic_timer_enable);
60
61 static void     lapic_timer_intr_reload(struct cputimer_intr *, sysclock_t);
62 static void     lapic_timer_intr_enable(struct cputimer_intr *);
63 static void     lapic_timer_intr_restart(struct cputimer_intr *);
64 static void     lapic_timer_intr_pmfixup(struct cputimer_intr *);
65
66 static struct cputimer_intr lapic_cputimer_intr = {
67         .freq = 0,
68         .reload = lapic_timer_intr_reload,
69         .enable = lapic_timer_intr_enable,
70         .config = cputimer_intr_default_config,
71         .restart = lapic_timer_intr_restart,
72         .pmfixup = lapic_timer_intr_pmfixup,
73         .initclock = cputimer_intr_default_initclock,
74         .next = SLIST_ENTRY_INITIALIZER,
75         .name = "lapic",
76         .type = CPUTIMER_INTR_LAPIC,
77         .prio = CPUTIMER_INTR_PRIO_LAPIC,
78         .caps = CPUTIMER_INTR_CAP_NONE
79 };
80
81 /*
82  * pointers to pmapped apic hardware.
83  */
84
85 volatile ioapic_t       **ioapic;
86
87 static int              lapic_timer_divisor_idx = -1;
88 static const uint32_t   lapic_timer_divisors[] = {
89         APIC_TDCR_2,    APIC_TDCR_4,    APIC_TDCR_8,    APIC_TDCR_16,
90         APIC_TDCR_32,   APIC_TDCR_64,   APIC_TDCR_128,  APIC_TDCR_1
91 };
92 #define APIC_TIMER_NDIVISORS \
93         (int)(sizeof(lapic_timer_divisors) / sizeof(lapic_timer_divisors[0]))
94
95
96 void
97 lapic_eoi(void)
98 {
99
100         lapic->eoi = 0;
101 }
102
103 /*
104  * Enable APIC, configure interrupts.
105  */
106 void
107 apic_initialize(boolean_t bsp)
108 {
109         uint32_t timer;
110         u_int   temp;
111
112         /*
113          * setup LVT1 as ExtINT on the BSP.  This is theoretically an
114          * aggregate interrupt input from the 8259.  The INTA cycle
115          * will be routed to the external controller (the 8259) which
116          * is expected to supply the vector.
117          *
118          * Must be setup edge triggered, active high.
119          *
120          * Disable LVT1 on the APs.  It doesn't matter what delivery
121          * mode we use because we leave it masked.
122          */
123         temp = lapic->lvt_lint0;
124         temp &= ~(APIC_LVT_MASKED | APIC_LVT_TRIG_MASK | 
125                   APIC_LVT_POLARITY_MASK | APIC_LVT_DM_MASK);
126         if (mycpu->gd_cpuid == 0)
127                 temp |= APIC_LVT_DM_EXTINT;
128         else
129                 temp |= APIC_LVT_DM_FIXED | APIC_LVT_MASKED;
130         lapic->lvt_lint0 = temp;
131
132         /*
133          * setup LVT2 as NMI, masked till later.  Edge trigger, active high.
134          */
135         temp = lapic->lvt_lint1;
136         temp &= ~(APIC_LVT_MASKED | APIC_LVT_TRIG_MASK | 
137                   APIC_LVT_POLARITY_MASK | APIC_LVT_DM_MASK);
138         temp |= APIC_LVT_MASKED | APIC_LVT_DM_NMI;
139         lapic->lvt_lint1 = temp;
140
141         /*
142          * Mask the apic error interrupt, apic performance counter
143          * interrupt.
144          */
145         lapic->lvt_error = lapic->lvt_error | APIC_LVT_MASKED;
146         lapic->lvt_pcint = lapic->lvt_pcint | APIC_LVT_MASKED;
147
148         /* Set apic timer vector and mask the apic timer interrupt. */
149         timer = lapic->lvt_timer;
150         timer &= ~APIC_LVTT_VECTOR;
151         timer |= XTIMER_OFFSET;
152         timer |= APIC_LVTT_MASKED;
153         lapic->lvt_timer = timer;
154
155         /*
156          * Set the Task Priority Register as needed.   At the moment allow
157          * interrupts on all cpus (the APs will remain CLId until they are
158          * ready to deal).  We could disable all but IPIs by setting
159          * temp |= TPR_IPI_ONLY for cpu != 0.
160          */
161         temp = lapic->tpr;
162         temp &= ~APIC_TPR_PRIO;         /* clear priority field */
163 #ifdef SMP /* APIC-IO */
164 if (!apic_io_enable) {
165 #endif
166         /*
167          * If we are NOT running the IO APICs, the LAPIC will only be used
168          * for IPIs.  Set the TPR to prevent any unintentional interrupts.
169          */
170         temp |= TPR_IPI_ONLY;
171 #ifdef SMP /* APIC-IO */
172 }
173 #endif
174         lapic->tpr = temp;
175
176         /* 
177          * enable the local APIC 
178          */
179         temp = lapic->svr;
180         temp |= APIC_SVR_ENABLE;        /* enable the APIC */
181         temp &= ~APIC_SVR_FOCUS_DISABLE; /* enable lopri focus processor */
182
183         /*
184          * Set the spurious interrupt vector.  The low 4 bits of the vector
185          * must be 1111.
186          */
187         if ((XSPURIOUSINT_OFFSET & 0x0F) != 0x0F)
188                 panic("bad XSPURIOUSINT_OFFSET: 0x%08x", XSPURIOUSINT_OFFSET);
189         temp &= ~APIC_SVR_VECTOR;
190         temp |= XSPURIOUSINT_OFFSET;
191
192         lapic->svr = temp;
193
194         /*
195          * Pump out a few EOIs to clean out interrupts that got through
196          * before we were able to set the TPR.
197          */
198         lapic_eoi();
199         lapic_eoi();
200         lapic_eoi();
201
202         if (bsp) {
203                 lapic_timer_calibrate();
204                 if (lapic_timer_enable) {
205                         cputimer_intr_register(&lapic_cputimer_intr);
206                         cputimer_intr_select(&lapic_cputimer_intr, 0);
207                 }
208         } else {
209                 lapic_timer_set_divisor(lapic_timer_divisor_idx);
210         }
211
212         if (bootverbose)
213                 apic_dump("apic_initialize()");
214 }
215
216
217 static void
218 lapic_timer_set_divisor(int divisor_idx)
219 {
220         KKASSERT(divisor_idx >= 0 && divisor_idx < APIC_TIMER_NDIVISORS);
221         lapic->dcr_timer = lapic_timer_divisors[divisor_idx];
222 }
223
224 static void
225 lapic_timer_oneshot(u_int count)
226 {
227         uint32_t value;
228
229         value = lapic->lvt_timer;
230         value &= ~APIC_LVTT_PERIODIC;
231         lapic->lvt_timer = value;
232         lapic->icr_timer = count;
233 }
234
235 static void
236 lapic_timer_oneshot_quick(u_int count)
237 {
238         lapic->icr_timer = count;
239 }
240
241 static void
242 lapic_timer_calibrate(void)
243 {
244         sysclock_t value;
245
246         /* Try to calibrate the local APIC timer. */
247         for (lapic_timer_divisor_idx = 0;
248              lapic_timer_divisor_idx < APIC_TIMER_NDIVISORS;
249              lapic_timer_divisor_idx++) {
250                 lapic_timer_set_divisor(lapic_timer_divisor_idx);
251                 lapic_timer_oneshot(APIC_TIMER_MAX_COUNT);
252                 DELAY(2000000);
253                 value = APIC_TIMER_MAX_COUNT - lapic->ccr_timer;
254                 if (value != APIC_TIMER_MAX_COUNT)
255                         break;
256         }
257         if (lapic_timer_divisor_idx >= APIC_TIMER_NDIVISORS)
258                 panic("lapic: no proper timer divisor?!\n");
259         lapic_cputimer_intr.freq = value / 2;
260
261         kprintf("lapic: divisor index %d, frequency %u Hz\n",
262                 lapic_timer_divisor_idx, lapic_cputimer_intr.freq);
263 }
264
265 static void
266 lapic_timer_process_oncpu(struct globaldata *gd, struct intrframe *frame)
267 {
268         sysclock_t count;
269
270         gd->gd_timer_running = 0;
271
272         count = sys_cputimer->count();
273         if (TAILQ_FIRST(&gd->gd_systimerq) != NULL)
274                 systimer_intr(&count, 0, frame);
275 }
276
277 void
278 lapic_timer_process(void)
279 {
280         lapic_timer_process_oncpu(mycpu, NULL);
281 }
282
283 void
284 lapic_timer_process_frame(struct intrframe *frame)
285 {
286         lapic_timer_process_oncpu(mycpu, frame);
287 }
288
289 static void
290 lapic_timer_intr_reload(struct cputimer_intr *cti, sysclock_t reload)
291 {
292         struct globaldata *gd = mycpu;
293
294         reload = (int64_t)reload * cti->freq / sys_cputimer->freq;
295         if (reload < 2)
296                 reload = 2;
297
298         if (gd->gd_timer_running) {
299                 if (reload < lapic->ccr_timer)
300                         lapic_timer_oneshot_quick(reload);
301         } else {
302                 gd->gd_timer_running = 1;
303                 lapic_timer_oneshot_quick(reload);
304         }
305 }
306
307 static void
308 lapic_timer_intr_enable(struct cputimer_intr *cti __unused)
309 {
310         uint32_t timer;
311
312         timer = lapic->lvt_timer;
313         timer &= ~(APIC_LVTT_MASKED | APIC_LVTT_PERIODIC);
314         lapic->lvt_timer = timer;
315
316         lapic_timer_fixup_handler(NULL);
317 }
318
319 static void
320 lapic_timer_fixup_handler(void *arg)
321 {
322         int *started = arg;
323
324         if (started != NULL)
325                 *started = 0;
326
327         if (strcmp(cpu_vendor, "AuthenticAMD") == 0) {
328                 /*
329                  * Detect the presence of C1E capability mostly on latest
330                  * dual-cores (or future) k8 family.  This feature renders
331                  * the local APIC timer dead, so we disable it by reading
332                  * the Interrupt Pending Message register and clearing both
333                  * C1eOnCmpHalt (bit 28) and SmiOnCmpHalt (bit 27).
334                  * 
335                  * Reference:
336                  *   "BIOS and Kernel Developer's Guide for AMD NPT
337                  *    Family 0Fh Processors"
338                  *   #32559 revision 3.00
339                  */
340                 if ((cpu_id & 0x00000f00) == 0x00000f00 &&
341                     (cpu_id & 0x0fff0000) >= 0x00040000) {
342                         uint64_t msr;
343
344                         msr = rdmsr(0xc0010055);
345                         if (msr & 0x18000000) {
346                                 struct globaldata *gd = mycpu;
347
348                                 kprintf("cpu%d: AMD C1E detected\n",
349                                         gd->gd_cpuid);
350                                 wrmsr(0xc0010055, msr & ~0x18000000ULL);
351
352                                 /*
353                                  * We are kinda stalled;
354                                  * kick start again.
355                                  */
356                                 gd->gd_timer_running = 1;
357                                 lapic_timer_oneshot_quick(2);
358
359                                 if (started != NULL)
360                                         *started = 1;
361                         }
362                 }
363         }
364 }
365
366 static void
367 lapic_timer_restart_handler(void *dummy __unused)
368 {
369         int started;
370
371         lapic_timer_fixup_handler(&started);
372         if (!started) {
373                 struct globaldata *gd = mycpu;
374
375                 gd->gd_timer_running = 1;
376                 lapic_timer_oneshot_quick(2);
377         }
378 }
379
380 /*
381  * This function is called only by ACPI-CA code currently:
382  * - AMD C1E fixup.  AMD C1E only seems to happen after ACPI
383  *   module controls PM.  So once ACPI-CA is attached, we try
384  *   to apply the fixup to prevent LAPIC timer from hanging.
385  */
386 static void
387 lapic_timer_intr_pmfixup(struct cputimer_intr *cti __unused)
388 {
389         lwkt_send_ipiq_mask(smp_active_mask,
390                             lapic_timer_fixup_handler, NULL);
391 }
392
393 static void
394 lapic_timer_intr_restart(struct cputimer_intr *cti __unused)
395 {
396         lwkt_send_ipiq_mask(smp_active_mask, lapic_timer_restart_handler, NULL);
397 }
398
399
400 /*
401  * dump contents of local APIC registers
402  */
403 void
404 apic_dump(char* str)
405 {
406         kprintf("SMP: CPU%d %s:\n", mycpu->gd_cpuid, str);
407         kprintf("     lint0: 0x%08x lint1: 0x%08x TPR: 0x%08x SVR: 0x%08x\n",
408                 lapic->lvt_lint0, lapic->lvt_lint1, lapic->tpr, lapic->svr);
409 }
410
411
412 #ifdef SMP /* APIC-IO */
413
414 /*
415  * IO APIC code,
416  */
417
418 #define IOAPIC_ISA_INTS         16
419 #define REDIRCNT_IOAPIC(A) \
420             ((int)((io_apic_versions[(A)] & IOART_VER_MAXREDIR) >> MAXREDIRSHIFT) + 1)
421
422 static int trigger (int apic, int pin, u_int32_t * flags);
423 static void polarity (int apic, int pin, u_int32_t * flags, int level);
424
425 #define DEFAULT_FLAGS           \
426         ((u_int32_t)            \
427          (IOART_INTMSET |       \
428           IOART_DESTPHY |       \
429           IOART_DELLOPRI))
430
431 #define DEFAULT_ISA_FLAGS       \
432         ((u_int32_t)            \
433          (IOART_INTMSET |       \
434           IOART_TRGREDG |       \
435           IOART_INTAHI |        \
436           IOART_DESTPHY |       \
437           IOART_DELLOPRI))
438
439 void
440 io_apic_set_id(int apic, int id)
441 {
442         u_int32_t ux;
443         
444         ux = io_apic_read(apic, IOAPIC_ID);     /* get current contents */
445         if (((ux & APIC_ID_MASK) >> 24) != id) {
446                 kprintf("Changing APIC ID for IO APIC #%d"
447                        " from %d to %d on chip\n",
448                        apic, ((ux & APIC_ID_MASK) >> 24), id);
449                 ux &= ~APIC_ID_MASK;    /* clear the ID field */
450                 ux |= (id << 24);
451                 io_apic_write(apic, IOAPIC_ID, ux);     /* write new value */
452                 ux = io_apic_read(apic, IOAPIC_ID);     /* re-read && test */
453                 if (((ux & APIC_ID_MASK) >> 24) != id)
454                         panic("can't control IO APIC #%d ID, reg: 0x%08x",
455                               apic, ux);
456         }
457 }
458
459
460 int
461 io_apic_get_id(int apic)
462 {
463   return (io_apic_read(apic, IOAPIC_ID) & APIC_ID_MASK) >> 24;
464 }
465   
466
467
468 /*
469  * Setup the IO APIC.
470  */
471 void
472 io_apic_setup_intpin(int apic, int pin)
473 {
474         int bus, bustype, irq;
475         u_char          select;         /* the select register is 8 bits */
476         u_int32_t       flags;          /* the window register is 32 bits */
477         u_int32_t       target;         /* the window register is 32 bits */
478         u_int32_t       vector;         /* the window register is 32 bits */
479         int             level;
480         int             cpuid;
481         char            envpath[32];
482
483         select = pin * 2 + IOAPIC_REDTBL0;      /* register */
484
485         /*
486          * Always clear an IO APIC pin before [re]programming it.  This is
487          * particularly important if the pin is set up for a level interrupt
488          * as the IOART_REM_IRR bit might be set.   When we reprogram the
489          * vector any EOI from pending ints on this pin could be lost and
490          * IRR might never get reset.
491          *
492          * To fix this problem, clear the vector and make sure it is 
493          * programmed as an edge interrupt.  This should theoretically
494          * clear IRR so we can later, safely program it as a level 
495          * interrupt.
496          */
497         imen_lock();
498
499         flags = io_apic_read(apic, select) & IOART_RESV;
500         flags |= IOART_INTMSET | IOART_TRGREDG | IOART_INTAHI;
501         flags |= IOART_DESTPHY | IOART_DELFIXED;
502
503         target = io_apic_read(apic, select + 1) & IOART_HI_DEST_RESV;
504         target |= 0;    /* fixed mode cpu mask of 0 - don't deliver anywhere */
505
506         vector = 0;
507
508         io_apic_write(apic, select, flags | vector);
509         io_apic_write(apic, select + 1, target);
510
511         imen_unlock();
512
513         /*
514          * We only deal with vectored interrupts here.  ? documentation is
515          * lacking, I'm guessing an interrupt type of 0 is the 'INT' type,
516          * vs ExTINT, etc.
517          *
518          * This test also catches unconfigured pins.
519          */
520         if (apic_int_type(apic, pin) != 0)
521                 return;
522
523         /*
524          * Leave the pin unprogrammed if it does not correspond to
525          * an IRQ.
526          */
527         irq = apic_irq(apic, pin);
528         if (irq < 0)
529                 return;
530         
531         /* determine the bus type for this pin */
532         bus = apic_src_bus_id(apic, pin);
533         if (bus < 0)
534                 return;
535         bustype = apic_bus_type(bus);
536         
537         if ((bustype == ISA) &&
538             (pin < IOAPIC_ISA_INTS) && 
539             (irq == pin) &&
540             (apic_polarity(apic, pin) == 0x1) &&
541             (apic_trigger(apic, pin) == 0x3)) {
542                 /* 
543                  * A broken BIOS might describe some ISA 
544                  * interrupts as active-high level-triggered.
545                  * Use default ISA flags for those interrupts.
546                  */
547                 flags = DEFAULT_ISA_FLAGS;
548         } else {
549                 /* 
550                  * Program polarity and trigger mode according to 
551                  * interrupt entry.
552                  */
553                 flags = DEFAULT_FLAGS;
554                 level = trigger(apic, pin, &flags);
555                 if (level == 1)
556                         int_to_apicintpin[irq].flags |= AIMI_FLAG_LEVEL;
557                 polarity(apic, pin, &flags, level);
558         }
559
560         cpuid = 0;
561         ksnprintf(envpath, sizeof(envpath), "hw.irq.%d.dest", irq);
562         kgetenv_int(envpath, &cpuid);
563
564         /* ncpus may not be available yet */
565         if (cpuid > mp_naps)
566                 cpuid = 0;
567
568         if (bootverbose) {
569                 kprintf("IOAPIC #%d intpin %d -> irq %d (CPU%d)\n",
570                        apic, pin, irq, cpuid);
571         }
572
573         /*
574          * Program the appropriate registers.  This routing may be 
575          * overridden when an interrupt handler for a device is
576          * actually added (see register_int(), which calls through
577          * the MACHINTR ABI to set up an interrupt handler/vector).
578          *
579          * The order in which we must program the two registers for
580          * safety is unclear! XXX
581          */
582         imen_lock();
583
584         vector = IDT_OFFSET + irq;                      /* IDT vec */
585         target = io_apic_read(apic, select + 1) & IOART_HI_DEST_RESV;
586         /* Deliver all interrupts to CPU0 (BSP) */
587         target |= (CPU_TO_ID(cpuid) << IOART_HI_DEST_SHIFT) &
588                   IOART_HI_DEST_MASK;
589         flags |= io_apic_read(apic, select) & IOART_RESV;
590         io_apic_write(apic, select, flags | vector);
591         io_apic_write(apic, select + 1, target);
592
593         imen_unlock();
594 }
595
596 int
597 io_apic_setup(int apic)
598 {
599         int             maxpin;
600         int             pin;
601
602         maxpin = REDIRCNT_IOAPIC(apic);         /* pins in APIC */
603         kprintf("Programming %d pins in IOAPIC #%d\n", maxpin, apic);
604         
605         for (pin = 0; pin < maxpin; ++pin) {
606                 io_apic_setup_intpin(apic, pin);
607         }
608         while (pin < 32) {
609                 if (apic_int_type(apic, pin) >= 0) {
610                         kprintf("Warning: IOAPIC #%d pin %d does not exist,"
611                                 " cannot program!\n", apic, pin);
612                 }
613                 ++pin;
614         }
615
616         /* return GOOD status */
617         return 0;
618 }
619 #undef DEFAULT_ISA_FLAGS
620 #undef DEFAULT_FLAGS
621
622
623 #define DEFAULT_EXTINT_FLAGS    \
624         ((u_int32_t)            \
625          (IOART_INTMSET |       \
626           IOART_TRGREDG |       \
627           IOART_INTAHI |        \
628           IOART_DESTPHY |       \
629           IOART_DELLOPRI))
630
631 /*
632  * XXX this function is only used by 8254 setup
633  * Setup the source of External INTerrupts.
634  */
635 int
636 ext_int_setup(int apic, int intr)
637 {
638         u_char  select;         /* the select register is 8 bits */
639         u_int32_t flags;        /* the window register is 32 bits */
640         u_int32_t target;       /* the window register is 32 bits */
641         u_int32_t vector;       /* the window register is 32 bits */
642         int cpuid;
643         char envpath[32];
644
645         if (apic_int_type(apic, intr) != 3)
646                 return -1;
647
648         cpuid = 0;
649         ksnprintf(envpath, sizeof(envpath), "hw.irq.%d.dest", intr);
650         kgetenv_int(envpath, &cpuid);
651
652         /* ncpus may not be available yet */
653         if (cpuid > mp_naps)
654                 cpuid = 0;
655
656         /* Deliver interrupts to CPU0 (BSP) */
657         target = (CPU_TO_ID(cpuid) << IOART_HI_DEST_SHIFT) &
658                  IOART_HI_DEST_MASK;
659         select = IOAPIC_REDTBL0 + (2 * intr);
660         vector = IDT_OFFSET + intr;
661         flags = DEFAULT_EXTINT_FLAGS;
662
663         io_apic_write(apic, select, flags | vector);
664         io_apic_write(apic, select + 1, target);
665
666         return 0;
667 }
668 #undef DEFAULT_EXTINT_FLAGS
669
670
671 /*
672  * Set the trigger level for an IO APIC pin.
673  */
674 static int
675 trigger(int apic, int pin, u_int32_t * flags)
676 {
677         int     id;
678         int     eirq;
679         int     level;
680         static int intcontrol = -1;
681
682         switch (apic_trigger(apic, pin)) {
683
684         case 0x00:
685                 break;
686
687         case 0x01:
688                 *flags &= ~IOART_TRGRLVL;       /* *flags |= IOART_TRGREDG */
689                 return 0;
690
691         case 0x03:
692                 *flags |= IOART_TRGRLVL;
693                 return 1;
694
695         case -1:
696         default:
697                 goto bad;
698         }
699
700         if ((id = apic_src_bus_id(apic, pin)) == -1)
701                 goto bad;
702
703         switch (apic_bus_type(id)) {
704         case ISA:
705                 *flags &= ~IOART_TRGRLVL;       /* *flags |= IOART_TRGREDG; */
706                 return 0;
707
708         case EISA:
709                 eirq = apic_src_bus_irq(apic, pin);
710
711                 if (eirq < 0 || eirq > 15) {
712                         kprintf("EISA IRQ %d?!?!\n", eirq);
713                         goto bad;
714                 }
715
716                 if (intcontrol == -1) {
717                         intcontrol = inb(ELCR1) << 8;
718                         intcontrol |= inb(ELCR0);
719                         kprintf("EISA INTCONTROL = %08x\n", intcontrol);
720                 }
721
722                 /* Use ELCR settings to determine level or edge mode */
723                 level = (intcontrol >> eirq) & 1;
724
725                 /*
726                  * Note that on older Neptune chipset based systems, any
727                  * pci interrupts often show up here and in the ELCR as well
728                  * as level sensitive interrupts attributed to the EISA bus.
729                  */
730
731                 if (level)
732                         *flags |= IOART_TRGRLVL;
733                 else
734                         *flags &= ~IOART_TRGRLVL;
735
736                 return level;
737
738         case PCI:
739                 *flags |= IOART_TRGRLVL;
740                 return 1;
741
742         case -1:
743         default:
744                 goto bad;
745         }
746
747 bad:
748         panic("bad APIC IO INT flags");
749 }
750
751
752 /*
753  * Set the polarity value for an IO APIC pin.
754  */
755 static void
756 polarity(int apic, int pin, u_int32_t * flags, int level)
757 {
758         int     id;
759
760         switch (apic_polarity(apic, pin)) {
761
762         case 0x00:
763                 break;
764
765         case 0x01:
766                 *flags &= ~IOART_INTALO;        /* *flags |= IOART_INTAHI */
767                 return;
768
769         case 0x03:
770                 *flags |= IOART_INTALO;
771                 return;
772
773         case -1:
774         default:
775                 goto bad;
776         }
777
778         if ((id = apic_src_bus_id(apic, pin)) == -1)
779                 goto bad;
780
781         switch (apic_bus_type(id)) {
782         case ISA:
783                 *flags &= ~IOART_INTALO;        /* *flags |= IOART_INTAHI */
784                 return;
785
786         case EISA:
787                 /* polarity converter always gives active high */
788                 *flags &= ~IOART_INTALO;
789                 return;
790
791         case PCI:
792                 *flags |= IOART_INTALO;
793                 return;
794
795         case -1:
796         default:
797                 goto bad;
798         }
799
800 bad:
801         panic("bad APIC IO INT flags");
802 }
803
804
805 /*
806  * Print contents of unmasked IRQs.
807  */
808 void
809 imen_dump(void)
810 {
811         int x;
812
813         kprintf("SMP: enabled INTs: ");
814         for (x = 0; x < APIC_INTMAPSIZE; ++x) {
815                 if ((int_to_apicintpin[x].flags & AIMI_FLAG_MASKED) == 0)
816                         kprintf("%d ", x);
817         }
818         kprintf("\n");
819 }
820
821
822 /*
823  * Inter Processor Interrupt functions.
824  */
825
826 #endif  /* SMP APIC-IO */
827
828 /*
829  * Send APIC IPI 'vector' to 'destType' via 'deliveryMode'.
830  *
831  *  destType is 1 of: APIC_DEST_SELF, APIC_DEST_ALLISELF, APIC_DEST_ALLESELF
832  *  vector is any valid SYSTEM INT vector
833  *  delivery_mode is 1 of: APIC_DELMODE_FIXED, APIC_DELMODE_LOWPRIO
834  *
835  * A backlog of requests can create a deadlock between cpus.  To avoid this
836  * we have to be able to accept IPIs at the same time we are trying to send
837  * them.  The critical section prevents us from attempting to send additional
838  * IPIs reentrantly, but also prevents IPIQ processing so we have to call
839  * lwkt_process_ipiq() manually.  It's rather messy and expensive for this
840  * to occur but fortunately it does not happen too often.
841  */
842 int
843 apic_ipi(int dest_type, int vector, int delivery_mode)
844 {
845         u_long  icr_lo;
846
847         crit_enter();
848         if ((lapic->icr_lo & APIC_DELSTAT_MASK) != 0) {
849             unsigned long rflags = read_rflags();
850             cpu_enable_intr();
851             while ((lapic->icr_lo & APIC_DELSTAT_MASK) != 0) {
852                 lwkt_process_ipiq();
853             }
854             write_rflags(rflags);
855         }
856
857         icr_lo = (lapic->icr_lo & APIC_ICRLO_RESV_MASK) | dest_type | 
858                 delivery_mode | vector;
859         lapic->icr_lo = icr_lo;
860         crit_exit();
861         return 0;
862 }
863
864 void
865 single_apic_ipi(int cpu, int vector, int delivery_mode)
866 {
867         u_long  icr_lo;
868         u_long  icr_hi;
869
870         crit_enter();
871         if ((lapic->icr_lo & APIC_DELSTAT_MASK) != 0) {
872             unsigned long rflags = read_rflags();
873             cpu_enable_intr();
874             while ((lapic->icr_lo & APIC_DELSTAT_MASK) != 0) {
875                 lwkt_process_ipiq();
876             }
877             write_rflags(rflags);
878         }
879         icr_hi = lapic->icr_hi & ~APIC_ID_MASK;
880         icr_hi |= (CPU_TO_ID(cpu) << 24);
881         lapic->icr_hi = icr_hi;
882
883         /* build ICR_LOW */
884         icr_lo = (lapic->icr_lo & APIC_ICRLO_RESV_MASK)
885             | APIC_DEST_DESTFLD | delivery_mode | vector;
886
887         /* write APIC ICR */
888         lapic->icr_lo = icr_lo;
889         crit_exit();
890 }
891
892 #if 0   
893
894 /*
895  * Returns 0 if the apic is busy, 1 if we were able to queue the request.
896  *
897  * NOT WORKING YET!  The code as-is may end up not queueing an IPI at all
898  * to the target, and the scheduler does not 'poll' for IPI messages.
899  */
900 int
901 single_apic_ipi_passive(int cpu, int vector, int delivery_mode)
902 {
903         u_long  icr_lo;
904         u_long  icr_hi;
905
906         crit_enter();
907         if ((lapic->icr_lo & APIC_DELSTAT_MASK) != 0) {
908             crit_exit();
909             return(0);
910         }
911         icr_hi = lapic->icr_hi & ~APIC_ID_MASK;
912         icr_hi |= (CPU_TO_ID(cpu) << 24);
913         lapic->icr_hi = icr_hi;
914
915         /* build IRC_LOW */
916         icr_lo = (lapic->icr_lo & APIC_RESV2_MASK)
917             | APIC_DEST_DESTFLD | delivery_mode | vector;
918
919         /* write APIC ICR */
920         lapic->icr_lo = icr_lo;
921         crit_exit();
922         return(1);
923 }
924
925 #endif
926
927 /*
928  * Send APIC IPI 'vector' to 'target's via 'delivery_mode'.
929  *
930  * target is a bitmask of destination cpus.  Vector is any
931  * valid system INT vector.  Delivery mode may be either
932  * APIC_DELMODE_FIXED or APIC_DELMODE_LOWPRIO.
933  */
934 void
935 selected_apic_ipi(u_int target, int vector, int delivery_mode)
936 {
937         crit_enter();
938         while (target) {
939                 int n = bsfl(target);
940                 target &= ~(1 << n);
941                 single_apic_ipi(n, vector, delivery_mode);
942         }
943         crit_exit();
944 }
945
946 /*
947  * Timer code, in development...
948  *  - suggested by rgrimes@gndrsh.aac.dev.com
949  */
950 int
951 get_apic_timer_frequency(void)
952 {
953         return(lapic_cputimer_intr.freq);
954 }
955
956 /*
957  * Load a 'downcount time' in uSeconds.
958  */
959 void
960 set_apic_timer(int us)
961 {
962         u_int count;
963
964         /*
965          * When we reach here, lapic timer's frequency
966          * must have been calculated as well as the
967          * divisor (lapic->dcr_timer is setup during the
968          * divisor calculation).
969          */
970         KKASSERT(lapic_cputimer_intr.freq != 0 &&
971                  lapic_timer_divisor_idx >= 0);
972
973         count = ((us * (int64_t)lapic_cputimer_intr.freq) + 999999) / 1000000;
974         lapic_timer_oneshot(count);
975 }
976
977
978 /*
979  * Read remaining time in timer.
980  */
981 int
982 read_apic_timer(void)
983 {
984 #if 0
985         /** XXX FIXME: we need to return the actual remaining time,
986          *         for now we just return the remaining count.
987          */
988 #else
989         return lapic->ccr_timer;
990 #endif
991 }
992
993
994 /*
995  * Spin-style delay, set delay time in uS, spin till it drains.
996  */
997 void
998 u_sleep(int count)
999 {
1000         set_apic_timer(count);
1001         while (read_apic_timer())
1002                  /* spin */ ;
1003 }
1004
1005 /*
1006  * XXX: Hack: Used by pmap_init
1007  */
1008 vm_offset_t cpu_apic_addr;
1009
1010 void
1011 lapic_init(vm_offset_t lapic_addr)
1012 {
1013         /*
1014          * lapic not mapped yet (pmap_init is called too late)
1015          */
1016         lapic = pmap_mapdev_uncacheable(lapic_addr, sizeof(struct LAPIC));
1017
1018 #if 0
1019         /* Local apic is mapped on last page */
1020         SMPpt[NPTEPG - 1] = (pt_entry_t)(PG_V | PG_RW | PG_N |
1021             pmap_get_pgeflag() | (lapic_addr & PG_FRAME));
1022 #endif
1023
1024         cpu_apic_addr = lapic_addr;
1025
1026         kprintf("lapic: at 0x%08lx\n", lapic_addr);
1027 }
1028
1029 static TAILQ_HEAD(, lapic_enumerator) lapic_enumerators =
1030         TAILQ_HEAD_INITIALIZER(lapic_enumerators);
1031
1032 void
1033 lapic_config(void)
1034 {
1035         struct lapic_enumerator *e;
1036         int error;
1037
1038         TAILQ_FOREACH(e, &lapic_enumerators, lapic_link) {
1039                 error = e->lapic_probe(e);
1040                 if (!error)
1041                         break;
1042         }
1043         if (e == NULL)
1044                 panic("can't config lapic\n");
1045
1046         e->lapic_enumerate(e);
1047 }
1048
1049 void
1050 lapic_enumerator_register(struct lapic_enumerator *ne)
1051 {
1052         struct lapic_enumerator *e;
1053
1054         TAILQ_FOREACH(e, &lapic_enumerators, lapic_link) {
1055                 if (e->lapic_prio < ne->lapic_prio) {
1056                         TAILQ_INSERT_BEFORE(e, ne, lapic_link);
1057                         return;
1058                 }
1059         }
1060         TAILQ_INSERT_TAIL(&lapic_enumerators, ne, lapic_link);
1061 }