dbeed68338990626203bc75ea36838ddc5a845a2
[dragonfly.git] / sys / dev / raid / mfi / mfi.c
1 /*-
2  * Copyright (c) 2006 IronPort Systems
3  * All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  * 1. Redistributions of source code must retain the above copyright
9  *    notice, this list of conditions and the following disclaimer.
10  * 2. Redistributions in binary form must reproduce the above copyright
11  *    notice, this list of conditions and the following disclaimer in the
12  *    documentation and/or other materials provided with the distribution.
13  *
14  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
15  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
16  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
17  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
18  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
19  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
20  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
21  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
22  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
23  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
24  * SUCH DAMAGE.
25  */
26 /*-
27  * Copyright (c) 2007 LSI Corp.
28  * Copyright (c) 2007 Rajesh Prabhakaran.
29  * All rights reserved.
30  *
31  * Redistribution and use in source and binary forms, with or without
32  * modification, are permitted provided that the following conditions
33  * are met:
34  * 1. Redistributions of source code must retain the above copyright
35  *    notice, this list of conditions and the following disclaimer.
36  * 2. Redistributions in binary form must reproduce the above copyright
37  *    notice, this list of conditions and the following disclaimer in the
38  *    documentation and/or other materials provided with the distribution.
39  *
40  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
41  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
42  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
43  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
44  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
45  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
46  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
47  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
48  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
49  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
50  * SUCH DAMAGE.
51  *
52  * $FreeBSD: src/sys/dev/mfi/mfi.c,v 1.54 2009/12/07 21:24:07 jkim Exp $
53  */
54
55 #include "opt_mfi.h"
56
57 #include <sys/param.h>
58 #include <sys/systm.h>
59 #include <sys/sysctl.h>
60 #include <sys/malloc.h>
61 #include <sys/kernel.h>
62 #include <sys/bus.h>
63 #include <sys/eventhandler.h>
64 #include <sys/rman.h>
65 #include <sys/bus_dma.h>
66 #include <sys/buf2.h>
67 #include <sys/ioccom.h>
68 #include <sys/uio.h>
69 #include <sys/proc.h>
70 #include <sys/signalvar.h>
71 #include <sys/device.h>
72 #include <sys/mplock2.h>
73
74 #include <dev/raid/mfi/mfireg.h>
75 #include <dev/raid/mfi/mfi_ioctl.h>
76 #include <dev/raid/mfi/mfivar.h>
77
78 static int      mfi_alloc_commands(struct mfi_softc *);
79 static int      mfi_comms_init(struct mfi_softc *);
80 static int      mfi_wait_command(struct mfi_softc *, struct mfi_command *);
81 static int      mfi_get_controller_info(struct mfi_softc *);
82 static int      mfi_get_log_state(struct mfi_softc *,
83                     struct mfi_evt_log_state **);
84 static int      mfi_parse_entries(struct mfi_softc *, int, int);
85 static int      mfi_dcmd_command(struct mfi_softc *, struct mfi_command **,
86                     uint32_t, void **, size_t);
87 static void     mfi_data_cb(void *, bus_dma_segment_t *, int, int);
88 static void     mfi_startup(void *arg);
89 static void     mfi_intr(void *arg);
90 static void     mfi_ldprobe(struct mfi_softc *sc);
91 static int      mfi_aen_register(struct mfi_softc *sc, int seq, int locale);
92 static void     mfi_aen_complete(struct mfi_command *);
93 static int      mfi_aen_setup(struct mfi_softc *, uint32_t);
94 static int      mfi_add_ld(struct mfi_softc *sc, int);
95 static void     mfi_add_ld_complete(struct mfi_command *);
96 static struct mfi_command * mfi_bio_command(struct mfi_softc *);
97 static void     mfi_bio_complete(struct mfi_command *);
98 static int      mfi_mapcmd(struct mfi_softc *, struct mfi_command *);
99 static int      mfi_send_frame(struct mfi_softc *, struct mfi_command *);
100 static void     mfi_complete(struct mfi_softc *, struct mfi_command *);
101 static int      mfi_abort(struct mfi_softc *, struct mfi_command *);
102 static int      mfi_linux_ioctl_int(struct cdev *, u_long, caddr_t, int);
103 static void     mfi_timeout(void *);
104 static int      mfi_user_command(struct mfi_softc *,
105                     struct mfi_ioc_passthru *);
106 static void     mfi_enable_intr_xscale(struct mfi_softc *sc);
107 static void     mfi_enable_intr_ppc(struct mfi_softc *sc);
108 static int32_t  mfi_read_fw_status_xscale(struct mfi_softc *sc);
109 static int32_t  mfi_read_fw_status_ppc(struct mfi_softc *sc);
110 static int      mfi_check_clear_intr_xscale(struct mfi_softc *sc);
111 static int      mfi_check_clear_intr_ppc(struct mfi_softc *sc);
112 static void     mfi_issue_cmd_xscale(struct mfi_softc *sc,uint32_t bus_add,uint32_t frame_cnt);
113 static void     mfi_issue_cmd_ppc(struct mfi_softc *sc,uint32_t bus_add,uint32_t frame_cnt);
114 static void     mfi_filter_detach(struct knote *);
115 static int      mfi_filter_read(struct knote *, long);
116 static int      mfi_filter_write(struct knote *, long);
117
118 SYSCTL_NODE(_hw, OID_AUTO, mfi, CTLFLAG_RD, 0, "MFI driver parameters");
119 static int      mfi_event_locale = MFI_EVT_LOCALE_ALL;
120 TUNABLE_INT("hw.mfi.event_locale", &mfi_event_locale);
121 SYSCTL_INT(_hw_mfi, OID_AUTO, event_locale, CTLFLAG_RW, &mfi_event_locale,
122             0, "event message locale");
123
124 static int      mfi_event_class = MFI_EVT_CLASS_INFO;
125 TUNABLE_INT("hw.mfi.event_class", &mfi_event_class);
126 SYSCTL_INT(_hw_mfi, OID_AUTO, event_class, CTLFLAG_RW, &mfi_event_class,
127           0, "event message class");
128
129 static int      mfi_max_cmds = 128;
130 TUNABLE_INT("hw.mfi.max_cmds", &mfi_max_cmds);
131 SYSCTL_INT(_hw_mfi, OID_AUTO, max_cmds, CTLFLAG_RD, &mfi_max_cmds,
132            0, "Max commands");
133
134 /* Management interface */
135 static d_open_t         mfi_open;
136 static d_close_t        mfi_close;
137 static d_ioctl_t        mfi_ioctl;
138 static d_kqfilter_t     mfi_kqfilter;
139
140 static struct dev_ops mfi_ops = {
141         { "mfi", 0, 0 },
142         .d_open =       mfi_open,
143         .d_close =      mfi_close,
144         .d_ioctl =      mfi_ioctl,
145         .d_kqfilter =   mfi_kqfilter,
146 };
147
148 static struct filterops mfi_read_filterops =
149         { FILTEROP_ISFD, NULL, mfi_filter_detach, mfi_filter_read };
150 static struct filterops mfi_write_filterops =
151         { FILTEROP_ISFD, NULL, mfi_filter_detach, mfi_filter_write };
152
153 MALLOC_DEFINE(M_MFIBUF, "mfibuf", "Buffers for the MFI driver");
154
155 #define MFI_INQ_LENGTH SHORT_INQUIRY_LENGTH
156
157 static void
158 mfi_enable_intr_xscale(struct mfi_softc *sc)
159 {
160         MFI_WRITE4(sc, MFI_OMSK, 0x01);
161 }
162
163 static void
164 mfi_enable_intr_ppc(struct mfi_softc *sc)
165 {
166         MFI_WRITE4(sc, MFI_ODCR0, 0xFFFFFFFF);
167         if (sc->mfi_flags & MFI_FLAGS_1078) {
168                 MFI_WRITE4(sc, MFI_OMSK, ~MFI_1078_EIM);
169         } else if (sc->mfi_flags & MFI_FLAGS_GEN2) {
170                 MFI_WRITE4(sc, MFI_OMSK, ~MFI_GEN2_EIM);
171         }
172 }
173
174 static int32_t
175 mfi_read_fw_status_xscale(struct mfi_softc *sc)
176 {
177         return MFI_READ4(sc, MFI_OMSG0);
178 }
179
180 static int32_t
181 mfi_read_fw_status_ppc(struct mfi_softc *sc)
182 {
183         return MFI_READ4(sc, MFI_OSP0);
184 }
185
186 static int
187 mfi_check_clear_intr_xscale(struct mfi_softc *sc)
188 {
189         int32_t status;
190
191         status = MFI_READ4(sc, MFI_OSTS);
192         if ((status & MFI_OSTS_INTR_VALID) == 0)
193                 return 1;
194
195         MFI_WRITE4(sc, MFI_OSTS, status);
196         return 0;
197 }
198
199 static int
200 mfi_check_clear_intr_ppc(struct mfi_softc *sc)
201 {
202         int32_t status;
203
204         status = MFI_READ4(sc, MFI_OSTS);
205         if (sc->mfi_flags & MFI_FLAGS_1078) {
206                 if (!(status & MFI_1078_RM)) {
207                         return 1;
208                 }
209         } else if (sc->mfi_flags & MFI_FLAGS_GEN2) {
210                 if (!(status & MFI_GEN2_RM)) {
211                         return 1;
212                 }
213         }
214
215         MFI_WRITE4(sc, MFI_ODCR0, status);
216         return 0;
217 }
218
219 static void
220 mfi_issue_cmd_xscale(struct mfi_softc *sc,uint32_t bus_add,uint32_t frame_cnt)
221 {
222         MFI_WRITE4(sc, MFI_IQP,(bus_add >>3)|frame_cnt);
223 }
224
225 static void
226 mfi_issue_cmd_ppc(struct mfi_softc *sc,uint32_t bus_add,uint32_t frame_cnt)
227 {
228         MFI_WRITE4(sc, MFI_IQP, (bus_add |frame_cnt <<1)|1 );
229 }
230
231 static int
232 mfi_transition_firmware(struct mfi_softc *sc)
233 {
234         uint32_t fw_state, cur_state;
235         int max_wait, i;
236
237         fw_state = sc->mfi_read_fw_status(sc)& MFI_FWSTATE_MASK;
238         while (fw_state != MFI_FWSTATE_READY) {
239                 if (bootverbose)
240                         device_printf(sc->mfi_dev, "Waiting for firmware to "
241                         "become ready\n");
242                 cur_state = fw_state;
243                 switch (fw_state) {
244                 case MFI_FWSTATE_FAULT:
245                         device_printf(sc->mfi_dev, "Firmware fault\n");
246                         return (ENXIO);
247                 case MFI_FWSTATE_WAIT_HANDSHAKE:
248                         MFI_WRITE4(sc, MFI_IDB, MFI_FWINIT_CLEAR_HANDSHAKE);
249                         max_wait = 2;
250                         break;
251                 case MFI_FWSTATE_OPERATIONAL:
252                         MFI_WRITE4(sc, MFI_IDB, MFI_FWINIT_READY);
253                         max_wait = 10;
254                         break;
255                 case MFI_FWSTATE_UNDEFINED:
256                 case MFI_FWSTATE_BB_INIT:
257                         max_wait = 2;
258                         break;
259                 case MFI_FWSTATE_FW_INIT:
260                 case MFI_FWSTATE_DEVICE_SCAN:
261                 case MFI_FWSTATE_FLUSH_CACHE:
262                         max_wait = 20;
263                         break;
264                 default:
265                         device_printf(sc->mfi_dev,"Unknown firmware state %d\n",
266                             fw_state);
267                         return (ENXIO);
268                 }
269                 for (i = 0; i < (max_wait * 10); i++) {
270                         fw_state = sc->mfi_read_fw_status(sc) & MFI_FWSTATE_MASK;
271                         if (fw_state == cur_state)
272                                 DELAY(100000);
273                         else
274                                 break;
275                 }
276                 if (fw_state == cur_state) {
277                         device_printf(sc->mfi_dev, "firmware stuck in state "
278                             "%#x\n", fw_state);
279                         return (ENXIO);
280                 }
281         }
282         return (0);
283 }
284
285 static void
286 mfi_addr32_cb(void *arg, bus_dma_segment_t *segs, int nsegs, int error)
287 {
288         uint32_t *addr;
289
290         addr = arg;
291         *addr = segs[0].ds_addr;
292 }
293
294 int
295 mfi_attach(struct mfi_softc *sc)
296 {
297         uint32_t status;
298         int error, commsz, framessz, sensesz;
299         int frames, unit, max_fw_sge;
300
301         device_printf(sc->mfi_dev, "Megaraid SAS driver Ver 3.00 \n");
302
303         lockinit(&sc->mfi_io_lock, "MFI I/O lock", 0, LK_CANRECURSE);
304         lockinit(&sc->mfi_config_lock, "MFI config", 0, LK_CANRECURSE);
305         TAILQ_INIT(&sc->mfi_ld_tqh);
306         TAILQ_INIT(&sc->mfi_aen_pids);
307         TAILQ_INIT(&sc->mfi_cam_ccbq);
308
309         mfi_initq_free(sc);
310         mfi_initq_ready(sc);
311         mfi_initq_busy(sc);
312         mfi_initq_bio(sc);
313
314         if (sc->mfi_flags & MFI_FLAGS_1064R) {
315                 sc->mfi_enable_intr = mfi_enable_intr_xscale;
316                 sc->mfi_read_fw_status = mfi_read_fw_status_xscale;
317                 sc->mfi_check_clear_intr = mfi_check_clear_intr_xscale;
318                 sc->mfi_issue_cmd = mfi_issue_cmd_xscale;
319         }
320         else {
321                 sc->mfi_enable_intr =  mfi_enable_intr_ppc;
322                 sc->mfi_read_fw_status = mfi_read_fw_status_ppc;
323                 sc->mfi_check_clear_intr = mfi_check_clear_intr_ppc;
324                 sc->mfi_issue_cmd = mfi_issue_cmd_ppc;
325         }
326
327
328         /* Before we get too far, see if the firmware is working */
329         if ((error = mfi_transition_firmware(sc)) != 0) {
330                 device_printf(sc->mfi_dev, "Firmware not in READY state, "
331                     "error %d\n", error);
332                 return (ENXIO);
333         }
334
335         /*
336          * Get information needed for sizing the contiguous memory for the
337          * frame pool.  Size down the sgl parameter since we know that
338          * we will never need more than what's required for MAXPHYS.
339          * It would be nice if these constants were available at runtime
340          * instead of compile time.
341          */
342         status = sc->mfi_read_fw_status(sc);
343         sc->mfi_max_fw_cmds = status & MFI_FWSTATE_MAXCMD_MASK;
344         max_fw_sge = (status & MFI_FWSTATE_MAXSGL_MASK) >> 16;
345         sc->mfi_max_sge = min(max_fw_sge, ((MFI_MAXPHYS / PAGE_SIZE) + 1));
346
347         /*
348          * Create the dma tag for data buffers.  Used both for block I/O
349          * and for various internal data queries.
350          */
351         if (bus_dma_tag_create( sc->mfi_parent_dmat,    /* parent */
352                                 1, 0,                   /* algnmnt, boundary */
353                                 BUS_SPACE_MAXADDR,      /* lowaddr */
354                                 BUS_SPACE_MAXADDR,      /* highaddr */
355                                 NULL, NULL,             /* filter, filterarg */
356                                 BUS_SPACE_MAXSIZE_32BIT,/* maxsize */
357                                 sc->mfi_max_sge,        /* nsegments */
358                                 BUS_SPACE_MAXSIZE_32BIT,/* maxsegsize */
359                                 BUS_DMA_ALLOCNOW,       /* flags */
360                                 &sc->mfi_buffer_dmat)) {
361                 device_printf(sc->mfi_dev, "Cannot allocate buffer DMA tag\n");
362                 return (ENOMEM);
363         }
364
365         /*
366          * Allocate DMA memory for the comms queues.  Keep it under 4GB for
367          * efficiency.  The mfi_hwcomms struct includes space for 1 reply queue
368          * entry, so the calculated size here will be will be 1 more than
369          * mfi_max_fw_cmds.  This is apparently a requirement of the hardware.
370          */
371         commsz = (sizeof(uint32_t) * sc->mfi_max_fw_cmds) +
372             sizeof(struct mfi_hwcomms);
373         if (bus_dma_tag_create( sc->mfi_parent_dmat,    /* parent */
374                                 1, 0,                   /* algnmnt, boundary */
375                                 BUS_SPACE_MAXADDR_32BIT,/* lowaddr */
376                                 BUS_SPACE_MAXADDR,      /* highaddr */
377                                 NULL, NULL,             /* filter, filterarg */
378                                 commsz,                 /* maxsize */
379                                 1,                      /* msegments */
380                                 commsz,                 /* maxsegsize */
381                                 0,                      /* flags */
382                                 &sc->mfi_comms_dmat)) {
383                 device_printf(sc->mfi_dev, "Cannot allocate comms DMA tag\n");
384                 return (ENOMEM);
385         }
386         if (bus_dmamem_alloc(sc->mfi_comms_dmat, (void **)&sc->mfi_comms,
387             BUS_DMA_NOWAIT, &sc->mfi_comms_dmamap)) {
388                 device_printf(sc->mfi_dev, "Cannot allocate comms memory\n");
389                 return (ENOMEM);
390         }
391         bzero(sc->mfi_comms, commsz);
392         bus_dmamap_load(sc->mfi_comms_dmat, sc->mfi_comms_dmamap,
393             sc->mfi_comms, commsz, mfi_addr32_cb, &sc->mfi_comms_busaddr, 0);
394
395         /*
396          * Allocate DMA memory for the command frames.  Keep them in the
397          * lower 4GB for efficiency.  Calculate the size of the commands at
398          * the same time; each command is one 64 byte frame plus a set of
399          * additional frames for holding sg lists or other data.
400          * The assumption here is that the SG list will start at the second
401          * frame and not use the unused bytes in the first frame.  While this
402          * isn't technically correct, it simplifies the calculation and allows
403          * for command frames that might be larger than an mfi_io_frame.
404          */
405         if (sizeof(bus_addr_t) == 8) {
406                 sc->mfi_sge_size = sizeof(struct mfi_sg64);
407                 sc->mfi_flags |= MFI_FLAGS_SG64;
408         } else {
409                 sc->mfi_sge_size = sizeof(struct mfi_sg32);
410         }
411         frames = (sc->mfi_sge_size * sc->mfi_max_sge - 1) / MFI_FRAME_SIZE + 2;
412         sc->mfi_cmd_size = frames * MFI_FRAME_SIZE;
413         framessz = sc->mfi_cmd_size * sc->mfi_max_fw_cmds;
414         if (bus_dma_tag_create( sc->mfi_parent_dmat,    /* parent */
415                                 64, 0,                  /* algnmnt, boundary */
416                                 BUS_SPACE_MAXADDR_32BIT,/* lowaddr */
417                                 BUS_SPACE_MAXADDR,      /* highaddr */
418                                 NULL, NULL,             /* filter, filterarg */
419                                 framessz,               /* maxsize */
420                                 1,                      /* nsegments */
421                                 framessz,               /* maxsegsize */
422                                 0,                      /* flags */
423                                 &sc->mfi_frames_dmat)) {
424                 device_printf(sc->mfi_dev, "Cannot allocate frame DMA tag\n");
425                 return (ENOMEM);
426         }
427         if (bus_dmamem_alloc(sc->mfi_frames_dmat, (void **)&sc->mfi_frames,
428             BUS_DMA_NOWAIT, &sc->mfi_frames_dmamap)) {
429                 device_printf(sc->mfi_dev, "Cannot allocate frames memory\n");
430                 return (ENOMEM);
431         }
432         bzero(sc->mfi_frames, framessz);
433         bus_dmamap_load(sc->mfi_frames_dmat, sc->mfi_frames_dmamap,
434             sc->mfi_frames, framessz, mfi_addr32_cb, &sc->mfi_frames_busaddr,0);
435
436         /*
437          * Allocate DMA memory for the frame sense data.  Keep them in the
438          * lower 4GB for efficiency
439          */
440         sensesz = sc->mfi_max_fw_cmds * MFI_SENSE_LEN;
441         if (bus_dma_tag_create( sc->mfi_parent_dmat,    /* parent */
442                                 4, 0,                   /* algnmnt, boundary */
443                                 BUS_SPACE_MAXADDR_32BIT,/* lowaddr */
444                                 BUS_SPACE_MAXADDR,      /* highaddr */
445                                 NULL, NULL,             /* filter, filterarg */
446                                 sensesz,                /* maxsize */
447                                 1,                      /* nsegments */
448                                 sensesz,                /* maxsegsize */
449                                 0,                      /* flags */
450                                 &sc->mfi_sense_dmat)) {
451                 device_printf(sc->mfi_dev, "Cannot allocate sense DMA tag\n");
452                 return (ENOMEM);
453         }
454         if (bus_dmamem_alloc(sc->mfi_sense_dmat, (void **)&sc->mfi_sense,
455             BUS_DMA_NOWAIT, &sc->mfi_sense_dmamap)) {
456                 device_printf(sc->mfi_dev, "Cannot allocate sense memory\n");
457                 return (ENOMEM);
458         }
459         bus_dmamap_load(sc->mfi_sense_dmat, sc->mfi_sense_dmamap,
460             sc->mfi_sense, sensesz, mfi_addr32_cb, &sc->mfi_sense_busaddr, 0);
461
462         if ((error = mfi_alloc_commands(sc)) != 0)
463                 return (error);
464
465         if ((error = mfi_comms_init(sc)) != 0)
466                 return (error);
467
468         if ((error = mfi_get_controller_info(sc)) != 0)
469                 return (error);
470
471         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
472         if ((error = mfi_aen_setup(sc, 0), 0) != 0) {
473                 lockmgr(&sc->mfi_io_lock, LK_RELEASE);
474                 return (error);
475         }
476         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
477
478         /*
479          * Set up the interrupt handler.  XXX This should happen in
480          * mfi_pci.c
481          */
482         sc->mfi_irq_rid = 0;
483         if ((sc->mfi_irq = bus_alloc_resource_any(sc->mfi_dev, SYS_RES_IRQ,
484             &sc->mfi_irq_rid, RF_SHAREABLE | RF_ACTIVE)) == NULL) {
485                 device_printf(sc->mfi_dev, "Cannot allocate interrupt\n");
486                 return (EINVAL);
487         }
488         if (bus_setup_intr(sc->mfi_dev, sc->mfi_irq, 0,
489             mfi_intr, sc, &sc->mfi_intr, NULL)) {
490                 device_printf(sc->mfi_dev, "Cannot set up interrupt\n");
491                 return (EINVAL);
492         }
493
494         /* Register a config hook to probe the bus for arrays */
495         sc->mfi_ich.ich_func = mfi_startup;
496         sc->mfi_ich.ich_arg = sc;
497         if (config_intrhook_establish(&sc->mfi_ich) != 0) {
498                 device_printf(sc->mfi_dev, "Cannot establish configuration "
499                     "hook\n");
500                 return (EINVAL);
501         }
502
503         /*
504          * Register a shutdown handler.
505          */
506         if ((sc->mfi_eh = EVENTHANDLER_REGISTER(shutdown_final, mfi_shutdown,
507             sc, SHUTDOWN_PRI_DEFAULT)) == NULL) {
508                 device_printf(sc->mfi_dev, "Warning: shutdown event "
509                     "registration failed\n");
510         }
511
512         /*
513          * Create the control device for doing management
514          */
515         unit = device_get_unit(sc->mfi_dev);
516         sc->mfi_cdev = make_dev(&mfi_ops, unit, UID_ROOT, GID_OPERATOR,
517             0640, "mfi%d", unit);
518         if (unit == 0)
519                 make_dev_alias(sc->mfi_cdev, "megaraid_sas_ioctl_node");
520         if (sc->mfi_cdev != NULL)
521                 sc->mfi_cdev->si_drv1 = sc;
522         sysctl_ctx_init(&sc->mfi_sysctl_ctx);
523         sc->mfi_sysctl_tree = SYSCTL_ADD_NODE(&sc->mfi_sysctl_ctx,
524             SYSCTL_STATIC_CHILDREN(_hw), OID_AUTO,
525             device_get_nameunit(sc->mfi_dev), CTLFLAG_RD, 0, "");
526         if (sc->mfi_sysctl_tree == NULL) {
527                 device_printf(sc->mfi_dev, "can't add sysctl node\n");
528                 return (EINVAL);
529         }
530         SYSCTL_ADD_INT(&sc->mfi_sysctl_ctx,
531             SYSCTL_CHILDREN(sc->mfi_sysctl_tree),
532             OID_AUTO, "delete_busy_volumes", CTLFLAG_RW,
533             &sc->mfi_delete_busy_volumes, 0, "Allow removal of busy volumes");
534         SYSCTL_ADD_INT(&sc->mfi_sysctl_ctx,
535             SYSCTL_CHILDREN(sc->mfi_sysctl_tree),
536             OID_AUTO, "keep_deleted_volumes", CTLFLAG_RW,
537             &sc->mfi_keep_deleted_volumes, 0,
538             "Don't detach the mfid device for a busy volume that is deleted");
539
540         device_add_child(sc->mfi_dev, "mfip", -1);
541         bus_generic_attach(sc->mfi_dev);
542
543         /* Start the timeout watchdog */
544         callout_init(&sc->mfi_watchdog_callout);
545         callout_reset(&sc->mfi_watchdog_callout, MFI_CMD_TIMEOUT * hz,
546             mfi_timeout, sc);
547
548         return (0);
549 }
550
551 static int
552 mfi_alloc_commands(struct mfi_softc *sc)
553 {
554         struct mfi_command *cm;
555         int i, ncmds;
556
557         /*
558          * XXX Should we allocate all the commands up front, or allocate on
559          * demand later like 'aac' does?
560          */
561         ncmds = MIN(mfi_max_cmds, sc->mfi_max_fw_cmds);
562         if (bootverbose)
563                 device_printf(sc->mfi_dev, "Max fw cmds= %d, sizing driver "
564                    "pool to %d\n", sc->mfi_max_fw_cmds, ncmds);
565
566         sc->mfi_commands = kmalloc(sizeof(struct mfi_command) * ncmds, M_MFIBUF,
567             M_WAITOK | M_ZERO);
568
569         for (i = 0; i < ncmds; i++) {
570                 cm = &sc->mfi_commands[i];
571                 cm->cm_frame = (union mfi_frame *)((uintptr_t)sc->mfi_frames +
572                     sc->mfi_cmd_size * i);
573                 cm->cm_frame_busaddr = sc->mfi_frames_busaddr +
574                     sc->mfi_cmd_size * i;
575                 cm->cm_frame->header.context = i;
576                 cm->cm_sense = &sc->mfi_sense[i];
577                 cm->cm_sense_busaddr= sc->mfi_sense_busaddr + MFI_SENSE_LEN * i;
578                 cm->cm_sc = sc;
579                 cm->cm_index = i;
580                 if (bus_dmamap_create(sc->mfi_buffer_dmat, 0,
581                     &cm->cm_dmamap) == 0)
582                         mfi_release_command(cm);
583                 else
584                         break;
585                 sc->mfi_total_cmds++;
586         }
587
588         return (0);
589 }
590
591 void
592 mfi_release_command(struct mfi_command *cm)
593 {
594         struct mfi_frame_header *hdr;
595         uint32_t *hdr_data;
596
597         /*
598          * Zero out the important fields of the frame, but make sure the
599          * context field is preserved.  For efficiency, handle the fields
600          * as 32 bit words.  Clear out the first S/G entry too for safety.
601          */
602         hdr = &cm->cm_frame->header;
603         if (cm->cm_data != NULL && hdr->sg_count) {
604                 cm->cm_sg->sg32[0].len = 0;
605                 cm->cm_sg->sg32[0].addr = 0;
606         }
607
608         hdr_data = (uint32_t *)cm->cm_frame;
609         hdr_data[0] = 0;        /* cmd, sense_len, cmd_status, scsi_status */
610         hdr_data[1] = 0;        /* target_id, lun_id, cdb_len, sg_count */
611         hdr_data[4] = 0;        /* flags, timeout */
612         hdr_data[5] = 0;        /* data_len */
613
614         cm->cm_extra_frames = 0;
615         cm->cm_flags = 0;
616         cm->cm_complete = NULL;
617         cm->cm_private = NULL;
618         cm->cm_data = NULL;
619         cm->cm_sg = 0;
620         cm->cm_total_frame_size = 0;
621
622         mfi_enqueue_free(cm);
623 }
624
625 static int
626 mfi_dcmd_command(struct mfi_softc *sc, struct mfi_command **cmp, uint32_t opcode,
627     void **bufp, size_t bufsize)
628 {
629         struct mfi_command *cm;
630         struct mfi_dcmd_frame *dcmd;
631         void *buf = NULL;
632
633         KKASSERT(lockstatus(&sc->mfi_io_lock, curthread) != 0);
634
635         cm = mfi_dequeue_free(sc);
636         if (cm == NULL)
637                 return (EBUSY);
638
639         if ((bufsize > 0) && (bufp != NULL)) {
640                 if (*bufp == NULL) {
641                         buf = kmalloc(bufsize, M_MFIBUF, M_NOWAIT|M_ZERO);
642                         if (buf == NULL) {
643                                 mfi_release_command(cm);
644                                 return (ENOMEM);
645                         }
646                         *bufp = buf;
647                 } else {
648                         buf = *bufp;
649                 }
650         }
651
652         dcmd =  &cm->cm_frame->dcmd;
653         bzero(dcmd->mbox, MFI_MBOX_SIZE);
654         dcmd->header.cmd = MFI_CMD_DCMD;
655         dcmd->header.timeout = 0;
656         dcmd->header.flags = 0;
657         dcmd->header.data_len = bufsize;
658         dcmd->opcode = opcode;
659         cm->cm_sg = &dcmd->sgl;
660         cm->cm_total_frame_size = MFI_DCMD_FRAME_SIZE;
661         cm->cm_flags = 0;
662         cm->cm_data = buf;
663         cm->cm_private = buf;
664         cm->cm_len = bufsize;
665
666         *cmp = cm;
667         if ((bufp != NULL) && (*bufp == NULL) && (buf != NULL))
668                 *bufp = buf;
669         return (0);
670 }
671
672 static int
673 mfi_comms_init(struct mfi_softc *sc)
674 {
675         struct mfi_command *cm;
676         struct mfi_init_frame *init;
677         struct mfi_init_qinfo *qinfo;
678         int error;
679
680         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
681         if ((cm = mfi_dequeue_free(sc)) == NULL)
682                 return (EBUSY);
683
684         /*
685          * Abuse the SG list area of the frame to hold the init_qinfo
686          * object;
687          */
688         init = &cm->cm_frame->init;
689         qinfo = (struct mfi_init_qinfo *)((uintptr_t)init + MFI_FRAME_SIZE);
690
691         bzero(qinfo, sizeof(struct mfi_init_qinfo));
692         qinfo->rq_entries = sc->mfi_max_fw_cmds + 1;
693         qinfo->rq_addr_lo = sc->mfi_comms_busaddr +
694             offsetof(struct mfi_hwcomms, hw_reply_q);
695         qinfo->pi_addr_lo = sc->mfi_comms_busaddr +
696             offsetof(struct mfi_hwcomms, hw_pi);
697         qinfo->ci_addr_lo = sc->mfi_comms_busaddr +
698             offsetof(struct mfi_hwcomms, hw_ci);
699
700         init->header.cmd = MFI_CMD_INIT;
701         init->header.data_len = sizeof(struct mfi_init_qinfo);
702         init->qinfo_new_addr_lo = cm->cm_frame_busaddr + MFI_FRAME_SIZE;
703         cm->cm_data = NULL;
704         cm->cm_flags = MFI_CMD_POLLED;
705
706         if ((error = mfi_mapcmd(sc, cm)) != 0) {
707                 device_printf(sc->mfi_dev, "failed to send init command\n");
708                 lockmgr(&sc->mfi_io_lock, LK_RELEASE);
709                 return (error);
710         }
711         mfi_release_command(cm);
712         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
713
714         return (0);
715 }
716
717 static int
718 mfi_get_controller_info(struct mfi_softc *sc)
719 {
720         struct mfi_command *cm = NULL;
721         struct mfi_ctrl_info *ci = NULL;
722         uint32_t max_sectors_1, max_sectors_2;
723         int error;
724
725         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
726         error = mfi_dcmd_command(sc, &cm, MFI_DCMD_CTRL_GETINFO,
727             (void **)&ci, sizeof(*ci));
728         if (error)
729                 goto out;
730         cm->cm_flags = MFI_CMD_DATAIN | MFI_CMD_POLLED;
731
732         if ((error = mfi_mapcmd(sc, cm)) != 0) {
733                 device_printf(sc->mfi_dev, "Failed to get controller info\n");
734                 sc->mfi_max_io = (sc->mfi_max_sge - 1) * PAGE_SIZE /
735                     MFI_SECTOR_LEN;
736                 error = 0;
737                 goto out;
738         }
739
740         bus_dmamap_sync(sc->mfi_buffer_dmat, cm->cm_dmamap,
741             BUS_DMASYNC_POSTREAD);
742         bus_dmamap_unload(sc->mfi_buffer_dmat, cm->cm_dmamap);
743
744         max_sectors_1 = (1 << ci->stripe_sz_ops.min) * ci->max_strips_per_io;
745         max_sectors_2 = ci->max_request_size;
746         sc->mfi_max_io = min(max_sectors_1, max_sectors_2);
747
748 out:
749         if (ci)
750                 kfree(ci, M_MFIBUF);
751         if (cm)
752                 mfi_release_command(cm);
753         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
754         return (error);
755 }
756
757 static int
758 mfi_get_log_state(struct mfi_softc *sc, struct mfi_evt_log_state **log_state)
759 {
760         struct mfi_command *cm = NULL;
761         int error;
762
763         error = mfi_dcmd_command(sc, &cm, MFI_DCMD_CTRL_EVENT_GETINFO,
764             (void **)log_state, sizeof(**log_state));
765         if (error)
766                 goto out;
767         cm->cm_flags = MFI_CMD_DATAIN | MFI_CMD_POLLED;
768
769         if ((error = mfi_mapcmd(sc, cm)) != 0) {
770                 device_printf(sc->mfi_dev, "Failed to get log state\n");
771                 goto out;
772         }
773
774         bus_dmamap_sync(sc->mfi_buffer_dmat, cm->cm_dmamap,
775             BUS_DMASYNC_POSTREAD);
776         bus_dmamap_unload(sc->mfi_buffer_dmat, cm->cm_dmamap);
777
778 out:
779         if (cm)
780                 mfi_release_command(cm);
781
782         return (error);
783 }
784
785 static int
786 mfi_aen_setup(struct mfi_softc *sc, uint32_t seq_start)
787 {
788         struct mfi_evt_log_state *log_state = NULL;
789         union mfi_evt class_locale;
790         int error = 0;
791         uint32_t seq;
792
793         class_locale.members.reserved = 0;
794         class_locale.members.locale = mfi_event_locale;
795         class_locale.members.class  = mfi_event_class;
796
797         if (seq_start == 0) {
798                 error = mfi_get_log_state(sc, &log_state);
799                 if (error) {
800                         if (log_state)
801                                 kfree(log_state, M_MFIBUF);
802                         return (error);
803                 }
804
805                 /*
806                  * Walk through any events that fired since the last
807                  * shutdown.
808                  */
809                 mfi_parse_entries(sc, log_state->shutdown_seq_num,
810                     log_state->newest_seq_num);
811                 seq = log_state->newest_seq_num;
812         } else
813                 seq = seq_start;
814         mfi_aen_register(sc, seq, class_locale.word);
815         if (log_state != NULL)
816                 kfree(log_state, M_MFIBUF);
817
818         return 0;
819 }
820
821 static int
822 mfi_wait_command(struct mfi_softc *sc, struct mfi_command *cm)
823 {
824
825         KKASSERT(lockstatus(&sc->mfi_io_lock, curthread) != 0);
826         cm->cm_complete = NULL;
827
828
829         /*
830          * MegaCli can issue a DCMD of 0.  In this case do nothing
831          * and return 0 to it as status
832          */
833         if (cm->cm_frame->dcmd.opcode == 0) {
834                 cm->cm_frame->header.cmd_status = MFI_STAT_OK;
835                 cm->cm_error = 0;
836                 return (cm->cm_error);
837         }
838         mfi_enqueue_ready(cm);
839         mfi_startio(sc);
840         if ((cm->cm_flags & MFI_CMD_COMPLETED) == 0)
841                 lksleep(cm, &sc->mfi_io_lock, 0, "mfiwait", 0);
842         return (cm->cm_error);
843 }
844
845 void
846 mfi_free(struct mfi_softc *sc)
847 {
848         struct mfi_command *cm;
849         int i;
850
851 #if 0 /* XXX swildner */
852         callout_drain(&sc->mfi_watchdog_callout);
853 #endif
854
855         if (sc->mfi_cdev != NULL)
856                 destroy_dev(sc->mfi_cdev);
857
858         if (sc->mfi_total_cmds != 0) {
859                 for (i = 0; i < sc->mfi_total_cmds; i++) {
860                         cm = &sc->mfi_commands[i];
861                         bus_dmamap_destroy(sc->mfi_buffer_dmat, cm->cm_dmamap);
862                 }
863                 kfree(sc->mfi_commands, M_MFIBUF);
864         }
865
866         if (sc->mfi_intr)
867                 bus_teardown_intr(sc->mfi_dev, sc->mfi_irq, sc->mfi_intr);
868         if (sc->mfi_irq != NULL)
869                 bus_release_resource(sc->mfi_dev, SYS_RES_IRQ, sc->mfi_irq_rid,
870                     sc->mfi_irq);
871
872         if (sc->mfi_sense_busaddr != 0)
873                 bus_dmamap_unload(sc->mfi_sense_dmat, sc->mfi_sense_dmamap);
874         if (sc->mfi_sense != NULL)
875                 bus_dmamem_free(sc->mfi_sense_dmat, sc->mfi_sense,
876                     sc->mfi_sense_dmamap);
877         if (sc->mfi_sense_dmat != NULL)
878                 bus_dma_tag_destroy(sc->mfi_sense_dmat);
879
880         if (sc->mfi_frames_busaddr != 0)
881                 bus_dmamap_unload(sc->mfi_frames_dmat, sc->mfi_frames_dmamap);
882         if (sc->mfi_frames != NULL)
883                 bus_dmamem_free(sc->mfi_frames_dmat, sc->mfi_frames,
884                     sc->mfi_frames_dmamap);
885         if (sc->mfi_frames_dmat != NULL)
886                 bus_dma_tag_destroy(sc->mfi_frames_dmat);
887
888         if (sc->mfi_comms_busaddr != 0)
889                 bus_dmamap_unload(sc->mfi_comms_dmat, sc->mfi_comms_dmamap);
890         if (sc->mfi_comms != NULL)
891                 bus_dmamem_free(sc->mfi_comms_dmat, sc->mfi_comms,
892                     sc->mfi_comms_dmamap);
893         if (sc->mfi_comms_dmat != NULL)
894                 bus_dma_tag_destroy(sc->mfi_comms_dmat);
895
896         if (sc->mfi_buffer_dmat != NULL)
897                 bus_dma_tag_destroy(sc->mfi_buffer_dmat);
898         if (sc->mfi_parent_dmat != NULL)
899                 bus_dma_tag_destroy(sc->mfi_parent_dmat);
900
901         if (sc->mfi_sysctl_tree != NULL)
902                 sysctl_ctx_free(&sc->mfi_sysctl_ctx);
903
904 #if 0 /* XXX swildner: not sure if we need something like mtx_initialized() */
905
906         if (mtx_initialized(&sc->mfi_io_lock)) {
907                 lockuninit(&sc->mfi_io_lock);
908                 sx_destroy(&sc->mfi_config_lock);
909         }
910 #endif
911
912         lockuninit(&sc->mfi_io_lock);
913         lockuninit(&sc->mfi_config_lock);
914
915         return;
916 }
917
918 static void
919 mfi_startup(void *arg)
920 {
921         struct mfi_softc *sc;
922
923         sc = (struct mfi_softc *)arg;
924
925         config_intrhook_disestablish(&sc->mfi_ich);
926
927         sc->mfi_enable_intr(sc);
928         lockmgr(&sc->mfi_config_lock, LK_EXCLUSIVE);
929         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
930         mfi_ldprobe(sc);
931         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
932         lockmgr(&sc->mfi_config_lock, LK_RELEASE);
933 }
934
935 static void
936 mfi_intr(void *arg)
937 {
938         struct mfi_softc *sc;
939         struct mfi_command *cm;
940         uint32_t pi, ci, context;
941
942         sc = (struct mfi_softc *)arg;
943
944         if (sc->mfi_check_clear_intr(sc))
945                 return;
946
947         pi = sc->mfi_comms->hw_pi;
948         ci = sc->mfi_comms->hw_ci;
949         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
950         while (ci != pi) {
951                 context = sc->mfi_comms->hw_reply_q[ci];
952                 if (context < sc->mfi_max_fw_cmds) {
953                         cm = &sc->mfi_commands[context];
954                         mfi_remove_busy(cm);
955                         cm->cm_error = 0;
956                         mfi_complete(sc, cm);
957                 }
958                 if (++ci == (sc->mfi_max_fw_cmds + 1)) {
959                         ci = 0;
960                 }
961         }
962
963         sc->mfi_comms->hw_ci = ci;
964
965         /* Give defered I/O a chance to run */
966         if (sc->mfi_flags & MFI_FLAGS_QFRZN)
967                 sc->mfi_flags &= ~MFI_FLAGS_QFRZN;
968         mfi_startio(sc);
969         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
970
971         return;
972 }
973
974 int
975 mfi_shutdown(struct mfi_softc *sc)
976 {
977         struct mfi_dcmd_frame *dcmd;
978         struct mfi_command *cm;
979         int error;
980
981         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
982         error = mfi_dcmd_command(sc, &cm, MFI_DCMD_CTRL_SHUTDOWN, NULL, 0);
983         if (error) {
984                 lockmgr(&sc->mfi_io_lock, LK_RELEASE);
985                 return (error);
986         }
987
988         if (sc->mfi_aen_cm != NULL)
989                 mfi_abort(sc, sc->mfi_aen_cm);
990
991         dcmd = &cm->cm_frame->dcmd;
992         dcmd->header.flags = MFI_FRAME_DIR_NONE;
993         cm->cm_flags = MFI_CMD_POLLED;
994         cm->cm_data = NULL;
995
996         if ((error = mfi_mapcmd(sc, cm)) != 0) {
997                 device_printf(sc->mfi_dev, "Failed to shutdown controller\n");
998         }
999
1000         mfi_release_command(cm);
1001         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
1002         return (error);
1003 }
1004
1005 static void
1006 mfi_ldprobe(struct mfi_softc *sc)
1007 {
1008         struct mfi_frame_header *hdr;
1009         struct mfi_command *cm = NULL;
1010         struct mfi_ld_list *list = NULL;
1011         struct mfi_disk *ld;
1012         int error, i;
1013
1014         KKASSERT(lockstatus(&sc->mfi_config_lock, curthread) != 0);
1015         KKASSERT(lockstatus(&sc->mfi_io_lock, curthread) != 0);
1016
1017         error = mfi_dcmd_command(sc, &cm, MFI_DCMD_LD_GET_LIST,
1018             (void **)&list, sizeof(*list));
1019         if (error)
1020                 goto out;
1021
1022         cm->cm_flags = MFI_CMD_DATAIN;
1023         if (mfi_wait_command(sc, cm) != 0) {
1024                 device_printf(sc->mfi_dev, "Failed to get device listing\n");
1025                 goto out;
1026         }
1027
1028         hdr = &cm->cm_frame->header;
1029         if (hdr->cmd_status != MFI_STAT_OK) {
1030                 device_printf(sc->mfi_dev, "MFI_DCMD_LD_GET_LIST failed %x\n",
1031                     hdr->cmd_status);
1032                 goto out;
1033         }
1034
1035         for (i = 0; i < list->ld_count; i++) {
1036                 TAILQ_FOREACH(ld, &sc->mfi_ld_tqh, ld_link) {
1037                         if (ld->ld_id == list->ld_list[i].ld.v.target_id)
1038                                 goto skip_add;
1039                 }
1040                 mfi_add_ld(sc, list->ld_list[i].ld.v.target_id);
1041         skip_add:;
1042         }
1043 out:
1044         if (list)
1045                 kfree(list, M_MFIBUF);
1046         if (cm)
1047                 mfi_release_command(cm);
1048
1049         return;
1050 }
1051
1052 /*
1053  * The timestamp is the number of seconds since 00:00 Jan 1, 2000.  If
1054  * the bits in 24-31 are all set, then it is the number of seconds since
1055  * boot.
1056  */
1057 static const char *
1058 format_timestamp(uint32_t timestamp)
1059 {
1060         static char buffer[32];
1061
1062         if ((timestamp & 0xff000000) == 0xff000000)
1063                 ksnprintf(buffer, sizeof(buffer), "boot + %us", timestamp &
1064                     0x00ffffff);
1065         else
1066                 ksnprintf(buffer, sizeof(buffer), "%us", timestamp);
1067         return (buffer);
1068 }
1069
1070 static const char *
1071 format_class(int8_t class)
1072 {
1073         static char buffer[6];
1074
1075         switch (class) {
1076         case MFI_EVT_CLASS_DEBUG:
1077                 return ("debug");
1078         case MFI_EVT_CLASS_PROGRESS:
1079                 return ("progress");
1080         case MFI_EVT_CLASS_INFO:
1081                 return ("info");
1082         case MFI_EVT_CLASS_WARNING:
1083                 return ("WARN");
1084         case MFI_EVT_CLASS_CRITICAL:
1085                 return ("CRIT");
1086         case MFI_EVT_CLASS_FATAL:
1087                 return ("FATAL");
1088         case MFI_EVT_CLASS_DEAD:
1089                 return ("DEAD");
1090         default:
1091                 ksnprintf(buffer, sizeof(buffer), "%d", class);
1092                 return (buffer);
1093         }
1094 }
1095
1096 static void
1097 mfi_decode_evt(struct mfi_softc *sc, struct mfi_evt_detail *detail)
1098 {
1099
1100         device_printf(sc->mfi_dev, "%d (%s/0x%04x/%s) - %s\n", detail->seq,
1101             format_timestamp(detail->time), detail->class.members.locale,
1102             format_class(detail->class.members.class), detail->description);
1103 }
1104
1105 static int
1106 mfi_aen_register(struct mfi_softc *sc, int seq, int locale)
1107 {
1108         struct mfi_command *cm;
1109         struct mfi_dcmd_frame *dcmd;
1110         union mfi_evt current_aen, prior_aen;
1111         struct mfi_evt_detail *ed = NULL;
1112         int error = 0;
1113
1114         current_aen.word = locale;
1115         if (sc->mfi_aen_cm != NULL) {
1116                 prior_aen.word =
1117                     ((uint32_t *)&sc->mfi_aen_cm->cm_frame->dcmd.mbox)[1];
1118                 if (prior_aen.members.class <= current_aen.members.class &&
1119                     !((prior_aen.members.locale & current_aen.members.locale)
1120                     ^current_aen.members.locale)) {
1121                         return (0);
1122                 } else {
1123                         prior_aen.members.locale |= current_aen.members.locale;
1124                         if (prior_aen.members.class
1125                             < current_aen.members.class)
1126                                 current_aen.members.class =
1127                                     prior_aen.members.class;
1128                         mfi_abort(sc, sc->mfi_aen_cm);
1129                 }
1130         }
1131
1132         error = mfi_dcmd_command(sc, &cm, MFI_DCMD_CTRL_EVENT_WAIT,
1133             (void **)&ed, sizeof(*ed));
1134         if (error) {
1135                 goto out;
1136         }
1137
1138         dcmd = &cm->cm_frame->dcmd;
1139         ((uint32_t *)&dcmd->mbox)[0] = seq;
1140         ((uint32_t *)&dcmd->mbox)[1] = locale;
1141         cm->cm_flags = MFI_CMD_DATAIN;
1142         cm->cm_complete = mfi_aen_complete;
1143
1144         sc->mfi_aen_cm = cm;
1145
1146         mfi_enqueue_ready(cm);
1147         mfi_startio(sc);
1148
1149 out:
1150         return (error);
1151 }
1152
1153 static void
1154 mfi_aen_complete(struct mfi_command *cm)
1155 {
1156         struct mfi_frame_header *hdr;
1157         struct mfi_softc *sc;
1158         struct mfi_evt_detail *detail;
1159         struct mfi_aen *mfi_aen_entry, *tmp;
1160         int seq = 0, aborted = 0;
1161
1162         sc = cm->cm_sc;
1163         hdr = &cm->cm_frame->header;
1164
1165         if (sc->mfi_aen_cm == NULL)
1166                 return;
1167
1168         if (sc->mfi_aen_cm->cm_aen_abort || hdr->cmd_status == 0xff) {
1169                 sc->mfi_aen_cm->cm_aen_abort = 0;
1170                 aborted = 1;
1171         } else {
1172                 sc->mfi_aen_triggered = 1;
1173                 if (sc->mfi_poll_waiting) {
1174                         sc->mfi_poll_waiting = 0;
1175                         KNOTE(&sc->mfi_kq.ki_note, 0);
1176                 }
1177                 detail = cm->cm_data;
1178                 /*
1179                  * XXX If this function is too expensive or is recursive, then
1180                  * events should be put onto a queue and processed later.
1181                  */
1182                 mfi_decode_evt(sc, detail);
1183                 seq = detail->seq + 1;
1184                 TAILQ_FOREACH_MUTABLE(mfi_aen_entry, &sc->mfi_aen_pids, aen_link, tmp) {
1185                         TAILQ_REMOVE(&sc->mfi_aen_pids, mfi_aen_entry,
1186                             aen_link);
1187                         lwkt_gettoken(&proc_token);
1188                         ksignal(mfi_aen_entry->p, SIGIO);
1189                         lwkt_reltoken(&proc_token);
1190                         kfree(mfi_aen_entry, M_MFIBUF);
1191                 }
1192         }
1193
1194         kfree(cm->cm_data, M_MFIBUF);
1195         sc->mfi_aen_cm = NULL;
1196         wakeup(&sc->mfi_aen_cm);
1197         mfi_release_command(cm);
1198
1199         /* set it up again so the driver can catch more events */
1200         if (!aborted) {
1201                 mfi_aen_setup(sc, seq);
1202         }
1203 }
1204
1205 #define MAX_EVENTS 15
1206
1207 static int
1208 mfi_parse_entries(struct mfi_softc *sc, int start_seq, int stop_seq)
1209 {
1210         struct mfi_command *cm;
1211         struct mfi_dcmd_frame *dcmd;
1212         struct mfi_evt_list *el;
1213         union mfi_evt class_locale;
1214         int error, i, seq, size;
1215
1216         class_locale.members.reserved = 0;
1217         class_locale.members.locale = mfi_event_locale;
1218         class_locale.members.class  = mfi_event_class;
1219
1220         size = sizeof(struct mfi_evt_list) + sizeof(struct mfi_evt_detail)
1221                 * (MAX_EVENTS - 1);
1222         el = kmalloc(size, M_MFIBUF, M_NOWAIT | M_ZERO);
1223         if (el == NULL)
1224                 return (ENOMEM);
1225
1226         for (seq = start_seq;;) {
1227                 if ((cm = mfi_dequeue_free(sc)) == NULL) {
1228                         kfree(el, M_MFIBUF);
1229                         return (EBUSY);
1230                 }
1231
1232                 dcmd = &cm->cm_frame->dcmd;
1233                 bzero(dcmd->mbox, MFI_MBOX_SIZE);
1234                 dcmd->header.cmd = MFI_CMD_DCMD;
1235                 dcmd->header.timeout = 0;
1236                 dcmd->header.data_len = size;
1237                 dcmd->opcode = MFI_DCMD_CTRL_EVENT_GET;
1238                 ((uint32_t *)&dcmd->mbox)[0] = seq;
1239                 ((uint32_t *)&dcmd->mbox)[1] = class_locale.word;
1240                 cm->cm_sg = &dcmd->sgl;
1241                 cm->cm_total_frame_size = MFI_DCMD_FRAME_SIZE;
1242                 cm->cm_flags = MFI_CMD_DATAIN | MFI_CMD_POLLED;
1243                 cm->cm_data = el;
1244                 cm->cm_len = size;
1245
1246                 if ((error = mfi_mapcmd(sc, cm)) != 0) {
1247                         device_printf(sc->mfi_dev,
1248                             "Failed to get controller entries\n");
1249                         mfi_release_command(cm);
1250                         break;
1251                 }
1252
1253                 bus_dmamap_sync(sc->mfi_buffer_dmat, cm->cm_dmamap,
1254                     BUS_DMASYNC_POSTREAD);
1255                 bus_dmamap_unload(sc->mfi_buffer_dmat, cm->cm_dmamap);
1256
1257                 if (dcmd->header.cmd_status == MFI_STAT_NOT_FOUND) {
1258                         mfi_release_command(cm);
1259                         break;
1260                 }
1261                 if (dcmd->header.cmd_status != MFI_STAT_OK) {
1262                         device_printf(sc->mfi_dev,
1263                             "Error %d fetching controller entries\n",
1264                             dcmd->header.cmd_status);
1265                         mfi_release_command(cm);
1266                         break;
1267                 }
1268                 mfi_release_command(cm);
1269
1270                 for (i = 0; i < el->count; i++) {
1271                         /*
1272                          * If this event is newer than 'stop_seq' then
1273                          * break out of the loop.  Note that the log
1274                          * is a circular buffer so we have to handle
1275                          * the case that our stop point is earlier in
1276                          * the buffer than our start point.
1277                          */
1278                         if (el->event[i].seq >= stop_seq) {
1279                                 if (start_seq <= stop_seq)
1280                                         break;
1281                                 else if (el->event[i].seq < start_seq)
1282                                         break;
1283                         }
1284                         mfi_decode_evt(sc, &el->event[i]);
1285                 }
1286                 seq = el->event[el->count - 1].seq + 1;
1287         }
1288
1289         kfree(el, M_MFIBUF);
1290         return (0);
1291 }
1292
1293 static int
1294 mfi_add_ld(struct mfi_softc *sc, int id)
1295 {
1296         struct mfi_command *cm;
1297         struct mfi_dcmd_frame *dcmd = NULL;
1298         struct mfi_ld_info *ld_info = NULL;
1299         int error;
1300
1301         KKASSERT(lockstatus(&sc->mfi_io_lock, curthread) != 0);
1302
1303         error = mfi_dcmd_command(sc, &cm, MFI_DCMD_LD_GET_INFO,
1304             (void **)&ld_info, sizeof(*ld_info));
1305         if (error) {
1306                 device_printf(sc->mfi_dev,
1307                     "Failed to allocate for MFI_DCMD_LD_GET_INFO %d\n", error);
1308                 if (ld_info)
1309                         kfree(ld_info, M_MFIBUF);
1310                 return (error);
1311         }
1312         cm->cm_flags = MFI_CMD_DATAIN;
1313         dcmd = &cm->cm_frame->dcmd;
1314         dcmd->mbox[0] = id;
1315         if (mfi_wait_command(sc, cm) != 0) {
1316                 device_printf(sc->mfi_dev,
1317                     "Failed to get logical drive: %d\n", id);
1318                 kfree(ld_info, M_MFIBUF);
1319                 return (0);
1320         }
1321
1322         mfi_add_ld_complete(cm);
1323         return (0);
1324 }
1325
1326 static void
1327 mfi_add_ld_complete(struct mfi_command *cm)
1328 {
1329         struct mfi_frame_header *hdr;
1330         struct mfi_ld_info *ld_info;
1331         struct mfi_softc *sc;
1332         device_t child;
1333
1334         sc = cm->cm_sc;
1335         hdr = &cm->cm_frame->header;
1336         ld_info = cm->cm_private;
1337
1338         if (hdr->cmd_status != MFI_STAT_OK) {
1339                 kfree(ld_info, M_MFIBUF);
1340                 mfi_release_command(cm);
1341                 return;
1342         }
1343         mfi_release_command(cm);
1344
1345         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
1346         get_mplock();
1347         if ((child = device_add_child(sc->mfi_dev, "mfid", -1)) == NULL) {
1348                 device_printf(sc->mfi_dev, "Failed to add logical disk\n");
1349                 kfree(ld_info, M_MFIBUF);
1350                 rel_mplock();
1351                 lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
1352                 return;
1353         }
1354
1355         device_set_ivars(child, ld_info);
1356         device_set_desc(child, "MFI Logical Disk");
1357         bus_generic_attach(sc->mfi_dev);
1358         rel_mplock();
1359         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
1360 }
1361
1362 static struct mfi_command *
1363 mfi_bio_command(struct mfi_softc *sc)
1364 {
1365         struct mfi_io_frame *io;
1366         struct mfi_command *cm;
1367         struct bio *bio;
1368         struct buf *bp;
1369         struct mfi_disk *disk;
1370         int flags, blkcount;
1371
1372         if ((cm = mfi_dequeue_free(sc)) == NULL)
1373                 return (NULL);
1374
1375         if ((bio = mfi_dequeue_bio(sc)) == NULL) {
1376                 mfi_release_command(cm);
1377                 return (NULL);
1378         }
1379
1380         bp = bio->bio_buf;
1381         io = &cm->cm_frame->io;
1382         switch (bp->b_cmd & 0x03) {
1383         case BUF_CMD_READ:
1384                 io->header.cmd = MFI_CMD_LD_READ;
1385                 flags = MFI_CMD_DATAIN;
1386                 break;
1387         case BUF_CMD_WRITE:
1388                 io->header.cmd = MFI_CMD_LD_WRITE;
1389                 flags = MFI_CMD_DATAOUT;
1390                 break;
1391         default:
1392                 panic("Invalid bio command");
1393         }
1394
1395         /* Cheat with the sector length to avoid a non-constant division */
1396         blkcount = (bp->b_bcount + MFI_SECTOR_LEN - 1) / MFI_SECTOR_LEN;
1397         disk = bio->bio_driver_info;
1398         io->header.target_id = disk->ld_id;
1399         io->header.timeout = 0;
1400         io->header.flags = 0;
1401         io->header.sense_len = MFI_SENSE_LEN;
1402         io->header.data_len = blkcount;
1403         io->sense_addr_lo = cm->cm_sense_busaddr;
1404         io->sense_addr_hi = 0;
1405         io->lba_hi = ((bio->bio_offset / MFI_SECTOR_LEN) & 0xffffffff00000000) >> 32;
1406         io->lba_lo = (bio->bio_offset / MFI_SECTOR_LEN) & 0xffffffff;
1407         cm->cm_complete = mfi_bio_complete;
1408         cm->cm_private = bio;
1409         cm->cm_data = bp->b_data;
1410         cm->cm_len = bp->b_bcount;
1411         cm->cm_sg = &io->sgl;
1412         cm->cm_total_frame_size = MFI_IO_FRAME_SIZE;
1413         cm->cm_flags = flags;
1414         return (cm);
1415 }
1416
1417 static void
1418 mfi_bio_complete(struct mfi_command *cm)
1419 {
1420         struct bio *bio;
1421         struct buf *bp;
1422         struct mfi_frame_header *hdr;
1423         struct mfi_softc *sc;
1424
1425         bio = cm->cm_private;
1426         bp = bio->bio_buf;
1427         hdr = &cm->cm_frame->header;
1428         sc = cm->cm_sc;
1429
1430         if ((hdr->cmd_status != 0) || (hdr->scsi_status != 0)) {
1431                 bp->b_flags |= B_ERROR;
1432                 bp->b_error = EIO;
1433                 device_printf(sc->mfi_dev, "I/O error, status= %d "
1434                     "scsi_status= %d\n", hdr->cmd_status, hdr->scsi_status);
1435                 mfi_print_sense(cm->cm_sc, cm->cm_sense);
1436         } else if (cm->cm_error != 0) {
1437                 bp->b_flags |= B_ERROR;
1438         }
1439
1440         mfi_release_command(cm);
1441         mfi_disk_complete(bio);
1442 }
1443
1444 void
1445 mfi_startio(struct mfi_softc *sc)
1446 {
1447         struct mfi_command *cm;
1448         struct ccb_hdr *ccbh;
1449
1450         for (;;) {
1451                 /* Don't bother if we're short on resources */
1452                 if (sc->mfi_flags & MFI_FLAGS_QFRZN)
1453                         break;
1454
1455                 /* Try a command that has already been prepared */
1456                 cm = mfi_dequeue_ready(sc);
1457
1458                 if (cm == NULL) {
1459                         if ((ccbh = TAILQ_FIRST(&sc->mfi_cam_ccbq)) != NULL)
1460                                 cm = sc->mfi_cam_start(ccbh);
1461                 }
1462
1463                 /* Nope, so look for work on the bioq */
1464                 if (cm == NULL)
1465                         cm = mfi_bio_command(sc);
1466
1467                 /* No work available, so exit */
1468                 if (cm == NULL)
1469                         break;
1470
1471                 /* Send the command to the controller */
1472                 if (mfi_mapcmd(sc, cm) != 0) {
1473                         mfi_requeue_ready(cm);
1474                         break;
1475                 }
1476         }
1477 }
1478
1479 static int
1480 mfi_mapcmd(struct mfi_softc *sc, struct mfi_command *cm)
1481 {
1482         int error, polled;
1483
1484         KKASSERT(lockstatus(&sc->mfi_io_lock, curthread) != 0);
1485
1486         if (cm->cm_data != NULL) {
1487                 polled = (cm->cm_flags & MFI_CMD_POLLED) ? BUS_DMA_NOWAIT : 0;
1488                 error = bus_dmamap_load(sc->mfi_buffer_dmat, cm->cm_dmamap,
1489                     cm->cm_data, cm->cm_len, mfi_data_cb, cm, polled);
1490                 if (error == EINPROGRESS) {
1491                         sc->mfi_flags |= MFI_FLAGS_QFRZN;
1492                         return (0);
1493                 }
1494         } else {
1495                 error = mfi_send_frame(sc, cm);
1496         }
1497
1498         return (error);
1499 }
1500
1501 static void
1502 mfi_data_cb(void *arg, bus_dma_segment_t *segs, int nsegs, int error)
1503 {
1504         struct mfi_frame_header *hdr;
1505         struct mfi_command *cm;
1506         union mfi_sgl *sgl;
1507         struct mfi_softc *sc;
1508         int i, dir;
1509
1510         cm = (struct mfi_command *)arg;
1511         sc = cm->cm_sc;
1512         hdr = &cm->cm_frame->header;
1513         sgl = cm->cm_sg;
1514
1515         if (error) {
1516                 kprintf("error %d in callback\n", error);
1517                 cm->cm_error = error;
1518                 mfi_complete(sc, cm);
1519                 return;
1520         }
1521
1522         if ((sc->mfi_flags & MFI_FLAGS_SG64) == 0) {
1523                 for (i = 0; i < nsegs; i++) {
1524                         sgl->sg32[i].addr = segs[i].ds_addr;
1525                         sgl->sg32[i].len = segs[i].ds_len;
1526                 }
1527         } else {
1528                 for (i = 0; i < nsegs; i++) {
1529                         sgl->sg64[i].addr = segs[i].ds_addr;
1530                         sgl->sg64[i].len = segs[i].ds_len;
1531                 }
1532                 hdr->flags |= MFI_FRAME_SGL64;
1533         }
1534         hdr->sg_count = nsegs;
1535
1536         dir = 0;
1537         if (cm->cm_flags & MFI_CMD_DATAIN) {
1538                 dir |= BUS_DMASYNC_PREREAD;
1539                 hdr->flags |= MFI_FRAME_DIR_READ;
1540         }
1541         if (cm->cm_flags & MFI_CMD_DATAOUT) {
1542                 dir |= BUS_DMASYNC_PREWRITE;
1543                 hdr->flags |= MFI_FRAME_DIR_WRITE;
1544         }
1545         bus_dmamap_sync(sc->mfi_buffer_dmat, cm->cm_dmamap, dir);
1546         cm->cm_flags |= MFI_CMD_MAPPED;
1547
1548         /*
1549          * Instead of calculating the total number of frames in the
1550          * compound frame, it's already assumed that there will be at
1551          * least 1 frame, so don't compensate for the modulo of the
1552          * following division.
1553          */
1554         cm->cm_total_frame_size += (sc->mfi_sge_size * nsegs);
1555         cm->cm_extra_frames = (cm->cm_total_frame_size - 1) / MFI_FRAME_SIZE;
1556
1557         mfi_send_frame(sc, cm);
1558
1559         return;
1560 }
1561
1562 static int
1563 mfi_send_frame(struct mfi_softc *sc, struct mfi_command *cm)
1564 {
1565         struct mfi_frame_header *hdr;
1566         int tm = MFI_POLL_TIMEOUT_SECS * 1000;
1567
1568         hdr = &cm->cm_frame->header;
1569
1570         if ((cm->cm_flags & MFI_CMD_POLLED) == 0) {
1571                 cm->cm_timestamp = time_second;
1572                 mfi_enqueue_busy(cm);
1573         } else {
1574                 hdr->cmd_status = 0xff;
1575                 hdr->flags |= MFI_FRAME_DONT_POST_IN_REPLY_QUEUE;
1576         }
1577
1578         /*
1579          * The bus address of the command is aligned on a 64 byte boundary,
1580          * leaving the least 6 bits as zero.  For whatever reason, the
1581          * hardware wants the address shifted right by three, leaving just
1582          * 3 zero bits.  These three bits are then used as a prefetching
1583          * hint for the hardware to predict how many frames need to be
1584          * fetched across the bus.  If a command has more than 8 frames
1585          * then the 3 bits are set to 0x7 and the firmware uses other
1586          * information in the command to determine the total amount to fetch.
1587          * However, FreeBSD doesn't support I/O larger than 128K, so 8 frames
1588          * is enough for both 32bit and 64bit systems.
1589          */
1590         if (cm->cm_extra_frames > 7)
1591                 cm->cm_extra_frames = 7;
1592
1593         sc->mfi_issue_cmd(sc,cm->cm_frame_busaddr,cm->cm_extra_frames);
1594
1595         if ((cm->cm_flags & MFI_CMD_POLLED) == 0)
1596                 return (0);
1597
1598         /* This is a polled command, so busy-wait for it to complete. */
1599         while (hdr->cmd_status == 0xff) {
1600                 DELAY(1000);
1601                 tm -= 1;
1602                 if (tm <= 0)
1603                         break;
1604         }
1605
1606         if (hdr->cmd_status == 0xff) {
1607                 device_printf(sc->mfi_dev, "Frame %p timed out "
1608                               "command 0x%X\n", hdr, cm->cm_frame->dcmd.opcode);
1609                 return (ETIMEDOUT);
1610         }
1611
1612         return (0);
1613 }
1614
1615 static void
1616 mfi_complete(struct mfi_softc *sc, struct mfi_command *cm)
1617 {
1618         int dir;
1619
1620         if ((cm->cm_flags & MFI_CMD_MAPPED) != 0) {
1621                 dir = 0;
1622                 if (cm->cm_flags & MFI_CMD_DATAIN)
1623                         dir |= BUS_DMASYNC_POSTREAD;
1624                 if (cm->cm_flags & MFI_CMD_DATAOUT)
1625                         dir |= BUS_DMASYNC_POSTWRITE;
1626
1627                 bus_dmamap_sync(sc->mfi_buffer_dmat, cm->cm_dmamap, dir);
1628                 bus_dmamap_unload(sc->mfi_buffer_dmat, cm->cm_dmamap);
1629                 cm->cm_flags &= ~MFI_CMD_MAPPED;
1630         }
1631
1632         cm->cm_flags |= MFI_CMD_COMPLETED;
1633
1634         if (cm->cm_complete != NULL)
1635                 cm->cm_complete(cm);
1636         else
1637                 wakeup(cm);
1638 }
1639
1640 static int
1641 mfi_abort(struct mfi_softc *sc, struct mfi_command *cm_abort)
1642 {
1643         struct mfi_command *cm;
1644         struct mfi_abort_frame *abort;
1645         int i = 0;
1646
1647         KKASSERT(lockstatus(&sc->mfi_io_lock, curthread) != 0);
1648
1649         if ((cm = mfi_dequeue_free(sc)) == NULL) {
1650                 return (EBUSY);
1651         }
1652
1653         abort = &cm->cm_frame->abort;
1654         abort->header.cmd = MFI_CMD_ABORT;
1655         abort->header.flags = 0;
1656         abort->abort_context = cm_abort->cm_frame->header.context;
1657         abort->abort_mfi_addr_lo = cm_abort->cm_frame_busaddr;
1658         abort->abort_mfi_addr_hi = 0;
1659         cm->cm_data = NULL;
1660         cm->cm_flags = MFI_CMD_POLLED;
1661
1662         sc->mfi_aen_cm->cm_aen_abort = 1;
1663         mfi_mapcmd(sc, cm);
1664         mfi_release_command(cm);
1665
1666         while (i < 5 && sc->mfi_aen_cm != NULL) {
1667                 lksleep(&sc->mfi_aen_cm, &sc->mfi_io_lock, 0, "mfiabort", 5 * hz);
1668                 i++;
1669         }
1670
1671         return (0);
1672 }
1673
1674 int
1675 mfi_dump_blocks(struct mfi_softc *sc, int id, uint64_t lba, void *virt, int len)
1676 {
1677         struct mfi_command *cm;
1678         struct mfi_io_frame *io;
1679         int error;
1680
1681         if ((cm = mfi_dequeue_free(sc)) == NULL)
1682                 return (EBUSY);
1683
1684         io = &cm->cm_frame->io;
1685         io->header.cmd = MFI_CMD_LD_WRITE;
1686         io->header.target_id = id;
1687         io->header.timeout = 0;
1688         io->header.flags = 0;
1689         io->header.sense_len = MFI_SENSE_LEN;
1690         io->header.data_len = (len + MFI_SECTOR_LEN - 1) / MFI_SECTOR_LEN;
1691         io->sense_addr_lo = cm->cm_sense_busaddr;
1692         io->sense_addr_hi = 0;
1693         io->lba_hi = (lba & 0xffffffff00000000) >> 32;
1694         io->lba_lo = lba & 0xffffffff;
1695         cm->cm_data = virt;
1696         cm->cm_len = len;
1697         cm->cm_sg = &io->sgl;
1698         cm->cm_total_frame_size = MFI_IO_FRAME_SIZE;
1699         cm->cm_flags = MFI_CMD_POLLED | MFI_CMD_DATAOUT;
1700
1701         error = mfi_mapcmd(sc, cm);
1702         bus_dmamap_sync(sc->mfi_buffer_dmat, cm->cm_dmamap,
1703             BUS_DMASYNC_POSTWRITE);
1704         bus_dmamap_unload(sc->mfi_buffer_dmat, cm->cm_dmamap);
1705         mfi_release_command(cm);
1706
1707         return (error);
1708 }
1709
1710 static int
1711 mfi_open(struct dev_open_args *ap)
1712 {
1713         cdev_t dev = ap->a_head.a_dev;
1714         struct mfi_softc *sc;
1715         int error;
1716
1717         sc = dev->si_drv1;
1718
1719         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
1720         if (sc->mfi_detaching)
1721                 error = ENXIO;
1722         else {
1723                 sc->mfi_flags |= MFI_FLAGS_OPEN;
1724                 error = 0;
1725         }
1726         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
1727
1728         return (error);
1729 }
1730
1731 static int
1732 mfi_close(struct dev_close_args *ap)
1733 {
1734         cdev_t dev = ap->a_head.a_dev;
1735         struct mfi_softc *sc;
1736         struct mfi_aen *mfi_aen_entry, *tmp;
1737
1738         sc = dev->si_drv1;
1739
1740         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
1741         sc->mfi_flags &= ~MFI_FLAGS_OPEN;
1742
1743         TAILQ_FOREACH_MUTABLE(mfi_aen_entry, &sc->mfi_aen_pids, aen_link, tmp) {
1744                 if (mfi_aen_entry->p == curproc) {
1745                         TAILQ_REMOVE(&sc->mfi_aen_pids, mfi_aen_entry,
1746                             aen_link);
1747                         kfree(mfi_aen_entry, M_MFIBUF);
1748                 }
1749         }
1750         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
1751         return (0);
1752 }
1753
1754 static int
1755 mfi_config_lock(struct mfi_softc *sc, uint32_t opcode)
1756 {
1757
1758         switch (opcode) {
1759         case MFI_DCMD_LD_DELETE:
1760         case MFI_DCMD_CFG_ADD:
1761         case MFI_DCMD_CFG_CLEAR:
1762                 lockmgr(&sc->mfi_config_lock, LK_EXCLUSIVE);
1763                 return (1);
1764         default:
1765                 return (0);
1766         }
1767 }
1768
1769 static void
1770 mfi_config_unlock(struct mfi_softc *sc, int locked)
1771 {
1772
1773         if (locked)
1774                 lockmgr(&sc->mfi_config_lock, LK_RELEASE);
1775 }
1776
1777 /* Perform pre-issue checks on commands from userland and possibly veto them. */
1778 static int
1779 mfi_check_command_pre(struct mfi_softc *sc, struct mfi_command *cm)
1780 {
1781         struct mfi_disk *ld, *ld2;
1782         int error;
1783
1784         KKASSERT(lockstatus(&sc->mfi_io_lock, curthread) != 0);
1785         error = 0;
1786         switch (cm->cm_frame->dcmd.opcode) {
1787         case MFI_DCMD_LD_DELETE:
1788                 TAILQ_FOREACH(ld, &sc->mfi_ld_tqh, ld_link) {
1789                         if (ld->ld_id == cm->cm_frame->dcmd.mbox[0])
1790                                 break;
1791                 }
1792                 if (ld == NULL)
1793                         error = ENOENT;
1794                 else
1795                         error = mfi_disk_disable(ld);
1796                 break;
1797         case MFI_DCMD_CFG_CLEAR:
1798                 TAILQ_FOREACH(ld, &sc->mfi_ld_tqh, ld_link) {
1799                         error = mfi_disk_disable(ld);
1800                         if (error)
1801                                 break;
1802                 }
1803                 if (error) {
1804                         TAILQ_FOREACH(ld2, &sc->mfi_ld_tqh, ld_link) {
1805                                 if (ld2 == ld)
1806                                         break;
1807                                 mfi_disk_enable(ld2);
1808                         }
1809                 }
1810                 break;
1811         default:
1812                 break;
1813         }
1814         return (error);
1815 }
1816
1817 /* Perform post-issue checks on commands from userland. */
1818 static void
1819 mfi_check_command_post(struct mfi_softc *sc, struct mfi_command *cm)
1820 {
1821         struct mfi_disk *ld, *ldn;
1822
1823         switch (cm->cm_frame->dcmd.opcode) {
1824         case MFI_DCMD_LD_DELETE:
1825                 TAILQ_FOREACH(ld, &sc->mfi_ld_tqh, ld_link) {
1826                         if (ld->ld_id == cm->cm_frame->dcmd.mbox[0])
1827                                 break;
1828                 }
1829                 KASSERT(ld != NULL, ("volume dissappeared"));
1830                 if (cm->cm_frame->header.cmd_status == MFI_STAT_OK) {
1831                         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
1832                         get_mplock();
1833                         device_delete_child(sc->mfi_dev, ld->ld_dev);
1834                         rel_mplock();
1835                         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
1836                 } else
1837                         mfi_disk_enable(ld);
1838                 break;
1839         case MFI_DCMD_CFG_CLEAR:
1840                 if (cm->cm_frame->header.cmd_status == MFI_STAT_OK) {
1841                         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
1842                         get_mplock();
1843                         TAILQ_FOREACH_MUTABLE(ld, &sc->mfi_ld_tqh, ld_link, ldn) {
1844                                 device_delete_child(sc->mfi_dev, ld->ld_dev);
1845                         }
1846                         rel_mplock();
1847                         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
1848                 } else {
1849                         TAILQ_FOREACH(ld, &sc->mfi_ld_tqh, ld_link)
1850                                 mfi_disk_enable(ld);
1851                 }
1852                 break;
1853         case MFI_DCMD_CFG_ADD:
1854                 mfi_ldprobe(sc);
1855                 break;
1856         case MFI_DCMD_CFG_FOREIGN_IMPORT:
1857                 mfi_ldprobe(sc);
1858                 break;
1859         }
1860 }
1861
1862 static int
1863 mfi_user_command(struct mfi_softc *sc, struct mfi_ioc_passthru *ioc)
1864 {
1865         struct mfi_command *cm;
1866         struct mfi_dcmd_frame *dcmd;
1867         void *ioc_buf = NULL;
1868         uint32_t context;
1869         int error = 0, locked;
1870
1871
1872         if (ioc->buf_size > 0) {
1873                 ioc_buf = kmalloc(ioc->buf_size, M_MFIBUF, M_WAITOK);
1874                 if (ioc_buf == NULL) {
1875                         return (ENOMEM);
1876                 }
1877                 error = copyin(ioc->buf, ioc_buf, ioc->buf_size);
1878                 if (error) {
1879                         device_printf(sc->mfi_dev, "failed to copyin\n");
1880                         kfree(ioc_buf, M_MFIBUF);
1881                         return (error);
1882                 }
1883         }
1884
1885         locked = mfi_config_lock(sc, ioc->ioc_frame.opcode);
1886
1887         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
1888         while ((cm = mfi_dequeue_free(sc)) == NULL)
1889                 lksleep(mfi_user_command, &sc->mfi_io_lock, 0, "mfiioc", hz);
1890
1891         /* Save context for later */
1892         context = cm->cm_frame->header.context;
1893
1894         dcmd = &cm->cm_frame->dcmd;
1895         bcopy(&ioc->ioc_frame, dcmd, sizeof(struct mfi_dcmd_frame));
1896
1897         cm->cm_sg = &dcmd->sgl;
1898         cm->cm_total_frame_size = MFI_DCMD_FRAME_SIZE;
1899         cm->cm_data = ioc_buf;
1900         cm->cm_len = ioc->buf_size;
1901
1902         /* restore context */
1903         cm->cm_frame->header.context = context;
1904
1905         /* Cheat since we don't know if we're writing or reading */
1906         cm->cm_flags = MFI_CMD_DATAIN | MFI_CMD_DATAOUT;
1907
1908         error = mfi_check_command_pre(sc, cm);
1909         if (error)
1910                 goto out;
1911
1912         error = mfi_wait_command(sc, cm);
1913         if (error) {
1914                 device_printf(sc->mfi_dev, "ioctl failed %d\n", error);
1915                 goto out;
1916         }
1917         bcopy(dcmd, &ioc->ioc_frame, sizeof(struct mfi_dcmd_frame));
1918         mfi_check_command_post(sc, cm);
1919 out:
1920         mfi_release_command(cm);
1921         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
1922         mfi_config_unlock(sc, locked);
1923         if (ioc->buf_size > 0)
1924                 error = copyout(ioc_buf, ioc->buf, ioc->buf_size);
1925         if (ioc_buf)
1926                 kfree(ioc_buf, M_MFIBUF);
1927         return (error);
1928 }
1929
1930 #ifdef __x86_64__
1931 #define PTRIN(p)                ((void *)(uintptr_t)(p))
1932 #else
1933 #define PTRIN(p)                (p)
1934 #endif
1935
1936 static int
1937 mfi_ioctl(struct dev_ioctl_args *ap)
1938 {
1939         cdev_t dev = ap->a_head.a_dev;
1940         u_long cmd = ap->a_cmd;
1941         int flag = ap->a_fflag;
1942         caddr_t arg = ap->a_data;
1943         struct mfi_softc *sc;
1944         union mfi_statrequest *ms;
1945         struct mfi_ioc_packet *ioc;
1946 #ifdef __x86_64__
1947         struct mfi_ioc_packet32 *ioc32;
1948 #endif
1949         struct mfi_ioc_aen *aen;
1950         struct mfi_command *cm = NULL;
1951         uint32_t context;
1952         union mfi_sense_ptr sense_ptr;
1953         uint8_t *data = NULL, *temp;
1954         int i;
1955         struct mfi_ioc_passthru *iop = (struct mfi_ioc_passthru *)arg;
1956 #ifdef __x86_64__
1957         struct mfi_ioc_passthru32 *iop32 = (struct mfi_ioc_passthru32 *)arg;
1958         struct mfi_ioc_passthru iop_swab;
1959 #endif
1960         int error, locked;
1961
1962         sc = dev->si_drv1;
1963         error = 0;
1964
1965         switch (cmd) {
1966         case MFIIO_STATS:
1967                 ms = (union mfi_statrequest *)arg;
1968                 switch (ms->ms_item) {
1969                 case MFIQ_FREE:
1970                 case MFIQ_BIO:
1971                 case MFIQ_READY:
1972                 case MFIQ_BUSY:
1973                         bcopy(&sc->mfi_qstat[ms->ms_item], &ms->ms_qstat,
1974                             sizeof(struct mfi_qstat));
1975                         break;
1976                 default:
1977                         error = ENOIOCTL;
1978                         break;
1979                 }
1980                 break;
1981         case MFIIO_QUERY_DISK:
1982         {
1983                 struct mfi_query_disk *qd;
1984                 struct mfi_disk *ld;
1985
1986                 qd = (struct mfi_query_disk *)arg;
1987                 lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
1988                 TAILQ_FOREACH(ld, &sc->mfi_ld_tqh, ld_link) {
1989                         if (ld->ld_id == qd->array_id)
1990                                 break;
1991                 }
1992                 if (ld == NULL) {
1993                         qd->present = 0;
1994                         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
1995                         return (0);
1996                 }
1997                 qd->present = 1;
1998                 if (ld->ld_flags & MFI_DISK_FLAGS_OPEN)
1999                         qd->open = 1;
2000                 bzero(qd->devname, SPECNAMELEN + 1);
2001                 ksnprintf(qd->devname, SPECNAMELEN, "mfid%d", ld->ld_unit);
2002                 lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2003                 break;
2004         }
2005         case MFI_CMD:
2006 #ifdef __x86_64__
2007         case MFI_CMD32:
2008 #endif
2009                 {
2010                 devclass_t devclass;
2011                 ioc = (struct mfi_ioc_packet *)arg;
2012                 int adapter;
2013
2014                 adapter = ioc->mfi_adapter_no;
2015                 if (device_get_unit(sc->mfi_dev) == 0 && adapter != 0) {
2016                         devclass = devclass_find("mfi");
2017                         sc = devclass_get_softc(devclass, adapter);
2018                 }
2019                 lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
2020                 if ((cm = mfi_dequeue_free(sc)) == NULL) {
2021                         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2022                         return (EBUSY);
2023                 }
2024                 lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2025                 locked = 0;
2026
2027                 /*
2028                  * save off original context since copying from user
2029                  * will clobber some data
2030                  */
2031                 context = cm->cm_frame->header.context;
2032
2033                 bcopy(ioc->mfi_frame.raw, cm->cm_frame,
2034                     2 * MFI_DCMD_FRAME_SIZE);  /* this isn't quite right */
2035                 cm->cm_total_frame_size = (sizeof(union mfi_sgl)
2036                     * ioc->mfi_sge_count) + ioc->mfi_sgl_off;
2037                 if (ioc->mfi_sge_count) {
2038                         cm->cm_sg =
2039                             (union mfi_sgl *)&cm->cm_frame->bytes[ioc->mfi_sgl_off];
2040                 }
2041                 cm->cm_flags = 0;
2042                 if (cm->cm_frame->header.flags & MFI_FRAME_DATAIN)
2043                         cm->cm_flags |= MFI_CMD_DATAIN;
2044                 if (cm->cm_frame->header.flags & MFI_FRAME_DATAOUT)
2045                         cm->cm_flags |= MFI_CMD_DATAOUT;
2046                 /* Legacy app shim */
2047                 if (cm->cm_flags == 0)
2048                         cm->cm_flags |= MFI_CMD_DATAIN | MFI_CMD_DATAOUT;
2049                 cm->cm_len = cm->cm_frame->header.data_len;
2050                 if (cm->cm_len &&
2051                     (cm->cm_flags & (MFI_CMD_DATAIN | MFI_CMD_DATAOUT))) {
2052                         cm->cm_data = data = kmalloc(cm->cm_len, M_MFIBUF,
2053                             M_WAITOK | M_ZERO);
2054                         if (cm->cm_data == NULL) {
2055                                 device_printf(sc->mfi_dev, "Malloc failed\n");
2056                                 goto out;
2057                         }
2058                 } else {
2059                         cm->cm_data = 0;
2060                 }
2061
2062                 /* restore header context */
2063                 cm->cm_frame->header.context = context;
2064
2065                 temp = data;
2066                 if (cm->cm_flags & MFI_CMD_DATAOUT) {
2067                         for (i = 0; i < ioc->mfi_sge_count; i++) {
2068 #ifdef __x86_64__
2069                                 if (cmd == MFI_CMD) {
2070                                         /* Native */
2071                                         error = copyin(ioc->mfi_sgl[i].iov_base,
2072                                                temp,
2073                                                ioc->mfi_sgl[i].iov_len);
2074                                 } else {
2075                                         void *temp_convert;
2076                                         /* 32bit */
2077                                         ioc32 = (struct mfi_ioc_packet32 *)ioc;
2078                                         temp_convert =
2079                                             PTRIN(ioc32->mfi_sgl[i].iov_base);
2080                                         error = copyin(temp_convert,
2081                                                temp,
2082                                                ioc32->mfi_sgl[i].iov_len);
2083                                 }
2084 #else
2085                                 error = copyin(ioc->mfi_sgl[i].iov_base,
2086                                        temp,
2087                                        ioc->mfi_sgl[i].iov_len);
2088 #endif
2089                                 if (error != 0) {
2090                                         device_printf(sc->mfi_dev,
2091                                             "Copy in failed\n");
2092                                         goto out;
2093                                 }
2094                                 temp = &temp[ioc->mfi_sgl[i].iov_len];
2095                         }
2096                 }
2097
2098                 if (cm->cm_frame->header.cmd == MFI_CMD_DCMD)
2099                         locked = mfi_config_lock(sc, cm->cm_frame->dcmd.opcode);
2100
2101                 if (cm->cm_frame->header.cmd == MFI_CMD_PD_SCSI_IO) {
2102                         cm->cm_frame->pass.sense_addr_lo = cm->cm_sense_busaddr;
2103                         cm->cm_frame->pass.sense_addr_hi = 0;
2104                 }
2105
2106                 lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
2107                 error = mfi_check_command_pre(sc, cm);
2108                 if (error) {
2109                         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2110                         goto out;
2111                 }
2112
2113                 if ((error = mfi_wait_command(sc, cm)) != 0) {
2114                         device_printf(sc->mfi_dev,
2115                             "Controller polled failed\n");
2116                         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2117                         goto out;
2118                 }
2119
2120                 mfi_check_command_post(sc, cm);
2121                 lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2122
2123                 temp = data;
2124                 if (cm->cm_flags & MFI_CMD_DATAIN) {
2125                         for (i = 0; i < ioc->mfi_sge_count; i++) {
2126 #ifdef __x86_64__
2127                                 if (cmd == MFI_CMD) {
2128                                         /* Native */
2129                                         error = copyout(temp,
2130                                                 ioc->mfi_sgl[i].iov_base,
2131                                                 ioc->mfi_sgl[i].iov_len);
2132                                 } else {
2133                                         void *temp_convert;
2134                                         /* 32bit */
2135                                         ioc32 = (struct mfi_ioc_packet32 *)ioc;
2136                                         temp_convert =
2137                                             PTRIN(ioc32->mfi_sgl[i].iov_base);
2138                                         error = copyout(temp,
2139                                                 temp_convert,
2140                                                 ioc32->mfi_sgl[i].iov_len);
2141                                 }
2142 #else
2143                                 error = copyout(temp,
2144                                         ioc->mfi_sgl[i].iov_base,
2145                                         ioc->mfi_sgl[i].iov_len);
2146 #endif
2147                                 if (error != 0) {
2148                                         device_printf(sc->mfi_dev,
2149                                             "Copy out failed\n");
2150                                         goto out;
2151                                 }
2152                                 temp = &temp[ioc->mfi_sgl[i].iov_len];
2153                         }
2154                 }
2155
2156                 if (ioc->mfi_sense_len) {
2157                         /* get user-space sense ptr then copy out sense */
2158                         bcopy(&((struct mfi_ioc_packet*)arg)
2159                             ->mfi_frame.raw[ioc->mfi_sense_off],
2160                             &sense_ptr.sense_ptr_data[0],
2161                             sizeof(sense_ptr.sense_ptr_data));
2162 #ifdef __x86_64__
2163                         if (cmd != MFI_CMD) {
2164                                 /*
2165                                  * not 64bit native so zero out any address
2166                                  * over 32bit */
2167                                 sense_ptr.addr.high = 0;
2168                         }
2169 #endif
2170                         error = copyout(cm->cm_sense, sense_ptr.user_space,
2171                             ioc->mfi_sense_len);
2172                         if (error != 0) {
2173                                 device_printf(sc->mfi_dev,
2174                                     "Copy out failed\n");
2175                                 goto out;
2176                         }
2177                 }
2178
2179                 ioc->mfi_frame.hdr.cmd_status = cm->cm_frame->header.cmd_status;
2180 out:
2181                 mfi_config_unlock(sc, locked);
2182                 if (data)
2183                         kfree(data, M_MFIBUF);
2184                 if (cm) {
2185                         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
2186                         mfi_release_command(cm);
2187                         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2188                 }
2189
2190                 break;
2191                 }
2192         case MFI_SET_AEN:
2193                 aen = (struct mfi_ioc_aen *)arg;
2194                 error = mfi_aen_register(sc, aen->aen_seq_num,
2195                     aen->aen_class_locale);
2196
2197                 break;
2198         case MFI_LINUX_CMD_2: /* Firmware Linux ioctl shim */
2199                 {
2200                         devclass_t devclass;
2201                         struct mfi_linux_ioc_packet l_ioc;
2202                         int adapter;
2203
2204                         devclass = devclass_find("mfi");
2205                         if (devclass == NULL)
2206                                 return (ENOENT);
2207
2208                         error = copyin(arg, &l_ioc, sizeof(l_ioc));
2209                         if (error)
2210                                 return (error);
2211                         adapter = l_ioc.lioc_adapter_no;
2212                         sc = devclass_get_softc(devclass, adapter);
2213                         if (sc == NULL)
2214                                 return (ENOENT);
2215                         return (mfi_linux_ioctl_int(sc->mfi_cdev,
2216                             cmd, arg, flag));
2217                         break;
2218                 }
2219         case MFI_LINUX_SET_AEN_2: /* AEN Linux ioctl shim */
2220                 {
2221                         devclass_t devclass;
2222                         struct mfi_linux_ioc_aen l_aen;
2223                         int adapter;
2224
2225                         devclass = devclass_find("mfi");
2226                         if (devclass == NULL)
2227                                 return (ENOENT);
2228
2229                         error = copyin(arg, &l_aen, sizeof(l_aen));
2230                         if (error)
2231                                 return (error);
2232                         adapter = l_aen.laen_adapter_no;
2233                         sc = devclass_get_softc(devclass, adapter);
2234                         if (sc == NULL)
2235                                 return (ENOENT);
2236                         return (mfi_linux_ioctl_int(sc->mfi_cdev,
2237                             cmd, arg, flag));
2238                         break;
2239                 }
2240 #ifdef __x86_64__
2241         case MFIIO_PASSTHRU32:
2242                 iop_swab.ioc_frame      = iop32->ioc_frame;
2243                 iop_swab.buf_size       = iop32->buf_size;
2244                 iop_swab.buf            = PTRIN(iop32->buf);
2245                 iop                     = &iop_swab;
2246                 /* FALLTHROUGH */
2247 #endif
2248         case MFIIO_PASSTHRU:
2249                 error = mfi_user_command(sc, iop);
2250 #ifdef __x86_64__
2251                 if (cmd == MFIIO_PASSTHRU32)
2252                         iop32->ioc_frame = iop_swab.ioc_frame;
2253 #endif
2254                 break;
2255         default:
2256                 device_printf(sc->mfi_dev, "IOCTL 0x%lx not handled\n", cmd);
2257                 error = ENOENT;
2258                 break;
2259         }
2260
2261         return (error);
2262 }
2263
2264 static int
2265 mfi_linux_ioctl_int(struct cdev *dev, u_long cmd, caddr_t arg, int flag)
2266 {
2267         struct mfi_softc *sc;
2268         struct mfi_linux_ioc_packet l_ioc;
2269         struct mfi_linux_ioc_aen l_aen;
2270         struct mfi_command *cm = NULL;
2271         struct mfi_aen *mfi_aen_entry;
2272         union mfi_sense_ptr sense_ptr;
2273         uint32_t context;
2274         uint8_t *data = NULL, *temp;
2275         int i;
2276         int error, locked;
2277
2278         sc = dev->si_drv1;
2279         error = 0;
2280         switch (cmd) {
2281         case MFI_LINUX_CMD_2: /* Firmware Linux ioctl shim */
2282                 error = copyin(arg, &l_ioc, sizeof(l_ioc));
2283                 if (error != 0)
2284                         return (error);
2285
2286                 if (l_ioc.lioc_sge_count > MAX_LINUX_IOCTL_SGE) {
2287                         return (EINVAL);
2288                 }
2289
2290                 lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
2291                 if ((cm = mfi_dequeue_free(sc)) == NULL) {
2292                         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2293                         return (EBUSY);
2294                 }
2295                 lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2296                 locked = 0;
2297
2298                 /*
2299                  * save off original context since copying from user
2300                  * will clobber some data
2301                  */
2302                 context = cm->cm_frame->header.context;
2303
2304                 bcopy(l_ioc.lioc_frame.raw, cm->cm_frame,
2305                       2 * MFI_DCMD_FRAME_SIZE); /* this isn't quite right */
2306                 cm->cm_total_frame_size = (sizeof(union mfi_sgl)
2307                       * l_ioc.lioc_sge_count) + l_ioc.lioc_sgl_off;
2308                 if (l_ioc.lioc_sge_count)
2309                         cm->cm_sg =
2310                             (union mfi_sgl *)&cm->cm_frame->bytes[l_ioc.lioc_sgl_off];
2311                 cm->cm_flags = 0;
2312                 if (cm->cm_frame->header.flags & MFI_FRAME_DATAIN)
2313                         cm->cm_flags |= MFI_CMD_DATAIN;
2314                 if (cm->cm_frame->header.flags & MFI_FRAME_DATAOUT)
2315                         cm->cm_flags |= MFI_CMD_DATAOUT;
2316                 cm->cm_len = cm->cm_frame->header.data_len;
2317                 if (cm->cm_len &&
2318                       (cm->cm_flags & (MFI_CMD_DATAIN | MFI_CMD_DATAOUT))) {
2319                         cm->cm_data = data = kmalloc(cm->cm_len, M_MFIBUF,
2320                             M_WAITOK | M_ZERO);
2321                         if (cm->cm_data == NULL) {
2322                                 device_printf(sc->mfi_dev, "Malloc failed\n");
2323                                 goto out;
2324                         }
2325                 } else {
2326                         cm->cm_data = 0;
2327                 }
2328
2329                 /* restore header context */
2330                 cm->cm_frame->header.context = context;
2331
2332                 temp = data;
2333                 if (cm->cm_flags & MFI_CMD_DATAOUT) {
2334                         for (i = 0; i < l_ioc.lioc_sge_count; i++) {
2335                                 error = copyin(PTRIN(l_ioc.lioc_sgl[i].iov_base),
2336                                        temp,
2337                                        l_ioc.lioc_sgl[i].iov_len);
2338                                 if (error != 0) {
2339                                         device_printf(sc->mfi_dev,
2340                                             "Copy in failed\n");
2341                                         goto out;
2342                                 }
2343                                 temp = &temp[l_ioc.lioc_sgl[i].iov_len];
2344                         }
2345                 }
2346
2347                 if (cm->cm_frame->header.cmd == MFI_CMD_DCMD)
2348                         locked = mfi_config_lock(sc, cm->cm_frame->dcmd.opcode);
2349
2350                 if (cm->cm_frame->header.cmd == MFI_CMD_PD_SCSI_IO) {
2351                         cm->cm_frame->pass.sense_addr_lo = cm->cm_sense_busaddr;
2352                         cm->cm_frame->pass.sense_addr_hi = 0;
2353                 }
2354
2355                 lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
2356                 error = mfi_check_command_pre(sc, cm);
2357                 if (error) {
2358                         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2359                         goto out;
2360                 }
2361
2362                 if ((error = mfi_wait_command(sc, cm)) != 0) {
2363                         device_printf(sc->mfi_dev,
2364                             "Controller polled failed\n");
2365                         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2366                         goto out;
2367                 }
2368
2369                 mfi_check_command_post(sc, cm);
2370                 lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2371
2372                 temp = data;
2373                 if (cm->cm_flags & MFI_CMD_DATAIN) {
2374                         for (i = 0; i < l_ioc.lioc_sge_count; i++) {
2375                                 error = copyout(temp,
2376                                         PTRIN(l_ioc.lioc_sgl[i].iov_base),
2377                                         l_ioc.lioc_sgl[i].iov_len);
2378                                 if (error != 0) {
2379                                         device_printf(sc->mfi_dev,
2380                                             "Copy out failed\n");
2381                                         goto out;
2382                                 }
2383                                 temp = &temp[l_ioc.lioc_sgl[i].iov_len];
2384                         }
2385                 }
2386
2387                 if (l_ioc.lioc_sense_len) {
2388                         /* get user-space sense ptr then copy out sense */
2389                         bcopy(&((struct mfi_linux_ioc_packet*)arg)
2390                             ->lioc_frame.raw[l_ioc.lioc_sense_off],
2391                             &sense_ptr.sense_ptr_data[0],
2392                             sizeof(sense_ptr.sense_ptr_data));
2393 #ifdef __x86_64__
2394                         /*
2395                          * only 32bit Linux support so zero out any
2396                          * address over 32bit
2397                          */
2398                         sense_ptr.addr.high = 0;
2399 #endif
2400                         error = copyout(cm->cm_sense, sense_ptr.user_space,
2401                             l_ioc.lioc_sense_len);
2402                         if (error != 0) {
2403                                 device_printf(sc->mfi_dev,
2404                                     "Copy out failed\n");
2405                                 goto out;
2406                         }
2407                 }
2408
2409                 error = copyout(&cm->cm_frame->header.cmd_status,
2410                         &((struct mfi_linux_ioc_packet*)arg)
2411                         ->lioc_frame.hdr.cmd_status,
2412                         1);
2413                 if (error != 0) {
2414                         device_printf(sc->mfi_dev,
2415                                       "Copy out failed\n");
2416                         goto out;
2417                 }
2418
2419 out:
2420                 mfi_config_unlock(sc, locked);
2421                 if (data)
2422                         kfree(data, M_MFIBUF);
2423                 if (cm) {
2424                         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
2425                         mfi_release_command(cm);
2426                         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2427                 }
2428
2429                 return (error);
2430         case MFI_LINUX_SET_AEN_2: /* AEN Linux ioctl shim */
2431                 error = copyin(arg, &l_aen, sizeof(l_aen));
2432                 if (error != 0)
2433                         return (error);
2434                 kprintf("AEN IMPLEMENTED for pid %d\n", curproc->p_pid);
2435                 mfi_aen_entry = kmalloc(sizeof(struct mfi_aen), M_MFIBUF,
2436                     M_WAITOK);
2437                 lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
2438                 if (mfi_aen_entry != NULL) {
2439                         mfi_aen_entry->p = curproc;
2440                         TAILQ_INSERT_TAIL(&sc->mfi_aen_pids, mfi_aen_entry,
2441                             aen_link);
2442                 }
2443                 error = mfi_aen_register(sc, l_aen.laen_seq_num,
2444                     l_aen.laen_class_locale);
2445
2446                 if (error != 0) {
2447                         TAILQ_REMOVE(&sc->mfi_aen_pids, mfi_aen_entry,
2448                             aen_link);
2449                         kfree(mfi_aen_entry, M_MFIBUF);
2450                 }
2451                 lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2452
2453                 return (error);
2454         default:
2455                 device_printf(sc->mfi_dev, "IOCTL 0x%lx not handled\n", cmd);
2456                 error = ENOENT;
2457                 break;
2458         }
2459
2460         return (error);
2461 }
2462
2463 static int
2464 mfi_kqfilter(struct dev_kqfilter_args *ap)
2465 {
2466         cdev_t dev = ap->a_head.a_dev;
2467         struct knote *kn = ap->a_kn;
2468         struct mfi_softc *sc;
2469         struct klist *klist;
2470
2471         ap->a_result = 0;
2472         sc = dev->si_drv1;
2473
2474         switch (kn->kn_filter) {
2475         case EVFILT_READ:
2476                 kn->kn_fop = &mfi_read_filterops;
2477                 kn->kn_hook = (caddr_t)sc;
2478                 break;
2479         case EVFILT_WRITE:
2480                 kn->kn_fop = &mfi_write_filterops;
2481                 kn->kn_hook = (caddr_t)sc;
2482                 break;
2483         default:
2484                 ap->a_result = EOPNOTSUPP;
2485                 return (0);
2486         }
2487
2488         klist = &sc->mfi_kq.ki_note;
2489         knote_insert(klist, kn);
2490
2491         return(0);
2492 }
2493
2494 static void
2495 mfi_filter_detach(struct knote *kn)
2496 {
2497         struct mfi_softc *sc = (struct mfi_softc *)kn->kn_hook;
2498         struct klist *klist = &sc->mfi_kq.ki_note;
2499
2500         knote_remove(klist, kn);
2501 }
2502
2503 static int
2504 mfi_filter_read(struct knote *kn, long hint)
2505 {
2506         struct mfi_softc *sc = (struct mfi_softc *)kn->kn_hook;
2507         int ready = 0;
2508
2509         if (sc->mfi_aen_triggered != 0) {
2510                 ready = 1;
2511                 sc->mfi_aen_triggered = 0;
2512         }
2513         if (sc->mfi_aen_triggered == 0 && sc->mfi_aen_cm == NULL)
2514                 kn->kn_flags |= EV_ERROR;
2515
2516         if (ready == 0)
2517                 sc->mfi_poll_waiting = 1;
2518
2519         return (ready);
2520 }
2521
2522 static int
2523 mfi_filter_write(struct knote *kn, long hint)
2524 {
2525         return (0);
2526 }
2527
2528 static void
2529 mfi_dump_all(void)
2530 {
2531         struct mfi_softc *sc;
2532         struct mfi_command *cm;
2533         devclass_t dc;
2534         time_t deadline;
2535         int timedout;
2536         int i;
2537
2538         dc = devclass_find("mfi");
2539         if (dc == NULL) {
2540                 kprintf("No mfi dev class\n");
2541                 return;
2542         }
2543
2544         for (i = 0; ; i++) {
2545                 sc = devclass_get_softc(dc, i);
2546                 if (sc == NULL)
2547                         break;
2548                 device_printf(sc->mfi_dev, "Dumping\n\n");
2549                 timedout = 0;
2550                 deadline = time_second - MFI_CMD_TIMEOUT;
2551                 lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
2552                 TAILQ_FOREACH(cm, &sc->mfi_busy, cm_link) {
2553                         if (cm->cm_timestamp < deadline) {
2554                                 device_printf(sc->mfi_dev,
2555                                     "COMMAND %p TIMEOUT AFTER %d SECONDS\n", cm,
2556                                     (int)(time_second - cm->cm_timestamp));
2557                                 MFI_PRINT_CMD(cm);
2558                                 timedout++;
2559                         }
2560                 }
2561
2562 #if 0
2563                 if (timedout)
2564                         MFI_DUMP_CMDS(SC);
2565 #endif
2566
2567                 lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2568         }
2569
2570         return;
2571 }
2572
2573 static void
2574 mfi_timeout(void *data)
2575 {
2576         struct mfi_softc *sc = (struct mfi_softc *)data;
2577         struct mfi_command *cm;
2578         time_t deadline;
2579         int timedout = 0;
2580
2581         deadline = time_second - MFI_CMD_TIMEOUT;
2582         lockmgr(&sc->mfi_io_lock, LK_EXCLUSIVE);
2583         TAILQ_FOREACH(cm, &sc->mfi_busy, cm_link) {
2584                 if (sc->mfi_aen_cm == cm)
2585                         continue;
2586                 if ((sc->mfi_aen_cm != cm) && (cm->cm_timestamp < deadline)) {
2587                         device_printf(sc->mfi_dev,
2588                             "COMMAND %p TIMEOUT AFTER %d SECONDS\n", cm,
2589                             (int)(time_second - cm->cm_timestamp));
2590                         MFI_PRINT_CMD(cm);
2591                         MFI_VALIDATE_CMD(sc, cm);
2592                         timedout++;
2593                 }
2594         }
2595
2596 #if 0
2597         if (timedout)
2598                 MFI_DUMP_CMDS(SC);
2599 #endif
2600
2601         lockmgr(&sc->mfi_io_lock, LK_RELEASE);
2602
2603         callout_reset(&sc->mfi_watchdog_callout, MFI_CMD_TIMEOUT * hz,
2604             mfi_timeout, sc);
2605
2606         if (0)
2607                 mfi_dump_all();
2608         return;
2609 }