kernel/nataraid: Fix a panic upon booting with a degraded Intel RAID.
[dragonfly.git] / sys / dev / disk / nata / ata-raid.c
1 /*-
2  * Copyright (c) 2000 - 2006 Søren Schmidt <sos@FreeBSD.org>
3  * All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  * 1. Redistributions of source code must retain the above copyright
9  *    notice, this list of conditions and the following disclaimer,
10  *    without modification, immediately at the beginning of the file.
11  * 2. Redistributions in binary form must reproduce the above copyright
12  *    notice, this list of conditions and the following disclaimer in the
13  *    documentation and/or other materials provided with the distribution.
14  *
15  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR ``AS IS'' AND ANY EXPRESS OR
16  * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
17  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
18  * IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR ANY DIRECT, INDIRECT,
19  * INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT
20  * NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
21  * DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
22  * THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
23  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
24  * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
25  *
26  * $FreeBSD: src/sys/dev/ata/ata-raid.c,v 1.120 2006/04/15 10:27:41 maxim Exp $
27  */
28
29 #include "opt_ata.h"
30
31 #include <sys/param.h>
32 #include <sys/bio.h>
33 #include <sys/buf.h>
34 #include <sys/buf2.h>
35 #include <sys/bus.h>
36 #include <sys/conf.h>
37 #include <sys/device.h>
38 #include <sys/devicestat.h>
39 #include <sys/disk.h>
40 #include <sys/endian.h>
41 #include <sys/libkern.h>
42 #include <sys/malloc.h>
43 #include <sys/module.h>
44 #include <sys/nata.h>
45 #include <sys/spinlock2.h>
46 #include <sys/systm.h>
47
48 #include <vm/pmap.h>
49
50 #include <machine/md_var.h>
51
52 #include <bus/pci/pcivar.h>
53
54 #include "ata-all.h"
55 #include "ata-disk.h"
56 #include "ata-raid.h"
57 #include "ata-pci.h"
58 #include "ata_if.h"
59
60
61 /* device structure */
62 static  d_strategy_t    ata_raid_strategy;
63 static  d_dump_t        ata_raid_dump;
64 static struct dev_ops ar_ops = {
65         { "ar", 0, D_DISK },
66         .d_open =       nullopen,
67         .d_close =      nullclose,
68         .d_read =       physread,
69         .d_write =      physwrite,
70         .d_strategy =   ata_raid_strategy,
71         .d_dump =       ata_raid_dump,
72 };
73
74 /* prototypes */
75 static void ata_raid_done(struct ata_request *request);
76 static void ata_raid_config_changed(struct ar_softc *rdp, int writeback);
77 static int ata_raid_status(struct ata_ioc_raid_config *config);
78 static int ata_raid_create(struct ata_ioc_raid_config *config);
79 static int ata_raid_delete(int array);
80 static int ata_raid_addspare(struct ata_ioc_raid_config *config);
81 static int ata_raid_rebuild(int array);
82 static int ata_raid_read_metadata(device_t subdisk);
83 static int ata_raid_write_metadata(struct ar_softc *rdp);
84 static int ata_raid_wipe_metadata(struct ar_softc *rdp);
85 static int ata_raid_adaptec_read_meta(device_t dev, struct ar_softc **raidp);
86 static int ata_raid_hptv2_read_meta(device_t dev, struct ar_softc **raidp);
87 static int ata_raid_hptv2_write_meta(struct ar_softc *rdp);
88 static int ata_raid_hptv3_read_meta(device_t dev, struct ar_softc **raidp);
89 static int ata_raid_intel_read_meta(device_t dev, struct ar_softc **raidp);
90 static int ata_raid_intel_write_meta(struct ar_softc *rdp);
91 static int ata_raid_ite_read_meta(device_t dev, struct ar_softc **raidp);
92 static int ata_raid_jmicron_read_meta(device_t dev, struct ar_softc **raidp);
93 static int ata_raid_jmicron_write_meta(struct ar_softc *rdp);
94 static int ata_raid_lsiv2_read_meta(device_t dev, struct ar_softc **raidp);
95 static int ata_raid_lsiv3_read_meta(device_t dev, struct ar_softc **raidp);
96 static int ata_raid_nvidia_read_meta(device_t dev, struct ar_softc **raidp);
97 static int ata_raid_promise_read_meta(device_t dev, struct ar_softc **raidp, int native);
98 static int ata_raid_promise_write_meta(struct ar_softc *rdp);
99 static int ata_raid_sii_read_meta(device_t dev, struct ar_softc **raidp);
100 static int ata_raid_sis_read_meta(device_t dev, struct ar_softc **raidp);
101 static int ata_raid_sis_write_meta(struct ar_softc *rdp);
102 static int ata_raid_via_read_meta(device_t dev, struct ar_softc **raidp);
103 static int ata_raid_via_write_meta(struct ar_softc *rdp);
104 static struct ata_request *ata_raid_init_request(struct ar_softc *rdp, struct bio *bio);
105 static int ata_raid_send_request(struct ata_request *request);
106 static int ata_raid_rw(device_t dev, u_int64_t lba, void *data, u_int bcount, int flags);
107 static char * ata_raid_format(struct ar_softc *rdp);
108 static char * ata_raid_type(struct ar_softc *rdp);
109 static char * ata_raid_flags(struct ar_softc *rdp);
110
111 /* debugging only */
112 static void ata_raid_print_meta(struct ar_softc *meta);
113 static void ata_raid_adaptec_print_meta(struct adaptec_raid_conf *meta);
114 static void ata_raid_hptv2_print_meta(struct hptv2_raid_conf *meta);
115 static void ata_raid_hptv3_print_meta(struct hptv3_raid_conf *meta);
116 static void ata_raid_intel_print_meta(struct intel_raid_conf *meta);
117 static void ata_raid_ite_print_meta(struct ite_raid_conf *meta);
118 static void ata_raid_jmicron_print_meta(struct jmicron_raid_conf *meta);
119 static void ata_raid_lsiv2_print_meta(struct lsiv2_raid_conf *meta);
120 static void ata_raid_lsiv3_print_meta(struct lsiv3_raid_conf *meta);
121 static void ata_raid_nvidia_print_meta(struct nvidia_raid_conf *meta);
122 static void ata_raid_promise_print_meta(struct promise_raid_conf *meta);
123 static void ata_raid_sii_print_meta(struct sii_raid_conf *meta);
124 static void ata_raid_sis_print_meta(struct sis_raid_conf *meta);
125 static void ata_raid_via_print_meta(struct via_raid_conf *meta);
126
127 /* internal vars */   
128 static struct ar_softc *ata_raid_arrays[MAX_ARRAYS];
129 static MALLOC_DEFINE(M_AR, "ar_driver", "ATA PseudoRAID driver");
130 static devclass_t ata_raid_sub_devclass;
131 static int testing = 0;
132
133 static void
134 ata_raid_attach(struct ar_softc *rdp, int writeback)
135 {
136     struct disk_info info;
137     cdev_t cdev;
138     char buffer[32];
139     int disk;
140
141     spin_init(&rdp->lock);
142     ata_raid_config_changed(rdp, writeback);
143
144     /* sanitize arrays total_size % (width * interleave) == 0 */
145     if (rdp->type == AR_T_RAID0 || rdp->type == AR_T_RAID01 ||
146         rdp->type == AR_T_RAID5) {
147         rdp->total_sectors = (rdp->total_sectors/(rdp->interleave*rdp->width))*
148                              (rdp->interleave * rdp->width);
149         ksprintf(buffer, " (stripe %d KB)",
150                 (rdp->interleave * DEV_BSIZE) / 1024);
151     }
152     else
153         buffer[0] = '\0';
154
155     devstat_add_entry(&rdp->devstat, "ar", rdp->lun,
156         DEV_BSIZE, DEVSTAT_NO_ORDERED_TAGS,
157         DEVSTAT_TYPE_STORARRAY | DEVSTAT_TYPE_IF_OTHER,
158         DEVSTAT_PRIORITY_ARRAY);
159
160     cdev = disk_create(rdp->lun, &rdp->disk, &ar_ops);
161     cdev->si_drv1 = rdp;
162     cdev->si_iosize_max = 128 * DEV_BSIZE;
163     rdp->cdev = cdev;
164
165     bzero(&info, sizeof(info));
166     info.d_media_blksize = DEV_BSIZE;           /* mandatory */
167     info.d_media_blocks = rdp->total_sectors;
168
169     info.d_secpertrack = rdp->sectors;          /* optional */
170     info.d_nheads = rdp->heads;
171     info.d_ncylinders = rdp->total_sectors/(rdp->heads*rdp->sectors);
172     info.d_secpercyl = rdp->sectors * rdp->heads;
173
174     kprintf("ar%d: %juMB <%s %s%s> status: %s\n", rdp->lun,
175            rdp->total_sectors / ((1024L * 1024L) / DEV_BSIZE),
176            ata_raid_format(rdp), ata_raid_type(rdp),
177            buffer, ata_raid_flags(rdp));
178
179     if (testing || bootverbose)
180         kprintf("ar%d: %ju sectors [%dC/%dH/%dS] <%s> subdisks defined as:\n",
181                rdp->lun, rdp->total_sectors,
182                rdp->cylinders, rdp->heads, rdp->sectors, rdp->name);
183
184     for (disk = 0; disk < rdp->total_disks; disk++) {
185         kprintf("ar%d: disk%d ", rdp->lun, disk);
186         if (rdp->disks[disk].dev) {
187             if (rdp->disks[disk].flags & AR_DF_PRESENT) {
188                 /* status of this disk in the array */
189                 if (rdp->disks[disk].flags & AR_DF_ONLINE)
190                     kprintf("READY ");
191                 else if (rdp->disks[disk].flags & AR_DF_SPARE)
192                     kprintf("SPARE ");
193                 else
194                     kprintf("FREE  ");
195
196                 /* what type of disk is this in the array */
197                 switch (rdp->type) {
198                 case AR_T_RAID1:
199                 case AR_T_RAID01:
200                     if (disk < rdp->width)
201                         kprintf("(master) ");
202                     else
203                         kprintf("(mirror) ");
204                 }
205                 
206                 /* which physical disk is used */
207                 kprintf("using %s at ata%d-%s\n",
208                        device_get_nameunit(rdp->disks[disk].dev),
209                        device_get_unit(device_get_parent(rdp->disks[disk].dev)),
210                        (((struct ata_device *)
211                          device_get_softc(rdp->disks[disk].dev))->unit == 
212                          ATA_MASTER) ? "master" : "slave");
213             }
214             else if (rdp->disks[disk].flags & AR_DF_ASSIGNED)
215                 kprintf("DOWN\n");
216             else
217                 kprintf("INVALID no RAID config on this subdisk\n");
218         }
219         else
220             kprintf("DOWN no device found for this subdisk\n");
221     }
222
223     disk_setdiskinfo(&rdp->disk, &info);
224 }
225
226 /*
227  * ATA PseudoRAID ioctl function. Note that this does not need to be adjusted
228  * to the dev_ops way, because it's just chained from the generic ata ioctl.
229  */
230 static int
231 ata_raid_ioctl(u_long cmd, caddr_t data)
232 {
233     struct ata_ioc_raid_config *config = (struct ata_ioc_raid_config *)data;
234     int *lun = (int *)data;
235     int error = EOPNOTSUPP;
236
237     switch (cmd) {
238     case IOCATARAIDSTATUS:
239         error = ata_raid_status(config);
240         break;
241                         
242     case IOCATARAIDCREATE:
243         error = ata_raid_create(config);
244         break;
245          
246     case IOCATARAIDDELETE:
247         error = ata_raid_delete(*lun);
248         break;
249      
250     case IOCATARAIDADDSPARE:
251         error = ata_raid_addspare(config);
252         break;
253                             
254     case IOCATARAIDREBUILD:
255         error = ata_raid_rebuild(*lun);
256         break;
257     }
258     return error;
259 }
260
261 static int
262 ata_raid_flush(struct ar_softc *rdp, struct bio *bp)
263 {
264     struct ata_request *request;
265     device_t dev;
266     int disk;
267
268     bp->bio_driver_info = NULL;
269
270     for (disk = 0; disk < rdp->total_disks; disk++) {
271         if ((dev = rdp->disks[disk].dev) != NULL)
272             bp->bio_driver_info = (void *)((intptr_t)bp->bio_driver_info + 1);
273     }
274     for (disk = 0; disk < rdp->total_disks; disk++) {
275         if ((dev = rdp->disks[disk].dev) == NULL)
276             continue;
277         if (!(request = ata_raid_init_request(rdp, bp)))
278             return ENOMEM;
279         request->dev = dev;
280         request->u.ata.command = ATA_FLUSHCACHE;
281         request->u.ata.lba = 0;
282         request->u.ata.count = 0;
283         request->u.ata.feature = 0;
284         request->timeout = 1;
285         request->retries = 0;
286         request->flags |= ATA_R_ORDERED | ATA_R_DIRECT;
287         ata_queue_request(request);
288     }
289     return 0;
290 }
291
292 /*
293  * XXX TGEN there are a lot of offset -> block number conversions going on
294  * here, which is suboptimal.
295  */
296 static int
297 ata_raid_strategy(struct dev_strategy_args *ap)
298 {
299     struct ar_softc *rdp = ap->a_head.a_dev->si_drv1;
300     struct bio *bp = ap->a_bio;
301     struct buf *bbp = bp->bio_buf;
302     struct ata_request *request;
303     caddr_t data;
304     u_int64_t blkno, lba, blk = 0;
305     int count, chunk, drv, par = 0, change = 0;
306
307     if (bbp->b_cmd == BUF_CMD_FLUSH) {
308         int error;
309
310         error = ata_raid_flush(rdp, bp);
311         if (error != 0) {
312                 bbp->b_flags |= B_ERROR;
313                 bbp->b_error = error;
314                 biodone(bp);
315         }
316         return(0);
317     }
318
319     if (!(rdp->status & AR_S_READY) ||
320         (bbp->b_cmd != BUF_CMD_READ && bbp->b_cmd != BUF_CMD_WRITE)) {
321         bbp->b_flags |= B_ERROR;
322         bbp->b_error = EIO;
323         biodone(bp);
324         return(0);
325     }
326
327     bbp->b_resid = bbp->b_bcount;
328     for (count = howmany(bbp->b_bcount, DEV_BSIZE),
329          /* bio_offset is byte granularity, convert */
330          blkno = (u_int64_t)(bp->bio_offset >> DEV_BSHIFT),
331          data = bbp->b_data;
332          count > 0; 
333          count -= chunk, blkno += chunk, data += (chunk * DEV_BSIZE)) {
334
335         switch (rdp->type) {
336         case AR_T_RAID1:
337             drv = 0;
338             lba = blkno;
339             chunk = count;
340             break;
341         
342         case AR_T_JBOD:
343         case AR_T_SPAN:
344             drv = 0;
345             lba = blkno;
346             while (lba >= rdp->disks[drv].sectors)
347                 lba -= rdp->disks[drv++].sectors;
348             chunk = min(rdp->disks[drv].sectors - lba, count);
349             break;
350         
351         case AR_T_RAID0:
352         case AR_T_RAID01:
353             chunk = blkno % rdp->interleave;
354             drv = (blkno / rdp->interleave) % rdp->width;
355             lba = (((blkno/rdp->interleave)/rdp->width)*rdp->interleave)+chunk;
356             chunk = min(count, rdp->interleave - chunk);
357             break;
358
359         case AR_T_RAID5:
360             drv = (blkno / rdp->interleave) % (rdp->width - 1);
361             par = rdp->width - 1 - 
362                   (blkno / (rdp->interleave * (rdp->width - 1))) % rdp->width;
363             if (drv >= par)
364                 drv++;
365             lba = ((blkno/rdp->interleave)/(rdp->width-1))*(rdp->interleave) +
366                   ((blkno%(rdp->interleave*(rdp->width-1)))%rdp->interleave);
367             chunk = min(count, rdp->interleave - (lba % rdp->interleave));
368             break;
369
370         default:
371             kprintf("ar%d: unknown array type in ata_raid_strategy\n", rdp->lun);
372             bbp->b_flags |= B_ERROR;
373             bbp->b_error = EIO;
374             biodone(bp);
375             return(0);
376         }
377          
378         /* offset on all but "first on HPTv2" */
379         if (!(drv == 0 && rdp->format == AR_F_HPTV2_RAID))
380             lba += rdp->offset_sectors;
381
382         if (!(request = ata_raid_init_request(rdp, bp))) {
383             bbp->b_flags |= B_ERROR;
384             bbp->b_error = EIO;
385             biodone(bp);
386             return(0);
387         }
388         request->data = data;
389         request->bytecount = chunk * DEV_BSIZE;
390         request->u.ata.lba = lba;
391         request->u.ata.count = request->bytecount / DEV_BSIZE;
392             
393         devstat_start_transaction(&rdp->devstat);
394         switch (rdp->type) {
395         case AR_T_JBOD:
396         case AR_T_SPAN:
397         case AR_T_RAID0:
398             if (((rdp->disks[drv].flags & (AR_DF_PRESENT|AR_DF_ONLINE)) ==
399                  (AR_DF_PRESENT|AR_DF_ONLINE) && !rdp->disks[drv].dev)) {
400                 rdp->disks[drv].flags &= ~AR_DF_ONLINE;
401                 ata_raid_config_changed(rdp, 1);
402                 ata_free_request(request);
403                 bbp->b_flags |= B_ERROR;
404                 bbp->b_error = EIO;
405                 biodone(bp);
406                 return(0);
407             }
408             request->this = drv;
409             request->dev = rdp->disks[request->this].dev;
410             ata_raid_send_request(request);
411             break;
412
413         case AR_T_RAID1:
414         case AR_T_RAID01:
415             if ((rdp->disks[drv].flags &
416                  (AR_DF_PRESENT|AR_DF_ONLINE))==(AR_DF_PRESENT|AR_DF_ONLINE) &&
417                 !rdp->disks[drv].dev) {
418                 rdp->disks[drv].flags &= ~AR_DF_ONLINE;
419                 change = 1;
420             }
421             if ((rdp->disks[drv + rdp->width].flags &
422                  (AR_DF_PRESENT|AR_DF_ONLINE))==(AR_DF_PRESENT|AR_DF_ONLINE) &&
423                 !rdp->disks[drv + rdp->width].dev) {
424                 rdp->disks[drv + rdp->width].flags &= ~AR_DF_ONLINE;
425                 change = 1;
426             }
427             if (change)
428                 ata_raid_config_changed(rdp, 1);
429             if (!(rdp->status & AR_S_READY)) {
430                 ata_free_request(request);
431                 bbp->b_flags |= B_ERROR;
432                 bbp->b_error = EIO;
433                 biodone(bp);
434                 return(0);
435             }
436
437             if (rdp->status & AR_S_REBUILDING)
438                 blk = ((lba / rdp->interleave) * rdp->width) * rdp->interleave +
439                       (rdp->interleave * (drv % rdp->width)) +
440                       lba % rdp->interleave;
441
442             if (bbp->b_cmd == BUF_CMD_READ) {
443                 int src_online =
444                     (rdp->disks[drv].flags & AR_DF_ONLINE);
445                 int mir_online =
446                     (rdp->disks[drv+rdp->width].flags & AR_DF_ONLINE);
447
448                 /* if mirror gone or close to last access on source */
449                 if (!mir_online || 
450                     ((src_online) &&
451                      ((u_int64_t)(bp->bio_offset >> DEV_BSHIFT)) >=
452                         (rdp->disks[drv].last_lba - AR_PROXIMITY) &&
453                      ((u_int64_t)(bp->bio_offset >> DEV_BSHIFT)) <=
454                         (rdp->disks[drv].last_lba + AR_PROXIMITY))) {
455                     rdp->toggle = 0;
456                 } 
457                 /* if source gone or close to last access on mirror */
458                 else if (!src_online ||
459                          ((mir_online) &&
460                           ((u_int64_t)(bp->bio_offset >> DEV_BSHIFT)) >=
461                           (rdp->disks[drv+rdp->width].last_lba-AR_PROXIMITY) &&
462                           ((u_int64_t)(bp->bio_offset >> DEV_BSHIFT)) <=
463                           (rdp->disks[drv+rdp->width].last_lba+AR_PROXIMITY))) {
464                     drv += rdp->width;
465                     rdp->toggle = 1;
466                 }
467                 /* not close to any previous access, toggle */
468                 else {
469                     if (rdp->toggle)
470                         rdp->toggle = 0;
471                     else {
472                         drv += rdp->width;
473                         rdp->toggle = 1;
474                     }
475                 }
476
477                 if ((rdp->status & AR_S_REBUILDING) &&
478                     (blk <= rdp->rebuild_lba) &&
479                     ((blk + chunk) > rdp->rebuild_lba)) {
480                     struct ata_composite *composite;
481                     struct ata_request *rebuild;
482                     int this;
483
484                     /* figure out what part to rebuild */
485                     if (drv < rdp->width)
486                         this = drv + rdp->width;
487                     else
488                         this = drv - rdp->width;
489
490                     /* do we have a spare to rebuild on ? */
491                     if (rdp->disks[this].flags & AR_DF_SPARE) {
492                         if ((composite = ata_alloc_composite())) {
493                             if ((rebuild = ata_alloc_request())) {
494                                 rdp->rebuild_lba = blk + chunk;
495                                 bcopy(request, rebuild,
496                                       sizeof(struct ata_request));
497                                 rebuild->this = this;
498                                 rebuild->dev = rdp->disks[this].dev;
499                                 rebuild->flags &= ~ATA_R_READ;
500                                 rebuild->flags |= ATA_R_WRITE;
501                                 spin_init(&composite->lock);
502                                 composite->residual = request->bytecount;
503                                 composite->rd_needed |= (1 << drv);
504                                 composite->wr_depend |= (1 << drv);
505                                 composite->wr_needed |= (1 << this);
506                                 composite->request[drv] = request;
507                                 composite->request[this] = rebuild;
508                                 request->composite = composite;
509                                 rebuild->composite = composite;
510                                 ata_raid_send_request(rebuild);
511                             }
512                             else {
513                                 ata_free_composite(composite);
514                                 kprintf("DOH! ata_alloc_request failed!\n");
515                             }
516                         }
517                         else {
518                             kprintf("DOH! ata_alloc_composite failed!\n");
519                         }
520                     }
521                     else if (rdp->disks[this].flags & AR_DF_ONLINE) {
522                         /*
523                          * if we got here we are a chunk of a RAID01 that 
524                          * does not need a rebuild, but we need to increment
525                          * the rebuild_lba address to get the rebuild to
526                          * move to the next chunk correctly
527                          */
528                         rdp->rebuild_lba = blk + chunk;
529                     }
530                     else
531                         kprintf("DOH! we didn't find the rebuild part\n");
532                 }
533             }
534             if (bbp->b_cmd == BUF_CMD_WRITE) {
535                 if ((rdp->disks[drv+rdp->width].flags & AR_DF_ONLINE) ||
536                     ((rdp->status & AR_S_REBUILDING) &&
537                      (rdp->disks[drv+rdp->width].flags & AR_DF_SPARE) &&
538                      ((blk < rdp->rebuild_lba) ||
539                       ((blk <= rdp->rebuild_lba) &&
540                        ((blk + chunk) > rdp->rebuild_lba))))) {
541                     if ((rdp->disks[drv].flags & AR_DF_ONLINE) ||
542                         ((rdp->status & AR_S_REBUILDING) &&
543                          (rdp->disks[drv].flags & AR_DF_SPARE) &&
544                          ((blk < rdp->rebuild_lba) ||
545                           ((blk <= rdp->rebuild_lba) &&
546                            ((blk + chunk) > rdp->rebuild_lba))))) {
547                         struct ata_request *mirror;
548                         struct ata_composite *composite;
549                         int this = drv + rdp->width;
550
551                         if ((composite = ata_alloc_composite())) {
552                             if ((mirror = ata_alloc_request())) {
553                                 if ((blk <= rdp->rebuild_lba) &&
554                                     ((blk + chunk) > rdp->rebuild_lba))
555                                     rdp->rebuild_lba = blk + chunk;
556                                 bcopy(request, mirror,
557                                       sizeof(struct ata_request));
558                                 mirror->this = this;
559                                 mirror->dev = rdp->disks[this].dev;
560                                 spin_init(&composite->lock);
561                                 composite->residual = request->bytecount;
562                                 composite->wr_needed |= (1 << drv);
563                                 composite->wr_needed |= (1 << this);
564                                 composite->request[drv] = request;
565                                 composite->request[this] = mirror;
566                                 request->composite = composite;
567                                 mirror->composite = composite;
568                                 ata_raid_send_request(mirror);
569                                 rdp->disks[this].last_lba =
570                                     (u_int64_t)(bp->bio_offset >> DEV_BSHIFT) +
571                                     chunk;
572                             }
573                             else {
574                                 ata_free_composite(composite);
575                                 kprintf("DOH! ata_alloc_request failed!\n");
576                             }
577                         }
578                         else {
579                             kprintf("DOH! ata_alloc_composite failed!\n");
580                         }
581                     }
582                     else
583                         drv += rdp->width;
584                 }
585             }
586             request->this = drv;
587             request->dev = rdp->disks[request->this].dev;
588             ata_raid_send_request(request);
589             rdp->disks[request->this].last_lba =
590                ((u_int64_t)(bp->bio_offset) >> DEV_BSHIFT) + chunk;
591             break;
592
593         case AR_T_RAID5:
594             if (((rdp->disks[drv].flags & (AR_DF_PRESENT|AR_DF_ONLINE)) ==
595                  (AR_DF_PRESENT|AR_DF_ONLINE) && !rdp->disks[drv].dev)) {
596                 rdp->disks[drv].flags &= ~AR_DF_ONLINE;
597                 change = 1;
598             }
599             if (((rdp->disks[par].flags & (AR_DF_PRESENT|AR_DF_ONLINE)) ==
600                  (AR_DF_PRESENT|AR_DF_ONLINE) && !rdp->disks[par].dev)) {
601                 rdp->disks[par].flags &= ~AR_DF_ONLINE;
602                 change = 1;
603             }
604             if (change)
605                 ata_raid_config_changed(rdp, 1);
606             if (!(rdp->status & AR_S_READY)) {
607                 ata_free_request(request);
608                 bbp->b_flags |= B_ERROR;
609                 bbp->b_error = EIO;
610                 biodone(bp);
611                 return(0);
612             }
613             if (rdp->status & AR_S_DEGRADED) {
614                 /* do the XOR game if possible */
615             }
616             else {
617                 request->this = drv;
618                 request->dev = rdp->disks[request->this].dev;
619                 if (bbp->b_cmd == BUF_CMD_READ) {
620                     ata_raid_send_request(request);
621                 }
622                 if (bbp->b_cmd == BUF_CMD_WRITE) { 
623                     ata_raid_send_request(request);
624                     /* XXX TGEN no, I don't speak Danish either */
625                     /*
626                      * sikre at læs-modify-skriv til hver disk er atomarisk.
627                      * par kopi af request
628                      * læse orgdata fra drv
629                      * skriv nydata til drv
630                      * læse parorgdata fra par
631                      * skriv orgdata xor parorgdata xor nydata til par
632                      */
633                 }
634             }
635             break;
636
637         default:
638             kprintf("ar%d: unknown array type in ata_raid_strategy\n", rdp->lun);
639         }
640     }
641
642     return(0);
643 }
644
645 static void
646 ata_raid_done(struct ata_request *request)
647 {
648     struct ar_softc *rdp = request->driver;
649     struct ata_composite *composite = NULL;
650     struct bio *bp = request->bio;
651     struct buf *bbp = bp->bio_buf;
652     int i, mirror, finished = 0;
653
654     if (bbp->b_cmd == BUF_CMD_FLUSH) {
655         if (bbp->b_error == 0)
656                 bbp->b_error = request->result;
657         ata_free_request(request);
658         bp->bio_driver_info = (void *)((intptr_t)bp->bio_driver_info - 1);
659         if ((intptr_t)bp->bio_driver_info == 0) {
660                 if (bbp->b_error)
661                         bbp->b_flags |= B_ERROR;
662                 biodone(bp);
663         }
664         return;
665     }
666
667     switch (rdp->type) {
668     case AR_T_JBOD:
669     case AR_T_SPAN:
670     case AR_T_RAID0:
671         if (request->result) {
672             rdp->disks[request->this].flags &= ~AR_DF_ONLINE;
673             ata_raid_config_changed(rdp, 1);
674             bbp->b_error = request->result;
675             finished = 1;
676         }
677         else {
678             bbp->b_resid -= request->donecount;
679             if (!bbp->b_resid)
680                 finished = 1;
681         }
682         break;
683
684     case AR_T_RAID1:
685     case AR_T_RAID01:
686         if (request->this < rdp->width)
687             mirror = request->this + rdp->width;
688         else
689             mirror = request->this - rdp->width;
690         if (request->result) {
691             rdp->disks[request->this].flags &= ~AR_DF_ONLINE;
692             ata_raid_config_changed(rdp, 1);
693         }
694         if (rdp->status & AR_S_READY) {
695             u_int64_t blk = 0;
696
697             if (rdp->status & AR_S_REBUILDING) 
698                 blk = ((request->u.ata.lba / rdp->interleave) * rdp->width) *
699                       rdp->interleave + (rdp->interleave * 
700                       (request->this % rdp->width)) +
701                       request->u.ata.lba % rdp->interleave;
702
703             if (bbp->b_cmd == BUF_CMD_READ) {
704
705                 /* is this a rebuild composite */
706                 if ((composite = request->composite)) {
707                     spin_lock(&composite->lock);
708                 
709                     /* handle the read part of a rebuild composite */
710                     if (request->flags & ATA_R_READ) {
711
712                         /* if read failed array is now broken */
713                         if (request->result) {
714                             rdp->disks[request->this].flags &= ~AR_DF_ONLINE;
715                             ata_raid_config_changed(rdp, 1);
716                             bbp->b_error = request->result;
717                             rdp->rebuild_lba = blk;
718                             finished = 1;
719                         }
720
721                         /* good data, update how far we've gotten */
722                         else {
723                             bbp->b_resid -= request->donecount;
724                             composite->residual -= request->donecount;
725                             if (!composite->residual) {
726                                 if (composite->wr_done & (1 << mirror))
727                                     finished = 1;
728                             }
729                         }
730                     }
731
732                     /* handle the write part of a rebuild composite */
733                     else if (request->flags & ATA_R_WRITE) {
734                         if (composite->rd_done & (1 << mirror)) {
735                             if (request->result) {
736                                 kprintf("DOH! rebuild failed\n"); /* XXX SOS */
737                                 rdp->rebuild_lba = blk;
738                             }
739                             if (!composite->residual)
740                                 finished = 1;
741                         }
742                     }
743                     spin_unlock(&composite->lock);
744                 }
745
746                 /* if read failed retry on the mirror */
747                 else if (request->result) {
748                     request->dev = rdp->disks[mirror].dev;
749                     request->flags &= ~ATA_R_TIMEOUT;
750                     ata_raid_send_request(request);
751                     return;
752                 }
753
754                 /* we have good data */
755                 else {
756                     bbp->b_resid -= request->donecount;
757                     if (!bbp->b_resid)
758                         finished = 1;
759                 }
760             }
761             else if (bbp->b_cmd == BUF_CMD_WRITE) {
762                 /* do we have a mirror or rebuild to deal with ? */
763                 if ((composite = request->composite)) {
764                     spin_lock(&composite->lock);
765                     if (composite->wr_done & (1 << mirror)) {
766                         if (request->result) {
767                             if (composite->request[mirror]->result) {
768                                 kprintf("DOH! all disks failed and got here\n");
769                                 bbp->b_error = EIO;
770                             }
771                             if (rdp->status & AR_S_REBUILDING) {
772                                 rdp->rebuild_lba = blk;
773                                 kprintf("DOH! rebuild failed\n"); /* XXX SOS */
774                             }
775                             bbp->b_resid -=
776                                 composite->request[mirror]->donecount;
777                             composite->residual -=
778                                 composite->request[mirror]->donecount;
779                         }
780                         else {
781                             bbp->b_resid -= request->donecount;
782                             composite->residual -= request->donecount;
783                         }
784                         if (!composite->residual)
785                             finished = 1;
786                     }
787                     spin_unlock(&composite->lock);
788                 }
789                 /* no mirror we are done */
790                 else {
791                     bbp->b_resid -= request->donecount;
792                     if (!bbp->b_resid)
793                         finished = 1;
794                 }
795             }
796         }
797         else {
798             /* XXX TGEN bbp->b_flags |= B_ERROR; */
799             bbp->b_error = request->result;
800             biodone(bp);
801         }
802         break;
803
804     case AR_T_RAID5:
805         if (request->result) {
806             rdp->disks[request->this].flags &= ~AR_DF_ONLINE;
807             ata_raid_config_changed(rdp, 1);
808             if (rdp->status & AR_S_READY) {
809                 if (bbp->b_cmd == BUF_CMD_READ) {
810                     /* do the XOR game to recover data */
811                 }
812                 if (bbp->b_cmd == BUF_CMD_WRITE) {
813                     /* if the parity failed we're OK sortof */
814                     /* otherwise wee need to do the XOR long dance */
815                 }
816                 finished = 1;
817             }
818             else {
819                 /* XXX TGEN bbp->b_flags |= B_ERROR; */
820                 bbp->b_error = request->result;
821                 biodone(bp);
822             }
823         }
824         else {
825             /* did we have an XOR game going ?? */
826             bbp->b_resid -= request->donecount;
827             if (!bbp->b_resid)
828                 finished = 1;
829         }
830         break;
831
832     default:
833         kprintf("ar%d: unknown array type in ata_raid_done\n", rdp->lun);
834     }
835
836     devstat_end_transaction_buf(&rdp->devstat, bbp);
837     if (finished) {
838         if ((rdp->status & AR_S_REBUILDING) && 
839             rdp->rebuild_lba >= rdp->total_sectors) {
840             int disk;
841
842             for (disk = 0; disk < rdp->total_disks; disk++) {
843                 if ((rdp->disks[disk].flags &
844                      (AR_DF_PRESENT | AR_DF_ASSIGNED | AR_DF_SPARE)) ==
845                     (AR_DF_PRESENT | AR_DF_ASSIGNED | AR_DF_SPARE)) {
846                     rdp->disks[disk].flags &= ~AR_DF_SPARE;
847                     rdp->disks[disk].flags |= AR_DF_ONLINE;
848                 }
849             }
850             rdp->status &= ~AR_S_REBUILDING;
851             ata_raid_config_changed(rdp, 1);
852         }
853         if (!bbp->b_resid)
854             biodone(bp);
855     }
856                  
857     if (composite) {
858         if (finished) {
859             /* we are done with this composite, free all resources */
860             for (i = 0; i < 32; i++) {
861                 if (composite->rd_needed & (1 << i) ||
862                     composite->wr_needed & (1 << i)) {
863                     ata_free_request(composite->request[i]);
864                 }
865             }
866             spin_uninit(&composite->lock);
867             ata_free_composite(composite);
868         }
869     }
870     else
871         ata_free_request(request);
872 }
873
874 static int
875 ata_raid_dump(struct dev_dump_args *ap)
876 {
877         struct ar_softc *rdp = ap->a_head.a_dev->si_drv1;
878         struct buf dbuf;
879         int error = 0;
880         int disk;
881
882         if (ap->a_length == 0) {
883                 /* flush subdisk buffers to media */
884                 for (disk = 0, error = 0; disk < rdp->total_disks; disk++) {
885                         if (rdp->disks[disk].dev) {
886                                 error |= ata_controlcmd(rdp->disks[disk].dev,
887                                                 ATA_FLUSHCACHE, 0, 0, 0);
888                         }
889                 }
890                 return (error ? EIO : 0);
891         }
892
893         bzero(&dbuf, sizeof(struct buf));
894         initbufbio(&dbuf);
895         BUF_LOCK(&dbuf, LK_EXCLUSIVE);
896         /* bio_offset is byte granularity, convert block granularity a_blkno */
897         dbuf.b_bio1.bio_offset = ap->a_offset;
898         dbuf.b_bio1.bio_caller_info1.ptr = (void *)rdp;
899         dbuf.b_bio1.bio_flags |= BIO_SYNC;
900         dbuf.b_bio1.bio_done = biodone_sync;
901         dbuf.b_bcount = ap->a_length;
902         dbuf.b_data = ap->a_virtual;
903         dbuf.b_cmd = BUF_CMD_WRITE;
904         dev_dstrategy(rdp->cdev, &dbuf.b_bio1);
905         /* wait for completion, unlock the buffer, check status */
906         if (biowait(&dbuf.b_bio1, "dumpw")) {
907             BUF_UNLOCK(&dbuf);
908             return(dbuf.b_error ? dbuf.b_error : EIO);
909         }
910         BUF_UNLOCK(&dbuf);
911         uninitbufbio(&dbuf);
912
913         return 0;
914 }
915
916 static void
917 ata_raid_config_changed(struct ar_softc *rdp, int writeback)
918 {
919     int disk, count, status;
920
921     spin_lock(&rdp->lock);
922     /* set default all working mode */
923     status = rdp->status;
924     rdp->status &= ~AR_S_DEGRADED;
925     rdp->status |= AR_S_READY;
926
927     /* make sure all lost drives are accounted for */
928     for (disk = 0; disk < rdp->total_disks; disk++) {
929         if (!(rdp->disks[disk].flags & AR_DF_PRESENT))
930             rdp->disks[disk].flags &= ~AR_DF_ONLINE;
931     }
932
933     /* depending on RAID type figure out our health status */
934     switch (rdp->type) {
935     case AR_T_JBOD:
936     case AR_T_SPAN:
937     case AR_T_RAID0:
938         for (disk = 0; disk < rdp->total_disks; disk++) 
939             if (!(rdp->disks[disk].flags & AR_DF_ONLINE))
940                 rdp->status &= ~AR_S_READY; 
941         break;
942
943     case AR_T_RAID1:
944     case AR_T_RAID01:
945         for (disk = 0; disk < rdp->width; disk++) {
946             if (!(rdp->disks[disk].flags & AR_DF_ONLINE) &&
947                 !(rdp->disks[disk + rdp->width].flags & AR_DF_ONLINE)) {
948                 rdp->status &= ~AR_S_READY;
949             }
950             else if (((rdp->disks[disk].flags & AR_DF_ONLINE) &&
951                       !(rdp->disks[disk + rdp->width].flags & AR_DF_ONLINE)) ||
952                      (!(rdp->disks[disk].flags & AR_DF_ONLINE) &&
953                       (rdp->disks [disk + rdp->width].flags & AR_DF_ONLINE))) {
954                 rdp->status |= AR_S_DEGRADED;
955             }
956         }
957         break;
958
959     case AR_T_RAID5:
960         for (count = 0, disk = 0; disk < rdp->total_disks; disk++) {
961             if (!(rdp->disks[disk].flags & AR_DF_ONLINE))
962                 count++;
963         }
964         if (count) {
965             if (count > 1)
966                 rdp->status &= ~AR_S_READY;
967             else
968                 rdp->status |= AR_S_DEGRADED;
969         }
970         break;
971     default:
972         rdp->status &= ~AR_S_READY;
973     }
974
975     /*
976      * Note that when the array breaks so comes up broken we
977      * force a write of the array config to the remaining
978      * drives so that the generation will be incremented past
979      * those of the missing or failed drives (in all cases).
980      */
981     if (rdp->status != status) {
982         if (!(rdp->status & AR_S_READY)) {
983             kprintf("ar%d: FAILURE - %s array broken\n",
984                    rdp->lun, ata_raid_type(rdp));
985             writeback = 1;
986         }
987         else if (rdp->status & AR_S_DEGRADED) {
988             if (rdp->type & (AR_T_RAID1 | AR_T_RAID01))
989                 kprintf("ar%d: WARNING - mirror", rdp->lun);
990             else
991                 kprintf("ar%d: WARNING - parity", rdp->lun);
992             kprintf(" protection lost. %s array in DEGRADED mode\n",
993                    ata_raid_type(rdp));
994             writeback = 1;
995         }
996     }
997     spin_unlock(&rdp->lock);
998     if (writeback)
999         ata_raid_write_metadata(rdp);
1000
1001 }
1002
1003 static int
1004 ata_raid_status(struct ata_ioc_raid_config *config)
1005 {
1006     struct ar_softc *rdp;
1007     int i;
1008         
1009     if (!(rdp = ata_raid_arrays[config->lun]))
1010         return ENXIO;
1011         
1012     config->type = rdp->type;
1013     config->total_disks = rdp->total_disks;
1014     for (i = 0; i < rdp->total_disks; i++ ) {
1015         if ((rdp->disks[i].flags & AR_DF_PRESENT) && rdp->disks[i].dev)  
1016             config->disks[i] = device_get_unit(rdp->disks[i].dev);
1017         else
1018             config->disks[i] = -1;
1019     }
1020     config->interleave = rdp->interleave;
1021     config->status = rdp->status;
1022     config->progress = 100 * rdp->rebuild_lba / rdp->total_sectors;
1023     return 0;
1024 }
1025
1026 static int
1027 ata_raid_create(struct ata_ioc_raid_config *config)
1028 {
1029     struct ar_softc *rdp;
1030     device_t subdisk;
1031     int array, disk;
1032     int ctlr = 0, total_disks = 0;
1033     u_int disk_size = 0;
1034     device_t gpdev;
1035
1036     for (array = 0; array < MAX_ARRAYS; array++) {
1037         if (!ata_raid_arrays[array])
1038             break;
1039     }
1040     if (array >= MAX_ARRAYS)
1041         return ENOSPC;
1042
1043     rdp = (struct ar_softc*)kmalloc(sizeof(struct ar_softc), M_AR,
1044         M_WAITOK | M_ZERO);
1045
1046     for (disk = 0; disk < config->total_disks; disk++) {
1047         if ((subdisk = devclass_get_device(ata_raid_sub_devclass,
1048                                            config->disks[disk]))) {
1049             struct ata_raid_subdisk *ars = device_get_softc(subdisk);
1050
1051             /* is device already assigned to another array ? */
1052             if (ars->raid[rdp->volume]) {
1053                 config->disks[disk] = -1;
1054                 kfree(rdp, M_AR);
1055                 return EBUSY;
1056             }
1057             rdp->disks[disk].dev = device_get_parent(subdisk);
1058
1059             gpdev = GRANDPARENT(rdp->disks[disk].dev);
1060
1061             switch (pci_get_vendor(gpdev)) {
1062             case ATA_HIGHPOINT_ID:
1063                 /* 
1064                  * we need some way to decide if it should be v2 or v3
1065                  * for now just use v2 since the v3 BIOS knows how to 
1066                  * handle that as well.
1067                  */
1068                 ctlr = AR_F_HPTV2_RAID;
1069                 rdp->disks[disk].sectors = HPTV3_LBA(rdp->disks[disk].dev);
1070                 break;
1071
1072             case ATA_INTEL_ID:
1073                 ctlr = AR_F_INTEL_RAID;
1074                 rdp->disks[disk].sectors = INTEL_LBA(rdp->disks[disk].dev);
1075                 break;
1076
1077             case ATA_ITE_ID:
1078                 ctlr = AR_F_ITE_RAID;
1079                 rdp->disks[disk].sectors = ITE_LBA(rdp->disks[disk].dev);
1080                 break;
1081
1082             case ATA_JMICRON_ID:
1083                 ctlr = AR_F_JMICRON_RAID;
1084                 rdp->disks[disk].sectors = JMICRON_LBA(rdp->disks[disk].dev);
1085                 break;
1086
1087             case 0:     /* XXX SOS cover up for bug in our PCI code */
1088             case ATA_PROMISE_ID:        
1089                 ctlr = AR_F_PROMISE_RAID;
1090                 rdp->disks[disk].sectors = PROMISE_LBA(rdp->disks[disk].dev);
1091                 break;
1092
1093             case ATA_SIS_ID:        
1094                 ctlr = AR_F_SIS_RAID;
1095                 rdp->disks[disk].sectors = SIS_LBA(rdp->disks[disk].dev);
1096                 break;
1097
1098             case ATA_ATI_ID:        
1099             case ATA_VIA_ID:        
1100                 ctlr = AR_F_VIA_RAID;
1101                 rdp->disks[disk].sectors = VIA_LBA(rdp->disks[disk].dev);
1102                 break;
1103
1104             default:
1105                 /* XXX SOS
1106                  * right, so here we are, we have an ATA chip and we want
1107                  * to create a RAID and store the metadata.
1108                  * we need to find a way to tell what kind of metadata this
1109                  * hardware's BIOS might be using (good ideas are welcomed)
1110                  * for now we just use our own native FreeBSD format.
1111                  * the only way to get support for the BIOS format is to
1112                  * setup the RAID from there, in that case we pickup the
1113                  * metadata format from the disks (if we support it).
1114                  */
1115                 kprintf("WARNING!! - not able to determine metadata format\n"
1116                        "WARNING!! - Using FreeBSD PseudoRAID metadata\n"
1117                        "If that is not what you want, use the BIOS to "
1118                        "create the array\n");
1119                 ctlr = AR_F_FREEBSD_RAID;
1120                 rdp->disks[disk].sectors = PROMISE_LBA(rdp->disks[disk].dev);
1121                 break;
1122             }
1123
1124             /* we need all disks to be of the same format */
1125             if ((rdp->format & AR_F_FORMAT_MASK) &&
1126                 (rdp->format & AR_F_FORMAT_MASK) != (ctlr & AR_F_FORMAT_MASK)) {
1127                 kfree(rdp, M_AR);
1128                 return EXDEV;
1129             }
1130             else
1131                 rdp->format = ctlr;
1132             
1133             /* use the smallest disk of the lots size */
1134             /* gigabyte boundry ??? XXX SOS */
1135             if (disk_size)
1136                 disk_size = min(rdp->disks[disk].sectors, disk_size);
1137             else
1138                 disk_size = rdp->disks[disk].sectors;
1139             rdp->disks[disk].flags = 
1140                 (AR_DF_PRESENT | AR_DF_ASSIGNED | AR_DF_ONLINE);
1141
1142             total_disks++;
1143         }
1144         else {
1145             config->disks[disk] = -1;
1146             kfree(rdp, M_AR);
1147             return ENXIO;
1148         }
1149     }
1150
1151     if (total_disks != config->total_disks) {
1152         kfree(rdp, M_AR);
1153         return ENODEV;
1154     }
1155
1156     switch (config->type) {
1157     case AR_T_JBOD:
1158     case AR_T_SPAN:
1159     case AR_T_RAID0:
1160         break;
1161
1162     case AR_T_RAID1:
1163         if (total_disks != 2) {
1164             kfree(rdp, M_AR);
1165             return EPERM;
1166         }
1167         break;
1168
1169     case AR_T_RAID01:
1170         if (total_disks % 2 != 0) {
1171             kfree(rdp, M_AR);
1172             return EPERM;
1173         }
1174         break;
1175
1176     case AR_T_RAID5:
1177         if (total_disks < 3) {
1178             kfree(rdp, M_AR);
1179             return EPERM;
1180         }
1181         break;
1182
1183     default:
1184         kfree(rdp, M_AR);
1185         return EOPNOTSUPP;
1186     }
1187     rdp->type = config->type;
1188     rdp->lun = array;
1189     if (rdp->type == AR_T_RAID0 || rdp->type == AR_T_RAID01 ||
1190         rdp->type == AR_T_RAID5) {
1191         int bit = 0;
1192
1193         while (config->interleave >>= 1)
1194             bit++;
1195         rdp->interleave = 1 << bit;
1196     }
1197     rdp->offset_sectors = 0;
1198
1199     /* values that depend on metadata format */
1200     switch (rdp->format) {
1201     case AR_F_ADAPTEC_RAID:
1202         rdp->interleave = min(max(32, rdp->interleave), 128); /*+*/
1203         break;
1204
1205     case AR_F_HPTV2_RAID:
1206         rdp->interleave = min(max(8, rdp->interleave), 128); /*+*/
1207         rdp->offset_sectors = HPTV2_LBA(x) + 1;
1208         break;
1209
1210     case AR_F_HPTV3_RAID:
1211         rdp->interleave = min(max(32, rdp->interleave), 4096); /*+*/
1212         break;
1213
1214     case AR_F_INTEL_RAID:
1215         rdp->interleave = min(max(8, rdp->interleave), 256); /*+*/
1216         break;
1217
1218     case AR_F_ITE_RAID:
1219         rdp->interleave = min(max(2, rdp->interleave), 128); /*+*/
1220         break;
1221
1222     case AR_F_JMICRON_RAID:
1223         rdp->interleave = min(max(8, rdp->interleave), 256); /*+*/
1224         break;
1225
1226     case AR_F_LSIV2_RAID:
1227         rdp->interleave = min(max(2, rdp->interleave), 4096);
1228         break;
1229
1230     case AR_F_LSIV3_RAID:
1231         rdp->interleave = min(max(2, rdp->interleave), 256);
1232         break;
1233
1234     case AR_F_PROMISE_RAID:
1235         rdp->interleave = min(max(2, rdp->interleave), 2048); /*+*/
1236         break;
1237
1238     case AR_F_SII_RAID:
1239         rdp->interleave = min(max(8, rdp->interleave), 256); /*+*/
1240         break;
1241
1242     case AR_F_SIS_RAID:
1243         rdp->interleave = min(max(32, rdp->interleave), 512); /*+*/
1244         break;
1245
1246     case AR_F_VIA_RAID:
1247         rdp->interleave = min(max(8, rdp->interleave), 128); /*+*/
1248         break;
1249     }
1250
1251     rdp->total_disks = total_disks;
1252     rdp->width = total_disks / (rdp->type & (AR_RAID1 | AR_T_RAID01) ? 2 : 1);
1253     rdp->total_sectors =
1254         (uint64_t)disk_size * (rdp->width - (rdp->type == AR_RAID5));
1255     rdp->heads = 255;
1256     rdp->sectors = 63;
1257     rdp->cylinders = rdp->total_sectors / (255 * 63);
1258     rdp->rebuild_lba = 0;
1259     rdp->status |= AR_S_READY;
1260
1261     /* we are committed to this array, grap the subdisks */
1262     for (disk = 0; disk < config->total_disks; disk++) {
1263         if ((subdisk = devclass_get_device(ata_raid_sub_devclass,
1264                                            config->disks[disk]))) {
1265             struct ata_raid_subdisk *ars = device_get_softc(subdisk);
1266
1267             ars->raid[rdp->volume] = rdp;
1268             ars->disk_number[rdp->volume] = disk;
1269         }
1270     }
1271     ata_raid_attach(rdp, 1);
1272     ata_raid_arrays[array] = rdp;
1273     config->lun = array;
1274     return 0;
1275 }
1276
1277 static int
1278 ata_raid_delete(int array)
1279 {
1280     struct ar_softc *rdp;    
1281     device_t subdisk;
1282     int disk;
1283
1284     if (!(rdp = ata_raid_arrays[array]))
1285         return ENXIO;
1286  
1287     rdp->status &= ~AR_S_READY;
1288     disk_destroy(&rdp->disk);
1289     devstat_remove_entry(&rdp->devstat);
1290
1291     for (disk = 0; disk < rdp->total_disks; disk++) {
1292         if ((rdp->disks[disk].flags & AR_DF_PRESENT) && rdp->disks[disk].dev) {
1293             if ((subdisk = devclass_get_device(ata_raid_sub_devclass,
1294                      device_get_unit(rdp->disks[disk].dev)))) {
1295                 struct ata_raid_subdisk *ars = device_get_softc(subdisk);
1296
1297                 if (ars->raid[rdp->volume] != rdp)           /* XXX SOS */
1298                     device_printf(subdisk, "DOH! this disk doesn't belong\n");
1299                 if (ars->disk_number[rdp->volume] != disk)   /* XXX SOS */
1300                     device_printf(subdisk, "DOH! this disk number is wrong\n");
1301                 ars->raid[rdp->volume] = NULL;
1302                 ars->disk_number[rdp->volume] = -1;
1303             }
1304             rdp->disks[disk].flags = 0;
1305         }
1306     }
1307     ata_raid_wipe_metadata(rdp);
1308     ata_raid_arrays[array] = NULL;
1309     kfree(rdp, M_AR);
1310     return 0;
1311 }
1312
1313 static int
1314 ata_raid_addspare(struct ata_ioc_raid_config *config)
1315 {
1316     struct ar_softc *rdp;    
1317     device_t subdisk;
1318     int disk;
1319
1320     if (!(rdp = ata_raid_arrays[config->lun]))
1321         return ENXIO;
1322     if (!(rdp->status & AR_S_DEGRADED) || !(rdp->status & AR_S_READY))
1323         return ENXIO;
1324     if (rdp->status & AR_S_REBUILDING)
1325         return EBUSY; 
1326     switch (rdp->type) {
1327     case AR_T_RAID1:
1328     case AR_T_RAID01:
1329     case AR_T_RAID5:
1330         for (disk = 0; disk < rdp->total_disks; disk++ ) {
1331
1332             if (((rdp->disks[disk].flags & (AR_DF_PRESENT | AR_DF_ONLINE)) ==
1333                  (AR_DF_PRESENT | AR_DF_ONLINE)) && rdp->disks[disk].dev)
1334                 continue;
1335
1336             if ((subdisk = devclass_get_device(ata_raid_sub_devclass,
1337                                                config->disks[0] ))) {
1338                 struct ata_raid_subdisk *ars = device_get_softc(subdisk);
1339
1340                 if (ars->raid[rdp->volume]) 
1341                     return EBUSY;
1342     
1343                 /* XXX SOS validate size etc etc */
1344                 ars->raid[rdp->volume] = rdp;
1345                 ars->disk_number[rdp->volume] = disk;
1346                 rdp->disks[disk].dev = device_get_parent(subdisk);
1347                 rdp->disks[disk].flags =
1348                     (AR_DF_PRESENT | AR_DF_ASSIGNED | AR_DF_SPARE);
1349
1350                 device_printf(rdp->disks[disk].dev,
1351                               "inserted into ar%d disk%d as spare\n",
1352                               rdp->lun, disk);
1353                 ata_raid_config_changed(rdp, 1);
1354                 return 0;
1355             }
1356         }
1357         return ENXIO;
1358
1359     default:
1360         return EPERM;
1361     }
1362 }
1363  
1364 static int
1365 ata_raid_rebuild(int array)
1366 {
1367     struct ar_softc *rdp;    
1368     int disk, count;
1369
1370     if (!(rdp = ata_raid_arrays[array]))
1371         return ENXIO;
1372     /* XXX SOS we should lock the rdp softc here */
1373     if (!(rdp->status & AR_S_DEGRADED) || !(rdp->status & AR_S_READY))
1374         return ENXIO;
1375     if (rdp->status & AR_S_REBUILDING)
1376         return EBUSY; 
1377
1378     switch (rdp->type) {
1379     case AR_T_RAID1:
1380     case AR_T_RAID01:
1381     case AR_T_RAID5:
1382         for (count = 0, disk = 0; disk < rdp->total_disks; disk++ ) {
1383             if (((rdp->disks[disk].flags &
1384                   (AR_DF_PRESENT|AR_DF_ASSIGNED|AR_DF_ONLINE|AR_DF_SPARE)) ==
1385                  (AR_DF_PRESENT | AR_DF_ASSIGNED | AR_DF_SPARE)) &&
1386                 rdp->disks[disk].dev) {
1387                 count++;
1388             }
1389         }
1390
1391         if (count) {
1392             rdp->rebuild_lba = 0;
1393             rdp->status |= AR_S_REBUILDING;
1394             return 0;
1395         }
1396         return EIO;
1397
1398     default:
1399         return EPERM;
1400     }
1401 }
1402
1403 static int
1404 ata_raid_read_metadata(device_t subdisk)
1405 {
1406     devclass_t pci_devclass = devclass_find("pci");
1407     devclass_t devclass=device_get_devclass(GRANDPARENT(GRANDPARENT(subdisk)));
1408     device_t gpdev;
1409     uint16_t vendor;
1410
1411     /* prioritize vendor native metadata layout if possible */
1412     if (devclass == pci_devclass) {
1413         gpdev = device_get_parent(subdisk);
1414         gpdev = GRANDPARENT(gpdev);
1415         vendor = pci_get_vendor(gpdev);
1416
1417         switch (vendor) {
1418         case ATA_HIGHPOINT_ID: 
1419             if (ata_raid_hptv3_read_meta(subdisk, ata_raid_arrays))
1420                 return 0;
1421             if (ata_raid_hptv2_read_meta(subdisk, ata_raid_arrays))
1422                 return 0;
1423             break;
1424
1425         case ATA_INTEL_ID:
1426             if (ata_raid_intel_read_meta(subdisk, ata_raid_arrays))
1427                 return 0;
1428             break;
1429
1430         case ATA_ITE_ID:
1431             if (ata_raid_ite_read_meta(subdisk, ata_raid_arrays))
1432                 return 0;
1433             break;
1434
1435         case ATA_JMICRON_ID:
1436             if (ata_raid_jmicron_read_meta(subdisk, ata_raid_arrays))
1437                 return 0;
1438             break;
1439
1440         case ATA_NVIDIA_ID:
1441             if (ata_raid_nvidia_read_meta(subdisk, ata_raid_arrays))
1442                 return 0;
1443             break;
1444
1445         case 0:         /* XXX SOS cover up for bug in our PCI code */
1446         case ATA_PROMISE_ID: 
1447             if (ata_raid_promise_read_meta(subdisk, ata_raid_arrays, 0))
1448                 return 0;
1449             break;
1450
1451         case ATA_ATI_ID:
1452         case ATA_SILICON_IMAGE_ID:
1453             if (ata_raid_sii_read_meta(subdisk, ata_raid_arrays))
1454                 return 0;
1455             break;
1456
1457         case ATA_SIS_ID:
1458             if (ata_raid_sis_read_meta(subdisk, ata_raid_arrays))
1459                 return 0;
1460             break;
1461
1462         case ATA_VIA_ID:
1463             if (ata_raid_via_read_meta(subdisk, ata_raid_arrays))
1464                 return 0;
1465             break;
1466         }
1467     }
1468     
1469     /* handle controllers that have multiple layout possibilities */
1470     /* NOTE: the order of these are not insignificant */
1471
1472     /* Adaptec HostRAID */
1473     if (ata_raid_adaptec_read_meta(subdisk, ata_raid_arrays))
1474         return 0;
1475
1476     /* LSILogic v3 and v2 */
1477     if (ata_raid_lsiv3_read_meta(subdisk, ata_raid_arrays))
1478         return 0;
1479     if (ata_raid_lsiv2_read_meta(subdisk, ata_raid_arrays))
1480         return 0;
1481
1482     /* if none of the above matched, try FreeBSD native format */
1483     return ata_raid_promise_read_meta(subdisk, ata_raid_arrays, 1);
1484 }
1485
1486 static int
1487 ata_raid_write_metadata(struct ar_softc *rdp)
1488 {
1489     switch (rdp->format) {
1490     case AR_F_FREEBSD_RAID:
1491     case AR_F_PROMISE_RAID: 
1492         return ata_raid_promise_write_meta(rdp);
1493
1494     case AR_F_HPTV3_RAID:
1495     case AR_F_HPTV2_RAID:
1496         /*
1497          * always write HPT v2 metadata, the v3 BIOS knows it as well.
1498          * this is handy since we cannot know what version BIOS is on there
1499          */
1500         return ata_raid_hptv2_write_meta(rdp);
1501
1502     case AR_F_INTEL_RAID:
1503         return ata_raid_intel_write_meta(rdp);
1504
1505     case AR_F_JMICRON_RAID:
1506         return ata_raid_jmicron_write_meta(rdp);
1507
1508     case AR_F_SIS_RAID:
1509         return ata_raid_sis_write_meta(rdp);
1510
1511     case AR_F_VIA_RAID:
1512         return ata_raid_via_write_meta(rdp);
1513 #if 0
1514     case AR_F_HPTV3_RAID:
1515         return ata_raid_hptv3_write_meta(rdp);
1516
1517     case AR_F_ADAPTEC_RAID:
1518         return ata_raid_adaptec_write_meta(rdp);
1519
1520     case AR_F_ITE_RAID:
1521         return ata_raid_ite_write_meta(rdp);
1522
1523     case AR_F_LSIV2_RAID:
1524         return ata_raid_lsiv2_write_meta(rdp);
1525
1526     case AR_F_LSIV3_RAID:
1527         return ata_raid_lsiv3_write_meta(rdp);
1528
1529     case AR_F_NVIDIA_RAID:
1530         return ata_raid_nvidia_write_meta(rdp);
1531
1532     case AR_F_SII_RAID:
1533         return ata_raid_sii_write_meta(rdp);
1534
1535 #endif
1536     default:
1537         kprintf("ar%d: writing of %s metadata is NOT supported yet\n",
1538                rdp->lun, ata_raid_format(rdp));
1539     }
1540     return -1;
1541 }
1542
1543 static int
1544 ata_raid_wipe_metadata(struct ar_softc *rdp)
1545 {
1546     int disk, error = 0;
1547     u_int64_t lba;
1548     u_int32_t size;
1549     u_int8_t *meta;
1550
1551     for (disk = 0; disk < rdp->total_disks; disk++) {
1552         if (rdp->disks[disk].dev) {
1553             switch (rdp->format) {
1554             case AR_F_ADAPTEC_RAID:
1555                 lba = ADP_LBA(rdp->disks[disk].dev);
1556                 size = sizeof(struct adaptec_raid_conf);
1557                 break;
1558
1559             case AR_F_HPTV2_RAID:
1560                 lba = HPTV2_LBA(rdp->disks[disk].dev);
1561                 size = sizeof(struct hptv2_raid_conf);
1562                 break;
1563                 
1564             case AR_F_HPTV3_RAID:
1565                 lba = HPTV3_LBA(rdp->disks[disk].dev);
1566                 size = sizeof(struct hptv3_raid_conf);
1567                 break;
1568
1569             case AR_F_INTEL_RAID:
1570                 lba = INTEL_LBA(rdp->disks[disk].dev);
1571                 size = 3 * 512;         /* XXX SOS */
1572                 break;
1573
1574             case AR_F_ITE_RAID:
1575                 lba = ITE_LBA(rdp->disks[disk].dev);
1576                 size = sizeof(struct ite_raid_conf);
1577                 break;
1578
1579             case AR_F_JMICRON_RAID:
1580                 lba = JMICRON_LBA(rdp->disks[disk].dev);
1581                 size = sizeof(struct jmicron_raid_conf);
1582                 break;
1583
1584             case AR_F_LSIV2_RAID:
1585                 lba = LSIV2_LBA(rdp->disks[disk].dev);
1586                 size = sizeof(struct lsiv2_raid_conf);
1587                 break;
1588
1589             case AR_F_LSIV3_RAID:
1590                 lba = LSIV3_LBA(rdp->disks[disk].dev);
1591                 size = sizeof(struct lsiv3_raid_conf);
1592                 break;
1593
1594             case AR_F_NVIDIA_RAID:
1595                 lba = NVIDIA_LBA(rdp->disks[disk].dev);
1596                 size = sizeof(struct nvidia_raid_conf);
1597                 break;
1598
1599             case AR_F_FREEBSD_RAID:
1600             case AR_F_PROMISE_RAID: 
1601                 lba = PROMISE_LBA(rdp->disks[disk].dev);
1602                 size = sizeof(struct promise_raid_conf);
1603                 break;
1604
1605             case AR_F_SII_RAID:
1606                 lba = SII_LBA(rdp->disks[disk].dev);
1607                 size = sizeof(struct sii_raid_conf);
1608                 break;
1609
1610             case AR_F_SIS_RAID:
1611                 lba = SIS_LBA(rdp->disks[disk].dev);
1612                 size = sizeof(struct sis_raid_conf);
1613                 break;
1614
1615             case AR_F_VIA_RAID:
1616                 lba = VIA_LBA(rdp->disks[disk].dev);
1617                 size = sizeof(struct via_raid_conf);
1618                 break;
1619
1620             default:
1621                 kprintf("ar%d: wiping of %s metadata is NOT supported yet\n",
1622                        rdp->lun, ata_raid_format(rdp));
1623                 return ENXIO;
1624             }
1625             meta = kmalloc(size, M_AR, M_WAITOK | M_ZERO);
1626             if (ata_raid_rw(rdp->disks[disk].dev, lba, meta, size,
1627                             ATA_R_WRITE | ATA_R_DIRECT)) {
1628                 device_printf(rdp->disks[disk].dev, "wipe metadata failed\n");
1629                 error = EIO;
1630             }
1631             kfree(meta, M_AR);
1632         }
1633     }
1634     return error;
1635 }
1636
1637 /* Adaptec HostRAID Metadata */
1638 static int
1639 ata_raid_adaptec_read_meta(device_t dev, struct ar_softc **raidp)
1640 {
1641     struct ata_raid_subdisk *ars = device_get_softc(dev);
1642     device_t parent = device_get_parent(dev);
1643     struct adaptec_raid_conf *meta;
1644     struct ar_softc *raid;
1645     int array, disk, retval = 0; 
1646
1647     meta = (struct adaptec_raid_conf *)
1648             kmalloc(sizeof(struct adaptec_raid_conf), M_AR, M_WAITOK | M_ZERO);
1649
1650     if (ata_raid_rw(parent, ADP_LBA(parent),
1651                     meta, sizeof(struct adaptec_raid_conf), ATA_R_READ)) {
1652         if (testing || bootverbose)
1653             device_printf(parent, "Adaptec read metadata failed\n");
1654         goto adaptec_out;
1655     }
1656
1657     /* check if this is a Adaptec RAID struct */
1658     if (meta->magic_0 != ADP_MAGIC_0 || meta->magic_3 != ADP_MAGIC_3) {
1659         if (testing || bootverbose)
1660             device_printf(parent, "Adaptec check1 failed\n");
1661         goto adaptec_out;
1662     }
1663
1664     if (testing || bootverbose)
1665         ata_raid_adaptec_print_meta(meta);
1666
1667     /* now convert Adaptec metadata into our generic form */
1668     for (array = 0; array < MAX_ARRAYS; array++) {
1669         if (!raidp[array]) {
1670             raidp[array] = 
1671                 (struct ar_softc *)kmalloc(sizeof(struct ar_softc), M_AR,
1672                                           M_WAITOK | M_ZERO);
1673         }
1674         raid = raidp[array];
1675         if (raid->format && (raid->format != AR_F_ADAPTEC_RAID))
1676             continue;
1677
1678         if (raid->magic_0 && raid->magic_0 != meta->configs[0].magic_0)
1679             continue;
1680
1681         if (!meta->generation || be32toh(meta->generation) > raid->generation) {
1682             switch (meta->configs[0].type) {
1683             case ADP_T_RAID0:
1684                 raid->magic_0 = meta->configs[0].magic_0;
1685                 raid->type = AR_T_RAID0;
1686                 raid->interleave = 1 << (meta->configs[0].stripe_shift >> 1);
1687                 raid->width = be16toh(meta->configs[0].total_disks);
1688                 break;
1689             
1690             case ADP_T_RAID1:
1691                 raid->magic_0 = meta->configs[0].magic_0;
1692                 raid->type = AR_T_RAID1;
1693                 raid->width = be16toh(meta->configs[0].total_disks) / 2;
1694                 break;
1695
1696             default:
1697                 device_printf(parent, "Adaptec unknown RAID type 0x%02x\n",
1698                               meta->configs[0].type);
1699                 kfree(raidp[array], M_AR);
1700                 raidp[array] = NULL;
1701                 goto adaptec_out;
1702             }
1703
1704             raid->format = AR_F_ADAPTEC_RAID;
1705             raid->generation = be32toh(meta->generation);
1706             raid->total_disks = be16toh(meta->configs[0].total_disks);
1707             raid->total_sectors = be32toh(meta->configs[0].sectors);
1708             raid->heads = 255;
1709             raid->sectors = 63;
1710             raid->cylinders = raid->total_sectors / (63 * 255);
1711             raid->offset_sectors = 0;
1712             raid->rebuild_lba = 0;
1713             raid->lun = array;
1714             strncpy(raid->name, meta->configs[0].name,
1715                     min(sizeof(raid->name), sizeof(meta->configs[0].name)));
1716
1717             /* clear out any old info */
1718             if (raid->generation) {
1719                 for (disk = 0; disk < raid->total_disks; disk++) {
1720                     raid->disks[disk].dev = NULL;
1721                     raid->disks[disk].flags = 0;
1722                 }
1723             }
1724         }
1725         if (be32toh(meta->generation) >= raid->generation) {
1726             struct ata_device *atadev = device_get_softc(parent);
1727             struct ata_channel *ch = device_get_softc(GRANDPARENT(dev));
1728             int disk_number = (ch->unit << !(ch->flags & ATA_NO_SLAVE)) +
1729                               ATA_DEV(atadev->unit);
1730
1731             raid->disks[disk_number].dev = parent;
1732             raid->disks[disk_number].sectors = 
1733                 be32toh(meta->configs[disk_number + 1].sectors);
1734             raid->disks[disk_number].flags =
1735                 (AR_DF_ONLINE | AR_DF_PRESENT | AR_DF_ASSIGNED);
1736             ars->raid[raid->volume] = raid;
1737             ars->disk_number[raid->volume] = disk_number;
1738             retval = 1;
1739         }
1740         break;
1741     }
1742
1743 adaptec_out:
1744     kfree(meta, M_AR);
1745     return retval;
1746 }
1747
1748 /* Highpoint V2 RocketRAID Metadata */
1749 static int
1750 ata_raid_hptv2_read_meta(device_t dev, struct ar_softc **raidp)
1751 {
1752     struct ata_raid_subdisk *ars = device_get_softc(dev);
1753     device_t parent = device_get_parent(dev);
1754     struct hptv2_raid_conf *meta;
1755     struct ar_softc *raid = NULL;
1756     int array, disk_number = 0, retval = 0;
1757
1758     meta = (struct hptv2_raid_conf *)kmalloc(sizeof(struct hptv2_raid_conf),
1759         M_AR, M_WAITOK | M_ZERO);
1760
1761     if (ata_raid_rw(parent, HPTV2_LBA(parent),
1762                     meta, sizeof(struct hptv2_raid_conf), ATA_R_READ)) {
1763         if (testing || bootverbose)
1764             device_printf(parent, "HighPoint (v2) read metadata failed\n");
1765         goto hptv2_out;
1766     }
1767
1768     /* check if this is a HighPoint v2 RAID struct */
1769     if (meta->magic != HPTV2_MAGIC_OK && meta->magic != HPTV2_MAGIC_BAD) {
1770         if (testing || bootverbose)
1771             device_printf(parent, "HighPoint (v2) check1 failed\n");
1772         goto hptv2_out;
1773     }
1774
1775     /* is this disk defined, or an old leftover/spare ? */
1776     if (!meta->magic_0) {
1777         if (testing || bootverbose)
1778             device_printf(parent, "HighPoint (v2) check2 failed\n");
1779         goto hptv2_out;
1780     }
1781
1782     if (testing || bootverbose)
1783         ata_raid_hptv2_print_meta(meta);
1784
1785     /* now convert HighPoint (v2) metadata into our generic form */
1786     for (array = 0; array < MAX_ARRAYS; array++) {
1787         if (!raidp[array]) {
1788             raidp[array] = 
1789                 (struct ar_softc *)kmalloc(sizeof(struct ar_softc), M_AR,
1790                                           M_WAITOK | M_ZERO);
1791         }
1792         raid = raidp[array];
1793         if (raid->format && (raid->format != AR_F_HPTV2_RAID))
1794             continue;
1795
1796         switch (meta->type) {
1797         case HPTV2_T_RAID0:
1798             if ((meta->order & (HPTV2_O_RAID0|HPTV2_O_OK)) ==
1799                 (HPTV2_O_RAID0|HPTV2_O_OK))
1800                 goto highpoint_raid1;
1801             if (meta->order & (HPTV2_O_RAID0 | HPTV2_O_RAID1))
1802                 goto highpoint_raid01;
1803             if (raid->magic_0 && raid->magic_0 != meta->magic_0)
1804                 continue;
1805             raid->magic_0 = meta->magic_0;
1806             raid->type = AR_T_RAID0;
1807             raid->interleave = 1 << meta->stripe_shift;
1808             disk_number = meta->disk_number;
1809             if (!(meta->order & HPTV2_O_OK))
1810                 meta->magic = 0;        /* mark bad */
1811             break;
1812
1813         case HPTV2_T_RAID1:
1814 highpoint_raid1:
1815             if (raid->magic_0 && raid->magic_0 != meta->magic_0)
1816                 continue;
1817             raid->magic_0 = meta->magic_0;
1818             raid->type = AR_T_RAID1;
1819             disk_number = (meta->disk_number > 0);
1820             break;
1821
1822         case HPTV2_T_RAID01_RAID0:
1823 highpoint_raid01:
1824             if (meta->order & HPTV2_O_RAID0) {
1825                 if ((raid->magic_0 && raid->magic_0 != meta->magic_0) ||
1826                     (raid->magic_1 && raid->magic_1 != meta->magic_1))
1827                     continue;
1828                 raid->magic_0 = meta->magic_0;
1829                 raid->magic_1 = meta->magic_1;
1830                 raid->type = AR_T_RAID01;
1831                 raid->interleave = 1 << meta->stripe_shift;
1832                 disk_number = meta->disk_number;
1833             }
1834             else {
1835                 if (raid->magic_1 && raid->magic_1 != meta->magic_1)
1836                     continue;
1837                 raid->magic_1 = meta->magic_1;
1838                 raid->type = AR_T_RAID01;
1839                 raid->interleave = 1 << meta->stripe_shift;
1840                 disk_number = meta->disk_number + meta->array_width;
1841                 if (!(meta->order & HPTV2_O_RAID1))
1842                     meta->magic = 0;    /* mark bad */
1843             }
1844             break;
1845
1846         case HPTV2_T_SPAN:
1847             if (raid->magic_0 && raid->magic_0 != meta->magic_0)
1848                 continue;
1849             raid->magic_0 = meta->magic_0;
1850             raid->type = AR_T_SPAN;
1851             disk_number = meta->disk_number;
1852             break;
1853
1854         default:
1855             device_printf(parent, "Highpoint (v2) unknown RAID type 0x%02x\n",
1856                           meta->type);
1857             kfree(raidp[array], M_AR);
1858             raidp[array] = NULL;
1859             goto hptv2_out;
1860         }
1861
1862         raid->format |= AR_F_HPTV2_RAID;
1863         raid->disks[disk_number].dev = parent;
1864         raid->disks[disk_number].flags = (AR_DF_PRESENT | AR_DF_ASSIGNED);
1865         raid->lun = array;
1866         strncpy(raid->name, meta->name_1,
1867                 min(sizeof(raid->name), sizeof(meta->name_1)));
1868         if (meta->magic == HPTV2_MAGIC_OK) {
1869             raid->disks[disk_number].flags |= AR_DF_ONLINE;
1870             raid->width = meta->array_width;
1871             raid->total_sectors = meta->total_sectors;
1872             raid->heads = 255;
1873             raid->sectors = 63;
1874             raid->cylinders = raid->total_sectors / (63 * 255);
1875             raid->offset_sectors = HPTV2_LBA(parent) + 1;
1876             raid->rebuild_lba = meta->rebuild_lba;
1877             raid->disks[disk_number].sectors =
1878                 raid->total_sectors / raid->width;
1879         }
1880         else
1881             raid->disks[disk_number].flags &= ~AR_DF_ONLINE;
1882
1883         if ((raid->type & AR_T_RAID0) && (raid->total_disks < raid->width))
1884             raid->total_disks = raid->width;
1885         if (disk_number >= raid->total_disks)
1886             raid->total_disks = disk_number + 1;
1887         ars->raid[raid->volume] = raid;
1888         ars->disk_number[raid->volume] = disk_number;
1889         retval = 1;
1890         break;
1891     }
1892
1893 hptv2_out:
1894     kfree(meta, M_AR);
1895     return retval;
1896 }
1897
1898 static int
1899 ata_raid_hptv2_write_meta(struct ar_softc *rdp)
1900 {
1901     struct hptv2_raid_conf *meta;
1902     struct timeval timestamp;
1903     int disk, error = 0;
1904
1905     meta = (struct hptv2_raid_conf *)kmalloc(sizeof(struct hptv2_raid_conf),
1906         M_AR, M_WAITOK | M_ZERO);
1907
1908     microtime(&timestamp);
1909     rdp->magic_0 = timestamp.tv_sec + 2;
1910     rdp->magic_1 = timestamp.tv_sec;
1911    
1912     for (disk = 0; disk < rdp->total_disks; disk++) {
1913         if ((rdp->disks[disk].flags & (AR_DF_PRESENT | AR_DF_ONLINE)) ==
1914             (AR_DF_PRESENT | AR_DF_ONLINE))
1915             meta->magic = HPTV2_MAGIC_OK;
1916         if (rdp->disks[disk].flags & AR_DF_ASSIGNED) {
1917             meta->magic_0 = rdp->magic_0;
1918             if (strlen(rdp->name))
1919                 strncpy(meta->name_1, rdp->name, sizeof(meta->name_1));
1920             else
1921                 strcpy(meta->name_1, "FreeBSD");
1922         }
1923         meta->disk_number = disk;
1924
1925         switch (rdp->type) {
1926         case AR_T_RAID0:
1927             meta->type = HPTV2_T_RAID0;
1928             strcpy(meta->name_2, "RAID 0");
1929             if (rdp->disks[disk].flags & AR_DF_ONLINE)
1930                 meta->order = HPTV2_O_OK;
1931             break;
1932
1933         case AR_T_RAID1:
1934             meta->type = HPTV2_T_RAID0;
1935             strcpy(meta->name_2, "RAID 1");
1936             meta->disk_number = (disk < rdp->width) ? disk : disk + 5;
1937             meta->order = HPTV2_O_RAID0 | HPTV2_O_OK;
1938             break;
1939
1940         case AR_T_RAID01:
1941             meta->type = HPTV2_T_RAID01_RAID0;
1942             strcpy(meta->name_2, "RAID 0+1");
1943             if (rdp->disks[disk].flags & AR_DF_ONLINE) {
1944                 if (disk < rdp->width) {
1945                     meta->order = (HPTV2_O_RAID0 | HPTV2_O_RAID1);
1946                     meta->magic_0 = rdp->magic_0 - 1;
1947                 }
1948                 else {
1949                     meta->order = HPTV2_O_RAID1;
1950                     meta->disk_number -= rdp->width;
1951                 }
1952             }
1953             else
1954                 meta->magic_0 = rdp->magic_0 - 1;
1955             meta->magic_1 = rdp->magic_1;
1956             break;
1957
1958         case AR_T_SPAN:
1959             meta->type = HPTV2_T_SPAN;
1960             strcpy(meta->name_2, "SPAN");
1961             break;
1962         default:
1963             kfree(meta, M_AR);
1964             return ENODEV;
1965         }
1966
1967         meta->array_width = rdp->width;
1968         meta->stripe_shift = (rdp->width > 1) ? (ffs(rdp->interleave)-1) : 0;
1969         meta->total_sectors = rdp->total_sectors;
1970         meta->rebuild_lba = rdp->rebuild_lba;
1971         if (testing || bootverbose)
1972             ata_raid_hptv2_print_meta(meta);
1973         if (rdp->disks[disk].dev) {
1974             if (ata_raid_rw(rdp->disks[disk].dev,
1975                             HPTV2_LBA(rdp->disks[disk].dev), meta,
1976                             sizeof(struct promise_raid_conf),
1977                             ATA_R_WRITE | ATA_R_DIRECT)) {
1978                 device_printf(rdp->disks[disk].dev, "write metadata failed\n");
1979                 error = EIO;
1980             }
1981         }
1982     }
1983     kfree(meta, M_AR);
1984     return error;
1985 }
1986
1987 /* Highpoint V3 RocketRAID Metadata */
1988 static int
1989 ata_raid_hptv3_read_meta(device_t dev, struct ar_softc **raidp)
1990 {
1991     struct ata_raid_subdisk *ars = device_get_softc(dev);
1992     device_t parent = device_get_parent(dev);
1993     struct hptv3_raid_conf *meta;
1994     struct ar_softc *raid = NULL;
1995     int array, disk_number, retval = 0;
1996
1997     meta = (struct hptv3_raid_conf *)kmalloc(sizeof(struct hptv3_raid_conf),
1998         M_AR, M_WAITOK | M_ZERO);
1999
2000     if (ata_raid_rw(parent, HPTV3_LBA(parent),
2001                     meta, sizeof(struct hptv3_raid_conf), ATA_R_READ)) {
2002         if (testing || bootverbose)
2003             device_printf(parent, "HighPoint (v3) read metadata failed\n");
2004         goto hptv3_out;
2005     }
2006
2007     /* check if this is a HighPoint v3 RAID struct */
2008     if (meta->magic != HPTV3_MAGIC) {
2009         if (testing || bootverbose)
2010             device_printf(parent, "HighPoint (v3) check1 failed\n");
2011         goto hptv3_out;
2012     }
2013
2014     /* check if there are any config_entries */
2015     if (meta->config_entries < 1) {
2016         if (testing || bootverbose)
2017             device_printf(parent, "HighPoint (v3) check2 failed\n");
2018         goto hptv3_out;
2019     }
2020
2021     if (testing || bootverbose)
2022         ata_raid_hptv3_print_meta(meta);
2023
2024     /* now convert HighPoint (v3) metadata into our generic form */
2025     for (array = 0; array < MAX_ARRAYS; array++) {
2026         if (!raidp[array]) {
2027             raidp[array] = 
2028                 (struct ar_softc *)kmalloc(sizeof(struct ar_softc), M_AR,
2029                                           M_WAITOK | M_ZERO);
2030         }
2031         raid = raidp[array];
2032         if (raid->format && (raid->format != AR_F_HPTV3_RAID))
2033             continue;
2034
2035         if ((raid->format & AR_F_HPTV3_RAID) && raid->magic_0 != meta->magic_0)
2036             continue;
2037         
2038         switch (meta->configs[0].type) {
2039         case HPTV3_T_RAID0:
2040             raid->type = AR_T_RAID0;
2041             raid->width = meta->configs[0].total_disks;
2042             disk_number = meta->configs[0].disk_number;
2043             break;
2044
2045         case HPTV3_T_RAID1:
2046             raid->type = AR_T_RAID1;
2047             raid->width = meta->configs[0].total_disks / 2;
2048             disk_number = meta->configs[0].disk_number;
2049             break;
2050
2051         case HPTV3_T_RAID5:
2052             raid->type = AR_T_RAID5;
2053             raid->width = meta->configs[0].total_disks;
2054             disk_number = meta->configs[0].disk_number;
2055             break;
2056
2057         case HPTV3_T_SPAN:
2058             raid->type = AR_T_SPAN;
2059             raid->width = meta->configs[0].total_disks;
2060             disk_number = meta->configs[0].disk_number;
2061             break;
2062
2063         default:
2064             device_printf(parent, "Highpoint (v3) unknown RAID type 0x%02x\n",
2065                           meta->configs[0].type);
2066             kfree(raidp[array], M_AR);
2067             raidp[array] = NULL;
2068             goto hptv3_out;
2069         }
2070         if (meta->config_entries == 2) {
2071             switch (meta->configs[1].type) {
2072             case HPTV3_T_RAID1:
2073                 if (raid->type == AR_T_RAID0) {
2074                     raid->type = AR_T_RAID01;
2075                     disk_number = meta->configs[1].disk_number +
2076                                   (meta->configs[0].disk_number << 1);
2077                     break;
2078                 }
2079             default:
2080                 device_printf(parent, "Highpoint (v3) unknown level 2 0x%02x\n",
2081                               meta->configs[1].type);
2082                 kfree(raidp[array], M_AR);
2083                 raidp[array] = NULL;
2084                 goto hptv3_out;
2085             }
2086         }
2087
2088         raid->magic_0 = meta->magic_0;
2089         raid->format = AR_F_HPTV3_RAID;
2090         raid->generation = meta->timestamp;
2091         raid->interleave = 1 << meta->configs[0].stripe_shift;
2092         raid->total_disks = meta->configs[0].total_disks +
2093             meta->configs[1].total_disks;
2094         raid->total_sectors = meta->configs[0].total_sectors +
2095             ((u_int64_t)meta->configs_high[0].total_sectors << 32);
2096         raid->heads = 255;
2097         raid->sectors = 63;
2098         raid->cylinders = raid->total_sectors / (63 * 255);
2099         raid->offset_sectors = 0;
2100         raid->rebuild_lba = meta->configs[0].rebuild_lba +
2101             ((u_int64_t)meta->configs_high[0].rebuild_lba << 32);
2102         raid->lun = array;
2103         strncpy(raid->name, meta->name,
2104                 min(sizeof(raid->name), sizeof(meta->name)));
2105         raid->disks[disk_number].sectors = raid->total_sectors /
2106             (raid->type == AR_T_RAID5 ? raid->width - 1 : raid->width);
2107         raid->disks[disk_number].dev = parent;
2108         raid->disks[disk_number].flags = 
2109             (AR_DF_PRESENT | AR_DF_ASSIGNED | AR_DF_ONLINE);
2110         ars->raid[raid->volume] = raid;
2111         ars->disk_number[raid->volume] = disk_number;
2112         retval = 1;
2113         break;
2114     }
2115
2116 hptv3_out:
2117     kfree(meta, M_AR);
2118     return retval;
2119 }
2120
2121 /* Intel MatrixRAID Metadata */
2122 static int
2123 ata_raid_intel_read_meta(device_t dev, struct ar_softc **raidp)
2124 {
2125     struct ata_raid_subdisk *ars = device_get_softc(dev);
2126     device_t parent = device_get_parent(dev);
2127     struct intel_raid_conf *meta;
2128     struct intel_raid_mapping *map;
2129     struct ar_softc *raid = NULL;
2130     u_int32_t checksum, *ptr;
2131     int array, count, disk, volume = 1, retval = 0;
2132     char *tmp;
2133
2134     meta = (struct intel_raid_conf *)kmalloc(1536, M_AR, M_WAITOK | M_ZERO);
2135
2136     if (ata_raid_rw(parent, INTEL_LBA(parent), meta, 1024, ATA_R_READ)) {
2137         if (testing || bootverbose)
2138             device_printf(parent, "Intel read metadata failed\n");
2139         goto intel_out;
2140     }
2141     tmp = (char *)meta;
2142     bcopy(tmp, tmp+1024, 512);
2143     bcopy(tmp+512, tmp, 1024);
2144     bzero(tmp+1024, 512);
2145
2146     /* check if this is a Intel RAID struct */
2147     if (strncmp(meta->intel_id, INTEL_MAGIC, strlen(INTEL_MAGIC))) {
2148         if (testing || bootverbose)
2149             device_printf(parent, "Intel check1 failed\n");
2150         goto intel_out;
2151     }
2152
2153     for (checksum = 0, ptr = (u_int32_t *)meta, count = 0;
2154          count < (meta->config_size / sizeof(u_int32_t)); count++) {
2155         checksum += *ptr++;
2156     }
2157     checksum -= meta->checksum;
2158     if (checksum != meta->checksum) {  
2159         if (testing || bootverbose)
2160             device_printf(parent, "Intel check2 failed\n");          
2161         goto intel_out;
2162     }
2163
2164     if (testing || bootverbose)
2165         ata_raid_intel_print_meta(meta);
2166
2167     map = (struct intel_raid_mapping *)&meta->disk[meta->total_disks];
2168
2169     /* now convert Intel metadata into our generic form */
2170     for (array = 0; array < MAX_ARRAYS; array++) {
2171         if (!raidp[array]) {
2172             raidp[array] = 
2173                 (struct ar_softc *)kmalloc(sizeof(struct ar_softc), M_AR,
2174                                           M_WAITOK | M_ZERO);
2175         }
2176         raid = raidp[array];
2177         if (raid->format && (raid->format != AR_F_INTEL_RAID))
2178             continue;
2179
2180         if ((raid->format & AR_F_INTEL_RAID) &&
2181             (raid->magic_0 != meta->config_id))
2182             continue;
2183
2184         /*
2185          * update our knowledge about the array config based on generation
2186          * NOTE: there can be multiple volumes on a disk set
2187          */
2188         if (!meta->generation || meta->generation > raid->generation) {
2189             switch (map->type) {
2190             case INTEL_T_RAID0:
2191                 raid->type = AR_T_RAID0;
2192                 raid->width = map->total_disks;
2193                 break;
2194
2195             case INTEL_T_RAID1:
2196                 if (map->total_disks == 4)
2197                     raid->type = AR_T_RAID01;
2198                 else
2199                     raid->type = AR_T_RAID1;
2200                 raid->width = map->total_disks / 2;
2201                 break;
2202
2203             case INTEL_T_RAID5:
2204                 raid->type = AR_T_RAID5;
2205                 raid->width = map->total_disks;
2206                 break;
2207
2208             default:
2209                 device_printf(parent, "Intel unknown RAID type 0x%02x\n",
2210                               map->type);
2211                 kfree(raidp[array], M_AR);
2212                 raidp[array] = NULL;
2213                 goto intel_out;
2214             }
2215
2216             switch (map->status) {
2217             case INTEL_S_READY:
2218                 raid->status = AR_S_READY;
2219                 break;
2220             case INTEL_S_DEGRADED:
2221                 raid->status |= AR_S_DEGRADED;
2222                 break;
2223             case INTEL_S_DISABLED:
2224             case INTEL_S_FAILURE:
2225                 raid->status = 0;
2226             }
2227
2228             raid->magic_0 = meta->config_id;
2229             raid->format = AR_F_INTEL_RAID;
2230             raid->generation = meta->generation;
2231             raid->interleave = map->stripe_sectors;
2232             raid->total_disks = map->total_disks;
2233             raid->total_sectors = map->total_sectors;
2234             raid->heads = 255;
2235             raid->sectors = 63;
2236             raid->cylinders = raid->total_sectors / (63 * 255);
2237             raid->offset_sectors = map->offset;         
2238             raid->rebuild_lba = 0;
2239             raid->lun = array;
2240             raid->volume = volume - 1;
2241             strncpy(raid->name, map->name,
2242                     min(sizeof(raid->name), sizeof(map->name)));
2243
2244             /* clear out any old info */
2245             for (disk = 0; disk < raid->total_disks; disk++) {
2246                 u_int disk_idx = map->disk_idx[disk] & 0xffff;
2247
2248                 raid->disks[disk].dev = NULL;
2249                 bcopy(meta->disk[disk_idx].serial,
2250                       raid->disks[disk].serial,
2251                       sizeof(raid->disks[disk].serial));
2252                 raid->disks[disk].sectors =
2253                     meta->disk[disk_idx].sectors;
2254                 raid->disks[disk].flags = 0;
2255                 if (meta->disk[disk_idx].flags & INTEL_F_ONLINE)
2256                     raid->disks[disk].flags |= AR_DF_ONLINE;
2257                 if (meta->disk[disk_idx].flags & INTEL_F_ASSIGNED)
2258                     raid->disks[disk].flags |= AR_DF_ASSIGNED;
2259                 if (meta->disk[disk_idx].flags & INTEL_F_SPARE) {
2260                     raid->disks[disk].flags &= ~(AR_DF_ONLINE | AR_DF_ASSIGNED);
2261                     raid->disks[disk].flags |= AR_DF_SPARE;
2262                 }
2263                 if (meta->disk[disk_idx].flags & INTEL_F_DOWN)
2264                     raid->disks[disk].flags &= ~AR_DF_ONLINE;
2265             }
2266         }
2267         if (meta->generation >= raid->generation) {
2268             for (disk = 0; disk < raid->total_disks; disk++) {
2269                 struct ata_device *atadev = device_get_softc(parent);
2270
2271                 if (!strncmp(raid->disks[disk].serial, atadev->param.serial,
2272                     sizeof(raid->disks[disk].serial))) {
2273                     raid->disks[disk].dev = parent;
2274                     raid->disks[disk].flags |= (AR_DF_PRESENT | AR_DF_ONLINE);
2275                     ars->raid[raid->volume] = raid;
2276                     ars->disk_number[raid->volume] = disk;
2277                     retval = 1;
2278                 }
2279             }
2280         }
2281         else
2282             goto intel_out;
2283
2284         if (retval) {
2285             if (volume < meta->total_volumes) {
2286                 map = (struct intel_raid_mapping *)
2287                       &map->disk_idx[map->total_disks];
2288                 volume++;
2289                 retval = 0;
2290                 continue;
2291             }
2292             break;
2293         }
2294         else {
2295             kfree(raidp[array], M_AR);
2296             raidp[array] = NULL;
2297             if (volume == 2)
2298                 retval = 1;
2299         }
2300     }
2301
2302 intel_out:
2303     kfree(meta, M_AR);
2304     return retval;
2305 }
2306
2307 static int
2308 ata_raid_intel_write_meta(struct ar_softc *rdp)
2309 {
2310     struct intel_raid_conf *meta;
2311     struct intel_raid_mapping *map;
2312     struct timeval timestamp;
2313     u_int32_t checksum, *ptr;
2314     int count, disk, error = 0;
2315     char *tmp;
2316
2317     meta = (struct intel_raid_conf *)kmalloc(1536, M_AR, M_WAITOK | M_ZERO);
2318
2319     rdp->generation++;
2320
2321     /* Generate a new config_id if none exists */
2322     if (!rdp->magic_0) {
2323         microtime(&timestamp);
2324         rdp->magic_0 = timestamp.tv_sec ^ timestamp.tv_usec;
2325     }
2326
2327     bcopy(INTEL_MAGIC, meta->intel_id, sizeof(meta->intel_id));
2328     bcopy(INTEL_VERSION_1100, meta->version, sizeof(meta->version));
2329     meta->config_id = rdp->magic_0;
2330     meta->generation = rdp->generation;
2331     meta->total_disks = rdp->total_disks;
2332     meta->total_volumes = 1;                                    /* XXX SOS */
2333     for (disk = 0; disk < rdp->total_disks; disk++) {
2334         if (rdp->disks[disk].dev) {
2335             struct ata_channel *ch =
2336                 device_get_softc(device_get_parent(rdp->disks[disk].dev));
2337             struct ata_device *atadev =
2338                 device_get_softc(rdp->disks[disk].dev);
2339
2340             bcopy(atadev->param.serial, meta->disk[disk].serial,
2341                   sizeof(rdp->disks[disk].serial));
2342             meta->disk[disk].sectors = rdp->disks[disk].sectors;
2343             meta->disk[disk].id = (ch->unit << 16) | ATA_DEV(atadev->unit);
2344         }
2345         else
2346             meta->disk[disk].sectors = rdp->total_sectors / rdp->width;
2347         meta->disk[disk].flags = 0;
2348         if (rdp->disks[disk].flags & AR_DF_SPARE)
2349             meta->disk[disk].flags  |= INTEL_F_SPARE;
2350         else {
2351             if (rdp->disks[disk].flags & AR_DF_ONLINE)
2352                 meta->disk[disk].flags |= INTEL_F_ONLINE;
2353             else
2354                 meta->disk[disk].flags |= INTEL_F_DOWN;
2355             if (rdp->disks[disk].flags & AR_DF_ASSIGNED)
2356                 meta->disk[disk].flags  |= INTEL_F_ASSIGNED;
2357         }
2358     }
2359     map = (struct intel_raid_mapping *)&meta->disk[meta->total_disks];
2360
2361     bcopy(rdp->name, map->name, sizeof(rdp->name));
2362     map->total_sectors = rdp->total_sectors;
2363     map->state = 12;                                            /* XXX SOS */
2364     map->offset = rdp->offset_sectors;
2365     map->stripe_count = rdp->total_sectors / (rdp->interleave*rdp->total_disks);
2366     map->stripe_sectors =  rdp->interleave;
2367     map->disk_sectors = rdp->total_sectors / rdp->width;
2368     map->status = INTEL_S_READY;                                /* XXX SOS */
2369     switch (rdp->type) {
2370     case AR_T_RAID0:
2371         map->type = INTEL_T_RAID0;
2372         break;
2373     case AR_T_RAID1:
2374         map->type = INTEL_T_RAID1;
2375         break;
2376     case AR_T_RAID01:
2377         map->type = INTEL_T_RAID1;
2378         break;
2379     case AR_T_RAID5:
2380         map->type = INTEL_T_RAID5;
2381         break;
2382     default:
2383         kfree(meta, M_AR);
2384         return ENODEV;
2385     }
2386     map->total_disks = rdp->total_disks;
2387     map->magic[0] = 0x02;
2388     map->magic[1] = 0xff;
2389     map->magic[2] = 0x01;
2390     for (disk = 0; disk < rdp->total_disks; disk++)
2391         map->disk_idx[disk] = disk;
2392
2393     meta->config_size = (char *)&map->disk_idx[disk] - (char *)meta;
2394     for (checksum = 0, ptr = (u_int32_t *)meta, count = 0;
2395          count < (meta->config_size / sizeof(u_int32_t)); count++) {
2396         checksum += *ptr++;
2397     }
2398     meta->checksum = checksum;
2399
2400     if (testing || bootverbose)
2401         ata_raid_intel_print_meta(meta);
2402
2403     tmp = (char *)meta;
2404     bcopy(tmp, tmp+1024, 512);
2405     bcopy(tmp+512, tmp, 1024);
2406     bzero(tmp+1024, 512);
2407
2408     for (disk = 0; disk < rdp->total_disks; disk++) {
2409         if (rdp->disks[disk].dev) {
2410             if (ata_raid_rw(rdp->disks[disk].dev,
2411                             INTEL_LBA(rdp->disks[disk].dev),
2412                             meta, 1024, ATA_R_WRITE | ATA_R_DIRECT)) {
2413                 device_printf(rdp->disks[disk].dev, "write metadata failed\n");
2414                 error = EIO;
2415             }
2416         }
2417     }
2418     kfree(meta, M_AR);
2419     return error;
2420 }
2421
2422
2423 /* Integrated Technology Express Metadata */
2424 static int
2425 ata_raid_ite_read_meta(device_t dev, struct ar_softc **raidp)
2426 {
2427     struct ata_raid_subdisk *ars = device_get_softc(dev);
2428     device_t parent = device_get_parent(dev);
2429     struct ite_raid_conf *meta;
2430     struct ar_softc *raid = NULL;
2431     int array, disk_number, count, retval = 0;
2432     u_int16_t *ptr;
2433
2434     meta = (struct ite_raid_conf *)kmalloc(sizeof(struct ite_raid_conf), M_AR,
2435         M_WAITOK | M_ZERO);
2436
2437     if (ata_raid_rw(parent, ITE_LBA(parent),
2438                     meta, sizeof(struct ite_raid_conf), ATA_R_READ)) {
2439         if (testing || bootverbose)
2440             device_printf(parent, "ITE read metadata failed\n");
2441         goto ite_out;
2442     }
2443
2444     /* check if this is a ITE RAID struct */
2445     for (ptr = (u_int16_t *)meta->ite_id, count = 0;
2446          count < sizeof(meta->ite_id)/sizeof(uint16_t); count++)
2447         ptr[count] = be16toh(ptr[count]);
2448
2449     if (strncmp(meta->ite_id, ITE_MAGIC, strlen(ITE_MAGIC))) {
2450         if (testing || bootverbose)
2451             device_printf(parent, "ITE check1 failed\n");
2452         goto ite_out;
2453     }
2454
2455     if (testing || bootverbose)
2456         ata_raid_ite_print_meta(meta);
2457
2458     /* now convert ITE metadata into our generic form */
2459     for (array = 0; array < MAX_ARRAYS; array++) {
2460         if ((raid = raidp[array])) {
2461             if (raid->format != AR_F_ITE_RAID)
2462                 continue;
2463             if (raid->magic_0 != *((u_int64_t *)meta->timestamp_0))
2464                 continue;
2465         }
2466
2467         /* if we dont have a disks timestamp the RAID is invalidated */
2468         if (*((u_int64_t *)meta->timestamp_1) == 0)
2469             goto ite_out;
2470
2471         if (!raid) {
2472             raidp[array] = (struct ar_softc *)kmalloc(sizeof(struct ar_softc),
2473                                                      M_AR, M_WAITOK | M_ZERO);
2474         }
2475
2476         switch (meta->type) {
2477         case ITE_T_RAID0:
2478             raid->type = AR_T_RAID0;
2479             raid->width = meta->array_width;
2480             raid->total_disks = meta->array_width;
2481             disk_number = meta->disk_number;
2482             break;
2483
2484         case ITE_T_RAID1:
2485             raid->type = AR_T_RAID1;
2486             raid->width = 1;
2487             raid->total_disks = 2;
2488             disk_number = meta->disk_number;
2489             break;
2490
2491         case ITE_T_RAID01:
2492             raid->type = AR_T_RAID01;
2493             raid->width = meta->array_width;
2494             raid->total_disks = 4;
2495             disk_number = ((meta->disk_number & 0x02) >> 1) |
2496                           ((meta->disk_number & 0x01) << 1);
2497             break;
2498
2499         case ITE_T_SPAN:
2500             raid->type = AR_T_SPAN;
2501             raid->width = 1;
2502             raid->total_disks = meta->array_width;
2503             disk_number = meta->disk_number;
2504             break;
2505
2506         default:
2507             device_printf(parent, "ITE unknown RAID type 0x%02x\n", meta->type);
2508             kfree(raidp[array], M_AR);
2509             raidp[array] = NULL;
2510             goto ite_out;
2511         }
2512
2513         raid->magic_0 = *((u_int64_t *)meta->timestamp_0);
2514         raid->format = AR_F_ITE_RAID;
2515         raid->generation = 0;
2516         raid->interleave = meta->stripe_sectors;
2517         raid->total_sectors = meta->total_sectors;
2518         raid->heads = 255;
2519         raid->sectors = 63;
2520         raid->cylinders = raid->total_sectors / (63 * 255);
2521         raid->offset_sectors = 0;
2522         raid->rebuild_lba = 0;
2523         raid->lun = array;
2524
2525         raid->disks[disk_number].dev = parent;
2526         raid->disks[disk_number].sectors = raid->total_sectors / raid->width;
2527         raid->disks[disk_number].flags = 
2528             (AR_DF_PRESENT | AR_DF_ASSIGNED | AR_DF_ONLINE);
2529         ars->raid[raid->volume] = raid;
2530         ars->disk_number[raid->volume] = disk_number;
2531         retval = 1;
2532         break;
2533     }
2534 ite_out:
2535     kfree(meta, M_AR);
2536     return retval;
2537 }
2538
2539 /* JMicron Technology Corp Metadata */
2540 static int
2541 ata_raid_jmicron_read_meta(device_t dev, struct ar_softc **raidp)
2542 {
2543     struct ata_raid_subdisk *ars = device_get_softc(dev);
2544     device_t parent = device_get_parent(dev);
2545     struct jmicron_raid_conf *meta;
2546     struct ar_softc *raid = NULL;
2547     u_int16_t checksum, *ptr;
2548     u_int64_t disk_size;
2549     int count, array, disk, total_disks, retval = 0;
2550
2551     meta = (struct jmicron_raid_conf *)
2552         kmalloc(sizeof(struct jmicron_raid_conf), M_AR, M_WAITOK | M_ZERO);
2553
2554     if (ata_raid_rw(parent, JMICRON_LBA(parent),
2555                     meta, sizeof(struct jmicron_raid_conf), ATA_R_READ)) {
2556         if (testing || bootverbose)
2557             device_printf(parent,
2558                           "JMicron read metadata failed\n");
2559     }
2560
2561     /* check for JMicron signature */
2562     if (strncmp(meta->signature, JMICRON_MAGIC, 2)) {
2563         if (testing || bootverbose)
2564             device_printf(parent, "JMicron check1 failed\n");
2565         goto jmicron_out;
2566     }
2567
2568     /* calculate checksum and compare for valid */
2569     for (checksum = 0, ptr = (u_int16_t *)meta, count = 0; count < 64; count++)
2570         checksum += *ptr++;
2571     if (checksum) {  
2572         if (testing || bootverbose)
2573             device_printf(parent, "JMicron check2 failed\n");
2574         goto jmicron_out;
2575     }
2576
2577     if (testing || bootverbose)
2578         ata_raid_jmicron_print_meta(meta);
2579
2580     /* now convert JMicron meta into our generic form */
2581     for (array = 0; array < MAX_ARRAYS; array++) {
2582 jmicron_next:
2583         if (!raidp[array]) {
2584             raidp[array] = 
2585                 (struct ar_softc *)kmalloc(sizeof(struct ar_softc), M_AR,
2586                                           M_WAITOK | M_ZERO);
2587         }
2588         raid = raidp[array];
2589         if (raid->format && (raid->format != AR_F_JMICRON_RAID))
2590             continue;
2591
2592         for (total_disks = 0, disk = 0; disk < JM_MAX_DISKS; disk++) {
2593             if (meta->disks[disk]) {
2594                 if (raid->format == AR_F_JMICRON_RAID) {
2595                     if (bcmp(&meta->disks[disk], 
2596                         raid->disks[disk].serial, sizeof(u_int32_t))) {
2597                         array++;
2598                         goto jmicron_next;
2599                     }
2600                 }
2601                 else 
2602                     bcopy(&meta->disks[disk],
2603                           raid->disks[disk].serial, sizeof(u_int32_t));
2604                 total_disks++;
2605             }
2606         }
2607         /* handle spares XXX SOS */
2608
2609         switch (meta->type) {
2610         case JM_T_RAID0:
2611             raid->type = AR_T_RAID0;
2612             raid->width = total_disks;
2613             break;
2614
2615         case JM_T_RAID1:
2616             raid->type = AR_T_RAID1;
2617             raid->width = 1;
2618             break;
2619
2620         case JM_T_RAID01:
2621             raid->type = AR_T_RAID01;
2622             raid->width = total_disks / 2;
2623             break;
2624
2625         case JM_T_RAID5:
2626             raid->type = AR_T_RAID5;
2627             raid->width = total_disks;
2628             break;
2629
2630         case JM_T_JBOD:
2631             raid->type = AR_T_SPAN;
2632             raid->width = 1;
2633             break;
2634
2635         default:
2636             device_printf(parent,
2637                           "JMicron unknown RAID type 0x%02x\n", meta->type);
2638             kfree(raidp[array], M_AR);
2639             raidp[array] = NULL;
2640             goto jmicron_out;
2641         }
2642         disk_size = (meta->disk_sectors_high << 16) + meta->disk_sectors_low;
2643         raid->format = AR_F_JMICRON_RAID;
2644         strncpy(raid->name, meta->name, sizeof(meta->name));
2645         raid->generation = 0;
2646         raid->interleave = 2 << meta->stripe_shift;
2647         raid->total_disks = total_disks;
2648         raid->total_sectors = disk_size * (raid->width-(raid->type==AR_RAID5));
2649         raid->heads = 255;
2650         raid->sectors = 63;
2651         raid->cylinders = raid->total_sectors / (63 * 255);
2652         raid->offset_sectors = meta->offset * 16;
2653         raid->rebuild_lba = 0;
2654         raid->lun = array;
2655
2656         for (disk = 0; disk < raid->total_disks; disk++) {
2657             if (meta->disks[disk] == meta->disk_id) {
2658                 raid->disks[disk].dev = parent;
2659                 raid->disks[disk].sectors = disk_size;
2660                 raid->disks[disk].flags =
2661                     (AR_DF_ONLINE | AR_DF_PRESENT | AR_DF_ASSIGNED);
2662                 ars->raid[raid->volume] = raid;
2663                 ars->disk_number[raid->volume] = disk;
2664                 retval = 1;
2665                 break;
2666             }
2667         }
2668         break;
2669     }
2670 jmicron_out:
2671     kfree(meta, M_AR);
2672     return retval;
2673 }
2674
2675 static int
2676 ata_raid_jmicron_write_meta(struct ar_softc *rdp)
2677 {
2678     struct jmicron_raid_conf *meta;
2679     u_int64_t disk_sectors;
2680     int disk, error = 0;
2681
2682     meta = (struct jmicron_raid_conf *)
2683         kmalloc(sizeof(struct jmicron_raid_conf), M_AR, M_WAITOK | M_ZERO);
2684
2685     rdp->generation++;
2686     switch (rdp->type) {
2687     case AR_T_JBOD:
2688         meta->type = JM_T_JBOD;
2689         break;
2690
2691     case AR_T_RAID0:
2692         meta->type = JM_T_RAID0;
2693         break;
2694
2695     case AR_T_RAID1:
2696         meta->type = JM_T_RAID1;
2697         break;
2698
2699     case AR_T_RAID5:
2700         meta->type = JM_T_RAID5;
2701         break;
2702
2703     case AR_T_RAID01:
2704         meta->type = JM_T_RAID01;
2705         break;
2706
2707     default:
2708         kfree(meta, M_AR);
2709         return ENODEV;
2710     }
2711     bcopy(JMICRON_MAGIC, meta->signature, sizeof(JMICRON_MAGIC));
2712     meta->version = JMICRON_VERSION;
2713     meta->offset = rdp->offset_sectors / 16;
2714     disk_sectors = rdp->total_sectors / (rdp->width - (rdp->type == AR_RAID5));
2715     meta->disk_sectors_low = disk_sectors & 0xffff;
2716     meta->disk_sectors_high = disk_sectors >> 16;
2717     strncpy(meta->name, rdp->name, sizeof(meta->name));
2718     meta->stripe_shift = ffs(rdp->interleave) - 2;
2719
2720     for (disk = 0; disk < rdp->total_disks; disk++) {
2721         if (rdp->disks[disk].serial[0])
2722             bcopy(rdp->disks[disk].serial,&meta->disks[disk],sizeof(u_int32_t));
2723         else
2724             meta->disks[disk] = (u_int32_t)(uintptr_t)rdp->disks[disk].dev;
2725     }
2726
2727     for (disk = 0; disk < rdp->total_disks; disk++) {
2728         if (rdp->disks[disk].dev) {
2729             u_int16_t checksum = 0, *ptr;
2730             int count;
2731
2732             meta->disk_id = meta->disks[disk];
2733             meta->checksum = 0;
2734             for (ptr = (u_int16_t *)meta, count = 0; count < 64; count++)
2735                 checksum += *ptr++;
2736             meta->checksum -= checksum;
2737
2738             if (testing || bootverbose)
2739                 ata_raid_jmicron_print_meta(meta);
2740
2741             if (ata_raid_rw(rdp->disks[disk].dev,
2742                             JMICRON_LBA(rdp->disks[disk].dev),
2743                             meta, sizeof(struct jmicron_raid_conf),
2744                             ATA_R_WRITE | ATA_R_DIRECT)) {
2745                 device_printf(rdp->disks[disk].dev, "write metadata failed\n");
2746                 error = EIO;
2747             }
2748         }
2749     }
2750     /* handle spares XXX SOS */
2751
2752     kfree(meta, M_AR);
2753     return error;
2754 }
2755
2756 /* LSILogic V2 MegaRAID Metadata */
2757 static int
2758 ata_raid_lsiv2_read_meta(device_t dev, struct ar_softc **raidp)
2759 {
2760     struct ata_raid_subdisk *ars = device_get_softc(dev);
2761     device_t parent = device_get_parent(dev);
2762     struct lsiv2_raid_conf *meta;
2763     struct ar_softc *raid = NULL;
2764     int array, retval = 0;
2765
2766     meta = (struct lsiv2_raid_conf *)kmalloc(sizeof(struct lsiv2_raid_conf),
2767         M_AR, M_WAITOK | M_ZERO);
2768
2769     if (ata_raid_rw(parent, LSIV2_LBA(parent),
2770                     meta, sizeof(struct lsiv2_raid_conf), ATA_R_READ)) {
2771         if (testing || bootverbose)
2772             device_printf(parent, "LSI (v2) read metadata failed\n");
2773         goto lsiv2_out;
2774     }
2775
2776     /* check if this is a LSI RAID struct */
2777     if (strncmp(meta->lsi_id, LSIV2_MAGIC, strlen(LSIV2_MAGIC))) {
2778         if (testing || bootverbose)
2779             device_printf(parent, "LSI (v2) check1 failed\n");
2780         goto lsiv2_out;
2781     }
2782
2783     if (testing || bootverbose)
2784         ata_raid_lsiv2_print_meta(meta);
2785
2786     /* now convert LSI (v2) config meta into our generic form */
2787     for (array = 0; array < MAX_ARRAYS; array++) {
2788         int raid_entry, conf_entry;
2789
2790         if (!raidp[array + meta->raid_number]) {
2791             raidp[array + meta->raid_number] = 
2792                 (struct ar_softc *)kmalloc(sizeof(struct ar_softc), M_AR,
2793                                           M_WAITOK | M_ZERO);
2794         }
2795         raid = raidp[array + meta->raid_number];
2796         if (raid->format && (raid->format != AR_F_LSIV2_RAID))
2797             continue;
2798
2799         if (raid->magic_0 && 
2800             ((raid->magic_0 != meta->timestamp) ||
2801              (raid->magic_1 != meta->raid_number)))
2802             continue;
2803
2804         array += meta->raid_number;
2805
2806         raid_entry = meta->raid_number;
2807         conf_entry = (meta->configs[raid_entry].raid.config_offset >> 4) +
2808                      meta->disk_number - 1;
2809
2810         switch (meta->configs[raid_entry].raid.type) {
2811         case LSIV2_T_RAID0:
2812             raid->magic_0 = meta->timestamp;
2813             raid->magic_1 = meta->raid_number;
2814             raid->type = AR_T_RAID0;
2815             raid->interleave = meta->configs[raid_entry].raid.stripe_sectors;
2816             raid->width = meta->configs[raid_entry].raid.array_width; 
2817             break;
2818
2819         case LSIV2_T_RAID1:
2820             raid->magic_0 = meta->timestamp;
2821             raid->magic_1 = meta->raid_number;
2822             raid->type = AR_T_RAID1;
2823             raid->width = meta->configs[raid_entry].raid.array_width; 
2824             break;
2825             
2826         case LSIV2_T_RAID0 | LSIV2_T_RAID1:
2827             raid->magic_0 = meta->timestamp;
2828             raid->magic_1 = meta->raid_number;
2829             raid->type = AR_T_RAID01;
2830             raid->interleave = meta->configs[raid_entry].raid.stripe_sectors;
2831             raid->width = meta->configs[raid_entry].raid.array_width; 
2832             break;
2833
2834         default:
2835             device_printf(parent, "LSI v2 unknown RAID type 0x%02x\n",
2836                           meta->configs[raid_entry].raid.type);
2837             kfree(raidp[array], M_AR);
2838             raidp[array] = NULL;
2839             goto lsiv2_out;
2840         }
2841
2842         raid->format = AR_F_LSIV2_RAID;
2843         raid->generation = 0;
2844         raid->total_disks = meta->configs[raid_entry].raid.disk_count;
2845         raid->total_sectors = meta->configs[raid_entry].raid.total_sectors;
2846         raid->heads = 255;
2847         raid->sectors = 63;
2848         raid->cylinders = raid->total_sectors / (63 * 255);
2849         raid->offset_sectors = 0;
2850         raid->rebuild_lba = 0;
2851         raid->lun = array;
2852
2853         if (meta->configs[conf_entry].disk.device != LSIV2_D_NONE) {
2854             raid->disks[meta->disk_number].dev = parent;
2855             raid->disks[meta->disk_number].sectors = 
2856                 meta->configs[conf_entry].disk.disk_sectors;
2857             raid->disks[meta->disk_number].flags = 
2858                 (AR_DF_ONLINE | AR_DF_PRESENT | AR_DF_ASSIGNED);
2859             ars->raid[raid->volume] = raid;
2860             ars->disk_number[raid->volume] = meta->disk_number;
2861             retval = 1;
2862         }
2863         else
2864             raid->disks[meta->disk_number].flags &= ~AR_DF_ONLINE;
2865
2866         break;
2867     }
2868
2869 lsiv2_out:
2870     kfree(meta, M_AR);
2871     return retval;
2872 }
2873
2874 /* LSILogic V3 MegaRAID Metadata */
2875 static int
2876 ata_raid_lsiv3_read_meta(device_t dev, struct ar_softc **raidp)
2877 {
2878     struct ata_raid_subdisk *ars = device_get_softc(dev);
2879     device_t parent = device_get_parent(dev);
2880     struct lsiv3_raid_conf *meta;
2881     struct ar_softc *raid = NULL;
2882     u_int8_t checksum, *ptr;
2883     int array, entry, count, disk_number, retval = 0;
2884
2885     meta = (struct lsiv3_raid_conf *)kmalloc(sizeof(struct lsiv3_raid_conf),
2886         M_AR, M_WAITOK | M_ZERO);
2887
2888     if (ata_raid_rw(parent, LSIV3_LBA(parent),
2889                     meta, sizeof(struct lsiv3_raid_conf), ATA_R_READ)) {
2890         if (testing || bootverbose)
2891             device_printf(parent, "LSI (v3) read metadata failed\n");
2892         goto lsiv3_out;
2893     }
2894
2895     /* check if this is a LSI RAID struct */
2896     if (strncmp(meta->lsi_id, LSIV3_MAGIC, strlen(LSIV3_MAGIC))) {
2897         if (testing || bootverbose)
2898             device_printf(parent, "LSI (v3) check1 failed\n");
2899         goto lsiv3_out;
2900     }
2901
2902     /* check if the checksum is OK */
2903     for (checksum = 0, ptr = meta->lsi_id, count = 0; count < 512; count++)
2904         checksum += *ptr++;
2905     if (checksum) {  
2906         if (testing || bootverbose)
2907             device_printf(parent, "LSI (v3) check2 failed\n");
2908         goto lsiv3_out;
2909     }
2910
2911     if (testing || bootverbose)
2912         ata_raid_lsiv3_print_meta(meta);
2913
2914     /* now convert LSI (v3) config meta into our generic form */
2915     for (array = 0, entry = 0; array < MAX_ARRAYS && entry < 8;) {
2916         if (!raidp[array]) {
2917             raidp[array] = 
2918                 (struct ar_softc *)kmalloc(sizeof(struct ar_softc), M_AR,
2919                                           M_WAITOK | M_ZERO);
2920         }
2921         raid = raidp[array];
2922         if (raid->format && (raid->format != AR_F_LSIV3_RAID)) {
2923             array++;
2924             continue;
2925         }
2926
2927         if ((raid->format == AR_F_LSIV3_RAID) &&
2928             (raid->magic_0 != meta->timestamp)) {
2929             array++;
2930             continue;
2931         }
2932
2933         switch (meta->raid[entry].total_disks) {
2934         case 0:
2935             entry++;
2936             continue;
2937         case 1:
2938             if (meta->raid[entry].device == meta->device) {
2939                 disk_number = 0;
2940                 break;
2941             }
2942             if (raid->format)
2943                 array++;
2944             entry++;
2945             continue;
2946         case 2:
2947             disk_number = (meta->device & (LSIV3_D_DEVICE|LSIV3_D_CHANNEL))?1:0;
2948             break;
2949         default:
2950             device_printf(parent, "lsiv3 > 2 disk support untested!!\n");
2951             disk_number = (meta->device & LSIV3_D_DEVICE ? 1 : 0) +
2952                           (meta->device & LSIV3_D_CHANNEL ? 2 : 0);
2953             break;
2954         }
2955
2956         switch (meta->raid[entry].type) {
2957         case LSIV3_T_RAID0:
2958             raid->type = AR_T_RAID0;
2959             raid->width = meta->raid[entry].total_disks;
2960             break;
2961
2962         case LSIV3_T_RAID1:
2963             raid->type = AR_T_RAID1;
2964             raid->width = meta->raid[entry].array_width;
2965             break;
2966
2967         default:
2968             device_printf(parent, "LSI v3 unknown RAID type 0x%02x\n",
2969                           meta->raid[entry].type);
2970             kfree(raidp[array], M_AR);
2971             raidp[array] = NULL;
2972             entry++;
2973             continue;
2974         }
2975
2976         raid->magic_0 = meta->timestamp;
2977         raid->format = AR_F_LSIV3_RAID;
2978         raid->generation = 0;
2979         raid->interleave = meta->raid[entry].stripe_pages * 8;
2980         raid->total_disks = meta->raid[entry].total_disks;
2981         raid->total_sectors = raid->width * meta->raid[entry].sectors;
2982         raid->heads = 255;
2983         raid->sectors = 63;
2984         raid->cylinders = raid->total_sectors / (63 * 255);
2985         raid->offset_sectors = meta->raid[entry].offset;
2986         raid->rebuild_lba = 0;
2987         raid->lun = array;
2988
2989         raid->disks[disk_number].dev = parent;
2990         raid->disks[disk_number].sectors = raid->total_sectors / raid->width;
2991         raid->disks[disk_number].flags = 
2992             (AR_DF_PRESENT | AR_DF_ASSIGNED | AR_DF_ONLINE);
2993         ars->raid[raid->volume] = raid;
2994         ars->disk_number[raid->volume] = disk_number;
2995         retval = 1;
2996         entry++;
2997         array++;
2998     }
2999
3000 lsiv3_out:
3001     kfree(meta, M_AR);
3002     return retval;
3003 }
3004
3005 /* nVidia MediaShield Metadata */
3006 static int
3007 ata_raid_nvidia_read_meta(device_t dev, struct ar_softc **raidp)
3008 {
3009     struct ata_raid_subdisk *ars = device_get_softc(dev);
3010     device_t parent = device_get_parent(dev);
3011     struct nvidia_raid_conf *meta;
3012     struct ar_softc *raid = NULL;
3013     u_int32_t checksum, *ptr;
3014     int array, count, retval = 0;
3015
3016     meta = (struct nvidia_raid_conf *)kmalloc(sizeof(struct nvidia_raid_conf),
3017         M_AR, M_WAITOK | M_ZERO);
3018
3019     if (ata_raid_rw(parent, NVIDIA_LBA(parent),
3020                     meta, sizeof(struct nvidia_raid_conf), ATA_R_READ)) {
3021         if (testing || bootverbose)
3022             device_printf(parent, "nVidia read metadata failed\n");
3023         goto nvidia_out;
3024     }
3025
3026     /* check if this is a nVidia RAID struct */
3027     if (strncmp(meta->nvidia_id, NV_MAGIC, strlen(NV_MAGIC))) {
3028         if (testing || bootverbose)
3029             device_printf(parent, "nVidia check1 failed\n");
3030         goto nvidia_out;
3031     }
3032
3033     /* check if the checksum is OK */
3034     for (checksum = 0, ptr = (u_int32_t*)meta, count = 0; 
3035          count < meta->config_size; count++)
3036         checksum += *ptr++;
3037     if (checksum) {  
3038         if (testing || bootverbose)
3039             device_printf(parent, "nVidia check2 failed\n");
3040         goto nvidia_out;
3041     }
3042
3043     if (testing || bootverbose)
3044         ata_raid_nvidia_print_meta(meta);
3045
3046     /* now convert nVidia meta into our generic form */
3047     for (array = 0; array < MAX_ARRAYS; array++) {
3048         if (!raidp[array]) {
3049             raidp[array] =
3050                 (struct ar_softc *)kmalloc(sizeof(struct ar_softc), M_AR,
3051                                           M_WAITOK | M_ZERO);
3052         }
3053         raid = raidp[array];
3054         if (raid->format && (raid->format != AR_F_NVIDIA_RAID))
3055             continue;
3056
3057         if (raid->format == AR_F_NVIDIA_RAID &&
3058             ((raid->magic_0 != meta->magic_1) ||
3059              (raid->magic_1 != meta->magic_2))) {
3060             continue;
3061         }
3062
3063         switch (meta->type) {
3064         case NV_T_SPAN:
3065             raid->type = AR_T_SPAN;
3066             break;
3067
3068         case NV_T_RAID0: 
3069             raid->type = AR_T_RAID0;
3070             break;
3071
3072         case NV_T_RAID1:
3073             raid->type = AR_T_RAID1;
3074             break;
3075
3076         case NV_T_RAID5:
3077             raid->type = AR_T_RAID5;
3078             break;
3079
3080         case NV_T_RAID01:
3081             raid->type = AR_T_RAID01;
3082             break;
3083
3084         default:
3085             device_printf(parent, "nVidia unknown RAID type 0x%02x\n",
3086                           meta->type);
3087             kfree(raidp[array], M_AR);
3088             raidp[array] = NULL;
3089             goto nvidia_out;
3090         }
3091         raid->magic_0 = meta->magic_1;
3092         raid->magic_1 = meta->magic_2;
3093         raid->format = AR_F_NVIDIA_RAID;
3094         raid->generation = 0;
3095         raid->interleave = meta->stripe_sectors;
3096         raid->width = meta->array_width;
3097         raid->total_disks = meta->total_disks;
3098         raid->total_sectors = meta->total_sectors;
3099         raid->heads = 255;
3100         raid->sectors = 63;
3101         raid->cylinders = raid->total_sectors / (63 * 255);
3102         raid->offset_sectors = 0;
3103         raid->rebuild_lba = meta->rebuild_lba;
3104         raid->lun = array;
3105         raid->status = AR_S_READY;
3106         if (meta->status & NV_S_DEGRADED)
3107             raid->status |= AR_S_DEGRADED;
3108
3109         raid->disks[meta->disk_number].dev = parent;
3110         raid->disks[meta->disk_number].sectors =
3111             raid->total_sectors / raid->width;
3112         raid->disks[meta->disk_number].flags =
3113             (AR_DF_PRESENT | AR_DF_ASSIGNED | AR_DF_ONLINE);
3114         ars->raid[raid->volume] = raid;
3115         ars->disk_number[raid->volume] = meta->disk_number;
3116         retval = 1;
3117         break;
3118     }
3119
3120 nvidia_out:
3121     kfree(meta, M_AR);
3122     return retval;
3123 }
3124
3125 /* Promise FastTrak Metadata */
3126 static int
3127 ata_raid_promise_read_meta(device_t dev, struct ar_softc **raidp, int native)
3128 {
3129     struct ata_raid_subdisk *ars = device_get_softc(dev);
3130     device_t parent = device_get_parent(dev);
3131     struct promise_raid_conf *meta;
3132     struct ar_softc *raid;
3133     u_int32_t checksum, *ptr;
3134     int array, count, disk, disksum = 0, retval = 0; 
3135
3136     meta = (struct promise_raid_conf *)
3137         kmalloc(sizeof(struct promise_raid_conf), M_AR, M_WAITOK | M_ZERO);
3138
3139     if (ata_raid_rw(parent, PROMISE_LBA(parent),
3140                     meta, sizeof(struct promise_raid_conf), ATA_R_READ)) {
3141         if (testing || bootverbose)
3142             device_printf(parent, "%s read metadata failed\n",
3143                           native ? "FreeBSD" : "Promise");
3144         goto promise_out;
3145     }
3146
3147     /* check the signature */
3148     if (native) {
3149         if (strncmp(meta->promise_id, ATA_MAGIC, strlen(ATA_MAGIC))) {
3150             if (testing || bootverbose)
3151                 device_printf(parent, "FreeBSD check1 failed\n");
3152             goto promise_out;
3153         }
3154     }
3155     else {
3156         if (strncmp(meta->promise_id, PR_MAGIC, strlen(PR_MAGIC))) {
3157             if (testing || bootverbose)
3158                 device_printf(parent, "Promise check1 failed\n");
3159             goto promise_out;
3160         }
3161     }
3162
3163     /* check if the checksum is OK */
3164     for (checksum = 0, ptr = (u_int32_t *)meta, count = 0; count < 511; count++)
3165         checksum += *ptr++;
3166     if (checksum != *ptr) {  
3167         if (testing || bootverbose)
3168             device_printf(parent, "%s check2 failed\n",
3169                           native ? "FreeBSD" : "Promise");           
3170         goto promise_out;
3171     }
3172
3173     /* check on disk integrity status */
3174     if (meta->raid.integrity != PR_I_VALID) {
3175         if (testing || bootverbose)
3176             device_printf(parent, "%s check3 failed\n",
3177                           native ? "FreeBSD" : "Promise");           
3178         goto promise_out;
3179     }
3180
3181     if (testing || bootverbose)
3182         ata_raid_promise_print_meta(meta);
3183
3184     /* now convert Promise metadata into our generic form */
3185     for (array = 0; array < MAX_ARRAYS; array++) {
3186         if (!raidp[array]) {
3187             raidp[array] = 
3188                 (struct ar_softc *)kmalloc(sizeof(struct ar_softc), M_AR,
3189                                           M_WAITOK | M_ZERO);
3190         }
3191         raid = raidp[array];
3192         if (raid->format &&
3193             (raid->format != (native ? AR_F_FREEBSD_RAID : AR_F_PROMISE_RAID)))
3194             continue;
3195
3196         if ((raid->format == (native ? AR_F_FREEBSD_RAID : AR_F_PROMISE_RAID))&&
3197             !(meta->raid.magic_1 == (raid->magic_1)))
3198             continue;
3199
3200         /* update our knowledge about the array config based on generation */
3201         if (!meta->raid.generation || meta->raid.generation > raid->generation){
3202             switch (meta->raid.type) {
3203             case PR_T_SPAN:
3204                 raid->type = AR_T_SPAN;
3205                 break;
3206
3207             case PR_T_JBOD:
3208                 raid->type = AR_T_JBOD;
3209                 break;
3210
3211             case PR_T_RAID0:
3212                 raid->type = AR_T_RAID0;
3213                 break;
3214
3215             case PR_T_RAID1:
3216                 raid->type = AR_T_RAID1;
3217                 if (meta->raid.array_width > 1)
3218                     raid->type = AR_T_RAID01;
3219                 break;
3220
3221             case PR_T_RAID5:
3222                 raid->type = AR_T_RAID5;
3223                 break;
3224
3225             default:
3226                 device_printf(parent, "%s unknown RAID type 0x%02x\n",
3227                               native ? "FreeBSD" : "Promise", meta->raid.type);
3228                 kfree(raidp[array], M_AR);
3229                 raidp[array] = NULL;
3230                 goto promise_out;
3231             }
3232             raid->magic_1 = meta->raid.magic_1;
3233             raid->format = (native ? AR_F_FREEBSD_RAID : AR_F_PROMISE_RAID);
3234             raid->generation = meta->raid.generation;
3235             raid->interleave = 1 << meta->raid.stripe_shift;
3236             raid->width = meta->raid.array_width;
3237             raid->total_disks = meta->raid.total_disks;
3238             raid->heads = meta->raid.heads + 1;
3239             raid->sectors = meta->raid.sectors;
3240             raid->cylinders = meta->raid.cylinders + 1;
3241             raid->total_sectors = meta->raid.total_sectors;
3242             raid->offset_sectors = 0;
3243             raid->rebuild_lba = meta->raid.rebuild_lba;
3244             raid->lun = array;
3245             if ((meta->raid.status &
3246                  (PR_S_VALID | PR_S_ONLINE | PR_S_INITED | PR_S_READY)) ==
3247                 (PR_S_VALID | PR_S_ONLINE | PR_S_INITED | PR_S_READY)) {
3248                 raid->status |= AR_S_READY;
3249                 if (meta->raid.status & PR_S_DEGRADED)
3250                     raid->status |= AR_S_DEGRADED;
3251             }
3252             else
3253                 raid->status &= ~AR_S_READY;
3254
3255             /* convert disk flags to our internal types */
3256             for (disk = 0; disk < meta->raid.total_disks; disk++) {
3257                 raid->disks[disk].dev = NULL;
3258                 raid->disks[disk].flags = 0;
3259                 *((u_int64_t *)(raid->disks[disk].serial)) = 
3260                     meta->raid.disk[disk].magic_0;
3261                 disksum += meta->raid.disk[disk].flags;
3262                 if (meta->raid.disk[disk].flags & PR_F_ONLINE)
3263                     raid->disks[disk].flags |= AR_DF_ONLINE;
3264                 if (meta->raid.disk[disk].flags & PR_F_ASSIGNED)
3265                     raid->disks[disk].flags |= AR_DF_ASSIGNED;
3266                 if (meta->raid.disk[disk].flags & PR_F_SPARE) {
3267                     raid->disks[disk].flags &= ~(AR_DF_ONLINE | AR_DF_ASSIGNED);
3268                     raid->disks[disk].flags |= AR_DF_SPARE;
3269                 }
3270                 if (meta->raid.disk[disk].flags & (PR_F_REDIR | PR_F_DOWN))
3271                     raid->disks[disk].flags &= ~AR_DF_ONLINE;
3272             }
3273             if (!disksum) {
3274                 device_printf(parent, "%s subdisks has no flags\n",
3275                               native ? "FreeBSD" : "Promise");
3276                 kfree(raidp[array], M_AR);
3277                 raidp[array] = NULL;
3278                 goto promise_out;
3279             }
3280         }
3281         if (meta->raid.generation >= raid->generation) {
3282             int disk_number = meta->raid.disk_number;
3283
3284             if (raid->disks[disk_number].flags && (meta->magic_0 ==
3285                 *((u_int64_t *)(raid->disks[disk_number].serial)))) {
3286                 raid->disks[disk_number].dev = parent;
3287                 raid->disks[disk_number].flags |= AR_DF_PRESENT;
3288                 raid->disks[disk_number].sectors = meta->raid.disk_sectors;
3289                 if ((raid->disks[disk_number].flags &
3290                     (AR_DF_PRESENT | AR_DF_ASSIGNED | AR_DF_ONLINE)) ==
3291                     (AR_DF_PRESENT | AR_DF_ASSIGNED | AR_DF_ONLINE)) {
3292                     ars->raid[raid->volume] = raid;
3293                     ars->disk_number[raid->volume] = disk_number;
3294                     retval = 1;
3295                 }
3296             }
3297         }
3298         break;
3299     }
3300
3301 promise_out:
3302     kfree(meta, M_AR);
3303     return retval;
3304 }
3305
3306 static int
3307 ata_raid_promise_write_meta(struct ar_softc *rdp)
3308 {
3309     struct promise_raid_conf *meta;
3310     struct timeval timestamp;
3311     u_int32_t *ckptr;
3312     int count, disk, drive, error = 0;
3313
3314     meta = (struct promise_raid_conf *)
3315         kmalloc(sizeof(struct promise_raid_conf), M_AR, M_WAITOK);
3316
3317     rdp->generation++;
3318     microtime(&timestamp);
3319
3320     for (disk = 0; disk < rdp->total_disks; disk++) {
3321         for (count = 0; count < sizeof(struct promise_raid_conf); count++)
3322             *(((u_int8_t *)meta) + count) = 255 - (count % 256);
3323         meta->dummy_0 = 0x00020000;
3324         meta->raid.disk_number = disk;
3325
3326         if (rdp->disks[disk].dev) {
3327             struct ata_device *atadev = device_get_softc(rdp->disks[disk].dev);
3328             struct ata_channel *ch = 
3329                 device_get_softc(device_get_parent(rdp->disks[disk].dev));
3330
3331             meta->raid.channel = ch->unit;
3332             meta->raid.device = ATA_DEV(atadev->unit);
3333             meta->raid.disk_sectors = rdp->disks[disk].sectors;
3334             meta->raid.disk_offset = rdp->offset_sectors;
3335         }
3336         else {
3337             meta->raid.channel = 0;
3338             meta->raid.device = 0;
3339             meta->raid.disk_sectors = 0;
3340             meta->raid.disk_offset = 0;
3341         }
3342         meta->magic_0 = PR_MAGIC0(meta->raid) | timestamp.tv_sec;
3343         meta->magic_1 = timestamp.tv_sec >> 16;
3344         meta->magic_2 = timestamp.tv_sec;
3345         meta->raid.integrity = PR_I_VALID;
3346         meta->raid.magic_0 = meta->magic_0;
3347         meta->raid.rebuild_lba = rdp->rebuild_lba;
3348         meta->raid.generation = rdp->generation;
3349
3350         if (rdp->status & AR_S_READY) {
3351             meta->raid.flags = (PR_F_VALID | PR_F_ASSIGNED | PR_F_ONLINE);
3352             meta->raid.status = 
3353                 (PR_S_VALID | PR_S_ONLINE | PR_S_INITED | PR_S_READY);
3354             if (rdp->status & AR_S_DEGRADED)
3355                 meta->raid.status |= PR_S_DEGRADED;
3356             else
3357                 meta->raid.status |= PR_S_FUNCTIONAL;
3358         }
3359         else {
3360             meta->raid.flags = PR_F_DOWN;
3361             meta->raid.status = 0;
3362         }
3363
3364         switch (rdp->type) {
3365         case AR_T_RAID0:
3366             meta->raid.type = PR_T_RAID0;
3367             break;
3368         case AR_T_RAID1:
3369             meta->raid.type = PR_T_RAID1;
3370             break;
3371         case AR_T_RAID01:
3372             meta->raid.type = PR_T_RAID1;
3373             break;
3374         case AR_T_RAID5:
3375             meta->raid.type = PR_T_RAID5;
3376             break;
3377         case AR_T_SPAN:
3378             meta->raid.type = PR_T_SPAN;
3379             break;
3380         case AR_T_JBOD:
3381             meta->raid.type = PR_T_JBOD;
3382             break;
3383         default:
3384             kfree(meta, M_AR);
3385             return ENODEV;
3386         }
3387
3388         meta->raid.total_disks = rdp->total_disks;
3389         meta->raid.stripe_shift = ffs(rdp->interleave) - 1;
3390         meta->raid.array_width = rdp->width;
3391         meta->raid.array_number = rdp->lun;
3392         meta->raid.total_sectors = rdp->total_sectors;
3393         meta->raid.cylinders = rdp->cylinders - 1;
3394         meta->raid.heads = rdp->heads - 1;
3395         meta->raid.sectors = rdp->sectors;
3396         meta->raid.magic_1 = (u_int64_t)meta->magic_2<<16 | meta->magic_1;
3397
3398         bzero(&meta->raid.disk, 8 * 12);
3399         for (drive = 0; drive < rdp->total_disks; drive++) {
3400             meta->raid.disk[drive].flags = 0;
3401             if (rdp->disks[drive].flags & AR_DF_PRESENT)
3402                 meta->raid.disk[drive].flags |= PR_F_VALID;
3403             if (rdp->disks[drive].flags & AR_DF_ASSIGNED)
3404                 meta->raid.disk[drive].flags |= PR_F_ASSIGNED;
3405             if (rdp->disks[drive].flags & AR_DF_ONLINE)
3406                 meta->raid.disk[drive].flags |= PR_F_ONLINE;
3407             else
3408                 if (rdp->disks[drive].flags & AR_DF_PRESENT)
3409                     meta->raid.disk[drive].flags = (PR_F_REDIR | PR_F_DOWN);
3410             if (rdp->disks[drive].flags & AR_DF_SPARE)
3411                 meta->raid.disk[drive].flags |= PR_F_SPARE;
3412             meta->raid.disk[drive].dummy_0 = 0x0;
3413             if (rdp->disks[drive].dev) {
3414                 struct ata_channel *ch = 
3415                     device_get_softc(device_get_parent(rdp->disks[drive].dev));
3416                 struct ata_device *atadev =
3417                     device_get_softc(rdp->disks[drive].dev);
3418
3419                 meta->raid.disk[drive].channel = ch->unit;
3420                 meta->raid.disk[drive].device = ATA_DEV(atadev->unit);
3421             }
3422             meta->raid.disk[drive].magic_0 =
3423                 PR_MAGIC0(meta->raid.disk[drive]) | timestamp.tv_sec;
3424         }
3425
3426         if (rdp->disks[disk].dev) {
3427             if ((rdp->disks[disk].flags & (AR_DF_PRESENT | AR_DF_ONLINE)) ==
3428                 (AR_DF_PRESENT | AR_DF_ONLINE)) {
3429                 if (rdp->format == AR_F_FREEBSD_RAID)
3430                     bcopy(ATA_MAGIC, meta->promise_id, sizeof(ATA_MAGIC));
3431                 else
3432                     bcopy(PR_MAGIC, meta->promise_id, sizeof(PR_MAGIC));
3433             }
3434             else
3435                 bzero(meta->promise_id, sizeof(meta->promise_id));
3436             meta->checksum = 0;
3437             for (ckptr = (int32_t *)meta, count = 0; count < 511; count++)
3438                 meta->checksum += *ckptr++;
3439             if (testing || bootverbose)
3440                 ata_raid_promise_print_meta(meta);
3441             if (ata_raid_rw(rdp->disks[disk].dev,
3442                             PROMISE_LBA(rdp->disks[disk].dev),
3443                             meta, sizeof(struct promise_raid_conf),
3444                             ATA_R_WRITE | ATA_R_DIRECT)) {
3445                 device_printf(rdp->disks[disk].dev, "write metadata failed\n");
3446                 error = EIO;
3447             }
3448         }
3449     }
3450     kfree(meta, M_AR);
3451     return error;
3452 }
3453
3454 /* Silicon Image Medley Metadata */
3455 static int
3456 ata_raid_sii_read_meta(device_t dev, struct ar_softc **raidp)
3457 {
3458     struct ata_raid_subdisk *ars = device_get_softc(dev);
3459     device_t parent = device_get_parent(dev);
3460     struct sii_raid_conf *meta;
3461     struct ar_softc *raid = NULL;
3462     u_int16_t checksum, *ptr;
3463     int array, count, disk, retval = 0;
3464
3465     meta = (struct sii_raid_conf *)kmalloc(sizeof(struct sii_raid_conf), M_AR,
3466         M_WAITOK | M_ZERO);
3467
3468     if (ata_raid_rw(parent, SII_LBA(parent),
3469                     meta, sizeof(struct sii_raid_conf), ATA_R_READ)) {
3470         if (testing || bootverbose)
3471             device_printf(parent, "Silicon Image read metadata failed\n");
3472         goto sii_out;
3473     }
3474
3475     /* check if this is a Silicon Image (Medley) RAID struct */
3476     for (checksum = 0, ptr = (u_int16_t *)meta, count = 0; count < 160; count++)
3477         checksum += *ptr++;
3478     if (checksum) {  
3479         if (testing || bootverbose)
3480             device_printf(parent, "Silicon Image check1 failed\n");
3481         goto sii_out;
3482     }
3483
3484     for (checksum = 0, ptr = (u_int16_t *)meta, count = 0; count < 256; count++)
3485         checksum += *ptr++;
3486     if (checksum != meta->checksum_1) {  
3487         if (testing || bootverbose)
3488             device_printf(parent, "Silicon Image check2 failed\n");          
3489         goto sii_out;
3490     }
3491
3492     /* check verison */
3493     if (meta->version_major != 0x0002 ||
3494         (meta->version_minor != 0x0000 && meta->version_minor != 0x0001)) {
3495         if (testing || bootverbose)
3496             device_printf(parent, "Silicon Image check3 failed\n");          
3497         goto sii_out;
3498     }
3499
3500     if (testing || bootverbose)
3501         ata_raid_sii_print_meta(meta);
3502
3503     /* now convert Silicon Image meta into our generic form */
3504     for (array = 0; array < MAX_ARRAYS; array++) {
3505         if (!raidp[array]) {
3506             raidp[array] = 
3507                 (struct ar_softc *)kmalloc(sizeof(struct ar_softc), M_AR,
3508                                           M_WAITOK | M_ZERO);
3509         }
3510         raid = raidp[array];
3511         if (raid->format && (raid->format != AR_F_SII_RAID))
3512             continue;
3513
3514         if (raid->format == AR_F_SII_RAID &&
3515             (raid->magic_0 != *((u_int64_t *)meta->timestamp))) {
3516             continue;
3517         }
3518
3519         /* update our knowledge about the array config based on generation */
3520         if (!meta->generation || meta->generation > raid->generation) {
3521             switch (meta->type) {
3522             case SII_T_RAID0:
3523                 raid->type = AR_T_RAID0;
3524                 break;
3525
3526             case SII_T_RAID1:
3527                 raid->type = AR_T_RAID1;
3528                 break;
3529
3530             case SII_T_RAID01:
3531                 raid->type = AR_T_RAID01;
3532                 break;
3533
3534             case SII_T_SPARE:
3535                 device_printf(parent, "Silicon Image SPARE disk\n");
3536                 kfree(raidp[array], M_AR);
3537                 raidp[array] = NULL;
3538                 goto sii_out;
3539
3540             default:
3541                 device_printf(parent,"Silicon Image unknown RAID type 0x%02x\n",
3542                               meta->type);
3543                 kfree(raidp[array], M_AR);
3544                 raidp[array] = NULL;
3545                 goto sii_out;
3546             }
3547             raid->magic_0 = *((u_int64_t *)meta->timestamp);
3548             raid->format = AR_F_SII_RAID;
3549             raid->generation = meta->generation;
3550             raid->interleave = meta->stripe_sectors;
3551             raid->width = (meta->raid0_disks != 0xff) ? meta->raid0_disks : 1;
3552             raid->total_disks = 
3553                 ((meta->raid0_disks != 0xff) ? meta->raid0_disks : 0) +
3554                 ((meta->raid1_disks != 0xff) ? meta->raid1_disks : 0);
3555             raid->total_sectors = meta->total_sectors;
3556             raid->heads = 255;
3557             raid->sectors = 63;
3558             raid->cylinders = raid->total_sectors / (63 * 255);
3559             raid->offset_sectors = 0;
3560             raid->rebuild_lba = meta->rebuild_lba;
3561             raid->lun = array;
3562             strncpy(raid->name, meta->name,
3563                     min(sizeof(raid->name), sizeof(meta->name)));
3564
3565             /* clear out any old info */
3566             if (raid->generation) {
3567                 for (disk = 0; disk < raid->total_disks; disk++) {
3568                     raid->disks[disk].dev = NULL;
3569                     raid->disks[disk].flags = 0;
3570                 }
3571             }
3572         }
3573         if (meta->generation >= raid->generation) {
3574             /* XXX SOS add check for the right physical disk by serial# */
3575             if (meta->status & SII_S_READY) {
3576                 int disk_number = (raid->type == AR_T_RAID01) ?
3577                     meta->raid1_ident + (meta->raid0_ident << 1) :
3578                     meta->disk_number;
3579
3580                 raid->disks[disk_number].dev = parent;
3581                 raid->disks[disk_number].sectors = 
3582                     raid->total_sectors / raid->width;
3583                 raid->disks[disk_number].flags =
3584                     (AR_DF_ONLINE | AR_DF_PRESENT | AR_DF_ASSIGNED);
3585                 ars->raid[raid->volume] = raid;
3586                 ars->disk_number[raid->volume] = disk_number;
3587                 retval = 1;
3588             }
3589         }
3590         break;
3591     }
3592
3593 sii_out:
3594     kfree(meta, M_AR);
3595     return retval;
3596 }
3597
3598 /* Silicon Integrated Systems Metadata */
3599 static int
3600 ata_raid_sis_read_meta(device_t dev, struct ar_softc **raidp)
3601 {
3602     struct ata_raid_subdisk *ars = device_get_softc(dev);
3603     device_t parent = device_get_parent(dev);
3604     struct sis_raid_conf *meta;
3605     struct ar_softc *raid = NULL;
3606     int array, disk_number, drive, retval = 0;
3607
3608     meta = (struct sis_raid_conf *)kmalloc(sizeof(struct sis_raid_conf), M_AR,
3609         M_WAITOK | M_ZERO);
3610
3611     if (ata_raid_rw(parent, SIS_LBA(parent),
3612                     meta, sizeof(struct sis_raid_conf), ATA_R_READ)) {
3613         if (testing || bootverbose)
3614             device_printf(parent,
3615                           "Silicon Integrated Systems read metadata failed\n");
3616     }
3617
3618     /* check for SiS magic */
3619     if (meta->magic != SIS_MAGIC) {
3620         if (testing || bootverbose)
3621             device_printf(parent,
3622                           "Silicon Integrated Systems check1 failed\n");
3623         goto sis_out;
3624     }
3625
3626     if (testing || bootverbose)
3627         ata_raid_sis_print_meta(meta);
3628
3629     /* now convert SiS meta into our generic form */
3630     for (array = 0; array < MAX_ARRAYS; array++) {
3631         if (!raidp[array]) {
3632             raidp[array] = 
3633                 (struct ar_softc *)kmalloc(sizeof(struct ar_softc), M_AR,
3634                                           M_WAITOK | M_ZERO);
3635         }
3636
3637         raid = raidp[array];
3638         if (raid->format && (raid->format != AR_F_SIS_RAID))
3639             continue;
3640
3641         if ((raid->format == AR_F_SIS_RAID) &&
3642             ((raid->magic_0 != meta->controller_pci_id) ||
3643              (raid->magic_1 != meta->timestamp))) {
3644             continue;
3645         }
3646
3647         switch (meta->type_total_disks & SIS_T_MASK) {
3648         case SIS_T_JBOD:
3649             raid->type = AR_T_JBOD;
3650             raid->width = (meta->type_total_disks & SIS_D_MASK);
3651             raid->total_sectors += SIS_LBA(parent);
3652             break;
3653
3654         case SIS_T_RAID0:
3655             raid->type = AR_T_RAID0;
3656             raid->width = (meta->type_total_disks & SIS_D_MASK);
3657             if (!raid->total_sectors || 
3658                 (raid->total_sectors > (raid->width * SIS_LBA(parent))))
3659                 raid->total_sectors = raid->width * SIS_LBA(parent);
3660             break;
3661
3662         case SIS_T_RAID1:
3663             raid->type = AR_T_RAID1;
3664             raid->width = 1;
3665             if (!raid->total_sectors || (raid->total_sectors > SIS_LBA(parent)))
3666                 raid->total_sectors = SIS_LBA(parent);
3667             break;
3668
3669         default:
3670             device_printf(parent, "Silicon Integrated Systems "
3671                           "unknown RAID type 0x%08x\n", meta->magic);
3672             kfree(raidp[array], M_AR);
3673             raidp[array] = NULL;
3674             goto sis_out;
3675         }
3676         raid->magic_0 = meta->controller_pci_id;
3677         raid->magic_1 = meta->timestamp;
3678         raid->format = AR_F_SIS_RAID;
3679         raid->generation = 0;
3680         raid->interleave = meta->stripe_sectors;
3681         raid->total_disks = (meta->type_total_disks & SIS_D_MASK);
3682         raid->heads = 255;
3683         raid->sectors = 63;
3684         raid->cylinders = raid->total_sectors / (63 * 255);
3685         raid->offset_sectors = 0;
3686         raid->rebuild_lba = 0;
3687         raid->lun = array;
3688         /* XXX SOS if total_disks > 2 this doesn't float */
3689         if (((meta->disks & SIS_D_MASTER) >> 4) == meta->disk_number)
3690             disk_number = 0;
3691         else 
3692             disk_number = 1;
3693
3694         for (drive = 0; drive < raid->total_disks; drive++) {
3695             raid->disks[drive].sectors = raid->total_sectors/raid->width;
3696             if (drive == disk_number) {
3697                 raid->disks[disk_number].dev = parent;
3698                 raid->disks[disk_number].flags =
3699                     (AR_DF_ONLINE | AR_DF_PRESENT | AR_DF_ASSIGNED);
3700                 ars->raid[raid->volume] = raid;
3701                 ars->disk_number[raid->volume] = disk_number;
3702             }
3703         }
3704         retval = 1;
3705         break;
3706     }
3707
3708 sis_out:
3709     kfree(meta, M_AR);
3710     return retval;
3711 }
3712
3713 static int
3714 ata_raid_sis_write_meta(struct ar_softc *rdp)
3715 {
3716     struct sis_raid_conf *meta;
3717     struct timeval timestamp;
3718     int disk, error = 0;
3719
3720     meta = (struct sis_raid_conf *)kmalloc(sizeof(struct sis_raid_conf), M_AR,
3721         M_WAITOK | M_ZERO);
3722
3723     rdp->generation++;
3724     microtime(&timestamp);
3725
3726     meta->magic = SIS_MAGIC;
3727     /* XXX SOS if total_disks > 2 this doesn't float */
3728     for (disk = 0; disk < rdp->total_disks; disk++) {
3729         if (rdp->disks[disk].dev) {
3730             struct ata_channel *ch = 
3731                 device_get_softc(device_get_parent(rdp->disks[disk].dev));
3732             struct ata_device *atadev = device_get_softc(rdp->disks[disk].dev);
3733             int disk_number = 1 + ATA_DEV(atadev->unit) + (ch->unit << 1);
3734
3735             meta->disks |= disk_number << ((1 - disk) << 2);
3736         }
3737     }
3738     switch (rdp->type) {
3739     case AR_T_JBOD:
3740         meta->type_total_disks = SIS_T_JBOD;
3741         break;
3742
3743     case AR_T_RAID0:
3744         meta->type_total_disks = SIS_T_RAID0;
3745         break;
3746
3747     case AR_T_RAID1:
3748         meta->type_total_disks = SIS_T_RAID1;
3749         break;
3750
3751     default:
3752         kfree(meta, M_AR);
3753         return ENODEV;
3754     }
3755     meta->type_total_disks |= (rdp->total_disks & SIS_D_MASK);
3756     meta->stripe_sectors = rdp->interleave;
3757     meta->timestamp = timestamp.tv_sec;
3758
3759     for (disk = 0; disk < rdp->total_disks; disk++) {
3760         if (rdp->disks[disk].dev) {
3761             struct ata_channel *ch = 
3762                 device_get_softc(device_get_parent(rdp->disks[disk].dev));
3763             struct ata_device *atadev = device_get_softc(rdp->disks[disk].dev);
3764
3765             meta->controller_pci_id =
3766                 (pci_get_vendor(GRANDPARENT(rdp->disks[disk].dev)) << 16) |
3767                 pci_get_device(GRANDPARENT(rdp->disks[disk].dev));
3768             bcopy(atadev->param.model, meta->model, sizeof(meta->model));
3769
3770             /* XXX SOS if total_disks > 2 this may not float */
3771             meta->disk_number = 1 + ATA_DEV(atadev->unit) + (ch->unit << 1);
3772
3773             if (testing || bootverbose)
3774                 ata_raid_sis_print_meta(meta);
3775
3776             if (ata_raid_rw(rdp->disks[disk].dev,
3777                             SIS_LBA(rdp->disks[disk].dev),
3778                             meta, sizeof(struct sis_raid_conf),
3779                             ATA_R_WRITE | ATA_R_DIRECT)) {
3780                 device_printf(rdp->disks[disk].dev, "write metadata failed\n");
3781                 error = EIO;
3782             }
3783         }
3784     }
3785     kfree(meta, M_AR);
3786     return error;
3787 }
3788
3789 /* VIA Tech V-RAID Metadata */
3790 static int
3791 ata_raid_via_read_meta(device_t dev, struct ar_softc **raidp)
3792 {
3793     struct ata_raid_subdisk *ars = device_get_softc(dev);
3794     device_t parent = device_get_parent(dev);
3795     struct via_raid_conf *meta;
3796     struct ar_softc *raid = NULL;
3797     u_int8_t checksum, *ptr;
3798     int array, count, disk, retval = 0;
3799
3800     meta = (struct via_raid_conf *)kmalloc(sizeof(struct via_raid_conf), M_AR,
3801         M_WAITOK | M_ZERO);
3802
3803     if (ata_raid_rw(parent, VIA_LBA(parent),
3804                     meta, sizeof(struct via_raid_conf), ATA_R_READ)) {
3805         if (testing || bootverbose)
3806             device_printf(parent, "VIA read metadata failed\n");
3807         goto via_out;
3808     }
3809
3810     /* check if this is a VIA RAID struct */
3811     if (meta->magic != VIA_MAGIC) {
3812         if (testing || bootverbose)
3813             device_printf(parent, "VIA check1 failed\n");
3814         goto via_out;
3815     }
3816
3817     /* calculate checksum and compare for valid */
3818     for (checksum = 0, ptr = (u_int8_t *)meta, count = 0; count < 50; count++)
3819         checksum += *ptr++;
3820     if (checksum != meta->checksum) {  
3821         if (testing || bootverbose)
3822             device_printf(parent, "VIA check2 failed\n");
3823         goto via_out;
3824     }
3825
3826     if (testing || bootverbose)
3827         ata_raid_via_print_meta(meta);
3828
3829     /* now convert VIA meta into our generic form */
3830     for (array = 0; array < MAX_ARRAYS; array++) {
3831         if (!raidp[array]) {
3832             raidp[array] = 
3833                 (struct ar_softc *)kmalloc(sizeof(struct ar_softc), M_AR,
3834                                           M_WAITOK | M_ZERO);
3835         }
3836         raid = raidp[array];
3837         if (raid->format && (raid->format != AR_F_VIA_RAID))
3838             continue;
3839
3840         if (raid->format == AR_F_VIA_RAID && (raid->magic_0 != meta->disks[0]))
3841             continue;
3842
3843         switch (meta->type & VIA_T_MASK) {
3844         case VIA_T_RAID0:
3845             raid->type = AR_T_RAID0;
3846             raid->width = meta->stripe_layout & VIA_L_DISKS;
3847             if (!raid->total_sectors ||
3848                 (raid->total_sectors > (raid->width * meta->disk_sectors)))
3849                 raid->total_sectors = raid->width * meta->disk_sectors;
3850             break;
3851
3852         case VIA_T_RAID1:
3853             raid->type = AR_T_RAID1;
3854             raid->width = 1;
3855             raid->total_sectors = meta->disk_sectors;
3856             break;
3857
3858         case VIA_T_RAID01:
3859             raid->type = AR_T_RAID01;
3860             raid->width = meta->stripe_layout & VIA_L_DISKS;
3861             if (!raid->total_sectors ||
3862                 (raid->total_sectors > (raid->width * meta->disk_sectors)))
3863                 raid->total_sectors = raid->width * meta->disk_sectors;
3864             break;
3865
3866         case VIA_T_RAID5:
3867             raid->type = AR_T_RAID5;
3868             raid->width = meta->stripe_layout & VIA_L_DISKS;
3869             if (!raid->total_sectors ||
3870                 (raid->total_sectors > ((raid->width - 1)*meta->disk_sectors)))
3871                 raid->total_sectors = (raid->width - 1) * meta->disk_sectors;
3872             break;
3873
3874         case VIA_T_SPAN:
3875             raid->type = AR_T_SPAN;
3876             raid->width = 1;
3877             raid->total_sectors += meta->disk_sectors;
3878             break;
3879
3880         default:
3881             device_printf(parent,"VIA unknown RAID type 0x%02x\n", meta->type);
3882