Merge tag 'sound-6.9-rc5' of git://git.kernel.org/pub/scm/linux/kernel/git/tiwai...
[linux.git] / drivers / virtio / virtio_pci_modern.c
1 // SPDX-License-Identifier: GPL-2.0-or-later
2 /*
3  * Virtio PCI driver - modern (virtio 1.0) device support
4  *
5  * This module allows virtio devices to be used over a virtual PCI device.
6  * This can be used with QEMU based VMMs like KVM or Xen.
7  *
8  * Copyright IBM Corp. 2007
9  * Copyright Red Hat, Inc. 2014
10  *
11  * Authors:
12  *  Anthony Liguori  <aliguori@us.ibm.com>
13  *  Rusty Russell <rusty@rustcorp.com.au>
14  *  Michael S. Tsirkin <mst@redhat.com>
15  */
16
17 #include <linux/delay.h>
18 #define VIRTIO_PCI_NO_LEGACY
19 #define VIRTIO_RING_NO_LEGACY
20 #include "virtio_pci_common.h"
21
22 #define VIRTIO_AVQ_SGS_MAX      4
23
24 static u64 vp_get_features(struct virtio_device *vdev)
25 {
26         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
27
28         return vp_modern_get_features(&vp_dev->mdev);
29 }
30
31 static bool vp_is_avq(struct virtio_device *vdev, unsigned int index)
32 {
33         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
34
35         if (!virtio_has_feature(vdev, VIRTIO_F_ADMIN_VQ))
36                 return false;
37
38         return index == vp_dev->admin_vq.vq_index;
39 }
40
41 static int virtqueue_exec_admin_cmd(struct virtio_pci_admin_vq *admin_vq,
42                                     u16 opcode,
43                                     struct scatterlist **sgs,
44                                     unsigned int out_num,
45                                     unsigned int in_num,
46                                     void *data)
47 {
48         struct virtqueue *vq;
49         int ret, len;
50
51         vq = admin_vq->info.vq;
52         if (!vq)
53                 return -EIO;
54
55         if (opcode != VIRTIO_ADMIN_CMD_LIST_QUERY &&
56             opcode != VIRTIO_ADMIN_CMD_LIST_USE &&
57             !((1ULL << opcode) & admin_vq->supported_cmds))
58                 return -EOPNOTSUPP;
59
60         ret = virtqueue_add_sgs(vq, sgs, out_num, in_num, data, GFP_KERNEL);
61         if (ret < 0)
62                 return -EIO;
63
64         if (unlikely(!virtqueue_kick(vq)))
65                 return -EIO;
66
67         while (!virtqueue_get_buf(vq, &len) &&
68                !virtqueue_is_broken(vq))
69                 cpu_relax();
70
71         if (virtqueue_is_broken(vq))
72                 return -EIO;
73
74         return 0;
75 }
76
77 int vp_modern_admin_cmd_exec(struct virtio_device *vdev,
78                              struct virtio_admin_cmd *cmd)
79 {
80         struct scatterlist *sgs[VIRTIO_AVQ_SGS_MAX], hdr, stat;
81         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
82         struct virtio_admin_cmd_status *va_status;
83         unsigned int out_num = 0, in_num = 0;
84         struct virtio_admin_cmd_hdr *va_hdr;
85         u16 status;
86         int ret;
87
88         if (!virtio_has_feature(vdev, VIRTIO_F_ADMIN_VQ))
89                 return -EOPNOTSUPP;
90
91         va_status = kzalloc(sizeof(*va_status), GFP_KERNEL);
92         if (!va_status)
93                 return -ENOMEM;
94
95         va_hdr = kzalloc(sizeof(*va_hdr), GFP_KERNEL);
96         if (!va_hdr) {
97                 ret = -ENOMEM;
98                 goto err_alloc;
99         }
100
101         va_hdr->opcode = cmd->opcode;
102         va_hdr->group_type = cmd->group_type;
103         va_hdr->group_member_id = cmd->group_member_id;
104
105         /* Add header */
106         sg_init_one(&hdr, va_hdr, sizeof(*va_hdr));
107         sgs[out_num] = &hdr;
108         out_num++;
109
110         if (cmd->data_sg) {
111                 sgs[out_num] = cmd->data_sg;
112                 out_num++;
113         }
114
115         /* Add return status */
116         sg_init_one(&stat, va_status, sizeof(*va_status));
117         sgs[out_num + in_num] = &stat;
118         in_num++;
119
120         if (cmd->result_sg) {
121                 sgs[out_num + in_num] = cmd->result_sg;
122                 in_num++;
123         }
124
125         mutex_lock(&vp_dev->admin_vq.cmd_lock);
126         ret = virtqueue_exec_admin_cmd(&vp_dev->admin_vq,
127                                        le16_to_cpu(cmd->opcode),
128                                        sgs, out_num, in_num, sgs);
129         mutex_unlock(&vp_dev->admin_vq.cmd_lock);
130
131         if (ret) {
132                 dev_err(&vdev->dev,
133                         "Failed to execute command on admin vq: %d\n.", ret);
134                 goto err_cmd_exec;
135         }
136
137         status = le16_to_cpu(va_status->status);
138         if (status != VIRTIO_ADMIN_STATUS_OK) {
139                 dev_err(&vdev->dev,
140                         "admin command error: status(%#x) qualifier(%#x)\n",
141                         status, le16_to_cpu(va_status->status_qualifier));
142                 ret = -status;
143         }
144
145 err_cmd_exec:
146         kfree(va_hdr);
147 err_alloc:
148         kfree(va_status);
149         return ret;
150 }
151
152 static void virtio_pci_admin_cmd_list_init(struct virtio_device *virtio_dev)
153 {
154         struct virtio_pci_device *vp_dev = to_vp_device(virtio_dev);
155         struct virtio_admin_cmd cmd = {};
156         struct scatterlist result_sg;
157         struct scatterlist data_sg;
158         __le64 *data;
159         int ret;
160
161         data = kzalloc(sizeof(*data), GFP_KERNEL);
162         if (!data)
163                 return;
164
165         sg_init_one(&result_sg, data, sizeof(*data));
166         cmd.opcode = cpu_to_le16(VIRTIO_ADMIN_CMD_LIST_QUERY);
167         cmd.group_type = cpu_to_le16(VIRTIO_ADMIN_GROUP_TYPE_SRIOV);
168         cmd.result_sg = &result_sg;
169
170         ret = vp_modern_admin_cmd_exec(virtio_dev, &cmd);
171         if (ret)
172                 goto end;
173
174         *data &= cpu_to_le64(VIRTIO_ADMIN_CMD_BITMAP);
175         sg_init_one(&data_sg, data, sizeof(*data));
176         cmd.opcode = cpu_to_le16(VIRTIO_ADMIN_CMD_LIST_USE);
177         cmd.data_sg = &data_sg;
178         cmd.result_sg = NULL;
179
180         ret = vp_modern_admin_cmd_exec(virtio_dev, &cmd);
181         if (ret)
182                 goto end;
183
184         vp_dev->admin_vq.supported_cmds = le64_to_cpu(*data);
185 end:
186         kfree(data);
187 }
188
189 static void vp_modern_avq_activate(struct virtio_device *vdev)
190 {
191         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
192         struct virtio_pci_admin_vq *admin_vq = &vp_dev->admin_vq;
193
194         if (!virtio_has_feature(vdev, VIRTIO_F_ADMIN_VQ))
195                 return;
196
197         __virtqueue_unbreak(admin_vq->info.vq);
198         virtio_pci_admin_cmd_list_init(vdev);
199 }
200
201 static void vp_modern_avq_deactivate(struct virtio_device *vdev)
202 {
203         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
204         struct virtio_pci_admin_vq *admin_vq = &vp_dev->admin_vq;
205
206         if (!virtio_has_feature(vdev, VIRTIO_F_ADMIN_VQ))
207                 return;
208
209         __virtqueue_break(admin_vq->info.vq);
210 }
211
212 static void vp_transport_features(struct virtio_device *vdev, u64 features)
213 {
214         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
215         struct pci_dev *pci_dev = vp_dev->pci_dev;
216
217         if ((features & BIT_ULL(VIRTIO_F_SR_IOV)) &&
218                         pci_find_ext_capability(pci_dev, PCI_EXT_CAP_ID_SRIOV))
219                 __virtio_set_bit(vdev, VIRTIO_F_SR_IOV);
220
221         if (features & BIT_ULL(VIRTIO_F_RING_RESET))
222                 __virtio_set_bit(vdev, VIRTIO_F_RING_RESET);
223
224         if (features & BIT_ULL(VIRTIO_F_ADMIN_VQ))
225                 __virtio_set_bit(vdev, VIRTIO_F_ADMIN_VQ);
226 }
227
228 static int __vp_check_common_size_one_feature(struct virtio_device *vdev, u32 fbit,
229                                             u32 offset, const char *fname)
230 {
231         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
232
233         if (!__virtio_test_bit(vdev, fbit))
234                 return 0;
235
236         if (likely(vp_dev->mdev.common_len >= offset))
237                 return 0;
238
239         dev_err(&vdev->dev,
240                 "virtio: common cfg size(%zu) does not match the feature %s\n",
241                 vp_dev->mdev.common_len, fname);
242
243         return -EINVAL;
244 }
245
246 #define vp_check_common_size_one_feature(vdev, fbit, field) \
247         __vp_check_common_size_one_feature(vdev, fbit, \
248                 offsetofend(struct virtio_pci_modern_common_cfg, field), #fbit)
249
250 static int vp_check_common_size(struct virtio_device *vdev)
251 {
252         if (vp_check_common_size_one_feature(vdev, VIRTIO_F_NOTIF_CONFIG_DATA, queue_notify_data))
253                 return -EINVAL;
254
255         if (vp_check_common_size_one_feature(vdev, VIRTIO_F_RING_RESET, queue_reset))
256                 return -EINVAL;
257
258         if (vp_check_common_size_one_feature(vdev, VIRTIO_F_ADMIN_VQ, admin_queue_num))
259                 return -EINVAL;
260
261         return 0;
262 }
263
264 /* virtio config->finalize_features() implementation */
265 static int vp_finalize_features(struct virtio_device *vdev)
266 {
267         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
268         u64 features = vdev->features;
269
270         /* Give virtio_ring a chance to accept features. */
271         vring_transport_features(vdev);
272
273         /* Give virtio_pci a chance to accept features. */
274         vp_transport_features(vdev, features);
275
276         if (!__virtio_test_bit(vdev, VIRTIO_F_VERSION_1)) {
277                 dev_err(&vdev->dev, "virtio: device uses modern interface "
278                         "but does not have VIRTIO_F_VERSION_1\n");
279                 return -EINVAL;
280         }
281
282         if (vp_check_common_size(vdev))
283                 return -EINVAL;
284
285         vp_modern_set_features(&vp_dev->mdev, vdev->features);
286
287         return 0;
288 }
289
290 /* virtio config->get() implementation */
291 static void vp_get(struct virtio_device *vdev, unsigned int offset,
292                    void *buf, unsigned int len)
293 {
294         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
295         struct virtio_pci_modern_device *mdev = &vp_dev->mdev;
296         void __iomem *device = mdev->device;
297         u8 b;
298         __le16 w;
299         __le32 l;
300
301         BUG_ON(offset + len > mdev->device_len);
302
303         switch (len) {
304         case 1:
305                 b = ioread8(device + offset);
306                 memcpy(buf, &b, sizeof b);
307                 break;
308         case 2:
309                 w = cpu_to_le16(ioread16(device + offset));
310                 memcpy(buf, &w, sizeof w);
311                 break;
312         case 4:
313                 l = cpu_to_le32(ioread32(device + offset));
314                 memcpy(buf, &l, sizeof l);
315                 break;
316         case 8:
317                 l = cpu_to_le32(ioread32(device + offset));
318                 memcpy(buf, &l, sizeof l);
319                 l = cpu_to_le32(ioread32(device + offset + sizeof l));
320                 memcpy(buf + sizeof l, &l, sizeof l);
321                 break;
322         default:
323                 BUG();
324         }
325 }
326
327 /* the config->set() implementation.  it's symmetric to the config->get()
328  * implementation */
329 static void vp_set(struct virtio_device *vdev, unsigned int offset,
330                    const void *buf, unsigned int len)
331 {
332         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
333         struct virtio_pci_modern_device *mdev = &vp_dev->mdev;
334         void __iomem *device = mdev->device;
335         u8 b;
336         __le16 w;
337         __le32 l;
338
339         BUG_ON(offset + len > mdev->device_len);
340
341         switch (len) {
342         case 1:
343                 memcpy(&b, buf, sizeof b);
344                 iowrite8(b, device + offset);
345                 break;
346         case 2:
347                 memcpy(&w, buf, sizeof w);
348                 iowrite16(le16_to_cpu(w), device + offset);
349                 break;
350         case 4:
351                 memcpy(&l, buf, sizeof l);
352                 iowrite32(le32_to_cpu(l), device + offset);
353                 break;
354         case 8:
355                 memcpy(&l, buf, sizeof l);
356                 iowrite32(le32_to_cpu(l), device + offset);
357                 memcpy(&l, buf + sizeof l, sizeof l);
358                 iowrite32(le32_to_cpu(l), device + offset + sizeof l);
359                 break;
360         default:
361                 BUG();
362         }
363 }
364
365 static u32 vp_generation(struct virtio_device *vdev)
366 {
367         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
368
369         return vp_modern_generation(&vp_dev->mdev);
370 }
371
372 /* config->{get,set}_status() implementations */
373 static u8 vp_get_status(struct virtio_device *vdev)
374 {
375         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
376
377         return vp_modern_get_status(&vp_dev->mdev);
378 }
379
380 static void vp_set_status(struct virtio_device *vdev, u8 status)
381 {
382         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
383
384         /* We should never be setting status to 0. */
385         BUG_ON(status == 0);
386         vp_modern_set_status(&vp_dev->mdev, status);
387         if (status & VIRTIO_CONFIG_S_DRIVER_OK)
388                 vp_modern_avq_activate(vdev);
389 }
390
391 static void vp_reset(struct virtio_device *vdev)
392 {
393         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
394         struct virtio_pci_modern_device *mdev = &vp_dev->mdev;
395
396         /* 0 status means a reset. */
397         vp_modern_set_status(mdev, 0);
398         /* After writing 0 to device_status, the driver MUST wait for a read of
399          * device_status to return 0 before reinitializing the device.
400          * This will flush out the status write, and flush in device writes,
401          * including MSI-X interrupts, if any.
402          */
403         while (vp_modern_get_status(mdev))
404                 msleep(1);
405
406         vp_modern_avq_deactivate(vdev);
407
408         /* Flush pending VQ/configuration callbacks. */
409         vp_synchronize_vectors(vdev);
410 }
411
412 static int vp_active_vq(struct virtqueue *vq, u16 msix_vec)
413 {
414         struct virtio_pci_device *vp_dev = to_vp_device(vq->vdev);
415         struct virtio_pci_modern_device *mdev = &vp_dev->mdev;
416         unsigned long index;
417
418         index = vq->index;
419
420         /* activate the queue */
421         vp_modern_set_queue_size(mdev, index, virtqueue_get_vring_size(vq));
422         vp_modern_queue_address(mdev, index, virtqueue_get_desc_addr(vq),
423                                 virtqueue_get_avail_addr(vq),
424                                 virtqueue_get_used_addr(vq));
425
426         if (msix_vec != VIRTIO_MSI_NO_VECTOR) {
427                 msix_vec = vp_modern_queue_vector(mdev, index, msix_vec);
428                 if (msix_vec == VIRTIO_MSI_NO_VECTOR)
429                         return -EBUSY;
430         }
431
432         return 0;
433 }
434
435 static int vp_modern_disable_vq_and_reset(struct virtqueue *vq)
436 {
437         struct virtio_pci_device *vp_dev = to_vp_device(vq->vdev);
438         struct virtio_pci_modern_device *mdev = &vp_dev->mdev;
439         struct virtio_pci_vq_info *info;
440         unsigned long flags;
441
442         if (!virtio_has_feature(vq->vdev, VIRTIO_F_RING_RESET))
443                 return -ENOENT;
444
445         vp_modern_set_queue_reset(mdev, vq->index);
446
447         info = vp_dev->vqs[vq->index];
448
449         /* delete vq from irq handler */
450         spin_lock_irqsave(&vp_dev->lock, flags);
451         list_del(&info->node);
452         spin_unlock_irqrestore(&vp_dev->lock, flags);
453
454         INIT_LIST_HEAD(&info->node);
455
456 #ifdef CONFIG_VIRTIO_HARDEN_NOTIFICATION
457         __virtqueue_break(vq);
458 #endif
459
460         /* For the case where vq has an exclusive irq, call synchronize_irq() to
461          * wait for completion.
462          *
463          * note: We can't use disable_irq() since it conflicts with the affinity
464          * managed IRQ that is used by some drivers.
465          */
466         if (vp_dev->per_vq_vectors && info->msix_vector != VIRTIO_MSI_NO_VECTOR)
467                 synchronize_irq(pci_irq_vector(vp_dev->pci_dev, info->msix_vector));
468
469         vq->reset = true;
470
471         return 0;
472 }
473
474 static int vp_modern_enable_vq_after_reset(struct virtqueue *vq)
475 {
476         struct virtio_pci_device *vp_dev = to_vp_device(vq->vdev);
477         struct virtio_pci_modern_device *mdev = &vp_dev->mdev;
478         struct virtio_pci_vq_info *info;
479         unsigned long flags, index;
480         int err;
481
482         if (!vq->reset)
483                 return -EBUSY;
484
485         index = vq->index;
486         info = vp_dev->vqs[index];
487
488         if (vp_modern_get_queue_reset(mdev, index))
489                 return -EBUSY;
490
491         if (vp_modern_get_queue_enable(mdev, index))
492                 return -EBUSY;
493
494         err = vp_active_vq(vq, info->msix_vector);
495         if (err)
496                 return err;
497
498         if (vq->callback) {
499                 spin_lock_irqsave(&vp_dev->lock, flags);
500                 list_add(&info->node, &vp_dev->virtqueues);
501                 spin_unlock_irqrestore(&vp_dev->lock, flags);
502         } else {
503                 INIT_LIST_HEAD(&info->node);
504         }
505
506 #ifdef CONFIG_VIRTIO_HARDEN_NOTIFICATION
507         __virtqueue_unbreak(vq);
508 #endif
509
510         vp_modern_set_queue_enable(&vp_dev->mdev, index, true);
511         vq->reset = false;
512
513         return 0;
514 }
515
516 static u16 vp_config_vector(struct virtio_pci_device *vp_dev, u16 vector)
517 {
518         return vp_modern_config_vector(&vp_dev->mdev, vector);
519 }
520
521 static bool vp_notify_with_data(struct virtqueue *vq)
522 {
523         u32 data = vring_notification_data(vq);
524
525         iowrite32(data, (void __iomem *)vq->priv);
526
527         return true;
528 }
529
530 static struct virtqueue *setup_vq(struct virtio_pci_device *vp_dev,
531                                   struct virtio_pci_vq_info *info,
532                                   unsigned int index,
533                                   void (*callback)(struct virtqueue *vq),
534                                   const char *name,
535                                   bool ctx,
536                                   u16 msix_vec)
537 {
538
539         struct virtio_pci_modern_device *mdev = &vp_dev->mdev;
540         bool (*notify)(struct virtqueue *vq);
541         struct virtqueue *vq;
542         bool is_avq;
543         u16 num;
544         int err;
545
546         if (__virtio_test_bit(&vp_dev->vdev, VIRTIO_F_NOTIFICATION_DATA))
547                 notify = vp_notify_with_data;
548         else
549                 notify = vp_notify;
550
551         is_avq = vp_is_avq(&vp_dev->vdev, index);
552         if (index >= vp_modern_get_num_queues(mdev) && !is_avq)
553                 return ERR_PTR(-EINVAL);
554
555         num = is_avq ?
556                 VIRTIO_AVQ_SGS_MAX : vp_modern_get_queue_size(mdev, index);
557         /* Check if queue is either not available or already active. */
558         if (!num || vp_modern_get_queue_enable(mdev, index))
559                 return ERR_PTR(-ENOENT);
560
561         info->msix_vector = msix_vec;
562
563         /* create the vring */
564         vq = vring_create_virtqueue(index, num,
565                                     SMP_CACHE_BYTES, &vp_dev->vdev,
566                                     true, true, ctx,
567                                     notify, callback, name);
568         if (!vq)
569                 return ERR_PTR(-ENOMEM);
570
571         vq->num_max = num;
572
573         err = vp_active_vq(vq, msix_vec);
574         if (err)
575                 goto err;
576
577         vq->priv = (void __force *)vp_modern_map_vq_notify(mdev, index, NULL);
578         if (!vq->priv) {
579                 err = -ENOMEM;
580                 goto err;
581         }
582
583         if (is_avq) {
584                 mutex_lock(&vp_dev->admin_vq.cmd_lock);
585                 vp_dev->admin_vq.info.vq = vq;
586                 mutex_unlock(&vp_dev->admin_vq.cmd_lock);
587         }
588
589         return vq;
590
591 err:
592         vring_del_virtqueue(vq);
593         return ERR_PTR(err);
594 }
595
596 static int vp_modern_find_vqs(struct virtio_device *vdev, unsigned int nvqs,
597                               struct virtqueue *vqs[],
598                               vq_callback_t *callbacks[],
599                               const char * const names[], const bool *ctx,
600                               struct irq_affinity *desc)
601 {
602         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
603         struct virtqueue *vq;
604         int rc = vp_find_vqs(vdev, nvqs, vqs, callbacks, names, ctx, desc);
605
606         if (rc)
607                 return rc;
608
609         /* Select and activate all queues. Has to be done last: once we do
610          * this, there's no way to go back except reset.
611          */
612         list_for_each_entry(vq, &vdev->vqs, list)
613                 vp_modern_set_queue_enable(&vp_dev->mdev, vq->index, true);
614
615         return 0;
616 }
617
618 static void del_vq(struct virtio_pci_vq_info *info)
619 {
620         struct virtqueue *vq = info->vq;
621         struct virtio_pci_device *vp_dev = to_vp_device(vq->vdev);
622         struct virtio_pci_modern_device *mdev = &vp_dev->mdev;
623
624         if (vp_is_avq(&vp_dev->vdev, vq->index)) {
625                 mutex_lock(&vp_dev->admin_vq.cmd_lock);
626                 vp_dev->admin_vq.info.vq = NULL;
627                 mutex_unlock(&vp_dev->admin_vq.cmd_lock);
628         }
629
630         if (vp_dev->msix_enabled)
631                 vp_modern_queue_vector(mdev, vq->index,
632                                        VIRTIO_MSI_NO_VECTOR);
633
634         if (!mdev->notify_base)
635                 pci_iounmap(mdev->pci_dev, (void __force __iomem *)vq->priv);
636
637         vring_del_virtqueue(vq);
638 }
639
640 static int virtio_pci_find_shm_cap(struct pci_dev *dev, u8 required_id,
641                                    u8 *bar, u64 *offset, u64 *len)
642 {
643         int pos;
644
645         for (pos = pci_find_capability(dev, PCI_CAP_ID_VNDR); pos > 0;
646              pos = pci_find_next_capability(dev, pos, PCI_CAP_ID_VNDR)) {
647                 u8 type, cap_len, id, res_bar;
648                 u32 tmp32;
649                 u64 res_offset, res_length;
650
651                 pci_read_config_byte(dev, pos + offsetof(struct virtio_pci_cap,
652                                                          cfg_type), &type);
653                 if (type != VIRTIO_PCI_CAP_SHARED_MEMORY_CFG)
654                         continue;
655
656                 pci_read_config_byte(dev, pos + offsetof(struct virtio_pci_cap,
657                                                          cap_len), &cap_len);
658                 if (cap_len != sizeof(struct virtio_pci_cap64)) {
659                         dev_err(&dev->dev, "%s: shm cap with bad size offset:"
660                                 " %d size: %d\n", __func__, pos, cap_len);
661                         continue;
662                 }
663
664                 pci_read_config_byte(dev, pos + offsetof(struct virtio_pci_cap,
665                                                          id), &id);
666                 if (id != required_id)
667                         continue;
668
669                 pci_read_config_byte(dev, pos + offsetof(struct virtio_pci_cap,
670                                                          bar), &res_bar);
671                 if (res_bar >= PCI_STD_NUM_BARS)
672                         continue;
673
674                 /* Type and ID match, and the BAR value isn't reserved.
675                  * Looks good.
676                  */
677
678                 /* Read the lower 32bit of length and offset */
679                 pci_read_config_dword(dev, pos + offsetof(struct virtio_pci_cap,
680                                                           offset), &tmp32);
681                 res_offset = tmp32;
682                 pci_read_config_dword(dev, pos + offsetof(struct virtio_pci_cap,
683                                                           length), &tmp32);
684                 res_length = tmp32;
685
686                 /* and now the top half */
687                 pci_read_config_dword(dev,
688                                       pos + offsetof(struct virtio_pci_cap64,
689                                                      offset_hi), &tmp32);
690                 res_offset |= ((u64)tmp32) << 32;
691                 pci_read_config_dword(dev,
692                                       pos + offsetof(struct virtio_pci_cap64,
693                                                      length_hi), &tmp32);
694                 res_length |= ((u64)tmp32) << 32;
695
696                 *bar = res_bar;
697                 *offset = res_offset;
698                 *len = res_length;
699
700                 return pos;
701         }
702         return 0;
703 }
704
705 static bool vp_get_shm_region(struct virtio_device *vdev,
706                               struct virtio_shm_region *region, u8 id)
707 {
708         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
709         struct pci_dev *pci_dev = vp_dev->pci_dev;
710         u8 bar;
711         u64 offset, len;
712         phys_addr_t phys_addr;
713         size_t bar_len;
714
715         if (!virtio_pci_find_shm_cap(pci_dev, id, &bar, &offset, &len))
716                 return false;
717
718         phys_addr = pci_resource_start(pci_dev, bar);
719         bar_len = pci_resource_len(pci_dev, bar);
720
721         if ((offset + len) < offset) {
722                 dev_err(&pci_dev->dev, "%s: cap offset+len overflow detected\n",
723                         __func__);
724                 return false;
725         }
726
727         if (offset + len > bar_len) {
728                 dev_err(&pci_dev->dev, "%s: bar shorter than cap offset+len\n",
729                         __func__);
730                 return false;
731         }
732
733         region->len = len;
734         region->addr = (u64) phys_addr + offset;
735
736         return true;
737 }
738
739 static int vp_modern_create_avq(struct virtio_device *vdev)
740 {
741         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
742         struct virtio_pci_admin_vq *avq;
743         struct virtqueue *vq;
744         u16 admin_q_num;
745
746         if (!virtio_has_feature(vdev, VIRTIO_F_ADMIN_VQ))
747                 return 0;
748
749         admin_q_num = vp_modern_avq_num(&vp_dev->mdev);
750         if (!admin_q_num)
751                 return -EINVAL;
752
753         avq = &vp_dev->admin_vq;
754         avq->vq_index = vp_modern_avq_index(&vp_dev->mdev);
755         sprintf(avq->name, "avq.%u", avq->vq_index);
756         vq = vp_dev->setup_vq(vp_dev, &vp_dev->admin_vq.info, avq->vq_index, NULL,
757                               avq->name, NULL, VIRTIO_MSI_NO_VECTOR);
758         if (IS_ERR(vq)) {
759                 dev_err(&vdev->dev, "failed to setup admin virtqueue, err=%ld",
760                         PTR_ERR(vq));
761                 return PTR_ERR(vq);
762         }
763
764         vp_modern_set_queue_enable(&vp_dev->mdev, avq->info.vq->index, true);
765         return 0;
766 }
767
768 static void vp_modern_destroy_avq(struct virtio_device *vdev)
769 {
770         struct virtio_pci_device *vp_dev = to_vp_device(vdev);
771
772         if (!virtio_has_feature(vdev, VIRTIO_F_ADMIN_VQ))
773                 return;
774
775         vp_dev->del_vq(&vp_dev->admin_vq.info);
776 }
777
778 static const struct virtio_config_ops virtio_pci_config_nodev_ops = {
779         .get            = NULL,
780         .set            = NULL,
781         .generation     = vp_generation,
782         .get_status     = vp_get_status,
783         .set_status     = vp_set_status,
784         .reset          = vp_reset,
785         .find_vqs       = vp_modern_find_vqs,
786         .del_vqs        = vp_del_vqs,
787         .synchronize_cbs = vp_synchronize_vectors,
788         .get_features   = vp_get_features,
789         .finalize_features = vp_finalize_features,
790         .bus_name       = vp_bus_name,
791         .set_vq_affinity = vp_set_vq_affinity,
792         .get_vq_affinity = vp_get_vq_affinity,
793         .get_shm_region  = vp_get_shm_region,
794         .disable_vq_and_reset = vp_modern_disable_vq_and_reset,
795         .enable_vq_after_reset = vp_modern_enable_vq_after_reset,
796         .create_avq = vp_modern_create_avq,
797         .destroy_avq = vp_modern_destroy_avq,
798 };
799
800 static const struct virtio_config_ops virtio_pci_config_ops = {
801         .get            = vp_get,
802         .set            = vp_set,
803         .generation     = vp_generation,
804         .get_status     = vp_get_status,
805         .set_status     = vp_set_status,
806         .reset          = vp_reset,
807         .find_vqs       = vp_modern_find_vqs,
808         .del_vqs        = vp_del_vqs,
809         .synchronize_cbs = vp_synchronize_vectors,
810         .get_features   = vp_get_features,
811         .finalize_features = vp_finalize_features,
812         .bus_name       = vp_bus_name,
813         .set_vq_affinity = vp_set_vq_affinity,
814         .get_vq_affinity = vp_get_vq_affinity,
815         .get_shm_region  = vp_get_shm_region,
816         .disable_vq_and_reset = vp_modern_disable_vq_and_reset,
817         .enable_vq_after_reset = vp_modern_enable_vq_after_reset,
818         .create_avq = vp_modern_create_avq,
819         .destroy_avq = vp_modern_destroy_avq,
820 };
821
822 /* the PCI probing function */
823 int virtio_pci_modern_probe(struct virtio_pci_device *vp_dev)
824 {
825         struct virtio_pci_modern_device *mdev = &vp_dev->mdev;
826         struct pci_dev *pci_dev = vp_dev->pci_dev;
827         int err;
828
829         mdev->pci_dev = pci_dev;
830
831         err = vp_modern_probe(mdev);
832         if (err)
833                 return err;
834
835         if (mdev->device)
836                 vp_dev->vdev.config = &virtio_pci_config_ops;
837         else
838                 vp_dev->vdev.config = &virtio_pci_config_nodev_ops;
839
840         vp_dev->config_vector = vp_config_vector;
841         vp_dev->setup_vq = setup_vq;
842         vp_dev->del_vq = del_vq;
843         vp_dev->is_avq = vp_is_avq;
844         vp_dev->isr = mdev->isr;
845         vp_dev->vdev.id = mdev->id;
846
847         mutex_init(&vp_dev->admin_vq.cmd_lock);
848         return 0;
849 }
850
851 void virtio_pci_modern_remove(struct virtio_pci_device *vp_dev)
852 {
853         struct virtio_pci_modern_device *mdev = &vp_dev->mdev;
854
855         mutex_destroy(&vp_dev->admin_vq.cmd_lock);
856         vp_modern_remove(mdev);
857 }