- Prefer m_getl()
[dragonfly.git] / sys / net / bpf.c
1 /*
2  * Copyright (c) 1990, 1991, 1993
3  *      The Regents of the University of California.  All rights reserved.
4  *
5  * This code is derived from the Stanford/CMU enet packet filter,
6  * (net/enet.c) distributed as part of 4.3BSD, and code contributed
7  * to Berkeley by Steven McCanne and Van Jacobson both of Lawrence
8  * Berkeley Laboratory.
9  *
10  * Redistribution and use in source and binary forms, with or without
11  * modification, are permitted provided that the following conditions
12  * are met:
13  * 1. Redistributions of source code must retain the above copyright
14  *    notice, this list of conditions and the following disclaimer.
15  * 2. Redistributions in binary form must reproduce the above copyright
16  *    notice, this list of conditions and the following disclaimer in the
17  *    documentation and/or other materials provided with the distribution.
18  * 3. All advertising materials mentioning features or use of this software
19  *    must display the following acknowledgement:
20  *      This product includes software developed by the University of
21  *      California, Berkeley and its contributors.
22  * 4. Neither the name of the University nor the names of its contributors
23  *    may be used to endorse or promote products derived from this software
24  *    without specific prior written permission.
25  *
26  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
27  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
28  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
29  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
30  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
31  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
32  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
33  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
34  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
35  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
36  * SUCH DAMAGE.
37  *
38  *      @(#)bpf.c       8.2 (Berkeley) 3/28/94
39  *
40  * $FreeBSD: src/sys/net/bpf.c,v 1.59.2.12 2002/04/14 21:41:48 luigi Exp $
41  * $DragonFly: src/sys/net/bpf.c,v 1.39 2007/02/12 14:05:13 sephe Exp $
42  */
43
44 #include "use_bpf.h"
45
46 #include <sys/param.h>
47 #include <sys/systm.h>
48 #include <sys/conf.h>
49 #include <sys/device.h>
50 #include <sys/malloc.h>
51 #include <sys/mbuf.h>
52 #include <sys/time.h>
53 #include <sys/proc.h>
54 #include <sys/signalvar.h>
55 #include <sys/filio.h>
56 #include <sys/sockio.h>
57 #include <sys/ttycom.h>
58 #include <sys/filedesc.h>
59
60 #include <sys/poll.h>
61
62 #include <sys/socket.h>
63 #include <sys/vnode.h>
64
65 #include <sys/thread2.h>
66
67 #include <net/if.h>
68 #include <net/bpf.h>
69 #include <net/bpfdesc.h>
70
71 #include <netinet/in.h>
72 #include <netinet/if_ether.h>
73 #include <sys/kernel.h>
74 #include <sys/sysctl.h>
75
76 MALLOC_DEFINE(M_BPF, "BPF", "BPF data");
77
78 #if NBPF > 0
79
80 /*
81  * The default read buffer size is patchable.
82  */
83 static int bpf_bufsize = BPF_DEFAULTBUFSIZE;
84 SYSCTL_INT(_debug, OID_AUTO, bpf_bufsize, CTLFLAG_RW,
85            &bpf_bufsize, 0, "");
86 static int bpf_maxbufsize = BPF_MAXBUFSIZE;
87 SYSCTL_INT(_debug, OID_AUTO, bpf_maxbufsize, CTLFLAG_RW,
88            &bpf_maxbufsize, 0, "");
89
90 /*
91  *  bpf_iflist is the list of interfaces; each corresponds to an ifnet
92  */
93 static struct bpf_if    *bpf_iflist;
94
95 static int      bpf_allocbufs(struct bpf_d *);
96 static void     bpf_attachd(struct bpf_d *d, struct bpf_if *bp);
97 static void     bpf_detachd(struct bpf_d *d);
98 static void     bpf_resetd(struct bpf_d *);
99 static void     bpf_freed(struct bpf_d *);
100 static void     bpf_mcopy(const void *, void *, size_t);
101 static int      bpf_movein(struct uio *, int, struct mbuf **,
102                            struct sockaddr *, int *);
103 static int      bpf_setif(struct bpf_d *, struct ifreq *);
104 static void     bpf_timed_out(void *);
105 static void     bpf_wakeup(struct bpf_d *);
106 static void     catchpacket(struct bpf_d *, u_char *, u_int, u_int,
107                             void (*)(const void *, void *, size_t),
108                             const struct timeval *);
109 static int      bpf_setf(struct bpf_d *, struct bpf_program *);
110 static int      bpf_getdltlist(struct bpf_d *, struct bpf_dltlist *);
111 static int      bpf_setdlt(struct bpf_d *, u_int);
112 static void     bpf_drvinit(void *unused);
113
114 static d_open_t         bpfopen;
115 static d_close_t        bpfclose;
116 static d_read_t         bpfread;
117 static d_write_t        bpfwrite;
118 static d_ioctl_t        bpfioctl;
119 static d_poll_t         bpfpoll;
120
121 #define CDEV_MAJOR 23
122 static struct dev_ops bpf_ops = {
123         { "bpf", CDEV_MAJOR, 0 },
124         .d_open =       bpfopen,
125         .d_close =      bpfclose,
126         .d_read =       bpfread,
127         .d_write =      bpfwrite,
128         .d_ioctl =      bpfioctl,
129         .d_poll =       bpfpoll,
130 };
131
132
133 static int
134 bpf_movein(struct uio *uio, int linktype, struct mbuf **mp,
135            struct sockaddr *sockp, int *datlen)
136 {
137         struct mbuf *m;
138         int error;
139         int len;
140         int hlen;
141
142         /*
143          * Build a sockaddr based on the data link layer type.
144          * We do this at this level because the ethernet header
145          * is copied directly into the data field of the sockaddr.
146          * In the case of SLIP, there is no header and the packet
147          * is forwarded as is.
148          * Also, we are careful to leave room at the front of the mbuf
149          * for the link level header.
150          */
151         switch (linktype) {
152         case DLT_SLIP:
153                 sockp->sa_family = AF_INET;
154                 hlen = 0;
155                 break;
156
157         case DLT_EN10MB:
158                 sockp->sa_family = AF_UNSPEC;
159                 /* XXX Would MAXLINKHDR be better? */
160                 hlen = sizeof(struct ether_header);
161                 break;
162
163         case DLT_FDDI:
164                 sockp->sa_family = AF_IMPLINK;
165                 hlen = 0;
166                 break;
167
168         case DLT_RAW:
169         case DLT_NULL:
170                 sockp->sa_family = AF_UNSPEC;
171                 hlen = 0;
172                 break;
173
174         case DLT_ATM_RFC1483:
175                 /*
176                  * en atm driver requires 4-byte atm pseudo header.
177                  * though it isn't standard, vpi:vci needs to be
178                  * specified anyway.
179                  */
180                 sockp->sa_family = AF_UNSPEC;
181                 hlen = 12;      /* XXX 4(ATM_PH) + 3(LLC) + 5(SNAP) */
182                 break;
183
184         case DLT_PPP:
185                 sockp->sa_family = AF_UNSPEC;
186                 hlen = 4;       /* This should match PPP_HDRLEN */
187                 break;
188
189         default:
190                 return(EIO);
191         }
192
193         len = uio->uio_resid;
194         *datlen = len - hlen;
195         if ((unsigned)len > MCLBYTES)
196                 return(EIO);
197
198         m = m_getl(len, MB_WAIT, MT_DATA, M_PKTHDR, NULL);
199         if (m == NULL)
200                 return(ENOBUFS);
201         m->m_pkthdr.len = m->m_len = len;
202         m->m_pkthdr.rcvif = NULL;
203         *mp = m;
204         /*
205          * Make room for link header.
206          */
207         if (hlen != 0) {
208                 m->m_pkthdr.len -= hlen;
209                 m->m_len -= hlen;
210                 m->m_data += hlen; /* XXX */
211                 error = uiomove(sockp->sa_data, hlen, uio);
212                 if (error)
213                         goto bad;
214         }
215         error = uiomove(mtod(m, caddr_t), len - hlen, uio);
216         if (!error)
217                 return(0);
218 bad:
219         m_freem(m);
220         return(error);
221 }
222
223 /*
224  * Attach file to the bpf interface, i.e. make d listen on bp.
225  * Must be called at splimp.
226  */
227 static void
228 bpf_attachd(struct bpf_d *d, struct bpf_if *bp)
229 {
230         /*
231          * Point d at bp, and add d to the interface's list of listeners.
232          * Finally, point the driver's bpf cookie at the interface so
233          * it will divert packets to bpf.
234          */
235         d->bd_bif = bp;
236         SLIST_INSERT_HEAD(&bp->bif_dlist, d, bd_next);
237         *bp->bif_driverp = bp;
238 }
239
240 /*
241  * Detach a file from its interface.
242  */
243 static void
244 bpf_detachd(struct bpf_d *d)
245 {
246         int error;
247         struct bpf_if *bp;
248         struct ifnet *ifp;
249
250         bp = d->bd_bif;
251         ifp = bp->bif_ifp;
252
253         /* Remove d from the interface's descriptor list. */
254         SLIST_REMOVE(&bp->bif_dlist, d, bpf_d, bd_next);
255
256         if (SLIST_EMPTY(&bp->bif_dlist)) {
257                 /*
258                  * Let the driver know that there are no more listeners.
259                  */
260                 *bp->bif_driverp = NULL;
261         }
262         d->bd_bif = NULL;
263         /*
264          * Check if this descriptor had requested promiscuous mode.
265          * If so, turn it off.
266          */
267         if (d->bd_promisc) {
268                 d->bd_promisc = 0;
269                 error = ifpromisc(ifp, 0);
270                 if (error != 0 && error != ENXIO) {
271                         /*
272                          * ENXIO can happen if a pccard is unplugged,
273                          * Something is really wrong if we were able to put
274                          * the driver into promiscuous mode, but can't
275                          * take it out.
276                          */
277                         if_printf(ifp, "bpf_detach: ifpromisc failed(%d)\n",
278                                   error);
279                 }
280         }
281 }
282
283 /*
284  * Open ethernet device.  Returns ENXIO for illegal minor device number,
285  * EBUSY if file is open by another process.
286  */
287 /* ARGSUSED */
288 static int
289 bpfopen(struct dev_open_args *ap)
290 {
291         cdev_t dev = ap->a_head.a_dev;
292         struct bpf_d *d;
293
294         if (ap->a_cred->cr_prison)
295                 return(EPERM);
296
297         d = dev->si_drv1;
298         /*
299          * Each minor can be opened by only one process.  If the requested
300          * minor is in use, return EBUSY.
301          */
302         if (d != NULL)
303                 return(EBUSY);
304         make_dev(&bpf_ops, minor(dev), 0, 0, 0600, "bpf%d", lminor(dev));
305         MALLOC(d, struct bpf_d *, sizeof *d, M_BPF, M_WAITOK | M_ZERO);
306         dev->si_drv1 = d;
307         d->bd_bufsize = bpf_bufsize;
308         d->bd_sig = SIGIO;
309         d->bd_seesent = 1;
310         callout_init(&d->bd_callout);
311         return(0);
312 }
313
314 /*
315  * Close the descriptor by detaching it from its interface,
316  * deallocating its buffers, and marking it free.
317  */
318 /* ARGSUSED */
319 static int
320 bpfclose(struct dev_close_args *ap)
321 {
322         cdev_t dev = ap->a_head.a_dev;
323         struct bpf_d *d = dev->si_drv1;
324
325         funsetown(d->bd_sigio);
326         crit_enter();
327         if (d->bd_state == BPF_WAITING)
328                 callout_stop(&d->bd_callout);
329         d->bd_state = BPF_IDLE;
330         if (d->bd_bif != NULL)
331                 bpf_detachd(d);
332         crit_exit();
333         bpf_freed(d);
334         dev->si_drv1 = NULL;
335         kfree(d, M_BPF);
336
337         return(0);
338 }
339
340 /*
341  * Rotate the packet buffers in descriptor d.  Move the store buffer
342  * into the hold slot, and the free buffer into the store slot.
343  * Zero the length of the new store buffer.
344  */
345 #define ROTATE_BUFFERS(d) \
346         (d)->bd_hbuf = (d)->bd_sbuf; \
347         (d)->bd_hlen = (d)->bd_slen; \
348         (d)->bd_sbuf = (d)->bd_fbuf; \
349         (d)->bd_slen = 0; \
350         (d)->bd_fbuf = NULL;
351 /*
352  *  bpfread - read next chunk of packets from buffers
353  */
354 static int
355 bpfread(struct dev_read_args *ap)
356 {
357         cdev_t dev = ap->a_head.a_dev;
358         struct bpf_d *d = dev->si_drv1;
359         int timed_out;
360         int error;
361
362         /*
363          * Restrict application to use a buffer the same size as
364          * as kernel buffers.
365          */
366         if (ap->a_uio->uio_resid != d->bd_bufsize)
367                 return(EINVAL);
368
369         crit_enter();
370         if (d->bd_state == BPF_WAITING)
371                 callout_stop(&d->bd_callout);
372         timed_out = (d->bd_state == BPF_TIMED_OUT);
373         d->bd_state = BPF_IDLE;
374         /*
375          * If the hold buffer is empty, then do a timed sleep, which
376          * ends when the timeout expires or when enough packets
377          * have arrived to fill the store buffer.
378          */
379         while (d->bd_hbuf == NULL) {
380                 if ((d->bd_immediate || timed_out) && d->bd_slen != 0) {
381                         /*
382                          * A packet(s) either arrived since the previous
383                          * read or arrived while we were asleep.
384                          * Rotate the buffers and return what's here.
385                          */
386                         ROTATE_BUFFERS(d);
387                         break;
388                 }
389
390                 /*
391                  * No data is available, check to see if the bpf device
392                  * is still pointed at a real interface.  If not, return
393                  * ENXIO so that the userland process knows to rebind
394                  * it before using it again.
395                  */
396                 if (d->bd_bif == NULL) {
397                         crit_exit();
398                         return(ENXIO);
399                 }
400
401                 if (ap->a_ioflag & IO_NDELAY) {
402                         crit_exit();
403                         return(EWOULDBLOCK);
404                 }
405                 error = tsleep(d, PCATCH, "bpf", d->bd_rtout);
406                 if (error == EINTR || error == ERESTART) {
407                         crit_exit();
408                         return(error);
409                 }
410                 if (error == EWOULDBLOCK) {
411                         /*
412                          * On a timeout, return what's in the buffer,
413                          * which may be nothing.  If there is something
414                          * in the store buffer, we can rotate the buffers.
415                          */
416                         if (d->bd_hbuf)
417                                 /*
418                                  * We filled up the buffer in between
419                                  * getting the timeout and arriving
420                                  * here, so we don't need to rotate.
421                                  */
422                                 break;
423
424                         if (d->bd_slen == 0) {
425                                 crit_exit();
426                                 return(0);
427                         }
428                         ROTATE_BUFFERS(d);
429                         break;
430                 }
431         }
432         /*
433          * At this point, we know we have something in the hold slot.
434          */
435         crit_exit();
436
437         /*
438          * Move data from hold buffer into user space.
439          * We know the entire buffer is transferred since
440          * we checked above that the read buffer is bpf_bufsize bytes.
441          */
442         error = uiomove(d->bd_hbuf, d->bd_hlen, ap->a_uio);
443
444         crit_enter();
445         d->bd_fbuf = d->bd_hbuf;
446         d->bd_hbuf = NULL;
447         d->bd_hlen = 0;
448         crit_exit();
449
450         return(error);
451 }
452
453
454 /*
455  * If there are processes sleeping on this descriptor, wake them up.
456  */
457 static void
458 bpf_wakeup(struct bpf_d *d)
459 {
460         if (d->bd_state == BPF_WAITING) {
461                 callout_stop(&d->bd_callout);
462                 d->bd_state = BPF_IDLE;
463         }
464         wakeup(d);
465         if (d->bd_async && d->bd_sig && d->bd_sigio)
466                 pgsigio(d->bd_sigio, d->bd_sig, 0);
467
468         get_mplock();
469         selwakeup(&d->bd_sel);
470         rel_mplock();
471         /* XXX */
472         d->bd_sel.si_pid = 0;
473 }
474
475 static void
476 bpf_timed_out(void *arg)
477 {
478         struct bpf_d *d = (struct bpf_d *)arg;
479
480         crit_enter();
481         if (d->bd_state == BPF_WAITING) {
482                 d->bd_state = BPF_TIMED_OUT;
483                 if (d->bd_slen != 0)
484                         bpf_wakeup(d);
485         }
486         crit_exit();
487 }
488
489 static  int
490 bpfwrite(struct dev_write_args *ap)
491 {
492         cdev_t dev = ap->a_head.a_dev;
493         struct bpf_d *d = dev->si_drv1;
494         struct ifnet *ifp;
495         struct mbuf *m;
496         int error;
497         static struct sockaddr dst;
498         int datlen;
499
500         if (d->bd_bif == NULL)
501                 return(ENXIO);
502
503         ifp = d->bd_bif->bif_ifp;
504
505         if (ap->a_uio->uio_resid == 0)
506                 return(0);
507
508         error = bpf_movein(ap->a_uio, (int)d->bd_bif->bif_dlt, &m,
509                            &dst, &datlen);
510         if (error)
511                 return(error);
512
513         if (datlen > ifp->if_mtu) {
514                 m_freem(m);
515                 return(EMSGSIZE);
516         }
517
518         if (d->bd_hdrcmplt)
519                 dst.sa_family = pseudo_AF_HDRCMPLT;
520
521         crit_enter();
522         lwkt_serialize_enter(ifp->if_serializer);
523         error = (*ifp->if_output)(ifp, m, &dst, (struct rtentry *)NULL);
524         lwkt_serialize_exit(ifp->if_serializer);
525         crit_exit();
526         /*
527          * The driver frees the mbuf.
528          */
529         return(error);
530 }
531
532 /*
533  * Reset a descriptor by flushing its packet buffer and clearing the
534  * receive and drop counts.  Should be called at splimp.
535  */
536 static void
537 bpf_resetd(struct bpf_d *d)
538 {
539         if (d->bd_hbuf) {
540                 /* Free the hold buffer. */
541                 d->bd_fbuf = d->bd_hbuf;
542                 d->bd_hbuf = NULL;
543         }
544         d->bd_slen = 0;
545         d->bd_hlen = 0;
546         d->bd_rcount = 0;
547         d->bd_dcount = 0;
548 }
549
550 /*
551  *  FIONREAD            Check for read packet available.
552  *  SIOCGIFADDR         Get interface address - convenient hook to driver.
553  *  BIOCGBLEN           Get buffer len [for read()].
554  *  BIOCSETF            Set ethernet read filter.
555  *  BIOCFLUSH           Flush read packet buffer.
556  *  BIOCPROMISC         Put interface into promiscuous mode.
557  *  BIOCGDLT            Get link layer type.
558  *  BIOCGETIF           Get interface name.
559  *  BIOCSETIF           Set interface.
560  *  BIOCSRTIMEOUT       Set read timeout.
561  *  BIOCGRTIMEOUT       Get read timeout.
562  *  BIOCGSTATS          Get packet stats.
563  *  BIOCIMMEDIATE       Set immediate mode.
564  *  BIOCVERSION         Get filter language version.
565  *  BIOCGHDRCMPLT       Get "header already complete" flag
566  *  BIOCSHDRCMPLT       Set "header already complete" flag
567  *  BIOCGSEESENT        Get "see packets sent" flag
568  *  BIOCSSEESENT        Set "see packets sent" flag
569  */
570 /* ARGSUSED */
571 static int
572 bpfioctl(struct dev_ioctl_args *ap)
573 {
574         cdev_t dev = ap->a_head.a_dev;
575         struct bpf_d *d = dev->si_drv1;
576         int error = 0;
577
578         crit_enter();
579         if (d->bd_state == BPF_WAITING)
580                 callout_stop(&d->bd_callout);
581         d->bd_state = BPF_IDLE;
582         crit_exit();
583
584         switch (ap->a_cmd) {
585         default:
586                 error = EINVAL;
587                 break;
588
589         /*
590          * Check for read packet available.
591          */
592         case FIONREAD:
593                 {
594                         int n;
595
596                         crit_enter();
597                         n = d->bd_slen;
598                         if (d->bd_hbuf)
599                                 n += d->bd_hlen;
600                         crit_exit();
601
602                         *(int *)ap->a_data = n;
603                         break;
604                 }
605
606         case SIOCGIFADDR:
607                 {
608                         struct ifnet *ifp;
609
610                         if (d->bd_bif == NULL)
611                                 error = EINVAL;
612                         else {
613                                 ifp = d->bd_bif->bif_ifp;
614                                 lwkt_serialize_enter(ifp->if_serializer);
615                                 error = ifp->if_ioctl(ifp, ap->a_cmd,
616                                                       ap->a_data, ap->a_cred);
617                                 lwkt_serialize_exit(ifp->if_serializer);
618                         }
619                         break;
620                 }
621
622         /*
623          * Get buffer len [for read()].
624          */
625         case BIOCGBLEN:
626                 *(u_int *)ap->a_data = d->bd_bufsize;
627                 break;
628
629         /*
630          * Set buffer length.
631          */
632         case BIOCSBLEN:
633                 if (d->bd_bif != 0)
634                         error = EINVAL;
635                 else {
636                         u_int size = *(u_int *)ap->a_data;
637
638                         if (size > bpf_maxbufsize)
639                                 *(u_int *)ap->a_data = size = bpf_maxbufsize;
640                         else if (size < BPF_MINBUFSIZE)
641                                 *(u_int *)ap->a_data = size = BPF_MINBUFSIZE;
642                         d->bd_bufsize = size;
643                 }
644                 break;
645
646         /*
647          * Set link layer read filter.
648          */
649         case BIOCSETF:
650                 error = bpf_setf(d, (struct bpf_program *)ap->a_data);
651                 break;
652
653         /*
654          * Flush read packet buffer.
655          */
656         case BIOCFLUSH:
657                 crit_enter();
658                 bpf_resetd(d);
659                 crit_exit();
660                 break;
661
662         /*
663          * Put interface into promiscuous mode.
664          */
665         case BIOCPROMISC:
666                 if (d->bd_bif == NULL) {
667                         /*
668                          * No interface attached yet.
669                          */
670                         error = EINVAL;
671                         break;
672                 }
673                 crit_enter();
674                 if (d->bd_promisc == 0) {
675                         error = ifpromisc(d->bd_bif->bif_ifp, 1);
676                         if (error == 0)
677                                 d->bd_promisc = 1;
678                 }
679                 crit_exit();
680                 break;
681
682         /*
683          * Get device parameters.
684          */
685         case BIOCGDLT:
686                 if (d->bd_bif == NULL)
687                         error = EINVAL;
688                 else
689                         *(u_int *)ap->a_data = d->bd_bif->bif_dlt;
690                 break;
691
692         /*
693          * Get a list of supported data link types.
694          */
695         case BIOCGDLTLIST:
696                 if (d->bd_bif == NULL)
697                         error = EINVAL;
698                 else
699                         error = bpf_getdltlist(d, (struct bpf_dltlist *)ap->a_data);
700                 break;
701
702         /*
703          * Set data link type.
704          */
705         case BIOCSDLT:
706                 if (d->bd_bif == NULL)
707                         error = EINVAL;
708                 else
709                         error = bpf_setdlt(d, *(u_int *)ap->a_data);
710                 break;
711
712         /*
713          * Get interface name.
714          */
715         case BIOCGETIF:
716                 if (d->bd_bif == NULL) {
717                         error = EINVAL;
718                 } else {
719                         struct ifnet *const ifp = d->bd_bif->bif_ifp;
720                         struct ifreq *const ifr = (struct ifreq *)ap->a_data;
721
722                         strlcpy(ifr->ifr_name, ifp->if_xname,
723                                 sizeof ifr->ifr_name);
724                 }
725                 break;
726
727         /*
728          * Set interface.
729          */
730         case BIOCSETIF:
731                 error = bpf_setif(d, (struct ifreq *)ap->a_data);
732                 break;
733
734         /*
735          * Set read timeout.
736          */
737         case BIOCSRTIMEOUT:
738                 {
739                         struct timeval *tv = (struct timeval *)ap->a_data;
740
741                         /*
742                          * Subtract 1 tick from tvtohz() since this isn't
743                          * a one-shot timer.
744                          */
745                         if ((error = itimerfix(tv)) == 0)
746                                 d->bd_rtout = tvtohz_low(tv);
747                         break;
748                 }
749
750         /*
751          * Get read timeout.
752          */
753         case BIOCGRTIMEOUT:
754                 {
755                         struct timeval *tv = (struct timeval *)ap->a_data;
756
757                         tv->tv_sec = d->bd_rtout / hz;
758                         tv->tv_usec = (d->bd_rtout % hz) * tick;
759                         break;
760                 }
761
762         /*
763          * Get packet stats.
764          */
765         case BIOCGSTATS:
766                 {
767                         struct bpf_stat *bs = (struct bpf_stat *)ap->a_data;
768
769                         bs->bs_recv = d->bd_rcount;
770                         bs->bs_drop = d->bd_dcount;
771                         break;
772                 }
773
774         /*
775          * Set immediate mode.
776          */
777         case BIOCIMMEDIATE:
778                 d->bd_immediate = *(u_int *)ap->a_data;
779                 break;
780
781         case BIOCVERSION:
782                 {
783                         struct bpf_version *bv = (struct bpf_version *)ap->a_data;
784
785                         bv->bv_major = BPF_MAJOR_VERSION;
786                         bv->bv_minor = BPF_MINOR_VERSION;
787                         break;
788                 }
789
790         /*
791          * Get "header already complete" flag
792          */
793         case BIOCGHDRCMPLT:
794                 *(u_int *)ap->a_data = d->bd_hdrcmplt;
795                 break;
796
797         /*
798          * Set "header already complete" flag
799          */
800         case BIOCSHDRCMPLT:
801                 d->bd_hdrcmplt = *(u_int *)ap->a_data ? 1 : 0;
802                 break;
803
804         /*
805          * Get "see sent packets" flag
806          */
807         case BIOCGSEESENT:
808                 *(u_int *)ap->a_data = d->bd_seesent;
809                 break;
810
811         /*
812          * Set "see sent packets" flag
813          */
814         case BIOCSSEESENT:
815                 d->bd_seesent = *(u_int *)ap->a_data;
816                 break;
817
818         case FIOASYNC:          /* Send signal on receive packets */
819                 d->bd_async = *(int *)ap->a_data;
820                 break;
821
822         case FIOSETOWN:
823                 error = fsetown(*(int *)ap->a_data, &d->bd_sigio);
824                 break;
825
826         case FIOGETOWN:
827                 *(int *)ap->a_data = fgetown(d->bd_sigio);
828                 break;
829
830         /* This is deprecated, FIOSETOWN should be used instead. */
831         case TIOCSPGRP:
832                 error = fsetown(-(*(int *)ap->a_data), &d->bd_sigio);
833                 break;
834
835         /* This is deprecated, FIOGETOWN should be used instead. */
836         case TIOCGPGRP:
837                 *(int *)ap->a_data = -fgetown(d->bd_sigio);
838                 break;
839
840         case BIOCSRSIG:         /* Set receive signal */
841                 {
842                         u_int sig;
843
844                         sig = *(u_int *)ap->a_data;
845
846                         if (sig >= NSIG)
847                                 error = EINVAL;
848                         else
849                                 d->bd_sig = sig;
850                         break;
851                 }
852         case BIOCGRSIG:
853                 *(u_int *)ap->a_data = d->bd_sig;
854                 break;
855         }
856         return(error);
857 }
858
859 /*
860  * Set d's packet filter program to fp.  If this file already has a filter,
861  * free it and replace it.  Returns EINVAL for bogus requests.
862  */
863 static int
864 bpf_setf(struct bpf_d *d, struct bpf_program *fp)
865 {
866         struct bpf_insn *fcode, *old;
867         u_int flen, size;
868
869         old = d->bd_filter;
870         if (fp->bf_insns == NULL) {
871                 if (fp->bf_len != 0)
872                         return(EINVAL);
873                 crit_enter();
874                 d->bd_filter = NULL;
875                 bpf_resetd(d);
876                 crit_exit();
877                 if (old != 0)
878                         kfree(old, M_BPF);
879                 return(0);
880         }
881         flen = fp->bf_len;
882         if (flen > BPF_MAXINSNS)
883                 return(EINVAL);
884
885         size = flen * sizeof *fp->bf_insns;
886         fcode = (struct bpf_insn *)kmalloc(size, M_BPF, M_WAITOK);
887         if (copyin(fp->bf_insns, fcode, size) == 0 &&
888             bpf_validate(fcode, (int)flen)) {
889                 crit_enter();
890                 d->bd_filter = fcode;
891                 bpf_resetd(d);
892                 crit_exit();
893                 if (old != 0)
894                         kfree(old, M_BPF);
895
896                 return(0);
897         }
898         kfree(fcode, M_BPF);
899         return(EINVAL);
900 }
901
902 /*
903  * Detach a file from its current interface (if attached at all) and attach
904  * to the interface indicated by the name stored in ifr.
905  * Return an errno or 0.
906  */
907 static int
908 bpf_setif(struct bpf_d *d, struct ifreq *ifr)
909 {
910         struct bpf_if *bp;
911         int error;
912         struct ifnet *theywant;
913
914         theywant = ifunit(ifr->ifr_name);
915         if (theywant == NULL)
916                 return(ENXIO);
917
918         /*
919          * Look through attached interfaces for the named one.
920          */
921         for (bp = bpf_iflist; bp != 0; bp = bp->bif_next) {
922                 struct ifnet *ifp = bp->bif_ifp;
923
924                 if (ifp == NULL || ifp != theywant)
925                         continue;
926                 /* skip additional entry */
927                 if (bp->bif_driverp != &ifp->if_bpf)
928                         continue;
929                 /*
930                  * We found the requested interface.
931                  * If it's not up, return an error.
932                  * Allocate the packet buffers if we need to.
933                  * If we're already attached to requested interface,
934                  * just flush the buffer.
935                  */
936                 if (!(ifp->if_flags & IFF_UP))
937                         return(ENETDOWN);
938
939                 if (d->bd_sbuf == NULL) {
940                         error = bpf_allocbufs(d);
941                         if (error != 0)
942                                 return(error);
943                 }
944                 crit_enter();
945                 if (bp != d->bd_bif) {
946                         if (d->bd_bif != NULL) {
947                                 /*
948                                  * Detach if attached to something else.
949                                  */
950                                 bpf_detachd(d);
951                         }
952
953                         bpf_attachd(d, bp);
954                 }
955                 bpf_resetd(d);
956                 crit_exit();
957                 return(0);
958         }
959
960         /* Not found. */
961         return(ENXIO);
962 }
963
964 /*
965  * Support for select() and poll() system calls
966  *
967  * Return true iff the specific operation will not block indefinitely.
968  * Otherwise, return false but make a note that a selwakeup() must be done.
969  */
970 int
971 bpfpoll(struct dev_poll_args *ap)
972 {
973         cdev_t dev = ap->a_head.a_dev;
974         struct bpf_d *d;
975         int revents;
976
977         d = dev->si_drv1;
978         if (d->bd_bif == NULL)
979                 return(ENXIO);
980
981         revents = ap->a_events & (POLLOUT | POLLWRNORM);
982         crit_enter();
983         if (ap->a_events & (POLLIN | POLLRDNORM)) {
984                 /*
985                  * An imitation of the FIONREAD ioctl code.
986                  * XXX not quite.  An exact imitation:
987                  *      if (d->b_slen != 0 ||
988                  *          (d->bd_hbuf != NULL && d->bd_hlen != 0)
989                  */
990                 if (d->bd_hlen != 0 ||
991                     ((d->bd_immediate || d->bd_state == BPF_TIMED_OUT) &&
992                     d->bd_slen != 0))
993                         revents |= ap->a_events & (POLLIN | POLLRDNORM);
994                 else {
995                         selrecord(curthread, &d->bd_sel);
996                         /* Start the read timeout if necessary. */
997                         if (d->bd_rtout > 0 && d->bd_state == BPF_IDLE) {
998                                 callout_reset(&d->bd_callout, d->bd_rtout,
999                                     bpf_timed_out, d);
1000                                 d->bd_state = BPF_WAITING;
1001                         }
1002                 }
1003         }
1004         crit_exit();
1005         ap->a_events = revents;
1006         return(0);
1007 }
1008
1009 /*
1010  * Process the packet pkt of length pktlen.  The packet is parsed
1011  * by each listener's filter, and if accepted, stashed into the
1012  * corresponding buffer.
1013  */
1014 void
1015 bpf_tap(struct bpf_if *bp, u_char *pkt, u_int pktlen)
1016 {
1017         struct bpf_d *d;
1018         struct timeval tv;
1019         int gottime = 0;
1020         u_int slen;
1021
1022         /*
1023          * Note that the ipl does not have to be raised at this point.
1024          * The only problem that could arise here is that if two different
1025          * interfaces shared any data.  This is not the case.
1026          */
1027         SLIST_FOREACH(d, &bp->bif_dlist, bd_next) {
1028                 ++d->bd_rcount;
1029                 slen = bpf_filter(d->bd_filter, pkt, pktlen, pktlen);
1030                 if (slen != 0) {
1031                         if (!gottime) {
1032                                 microtime(&tv);
1033                                 gottime = 1;
1034                         }
1035                         catchpacket(d, pkt, pktlen, slen, ovbcopy, &tv);
1036                 }
1037         }
1038 }
1039
1040 /*
1041  * Copy data from an mbuf chain into a buffer.  This code is derived
1042  * from m_copydata in sys/uipc_mbuf.c.
1043  */
1044 static void
1045 bpf_mcopy(const void *src_arg, void *dst_arg, size_t len)
1046 {
1047         const struct mbuf *m;
1048         u_int count;
1049         u_char *dst;
1050
1051         m = src_arg;
1052         dst = dst_arg;
1053         while (len > 0) {
1054                 if (m == NULL)
1055                         panic("bpf_mcopy");
1056                 count = min(m->m_len, len);
1057                 bcopy(mtod(m, void *), dst, count);
1058                 m = m->m_next;
1059                 dst += count;
1060                 len -= count;
1061         }
1062 }
1063
1064 /*
1065  * Process the packet in the mbuf chain m.  The packet is parsed by each
1066  * listener's filter, and if accepted, stashed into the corresponding
1067  * buffer.
1068  */
1069 void
1070 bpf_mtap(struct bpf_if *bp, struct mbuf *m)
1071 {
1072         struct bpf_d *d;
1073         u_int pktlen, slen;
1074         struct timeval tv;
1075         int gottime = 0;
1076
1077         /* Don't compute pktlen, if no descriptor is attached. */
1078         if (SLIST_EMPTY(&bp->bif_dlist))
1079                 return;
1080
1081         pktlen = m_lengthm(m, NULL);
1082
1083         SLIST_FOREACH(d, &bp->bif_dlist, bd_next) {
1084                 if (!d->bd_seesent && (m->m_pkthdr.rcvif == NULL))
1085                         continue;
1086                 ++d->bd_rcount;
1087                 slen = bpf_filter(d->bd_filter, (u_char *)m, pktlen, 0);
1088                 if (slen != 0) {
1089                         if (!gottime) {
1090                                 microtime(&tv);
1091                                 gottime = 1;
1092                         }
1093                         catchpacket(d, (u_char *)m, pktlen, slen, bpf_mcopy,
1094                                     &tv);
1095                 }
1096         }
1097 }
1098
1099 void
1100 bpf_mtap_family(struct bpf_if *bp, struct mbuf *m, sa_family_t family)
1101 {
1102         u_int family4;
1103
1104         KKASSERT(family != AF_UNSPEC);
1105
1106         family4 = (u_int)family;
1107         bpf_ptap(bp, m, &family4, sizeof(family4));
1108 }
1109
1110 /*
1111  * Process the packet in the mbuf chain m with the header in m prepended.
1112  * The packet is parsed by each listener's filter, and if accepted,
1113  * stashed into the corresponding buffer.
1114  */
1115 void
1116 bpf_ptap(struct bpf_if *bp, struct mbuf *m, const void *data, u_int dlen)
1117 {
1118         struct mbuf mb;
1119
1120         /*
1121          * Craft on-stack mbuf suitable for passing to bpf_mtap.
1122          * Note that we cut corners here; we only setup what's
1123          * absolutely needed--this mbuf should never go anywhere else.
1124          */
1125         mb.m_next = m;
1126         mb.m_data = __DECONST(void *, data); /* LINTED */
1127         mb.m_len = dlen;
1128         mb.m_pkthdr.rcvif = m->m_pkthdr.rcvif;
1129
1130         bpf_mtap(bp, &mb);
1131 }
1132
1133 /*
1134  * Move the packet data from interface memory (pkt) into the
1135  * store buffer.  Return 1 if it's time to wakeup a listener (buffer full),
1136  * otherwise 0.  "copy" is the routine called to do the actual data
1137  * transfer.  bcopy is passed in to copy contiguous chunks, while
1138  * bpf_mcopy is passed in to copy mbuf chains.  In the latter case,
1139  * pkt is really an mbuf.
1140  */
1141 static void
1142 catchpacket(struct bpf_d *d, u_char *pkt, u_int pktlen, u_int snaplen,
1143             void (*cpfn)(const void *, void *, size_t),
1144             const struct timeval *tv)
1145 {
1146         struct bpf_hdr *hp;
1147         int totlen, curlen;
1148         int hdrlen = d->bd_bif->bif_hdrlen;
1149         /*
1150          * Figure out how many bytes to move.  If the packet is
1151          * greater or equal to the snapshot length, transfer that
1152          * much.  Otherwise, transfer the whole packet (unless
1153          * we hit the buffer size limit).
1154          */
1155         totlen = hdrlen + min(snaplen, pktlen);
1156         if (totlen > d->bd_bufsize)
1157                 totlen = d->bd_bufsize;
1158
1159         /*
1160          * Round up the end of the previous packet to the next longword.
1161          */
1162         curlen = BPF_WORDALIGN(d->bd_slen);
1163         if (curlen + totlen > d->bd_bufsize) {
1164                 /*
1165                  * This packet will overflow the storage buffer.
1166                  * Rotate the buffers if we can, then wakeup any
1167                  * pending reads.
1168                  */
1169                 if (d->bd_fbuf == NULL) {
1170                         /*
1171                          * We haven't completed the previous read yet,
1172                          * so drop the packet.
1173                          */
1174                         ++d->bd_dcount;
1175                         return;
1176                 }
1177                 ROTATE_BUFFERS(d);
1178                 bpf_wakeup(d);
1179                 curlen = 0;
1180         }
1181         else if (d->bd_immediate || d->bd_state == BPF_TIMED_OUT)
1182                 /*
1183                  * Immediate mode is set, or the read timeout has
1184                  * already expired during a select call.  A packet
1185                  * arrived, so the reader should be woken up.
1186                  */
1187                 bpf_wakeup(d);
1188
1189         /*
1190          * Append the bpf header.
1191          */
1192         hp = (struct bpf_hdr *)(d->bd_sbuf + curlen);
1193         hp->bh_tstamp = *tv;
1194         hp->bh_datalen = pktlen;
1195         hp->bh_hdrlen = hdrlen;
1196         /*
1197          * Copy the packet data into the store buffer and update its length.
1198          */
1199         (*cpfn)(pkt, (u_char *)hp + hdrlen, (hp->bh_caplen = totlen - hdrlen));
1200         d->bd_slen = curlen + totlen;
1201 }
1202
1203 /*
1204  * Initialize all nonzero fields of a descriptor.
1205  */
1206 static int
1207 bpf_allocbufs(struct bpf_d *d)
1208 {
1209         d->bd_fbuf = kmalloc(d->bd_bufsize, M_BPF, M_WAITOK);
1210         d->bd_sbuf = kmalloc(d->bd_bufsize, M_BPF, M_WAITOK);
1211         d->bd_slen = 0;
1212         d->bd_hlen = 0;
1213         return(0);
1214 }
1215
1216 /*
1217  * Free buffers currently in use by a descriptor.
1218  * Called on close.
1219  */
1220 static void
1221 bpf_freed(struct bpf_d *d)
1222 {
1223         /*
1224          * We don't need to lock out interrupts since this descriptor has
1225          * been detached from its interface and it yet hasn't been marked
1226          * free.
1227          */
1228         if (d->bd_sbuf != NULL) {
1229                 kfree(d->bd_sbuf, M_BPF);
1230                 if (d->bd_hbuf != NULL)
1231                         kfree(d->bd_hbuf, M_BPF);
1232                 if (d->bd_fbuf != NULL)
1233                         kfree(d->bd_fbuf, M_BPF);
1234         }
1235         if (d->bd_filter)
1236                 kfree(d->bd_filter, M_BPF);
1237 }
1238
1239 /*
1240  * Attach an interface to bpf.  ifp is a pointer to the structure
1241  * defining the interface to be attached, dlt is the link layer type,
1242  * and hdrlen is the fixed size of the link header (variable length
1243  * headers are not yet supported).
1244  */
1245 void
1246 bpfattach(struct ifnet *ifp, u_int dlt, u_int hdrlen)
1247 {
1248         bpfattach_dlt(ifp, dlt, hdrlen, &ifp->if_bpf);
1249 }
1250
1251 void
1252 bpfattach_dlt(struct ifnet *ifp, u_int dlt, u_int hdrlen, struct bpf_if **driverp)
1253 {
1254         struct bpf_if *bp;
1255
1256         bp = kmalloc(sizeof *bp, M_BPF, M_WAITOK | M_ZERO);
1257
1258         SLIST_INIT(&bp->bif_dlist);
1259         bp->bif_ifp = ifp;
1260         bp->bif_dlt = dlt;
1261         bp->bif_driverp = driverp;
1262         *bp->bif_driverp = NULL;
1263
1264         bp->bif_next = bpf_iflist;
1265         bpf_iflist = bp;
1266
1267         /*
1268          * Compute the length of the bpf header.  This is not necessarily
1269          * equal to SIZEOF_BPF_HDR because we want to insert spacing such
1270          * that the network layer header begins on a longword boundary (for
1271          * performance reasons and to alleviate alignment restrictions).
1272          */
1273         bp->bif_hdrlen = BPF_WORDALIGN(hdrlen + SIZEOF_BPF_HDR) - hdrlen;
1274
1275         if (bootverbose)
1276                 if_printf(ifp, "bpf attached\n");
1277 }
1278
1279 /*
1280  * Detach bpf from an interface.  This involves detaching each descriptor
1281  * associated with the interface, and leaving bd_bif NULL.  Notify each
1282  * descriptor as it's detached so that any sleepers wake up and get
1283  * ENXIO.
1284  */
1285 void
1286 bpfdetach(struct ifnet *ifp)
1287 {
1288         struct bpf_if *bp, *bp_prev;
1289         struct bpf_d *d;
1290
1291         crit_enter();
1292
1293         /* Locate BPF interface information */
1294         bp_prev = NULL;
1295         for (bp = bpf_iflist; bp != NULL; bp = bp->bif_next) {
1296                 if (ifp == bp->bif_ifp)
1297                         break;
1298                 bp_prev = bp;
1299         }
1300
1301         /* Interface wasn't attached */
1302         if (bp->bif_ifp == NULL) {
1303                 crit_exit();
1304                 kprintf("bpfdetach: %s was not attached\n", ifp->if_xname);
1305                 return;
1306         }
1307
1308         while ((d = SLIST_FIRST(&bp->bif_dlist)) != NULL) {
1309                 bpf_detachd(d);
1310                 bpf_wakeup(d);
1311         }
1312
1313         if (bp_prev != NULL)
1314                 bp_prev->bif_next = bp->bif_next;
1315         else
1316                 bpf_iflist = bp->bif_next;
1317
1318         kfree(bp, M_BPF);
1319
1320         crit_exit();
1321 }
1322
1323 /*
1324  * Get a list of available data link type of the interface.
1325  */
1326 static int
1327 bpf_getdltlist(struct bpf_d *d, struct bpf_dltlist *bfl)
1328 {
1329         int n, error;
1330         struct ifnet *ifp;
1331         struct bpf_if *bp;
1332
1333         ifp = d->bd_bif->bif_ifp;
1334         n = 0;
1335         error = 0;
1336         for (bp = bpf_iflist; bp != 0; bp = bp->bif_next) {
1337                 if (bp->bif_ifp != ifp)
1338                         continue;
1339                 if (bfl->bfl_list != NULL) {
1340                         if (n >= bfl->bfl_len) {
1341                                 return (ENOMEM);
1342                         }
1343                         error = copyout(&bp->bif_dlt,
1344                             bfl->bfl_list + n, sizeof(u_int));
1345                 }
1346                 n++;
1347         }
1348         bfl->bfl_len = n;
1349         return(error);
1350 }
1351
1352 /*
1353  * Set the data link type of a BPF instance.
1354  */
1355 static int
1356 bpf_setdlt(struct bpf_d *d, u_int dlt)
1357 {
1358         int error, opromisc;
1359         struct ifnet *ifp;
1360         struct bpf_if *bp;
1361
1362         if (d->bd_bif->bif_dlt == dlt)
1363                 return (0);
1364         ifp = d->bd_bif->bif_ifp;
1365         for (bp = bpf_iflist; bp != 0; bp = bp->bif_next) {
1366                 if (bp->bif_ifp == ifp && bp->bif_dlt == dlt)
1367                         break;
1368         }
1369         if (bp != NULL) {
1370                 opromisc = d->bd_promisc;
1371                 crit_enter();
1372                 bpf_detachd(d);
1373                 bpf_attachd(d, bp);
1374                 bpf_resetd(d);
1375                 if (opromisc) {
1376                         error = ifpromisc(bp->bif_ifp, 1);
1377                         if (error)
1378                                 if_printf(bp->bif_ifp,
1379                                         "bpf_setdlt: ifpromisc failed (%d)\n",
1380                                         error);
1381                         else
1382                                 d->bd_promisc = 1;
1383                 }
1384                 crit_exit();
1385         }
1386         return(bp == NULL ? EINVAL : 0);
1387 }
1388
1389 static void
1390 bpf_drvinit(void *unused)
1391 {
1392         dev_ops_add(&bpf_ops, 0, 0);
1393 }
1394
1395 SYSINIT(bpfdev,SI_SUB_DRIVERS,SI_ORDER_MIDDLE+CDEV_MAJOR,bpf_drvinit,NULL)
1396
1397 #else /* !BPF */
1398 /*
1399  * NOP stubs to allow bpf-using drivers to load and function.
1400  *
1401  * A 'better' implementation would allow the core bpf functionality
1402  * to be loaded at runtime.
1403  */
1404
1405 void
1406 bpf_tap(struct bpf_if *bp, u_char *pkt, u_int pktlen)
1407 {
1408 }
1409
1410 void
1411 bpf_mtap(struct bpf_if *bp, struct mbuf *m)
1412 {
1413 }
1414
1415 void
1416 bpf_ptap(struct bpf_if *bp, struct mbuf *m, const void *data, u_int dlen)
1417 {
1418 }
1419
1420 void
1421 bpfattach(struct ifnet *ifp, u_int dlt, u_int hdrlen)
1422 {
1423 }
1424
1425 void
1426 bpfattach_dlt(struct ifnet *ifp, u_int dlt, u_int hdrlen, struct bpf_if **driverp)
1427 {
1428 }
1429
1430 void
1431 bpfdetach(struct ifnet *ifp)
1432 {
1433 }
1434
1435 u_int
1436 bpf_filter(const struct bpf_insn *pc, u_char *p, u_int wirelen, u_int buflen)
1437 {
1438         return -1;      /* "no filter" behaviour */
1439 }
1440
1441 #endif /* !BPF */