Move stack variable near its usage
[dragonfly.git] / sys / netinet / in.c
1 /*
2  * Copyright (c) 1982, 1986, 1991, 1993
3  *      The Regents of the University of California.  All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  * 1. Redistributions of source code must retain the above copyright
9  *    notice, this list of conditions and the following disclaimer.
10  * 2. Redistributions in binary form must reproduce the above copyright
11  *    notice, this list of conditions and the following disclaimer in the
12  *    documentation and/or other materials provided with the distribution.
13  * 3. All advertising materials mentioning features or use of this software
14  *    must display the following acknowledgement:
15  *      This product includes software developed by the University of
16  *      California, Berkeley and its contributors.
17  * 4. Neither the name of the University nor the names of its contributors
18  *    may be used to endorse or promote products derived from this software
19  *    without specific prior written permission.
20  *
21  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
22  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
23  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
24  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
25  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
26  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
27  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
28  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
29  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
30  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
31  * SUCH DAMAGE.
32  *
33  *      @(#)in.c        8.4 (Berkeley) 1/9/95
34  * $FreeBSD: src/sys/netinet/in.c,v 1.44.2.14 2002/11/08 00:45:50 suz Exp $
35  * $DragonFly: src/sys/netinet/in.c,v 1.38 2008/06/09 04:59:22 sephe Exp $
36  */
37
38 #include "opt_bootp.h"
39
40 #include <sys/param.h>
41 #include <sys/systm.h>
42 #include <sys/sockio.h>
43 #include <sys/malloc.h>
44 #include <sys/proc.h>
45 #include <sys/msgport.h>
46 #include <sys/socket.h>
47
48 #include <sys/kernel.h>
49 #include <sys/sysctl.h>
50 #include <sys/thread2.h>
51
52 #include <net/if.h>
53 #include <net/if_types.h>
54 #include <net/route.h>
55 #include <net/netmsg2.h>
56
57 #include <netinet/in.h>
58 #include <netinet/in_var.h>
59 #include <netinet/in_pcb.h>
60
61 #include <netinet/igmp_var.h>
62
63 MALLOC_DEFINE(M_IPMADDR, "in_multi", "internet multicast address");
64
65 static int in_mask2len (struct in_addr *);
66 static void in_len2mask (struct in_addr *, int);
67 static int in_lifaddr_ioctl (struct socket *, u_long, caddr_t,
68         struct ifnet *, struct thread *);
69
70 static void     in_socktrim (struct sockaddr_in *);
71 static int      in_ifinit(struct ifnet *, struct in_ifaddr *,
72                     const struct sockaddr_in *, int);
73
74 static void     in_control_dispatch(struct netmsg *);
75 static int      in_control_internal(u_long, caddr_t, struct ifnet *,
76                     struct thread *);
77
78 static int subnetsarelocal = 0;
79 SYSCTL_INT(_net_inet_ip, OID_AUTO, subnets_are_local, CTLFLAG_RW,
80         &subnetsarelocal, 0, "");
81
82 struct in_multihead in_multihead; /* XXX BSS initialization */
83
84 extern struct inpcbinfo ripcbinfo;
85 extern struct inpcbinfo udbinfo;
86
87 /*
88  * Return 1 if an internet address is for a ``local'' host
89  * (one to which we have a connection).  If subnetsarelocal
90  * is true, this includes other subnets of the local net.
91  * Otherwise, it includes only the directly-connected (sub)nets.
92  */
93 int
94 in_localaddr(struct in_addr in)
95 {
96         u_long i = ntohl(in.s_addr);
97         struct in_ifaddr_container *iac;
98         struct in_ifaddr *ia;
99
100         if (subnetsarelocal) {
101                 TAILQ_FOREACH(iac, &in_ifaddrheads[mycpuid], ia_link) {
102                         ia = iac->ia;
103
104                         if ((i & ia->ia_netmask) == ia->ia_net)
105                                 return (1);
106                 }
107         } else {
108                 TAILQ_FOREACH(iac, &in_ifaddrheads[mycpuid], ia_link) {
109                         ia = iac->ia;
110
111                         if ((i & ia->ia_subnetmask) == ia->ia_subnet)
112                                 return (1);
113                 }
114         }
115         return (0);
116 }
117
118 /*
119  * Determine whether an IP address is in a reserved set of addresses
120  * that may not be forwarded, or whether datagrams to that destination
121  * may be forwarded.
122  */
123 int
124 in_canforward(struct in_addr in)
125 {
126         u_long i = ntohl(in.s_addr);
127         u_long net;
128
129         if (IN_EXPERIMENTAL(i) || IN_MULTICAST(i))
130                 return (0);
131         if (IN_CLASSA(i)) {
132                 net = i & IN_CLASSA_NET;
133                 if (net == 0 || net == (IN_LOOPBACKNET << IN_CLASSA_NSHIFT))
134                         return (0);
135         }
136         return (1);
137 }
138
139 /*
140  * Trim a mask in a sockaddr
141  */
142 static void
143 in_socktrim(struct sockaddr_in *ap)
144 {
145     char *cplim = (char *) &ap->sin_addr;
146     char *cp = (char *) (&ap->sin_addr + 1);
147
148     ap->sin_len = 0;
149     while (--cp >= cplim)
150         if (*cp) {
151             (ap)->sin_len = cp - (char *) (ap) + 1;
152             break;
153         }
154 }
155
156 static int
157 in_mask2len(struct in_addr *mask)
158 {
159         int x, y;
160         u_char *p;
161
162         p = (u_char *)mask;
163         for (x = 0; x < sizeof *mask; x++) {
164                 if (p[x] != 0xff)
165                         break;
166         }
167         y = 0;
168         if (x < sizeof *mask) {
169                 for (y = 0; y < 8; y++) {
170                         if ((p[x] & (0x80 >> y)) == 0)
171                                 break;
172                 }
173         }
174         return x * 8 + y;
175 }
176
177 static void
178 in_len2mask(struct in_addr *mask, int len)
179 {
180         int i;
181         u_char *p;
182
183         p = (u_char *)mask;
184         bzero(mask, sizeof *mask);
185         for (i = 0; i < len / 8; i++)
186                 p[i] = 0xff;
187         if (len % 8)
188                 p[i] = (0xff00 >> (len % 8)) & 0xff;
189 }
190
191 static int in_interfaces;       /* number of external internet interfaces */
192
193 struct in_control_arg {
194         u_long          cmd;
195         caddr_t         data;
196         struct ifnet    *ifp;
197         struct thread   *td;
198 };
199
200 static void
201 in_control_dispatch(struct netmsg *nmsg)
202 {
203         struct lwkt_msg *msg = &nmsg->nm_lmsg;
204         const struct in_control_arg *arg = msg->u.ms_resultp;
205         int error;
206
207         error = in_control_internal(arg->cmd, arg->data, arg->ifp, arg->td);
208         lwkt_replymsg(msg, error);
209 }
210
211 /*
212  * Generic internet control operations (ioctl's).
213  * Ifp is 0 if not an interface-specific ioctl.
214  *
215  * NOTE! td might be NULL.
216  */
217 /* ARGSUSED */
218 int
219 in_control(struct socket *so, u_long cmd, caddr_t data, struct ifnet *ifp,
220            struct thread *td)
221 {
222         struct netmsg nmsg;
223         struct in_control_arg arg;
224         struct lwkt_msg *msg;
225         int error;
226
227         switch (cmd) {
228         case SIOCALIFADDR:
229         case SIOCDLIFADDR:
230                 if (td && (error = suser(td)) != 0)
231                         return error;
232                 /* FALLTHROUGH */
233         case SIOCGLIFADDR:
234                 if (!ifp)
235                         return EINVAL;
236                 return in_lifaddr_ioctl(so, cmd, data, ifp, td);
237         }
238
239         KASSERT(cmd != SIOCALIFADDR && cmd != SIOCDLIFADDR,
240                 ("recursive SIOC%cLIFADDR!\n",
241                  cmd == SIOCDLIFADDR ? 'D' : 'A'));
242
243         /*
244          * IFADDR alterations are serialized by netisr0
245          */
246         switch (cmd) {
247         case SIOCSIFDSTADDR:
248         case SIOCSIFBRDADDR:
249         case SIOCSIFADDR:
250         case SIOCSIFNETMASK:
251         case SIOCAIFADDR:
252         case SIOCDIFADDR:
253                 bzero(&arg, sizeof(arg));
254                 arg.cmd = cmd;
255                 arg.data = data;
256                 arg.ifp = ifp;
257                 arg.td = td;
258
259                 netmsg_init(&nmsg, &curthread->td_msgport, 0,
260                             in_control_dispatch);
261                 msg = &nmsg.nm_lmsg;
262                 msg->u.ms_resultp = &arg;
263
264                 lwkt_domsg(cpu_portfn(0), msg, 0);
265                 return msg->ms_error;
266         default:
267                 return in_control_internal(cmd, data, ifp, td);
268         }
269 }
270
271 static void
272 in_ialink_dispatch(struct netmsg *nmsg)
273 {
274         struct lwkt_msg *lmsg = &nmsg->nm_lmsg;
275         struct in_ifaddr *ia = lmsg->u.ms_resultp;
276         struct ifaddr_container *ifac;
277         struct in_ifaddr_container *iac;
278         int cpu = mycpuid;
279
280         crit_enter();
281
282         ifac = &ia->ia_ifa.ifa_containers[cpu];
283         ASSERT_IFAC_VALID(ifac);
284         KASSERT((ifac->ifa_listmask & IFA_LIST_IN_IFADDRHEAD) == 0,
285                 ("ia is on in_ifaddrheads\n"));
286
287         ifac->ifa_listmask |= IFA_LIST_IN_IFADDRHEAD;
288         iac = &ifac->ifa_proto_u.u_in_ifac;
289         TAILQ_INSERT_TAIL(&in_ifaddrheads[cpu], iac, ia_link);
290
291         crit_exit();
292
293         ifa_forwardmsg(lmsg, cpu + 1);
294 }
295
296 static void
297 in_iaunlink_dispatch(struct netmsg *nmsg)
298 {
299         struct lwkt_msg *lmsg = &nmsg->nm_lmsg;
300         struct in_ifaddr *ia = lmsg->u.ms_resultp;
301         struct ifaddr_container *ifac;
302         struct in_ifaddr_container *iac;
303         int cpu = mycpuid;
304
305         crit_enter();
306
307         ifac = &ia->ia_ifa.ifa_containers[cpu];
308         ASSERT_IFAC_VALID(ifac);
309         KASSERT(ifac->ifa_listmask & IFA_LIST_IN_IFADDRHEAD,
310                 ("ia is not on in_ifaddrheads\n"));
311
312         iac = &ifac->ifa_proto_u.u_in_ifac;
313         TAILQ_REMOVE(&in_ifaddrheads[cpu], iac, ia_link);
314         ifac->ifa_listmask &= ~IFA_LIST_IN_IFADDRHEAD;
315
316         crit_exit();
317
318         ifa_forwardmsg(lmsg, cpu + 1);
319 }
320
321 static void
322 in_ialink(struct in_ifaddr *ia)
323 {
324         struct netmsg nmsg;
325         struct lwkt_msg *lmsg;
326
327         netmsg_init(&nmsg, &curthread->td_msgport, 0, in_ialink_dispatch);
328         lmsg = &nmsg.nm_lmsg;
329         lmsg->u.ms_resultp = ia;
330
331         ifa_domsg(lmsg);
332 }
333
334 void
335 in_iaunlink(struct in_ifaddr *ia)
336 {
337         struct netmsg nmsg;
338         struct lwkt_msg *lmsg;
339
340         netmsg_init(&nmsg, &curthread->td_msgport, 0, in_iaunlink_dispatch);
341         lmsg = &nmsg.nm_lmsg;
342         lmsg->u.ms_resultp = ia;
343
344         ifa_domsg(lmsg);
345 }
346
347 static __inline struct in_ifaddr *
348 in_ianext(struct in_ifaddr *oia)
349 {
350         struct ifaddr_container *ifac;
351         struct in_ifaddr_container *iac;
352
353         ifac = &oia->ia_ifa.ifa_containers[mycpuid];
354         ASSERT_IFAC_VALID(ifac);
355         KASSERT(ifac->ifa_listmask & IFA_LIST_IN_IFADDRHEAD,
356                 ("ia is not on in_ifaddrheads\n"));
357
358         iac = &ifac->ifa_proto_u.u_in_ifac;
359         iac = TAILQ_NEXT(iac, ia_link);
360         if (iac != NULL)
361                 return iac->ia;
362         else
363                 return NULL;
364 }
365
366 static int
367 in_control_internal(u_long cmd, caddr_t data, struct ifnet *ifp,
368                     struct thread *td)
369 {
370         struct ifreq *ifr = (struct ifreq *)data;
371         struct in_ifaddr *ia = NULL;
372         struct in_addr dst;
373         struct in_aliasreq *ifra = (struct in_aliasreq *)data;
374         struct ifaddr_container *ifac;
375         struct sockaddr_in oldaddr;
376         int hostIsNew, iaIsNew, maskIsNew;
377         int error = 0;
378
379         iaIsNew = 0;
380
381         /*
382          * Find address for this interface, if it exists.
383          *
384          * If an alias address was specified, find that one instead of
385          * the first one on the interface, if possible
386          */
387         if (ifp) {
388                 struct in_ifaddr *iap;
389
390                 dst = ((struct sockaddr_in *)&ifr->ifr_addr)->sin_addr;
391                 LIST_FOREACH(iap, INADDR_HASH(dst.s_addr), ia_hash)
392                         if (iap->ia_ifp == ifp &&
393                             iap->ia_addr.sin_addr.s_addr == dst.s_addr) {
394                                 ia = iap;
395                                 break;
396                         }
397                 if (ia == NULL) {
398                         TAILQ_FOREACH(ifac, &ifp->if_addrheads[mycpuid],
399                                       ifa_link) {
400                                 iap = ifatoia(ifac->ifa);
401                                 if (iap->ia_addr.sin_family == AF_INET) {
402                                         ia = iap;
403                                         break;
404                                 }
405                         }
406                 }
407         }
408
409         switch (cmd) {
410         case SIOCAIFADDR:
411         case SIOCDIFADDR:
412                 if (ifp == NULL)
413                         return (EADDRNOTAVAIL);
414                 if (ifra->ifra_addr.sin_family == AF_INET) {
415                         while (ia != NULL) {
416                                 if (ia->ia_ifp == ifp  &&
417                                     ia->ia_addr.sin_addr.s_addr ==
418                                     ifra->ifra_addr.sin_addr.s_addr)
419                                         break;
420                                 ia = in_ianext(ia);
421                         }
422                         if ((ifp->if_flags & IFF_POINTOPOINT) &&
423                             cmd == SIOCAIFADDR &&
424                             ifra->ifra_dstaddr.sin_addr.s_addr == INADDR_ANY) {
425                                 return EDESTADDRREQ;
426                         }
427                 }
428                 if (cmd == SIOCDIFADDR && ia == NULL)
429                         return (EADDRNOTAVAIL);
430                 /* FALLTHROUGH */
431         case SIOCSIFADDR:
432         case SIOCSIFNETMASK:
433         case SIOCSIFDSTADDR:
434                 if (td && (error = suser(td)) != 0)
435                         return error;
436
437                 if (ifp == NULL)
438                         return (EADDRNOTAVAIL);
439
440                 if (cmd == SIOCSIFDSTADDR &&
441                     (ifp->if_flags & IFF_POINTOPOINT) == 0)
442                         return (EINVAL);
443
444                 if (ia == NULL) {
445                         struct ifaddr *ifa;
446                         int i;
447
448                         ia = ifa_create(sizeof(*ia), M_WAITOK);
449                         ifa = &ia->ia_ifa;
450
451                         /*
452                          * Setup per-CPU information
453                          */
454                         for (i = 0; i < ncpus; ++i) {
455                                 struct in_ifaddr_container *iac;
456
457                                 ifac = &ifa->ifa_containers[i];
458                                 iac = &ifac->ifa_proto_u.u_in_ifac;
459                                 iac->ia = ia;
460                                 iac->ia_ifac = ifac;
461                         }
462
463                         /*
464                          * Protect from NETISR_IP traversing address list
465                          * while we're modifying it.
466                          */
467                         crit_enter();
468
469                         in_ialink(ia);
470                         ifa_iflink(ifa, ifp, 1);
471
472                         ifa->ifa_addr = (struct sockaddr *)&ia->ia_addr;
473                         ifa->ifa_dstaddr = (struct sockaddr *)&ia->ia_dstaddr;
474                         ifa->ifa_netmask = (struct sockaddr *)&ia->ia_sockmask;
475                         ia->ia_sockmask.sin_len = 8;
476                         ia->ia_sockmask.sin_family = AF_INET;
477                         if (ifp->if_flags & IFF_BROADCAST) {
478                                 ia->ia_broadaddr.sin_len = sizeof ia->ia_addr;
479                                 ia->ia_broadaddr.sin_family = AF_INET;
480                         }
481                         ia->ia_ifp = ifp;
482                         if (!(ifp->if_flags & IFF_LOOPBACK))
483                                 in_interfaces++;
484                         iaIsNew = 1;
485
486                         crit_exit();
487                 }
488                 break;
489
490         case SIOCSIFBRDADDR:
491                 if (td && (error = suser(td)) != 0)
492                         return error;
493                 /* FALLTHROUGH */
494
495         case SIOCGIFADDR:
496         case SIOCGIFNETMASK:
497         case SIOCGIFDSTADDR:
498         case SIOCGIFBRDADDR:
499                 if (ia == NULL)
500                         return (EADDRNOTAVAIL);
501                 break;
502         }
503
504         switch (cmd) {
505         case SIOCGIFADDR:
506                 *((struct sockaddr_in *)&ifr->ifr_addr) = ia->ia_addr;
507                 return (0);
508
509         case SIOCGIFBRDADDR:
510                 if ((ifp->if_flags & IFF_BROADCAST) == 0)
511                         return (EINVAL);
512                 *((struct sockaddr_in *)&ifr->ifr_dstaddr) = ia->ia_broadaddr;
513                 return (0);
514
515         case SIOCGIFDSTADDR:
516                 if ((ifp->if_flags & IFF_POINTOPOINT) == 0)
517                         return (EINVAL);
518                 *((struct sockaddr_in *)&ifr->ifr_dstaddr) = ia->ia_dstaddr;
519                 return (0);
520
521         case SIOCGIFNETMASK:
522                 *((struct sockaddr_in *)&ifr->ifr_addr) = ia->ia_sockmask;
523                 return (0);
524
525         case SIOCSIFDSTADDR:
526                 KKASSERT(ifp->if_flags & IFF_POINTOPOINT);
527
528                 oldaddr = ia->ia_dstaddr;
529                 ia->ia_dstaddr = *(struct sockaddr_in *)&ifr->ifr_dstaddr;
530                 if (ifp->if_ioctl != NULL) {
531                         lwkt_serialize_enter(ifp->if_serializer);
532                         error = ifp->if_ioctl(ifp, SIOCSIFDSTADDR, (caddr_t)ia,
533                                               td->td_proc->p_ucred);
534                         lwkt_serialize_exit(ifp->if_serializer);
535                         if (error) {
536                                 ia->ia_dstaddr = oldaddr;
537                                 return (error);
538                         }
539                 }
540                 if (ia->ia_flags & IFA_ROUTE) {
541                         ia->ia_ifa.ifa_dstaddr = (struct sockaddr *)&oldaddr;
542                         rtinit(&ia->ia_ifa, RTM_DELETE, RTF_HOST);
543                         ia->ia_ifa.ifa_dstaddr =
544                                         (struct sockaddr *)&ia->ia_dstaddr;
545                         rtinit(&ia->ia_ifa, RTM_ADD, RTF_HOST | RTF_UP);
546                 }
547                 return (0);
548
549         case SIOCSIFBRDADDR:
550                 if ((ifp->if_flags & IFF_BROADCAST) == 0)
551                         return (EINVAL);
552                 ia->ia_broadaddr = *(struct sockaddr_in *)&ifr->ifr_broadaddr;
553                 return (0);
554
555         case SIOCSIFADDR:
556                 error = in_ifinit(ifp, ia,
557                     (const struct sockaddr_in *)&ifr->ifr_addr, 1);
558                 if (error != 0 && iaIsNew)
559                         break;
560                 if (error == 0)
561                         EVENTHANDLER_INVOKE(ifaddr_event, ifp);
562                 return (0);
563
564         case SIOCSIFNETMASK:
565                 ia->ia_sockmask.sin_addr = ifra->ifra_addr.sin_addr;
566                 ia->ia_subnetmask = ntohl(ia->ia_sockmask.sin_addr.s_addr);
567                 return (0);
568
569         case SIOCAIFADDR:
570                 maskIsNew = 0;
571                 hostIsNew = 1;
572                 error = 0;
573                 if (ia->ia_addr.sin_family == AF_INET) {
574                         if (ifra->ifra_addr.sin_len == 0) {
575                                 ifra->ifra_addr = ia->ia_addr;
576                                 hostIsNew = 0;
577                         } else if (ifra->ifra_addr.sin_addr.s_addr ==
578                                    ia->ia_addr.sin_addr.s_addr) {
579                                 hostIsNew = 0;
580                         }
581                 }
582                 if (ifra->ifra_mask.sin_len) {
583                         in_ifscrub(ifp, ia);
584                         ia->ia_sockmask = ifra->ifra_mask;
585                         ia->ia_sockmask.sin_family = AF_INET;
586                         ia->ia_subnetmask =
587                             ntohl(ia->ia_sockmask.sin_addr.s_addr);
588                         maskIsNew = 1;
589                 }
590                 if ((ifp->if_flags & IFF_POINTOPOINT) &&
591                     ifra->ifra_dstaddr.sin_family == AF_INET) {
592                         in_ifscrub(ifp, ia);
593                         ia->ia_dstaddr = ifra->ifra_dstaddr;
594                         maskIsNew  = 1; /* We lie; but the effect's the same */
595                 }
596                 if (ifra->ifra_addr.sin_family == AF_INET &&
597                     (hostIsNew || maskIsNew))
598                         error = in_ifinit(ifp, ia, &ifra->ifra_addr, 0);
599
600                 if (error != 0 && iaIsNew)
601                         break;
602
603                 if ((ifp->if_flags & IFF_BROADCAST) &&
604                     ifra->ifra_broadaddr.sin_family == AF_INET)
605                         ia->ia_broadaddr = ifra->ifra_broadaddr;
606                 if (error == 0)
607                         EVENTHANDLER_INVOKE(ifaddr_event, ifp);
608                 return (error);
609
610         case SIOCDIFADDR:
611                 /*
612                  * in_ifscrub kills the interface route.
613                  */
614                 in_ifscrub(ifp, ia);
615                 /*
616                  * in_ifadown gets rid of all the rest of
617                  * the routes.  This is not quite the right
618                  * thing to do, but at least if we are running
619                  * a routing process they will come back.
620                  */
621                 in_ifadown(&ia->ia_ifa, 1);
622                 EVENTHANDLER_INVOKE(ifaddr_event, ifp);
623                 error = 0;
624                 break;
625
626         default:
627                 if (ifp == NULL || ifp->if_ioctl == NULL)
628                         return (EOPNOTSUPP);
629                 lwkt_serialize_enter(ifp->if_serializer);
630                 error = ifp->if_ioctl(ifp, cmd, data, td->td_proc->p_ucred);
631                 lwkt_serialize_exit(ifp->if_serializer);
632                 return (error);
633         }
634
635         ifa_ifunlink(&ia->ia_ifa, ifp);
636         in_iaunlink(ia);
637
638         /*
639          * Protect from NETISR_IP traversing address list while we're modifying
640          * it.
641          */
642         crit_enter();   /* XXX MP */
643         if (cmd == SIOCDIFADDR && ia->ia_addr.sin_family == AF_INET) {
644                 /* XXX Assume that 'ia' is in hash table */
645                 LIST_REMOVE(ia, ia_hash);
646         }
647         crit_exit();    /* XXX MP */
648
649         ifa_destroy(&ia->ia_ifa);
650
651         return (error);
652 }
653
654 /*
655  * SIOC[GAD]LIFADDR.
656  *      SIOCGLIFADDR: get first address. (?!?)
657  *      SIOCGLIFADDR with IFLR_PREFIX:
658  *              get first address that matches the specified prefix.
659  *      SIOCALIFADDR: add the specified address.
660  *      SIOCALIFADDR with IFLR_PREFIX:
661  *              EINVAL since we can't deduce hostid part of the address.
662  *      SIOCDLIFADDR: delete the specified address.
663  *      SIOCDLIFADDR with IFLR_PREFIX:
664  *              delete the first address that matches the specified prefix.
665  * return values:
666  *      EINVAL on invalid parameters
667  *      EADDRNOTAVAIL on prefix match failed/specified address not found
668  *      other values may be returned from in_ioctl()
669  *
670  * NOTE! td might be NULL.
671  */
672 static int
673 in_lifaddr_ioctl(struct socket *so, u_long cmd, caddr_t data, struct ifnet *ifp,
674                  struct thread *td)
675 {
676         struct if_laddrreq *iflr = (struct if_laddrreq *)data;
677
678         /* sanity checks */
679         if (!data || !ifp) {
680                 panic("invalid argument to in_lifaddr_ioctl");
681                 /*NOTRECHED*/
682         }
683
684         switch (cmd) {
685         case SIOCGLIFADDR:
686                 /* address must be specified on GET with IFLR_PREFIX */
687                 if ((iflr->flags & IFLR_PREFIX) == 0)
688                         break;
689                 /*FALLTHROUGH*/
690         case SIOCALIFADDR:
691         case SIOCDLIFADDR:
692                 /* address must be specified on ADD and DELETE */
693                 if (iflr->addr.ss_family != AF_INET)
694                         return EINVAL;
695                 if (iflr->addr.ss_len != sizeof(struct sockaddr_in))
696                         return EINVAL;
697                 /* XXX need improvement */
698                 if (iflr->dstaddr.ss_family
699                  && iflr->dstaddr.ss_family != AF_INET)
700                         return EINVAL;
701                 if (iflr->dstaddr.ss_family
702                  && iflr->dstaddr.ss_len != sizeof(struct sockaddr_in))
703                         return EINVAL;
704                 break;
705         default: /*shouldn't happen*/
706                 return EOPNOTSUPP;
707         }
708         if (sizeof(struct in_addr) * 8 < iflr->prefixlen)
709                 return EINVAL;
710
711         switch (cmd) {
712         case SIOCALIFADDR:
713             {
714                 struct in_aliasreq ifra;
715
716                 if (iflr->flags & IFLR_PREFIX)
717                         return EINVAL;
718
719                 /* copy args to in_aliasreq, perform ioctl(SIOCAIFADDR_IN6). */
720                 bzero(&ifra, sizeof ifra);
721                 bcopy(iflr->iflr_name, ifra.ifra_name, sizeof ifra.ifra_name);
722
723                 bcopy(&iflr->addr, &ifra.ifra_addr, iflr->addr.ss_len);
724
725                 if (iflr->dstaddr.ss_family) {  /*XXX*/
726                         bcopy(&iflr->dstaddr, &ifra.ifra_dstaddr,
727                                 iflr->dstaddr.ss_len);
728                 }
729
730                 ifra.ifra_mask.sin_family = AF_INET;
731                 ifra.ifra_mask.sin_len = sizeof(struct sockaddr_in);
732                 in_len2mask(&ifra.ifra_mask.sin_addr, iflr->prefixlen);
733
734                 return in_control(so, SIOCAIFADDR, (caddr_t)&ifra, ifp, td);
735             }
736         case SIOCGLIFADDR:
737         case SIOCDLIFADDR:
738             {
739                 struct ifaddr_container *ifac;
740                 struct in_ifaddr *ia;
741                 struct in_addr mask, candidate, match;
742                 struct sockaddr_in *sin;
743                 int cmp;
744
745                 bzero(&mask, sizeof mask);
746                 if (iflr->flags & IFLR_PREFIX) {
747                         /* lookup a prefix rather than address. */
748                         in_len2mask(&mask, iflr->prefixlen);
749
750                         sin = (struct sockaddr_in *)&iflr->addr;
751                         match.s_addr = sin->sin_addr.s_addr;
752                         match.s_addr &= mask.s_addr;
753
754                         /* if you set extra bits, that's wrong */
755                         if (match.s_addr != sin->sin_addr.s_addr)
756                                 return EINVAL;
757
758                         cmp = 1;
759                 } else {
760                         if (cmd == SIOCGLIFADDR) {
761                                 /* on getting an address, take the 1st match */
762                                 match.s_addr = 0; /* gcc4 warning */
763                                 cmp = 0;        /*XXX*/
764                         } else {
765                                 /* on deleting an address, do exact match */
766                                 in_len2mask(&mask, 32);
767                                 sin = (struct sockaddr_in *)&iflr->addr;
768                                 match.s_addr = sin->sin_addr.s_addr;
769
770                                 cmp = 1;
771                         }
772                 }
773
774                 TAILQ_FOREACH(ifac, &ifp->if_addrheads[mycpuid], ifa_link) {
775                         struct ifaddr *ifa = ifac->ifa;
776
777                         if (ifa->ifa_addr->sa_family != AF_INET6)
778                                 continue;
779                         if (!cmp)
780                                 break;
781                         candidate.s_addr =
782                         ((struct sockaddr_in *)&ifa->ifa_addr)->sin_addr.s_addr;
783                         candidate.s_addr &= mask.s_addr;
784                         if (candidate.s_addr == match.s_addr)
785                                 break;
786                 }
787                 if (ifac == NULL)
788                         return EADDRNOTAVAIL;
789                 ia = (struct in_ifaddr *)(ifac->ifa);
790
791                 if (cmd == SIOCGLIFADDR) {
792                         /* fill in the if_laddrreq structure */
793                         bcopy(&ia->ia_addr, &iflr->addr, ia->ia_addr.sin_len);
794
795                         if ((ifp->if_flags & IFF_POINTOPOINT) != 0) {
796                                 bcopy(&ia->ia_dstaddr, &iflr->dstaddr,
797                                         ia->ia_dstaddr.sin_len);
798                         } else
799                                 bzero(&iflr->dstaddr, sizeof iflr->dstaddr);
800
801                         iflr->prefixlen =
802                                 in_mask2len(&ia->ia_sockmask.sin_addr);
803
804                         iflr->flags = 0;        /*XXX*/
805
806                         return 0;
807                 } else {
808                         struct in_aliasreq ifra;
809
810                         /* fill in_aliasreq and do ioctl(SIOCDIFADDR_IN6) */
811                         bzero(&ifra, sizeof ifra);
812                         bcopy(iflr->iflr_name, ifra.ifra_name,
813                                 sizeof ifra.ifra_name);
814
815                         bcopy(&ia->ia_addr, &ifra.ifra_addr,
816                                 ia->ia_addr.sin_len);
817                         if ((ifp->if_flags & IFF_POINTOPOINT) != 0) {
818                                 bcopy(&ia->ia_dstaddr, &ifra.ifra_dstaddr,
819                                         ia->ia_dstaddr.sin_len);
820                         }
821                         bcopy(&ia->ia_sockmask, &ifra.ifra_dstaddr,
822                                 ia->ia_sockmask.sin_len);
823
824                         return in_control(so, SIOCDIFADDR, (caddr_t)&ifra,
825                                           ifp, td);
826                 }
827             }
828         }
829
830         return EOPNOTSUPP;      /*just for safety*/
831 }
832
833 /*
834  * Delete any existing route for an interface.
835  */
836 void
837 in_ifscrub(struct ifnet *ifp, struct in_ifaddr *ia)
838 {
839
840         if ((ia->ia_flags & IFA_ROUTE) == 0)
841                 return;
842         if (ifp->if_flags & (IFF_LOOPBACK|IFF_POINTOPOINT))
843                 rtinit(&ia->ia_ifa, RTM_DELETE, RTF_HOST);
844         else
845                 rtinit(&ia->ia_ifa, RTM_DELETE, 0);
846         ia->ia_flags &= ~IFA_ROUTE;
847 }
848
849 /*
850  * Initialize an interface's internet address
851  * and routing table entry.
852  */
853 static int
854 in_ifinit(struct ifnet *ifp, struct in_ifaddr *ia,
855           const struct sockaddr_in *sin, int scrub)
856 {
857         u_long i = ntohl(sin->sin_addr.s_addr);
858         struct sockaddr_in oldaddr;
859         int flags = RTF_UP, error = 0;
860         int old_hash = 0, new_hash = 0;
861
862         crit_enter();
863         oldaddr = ia->ia_addr;
864         if (oldaddr.sin_family == AF_INET) {
865                 old_hash = 1;
866                 LIST_REMOVE(ia, ia_hash);
867         }
868
869         ia->ia_addr = *sin;
870         if (ia->ia_addr.sin_family == AF_INET) {
871                 new_hash = 1;
872                 LIST_INSERT_HEAD(INADDR_HASH(ia->ia_addr.sin_addr.s_addr),
873                     ia, ia_hash);
874         }
875         crit_exit();
876
877         /*
878          * Give the interface a chance to initialize
879          * if this is its first address,
880          * and to validate the address if necessary.
881          */
882         if (ifp->if_ioctl != NULL) {
883                 lwkt_serialize_enter(ifp->if_serializer);
884                 error = ifp->if_ioctl(ifp, SIOCSIFADDR, (caddr_t)ia, NULL);
885                 lwkt_serialize_exit(ifp->if_serializer);
886                 if (error)
887                         goto fail;
888         }
889
890         /*
891          * Delete old route, if requested.
892          */
893         if (scrub) {
894                 ia->ia_ifa.ifa_addr = (struct sockaddr *)&oldaddr;
895                 in_ifscrub(ifp, ia);
896                 ia->ia_ifa.ifa_addr = (struct sockaddr *)&ia->ia_addr;
897         }
898
899         /*
900          * Calculate netmask/subnetmask.
901          */
902         if (IN_CLASSA(i))
903                 ia->ia_netmask = IN_CLASSA_NET;
904         else if (IN_CLASSB(i))
905                 ia->ia_netmask = IN_CLASSB_NET;
906         else
907                 ia->ia_netmask = IN_CLASSC_NET;
908         /*
909          * The subnet mask usually includes at least the standard network part,
910          * but may may be smaller in the case of supernetting.
911          * If it is set, we believe it.
912          */
913         if (ia->ia_subnetmask == 0) {
914                 ia->ia_subnetmask = ia->ia_netmask;
915                 ia->ia_sockmask.sin_addr.s_addr = htonl(ia->ia_subnetmask);
916         } else {
917                 ia->ia_netmask &= ia->ia_subnetmask;
918         }
919         ia->ia_net = i & ia->ia_netmask;
920         ia->ia_subnet = i & ia->ia_subnetmask;
921         in_socktrim(&ia->ia_sockmask);
922
923         /*
924          * Add route for the network.
925          */
926         ia->ia_ifa.ifa_metric = ifp->if_metric;
927         if (ifp->if_flags & IFF_BROADCAST) {
928                 ia->ia_broadaddr.sin_addr.s_addr =
929                         htonl(ia->ia_subnet | ~ia->ia_subnetmask);
930                 ia->ia_netbroadcast.s_addr =
931                         htonl(ia->ia_net | ~ ia->ia_netmask);
932         } else if (ifp->if_flags & IFF_LOOPBACK) {
933                 ia->ia_ifa.ifa_dstaddr = ia->ia_ifa.ifa_addr;
934                 flags |= RTF_HOST;
935         } else if (ifp->if_flags & IFF_POINTOPOINT) {
936                 if (ia->ia_dstaddr.sin_family != AF_INET)
937                         return (0);
938                 flags |= RTF_HOST;
939         }
940
941         /*-
942          * Don't add host routes for interface addresses of
943          * 0.0.0.0 --> 0.255.255.255 netmask 255.0.0.0.  This makes it
944          * possible to assign several such address pairs with consistent
945          * results (no host route) and is required by BOOTP.
946          *
947          * XXX: This is ugly !  There should be a way for the caller to
948          *      say that they don't want a host route.
949          */
950         if (ia->ia_addr.sin_addr.s_addr != INADDR_ANY ||
951             ia->ia_netmask != IN_CLASSA_NET ||
952             ia->ia_dstaddr.sin_addr.s_addr != htonl(IN_CLASSA_HOST)) {
953                 if ((error = rtinit(&ia->ia_ifa, RTM_ADD, flags)) != 0)
954                         goto fail;
955                 ia->ia_flags |= IFA_ROUTE;
956         }
957
958         /*
959          * If the interface supports multicast, join the "all hosts"
960          * multicast group on that interface.
961          */
962         if (ifp->if_flags & IFF_MULTICAST) {
963                 struct in_addr addr;
964
965                 addr.s_addr = htonl(INADDR_ALLHOSTS_GROUP);
966                 in_addmulti(&addr, ifp);
967         }
968         return (0);
969 fail:
970         crit_enter();
971         if (new_hash)
972                 LIST_REMOVE(ia, ia_hash);
973
974         ia->ia_addr = oldaddr;
975         if (old_hash) {
976                 LIST_INSERT_HEAD(INADDR_HASH(ia->ia_addr.sin_addr.s_addr),
977                     ia, ia_hash);
978         }
979         crit_exit();
980         return (error);
981 }
982
983
984 /*
985  * Return 1 if the address might be a local broadcast address.
986  */
987 int
988 in_broadcast(struct in_addr in, struct ifnet *ifp)
989 {
990         struct ifaddr_container *ifac;
991         u_long t;
992
993         if (in.s_addr == INADDR_BROADCAST ||
994             in.s_addr == INADDR_ANY)
995                 return 1;
996         if ((ifp->if_flags & IFF_BROADCAST) == 0)
997                 return 0;
998         t = ntohl(in.s_addr);
999         /*
1000          * Look through the list of addresses for a match
1001          * with a broadcast address.
1002          */
1003 #define ia ((struct in_ifaddr *)ifa)
1004         TAILQ_FOREACH(ifac, &ifp->if_addrheads[mycpuid], ifa_link) {
1005                 struct ifaddr *ifa = ifac->ifa;
1006
1007                 if (ifa->ifa_addr->sa_family == AF_INET &&
1008                     (in.s_addr == ia->ia_broadaddr.sin_addr.s_addr ||
1009                      in.s_addr == ia->ia_netbroadcast.s_addr ||
1010                      /*
1011                       * Check for old-style (host 0) broadcast.
1012                       */
1013                      t == ia->ia_subnet || t == ia->ia_net) &&
1014                      /*
1015                       * Check for an all one subnetmask. These
1016                       * only exist when an interface gets a secondary
1017                       * address.
1018                       */
1019                      ia->ia_subnetmask != (u_long)0xffffffff)
1020                             return 1;
1021         }
1022         return (0);
1023 #undef ia
1024 }
1025 /*
1026  * Add an address to the list of IP multicast addresses for a given interface.
1027  */
1028 struct in_multi *
1029 in_addmulti(struct in_addr *ap, struct ifnet *ifp)
1030 {
1031         struct in_multi *inm;
1032         int error;
1033         struct sockaddr_in sin;
1034         struct ifmultiaddr *ifma;
1035
1036         /*
1037          * Call generic routine to add membership or increment
1038          * refcount.  It wants addresses in the form of a sockaddr,
1039          * so we build one here (being careful to zero the unused bytes).
1040          */
1041         bzero(&sin, sizeof sin);
1042         sin.sin_family = AF_INET;
1043         sin.sin_len = sizeof sin;
1044         sin.sin_addr = *ap;
1045         crit_enter();
1046         error = if_addmulti(ifp, (struct sockaddr *)&sin, &ifma);
1047         if (error) {
1048                 crit_exit();
1049                 return 0;
1050         }
1051
1052         /*
1053          * If ifma->ifma_protospec is null, then if_addmulti() created
1054          * a new record.  Otherwise, we are done.
1055          */
1056         if (ifma->ifma_protospec != 0) {
1057                 crit_exit();
1058                 return ifma->ifma_protospec;
1059         }
1060
1061         /* XXX - if_addmulti uses M_WAITOK.  Can this really be called
1062            at interrupt time?  If so, need to fix if_addmulti. XXX */
1063         inm = kmalloc(sizeof *inm, M_IPMADDR, M_WAITOK | M_ZERO);
1064         inm->inm_addr = *ap;
1065         inm->inm_ifp = ifp;
1066         inm->inm_ifma = ifma;
1067         ifma->ifma_protospec = inm;
1068         LIST_INSERT_HEAD(&in_multihead, inm, inm_link);
1069
1070         /*
1071          * Let IGMP know that we have joined a new IP multicast group.
1072          */
1073         igmp_joingroup(inm);
1074         crit_exit();
1075         return (inm);
1076 }
1077
1078 /*
1079  * Delete a multicast address record.
1080  */
1081 void
1082 in_delmulti(struct in_multi *inm)
1083 {
1084         struct ifmultiaddr *ifma;
1085         struct in_multi my_inm;
1086
1087         crit_enter();
1088         ifma = inm->inm_ifma;
1089         my_inm.inm_ifp = NULL ; /* don't send the leave msg */
1090         if (ifma->ifma_refcount == 1) {
1091                 /*
1092                  * No remaining claims to this record; let IGMP know that
1093                  * we are leaving the multicast group.
1094                  * But do it after the if_delmulti() which might reset
1095                  * the interface and nuke the packet.
1096                  */
1097                 my_inm = *inm ;
1098                 ifma->ifma_protospec = 0;
1099                 LIST_REMOVE(inm, inm_link);
1100                 kfree(inm, M_IPMADDR);
1101         }
1102         /* XXX - should be separate API for when we have an ifma? */
1103         if_delmulti(ifma->ifma_ifp, ifma->ifma_addr);
1104         if (my_inm.inm_ifp != NULL)
1105                 igmp_leavegroup(&my_inm);
1106         crit_exit();
1107 }
1108
1109 void
1110 in_ifdetach(struct ifnet *ifp)
1111 {
1112         in_pcbpurgeif0(LIST_FIRST(&ripcbinfo.pcblisthead), ifp);
1113         in_pcbpurgeif0(LIST_FIRST(&udbinfo.pcblisthead), ifp);
1114 }