4ac35d7fa06075a1daeb1e8eac1fca95734a1098
[dragonfly.git] / sys / netinet / in_gif.c
1 /*
2  * $FreeBSD: src/sys/netinet/in_gif.c,v 1.5.2.11 2003/01/23 21:06:45 sam Exp $
3  * $DragonFly: src/sys/netinet/in_gif.c,v 1.8 2004/06/01 17:35:58 joerg Exp $
4  * $KAME: in_gif.c,v 1.54 2001/05/14 14:02:16 itojun Exp $
5  */
6 /*
7  * Copyright (C) 1995, 1996, 1997, and 1998 WIDE Project.
8  * All rights reserved.
9  *
10  * Redistribution and use in source and binary forms, with or without
11  * modification, are permitted provided that the following conditions
12  * are met:
13  * 1. Redistributions of source code must retain the above copyright
14  *    notice, this list of conditions and the following disclaimer.
15  * 2. Redistributions in binary form must reproduce the above copyright
16  *    notice, this list of conditions and the following disclaimer in the
17  *    documentation and/or other materials provided with the distribution.
18  * 3. Neither the name of the project nor the names of its contributors
19  *    may be used to endorse or promote products derived from this software
20  *    without specific prior written permission.
21  *
22  * THIS SOFTWARE IS PROVIDED BY THE PROJECT AND CONTRIBUTORS ``AS IS'' AND
23  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
24  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
25  * ARE DISCLAIMED.  IN NO EVENT SHALL THE PROJECT OR CONTRIBUTORS BE LIABLE
26  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
27  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
28  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
29  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
30  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
31  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
32  * SUCH DAMAGE.
33  */
34
35 #include "opt_inet.h"
36 #include "opt_inet6.h"
37
38 #include <sys/param.h>
39 #include <sys/systm.h>
40 #include <sys/socket.h>
41 #include <sys/sockio.h>
42 #include <sys/mbuf.h>
43 #include <sys/errno.h>
44 #include <sys/kernel.h>
45 #include <sys/sysctl.h>
46 #include <sys/protosw.h>
47
48 #include <sys/malloc.h>
49
50 #include <net/if.h>
51 #include <net/route.h>
52
53 #include <netinet/in.h>
54 #include <netinet/in_systm.h>
55 #include <netinet/ip.h>
56 #include <netinet/ip_var.h>
57 #include <netinet/in_gif.h>
58 #include <netinet/in_var.h>
59 #include <netinet/ip_encap.h>
60 #include <netinet/ip_ecn.h>
61
62 #ifdef INET6
63 #include <netinet/ip6.h>
64 #endif
65
66 #include <net/gif/if_gif.h>     
67 #include <net/net_osdep.h>
68
69 #include <sys/thread2.h>        /* ipstat */
70
71 static int gif_validate4 (const struct ip *, struct gif_softc *,
72         struct ifnet *);
73
74 extern  struct domain inetdomain;
75 struct protosw in_gif_protosw =
76 { SOCK_RAW,     &inetdomain,    0/*IPPROTO_IPV[46]*/,   PR_ATOMIC|PR_ADDR,
77   in_gif_input, rip_output,     0,      rip_ctloutput,
78   cpu0_soport,
79   0,            0,              0,              0,
80   &rip_usrreqs
81 };
82
83 int ip_gif_ttl = GIF_TTL;
84 SYSCTL_INT(_net_inet_ip, IPCTL_GIF_TTL, gifttl, CTLFLAG_RW,
85         &ip_gif_ttl,    0, "");
86
87 int
88 in_gif_output(ifp, family, m)
89         struct ifnet    *ifp;
90         int             family;
91         struct mbuf     *m;
92 {
93         struct gif_softc *sc = (struct gif_softc*)ifp;
94         struct sockaddr_in *dst = (struct sockaddr_in *)&sc->gif_ro.ro_dst;
95         struct sockaddr_in *sin_src = (struct sockaddr_in *)sc->gif_psrc;
96         struct sockaddr_in *sin_dst = (struct sockaddr_in *)sc->gif_pdst;
97         struct ip iphdr;        /* capsule IP header, host byte ordered */
98         int proto, error;
99         u_int8_t tos;
100
101         if (sin_src == NULL || sin_dst == NULL ||
102             sin_src->sin_family != AF_INET ||
103             sin_dst->sin_family != AF_INET) {
104                 m_freem(m);
105                 return EAFNOSUPPORT;
106         }
107
108         switch (family) {
109 #ifdef INET
110         case AF_INET:
111             {
112                 struct ip *ip;
113
114                 proto = IPPROTO_IPV4;
115                 if (m->m_len < sizeof(*ip)) {
116                         m = m_pullup(m, sizeof(*ip));
117                         if (!m)
118                                 return ENOBUFS;
119                 }
120                 ip = mtod(m, struct ip *);
121                 tos = ip->ip_tos;
122                 break;
123             }
124 #endif /* INET */
125 #ifdef INET6
126         case AF_INET6:
127             {
128                 struct ip6_hdr *ip6;
129                 proto = IPPROTO_IPV6;
130                 if (m->m_len < sizeof(*ip6)) {
131                         m = m_pullup(m, sizeof(*ip6));
132                         if (!m)
133                                 return ENOBUFS;
134                 }
135                 ip6 = mtod(m, struct ip6_hdr *);
136                 tos = (ntohl(ip6->ip6_flow) >> 20) & 0xff;
137                 break;
138             }
139 #endif /* INET6 */
140         default:
141 #ifdef DEBUG
142                 printf("in_gif_output: warning: unknown family %d passed\n",
143                         family);
144 #endif
145                 m_freem(m);
146                 return EAFNOSUPPORT;
147         }
148
149         bzero(&iphdr, sizeof(iphdr));
150         iphdr.ip_src = sin_src->sin_addr;
151         /* bidirectional configured tunnel mode */
152         if (sin_dst->sin_addr.s_addr != INADDR_ANY)
153                 iphdr.ip_dst = sin_dst->sin_addr;
154         else {
155                 m_freem(m);
156                 return ENETUNREACH;
157         }
158         iphdr.ip_p = proto;
159         /* version will be set in ip_output() */
160         iphdr.ip_ttl = ip_gif_ttl;
161         iphdr.ip_len = m->m_pkthdr.len + sizeof(struct ip);
162         if (ifp->if_flags & IFF_LINK1)
163                 ip_ecn_ingress(ECN_ALLOWED, &iphdr.ip_tos, &tos);
164         else
165                 ip_ecn_ingress(ECN_NOCARE, &iphdr.ip_tos, &tos);
166
167         /* prepend new IP header */
168         M_PREPEND(m, sizeof(struct ip), M_DONTWAIT);
169         if (m && m->m_len < sizeof(struct ip))
170                 m = m_pullup(m, sizeof(struct ip));
171         if (m == NULL) {
172                 printf("ENOBUFS in in_gif_output %d\n", __LINE__);
173                 return ENOBUFS;
174         }
175         bcopy(&iphdr, mtod(m, struct ip *), sizeof(struct ip));
176
177         if (dst->sin_family != sin_dst->sin_family ||
178             dst->sin_addr.s_addr != sin_dst->sin_addr.s_addr) {
179                 /* cache route doesn't match */
180                 dst->sin_family = sin_dst->sin_family;
181                 dst->sin_len = sizeof(struct sockaddr_in);
182                 dst->sin_addr = sin_dst->sin_addr;
183                 if (sc->gif_ro.ro_rt) {
184                         RTFREE(sc->gif_ro.ro_rt);
185                         sc->gif_ro.ro_rt = NULL;
186                 }
187 #if 0
188                 sc->gif_if.if_mtu = GIF_MTU;
189 #endif
190         }
191
192         if (sc->gif_ro.ro_rt == NULL) {
193                 rtalloc(&sc->gif_ro);
194                 if (sc->gif_ro.ro_rt == NULL) {
195                         m_freem(m);
196                         return ENETUNREACH;
197                 }
198
199                 /* if it constitutes infinite encapsulation, punt. */
200                 if (sc->gif_ro.ro_rt->rt_ifp == ifp) {
201                         m_freem(m);
202                         return ENETUNREACH;     /* XXX */
203                 }
204 #if 0
205                 ifp->if_mtu = sc->gif_ro.ro_rt->rt_ifp->if_mtu
206                         - sizeof(struct ip);
207 #endif
208         }
209
210         error = ip_output(m, NULL, &sc->gif_ro, 0, NULL, NULL);
211         return(error);
212 }
213
214 void
215 in_gif_input(m, off, proto)
216         struct mbuf *m;
217         int off;
218         int proto;
219 {
220         struct ifnet *gifp = NULL;
221         struct ip *ip;
222         int af;
223         u_int8_t otos;
224
225         ip = mtod(m, struct ip *);
226
227         gifp = (struct ifnet *)encap_getarg(m);
228
229         if (gifp == NULL || (gifp->if_flags & IFF_UP) == 0) {
230                 m_freem(m);
231                 ipstat.ips_nogif++;
232                 return;
233         }
234
235         otos = ip->ip_tos;
236         m_adj(m, off);
237
238         switch (proto) {
239 #ifdef INET
240         case IPPROTO_IPV4:
241             {
242                 struct ip *ip;
243                 af = AF_INET;
244                 if (m->m_len < sizeof(*ip)) {
245                         m = m_pullup(m, sizeof(*ip));
246                         if (!m)
247                                 return;
248                 }
249                 ip = mtod(m, struct ip *);
250                 if (gifp->if_flags & IFF_LINK1)
251                         ip_ecn_egress(ECN_ALLOWED, &otos, &ip->ip_tos);
252                 else
253                         ip_ecn_egress(ECN_NOCARE, &otos, &ip->ip_tos);
254                 break;
255             }
256 #endif
257 #ifdef INET6
258         case IPPROTO_IPV6:
259             {
260                 struct ip6_hdr *ip6;
261                 u_int8_t itos;
262                 af = AF_INET6;
263                 if (m->m_len < sizeof(*ip6)) {
264                         m = m_pullup(m, sizeof(*ip6));
265                         if (!m)
266                                 return;
267                 }
268                 ip6 = mtod(m, struct ip6_hdr *);
269                 itos = (ntohl(ip6->ip6_flow) >> 20) & 0xff;
270                 if (gifp->if_flags & IFF_LINK1)
271                         ip_ecn_egress(ECN_ALLOWED, &otos, &itos);
272                 else
273                         ip_ecn_egress(ECN_NOCARE, &otos, &itos);
274                 ip6->ip6_flow &= ~htonl(0xff << 20);
275                 ip6->ip6_flow |= htonl((u_int32_t)itos << 20);
276                 break;
277             }
278 #endif /* INET6 */
279         default:
280                 ipstat.ips_nogif++;
281                 m_freem(m);
282                 return;
283         }
284         gif_input(m, af, gifp);
285         return;
286 }
287
288 /*
289  * validate outer address.
290  */
291 static int
292 gif_validate4(ip, sc, ifp)
293         const struct ip *ip;
294         struct gif_softc *sc;
295         struct ifnet *ifp;
296 {
297         struct sockaddr_in *src, *dst;
298         struct in_ifaddr *ia4;
299
300         src = (struct sockaddr_in *)sc->gif_psrc;
301         dst = (struct sockaddr_in *)sc->gif_pdst;
302
303         /* check for address match */
304         if (src->sin_addr.s_addr != ip->ip_dst.s_addr ||
305             dst->sin_addr.s_addr != ip->ip_src.s_addr)
306                 return 0;
307
308         /* martian filters on outer source - NOT done in ip_input! */
309         if (IN_MULTICAST(ntohl(ip->ip_src.s_addr)))
310                 return 0;
311         switch ((ntohl(ip->ip_src.s_addr) & 0xff000000) >> 24) {
312         case 0: case 127: case 255:
313                 return 0;
314         }
315         /* reject packets with broadcast on source */
316         for (ia4 = TAILQ_FIRST(&in_ifaddrhead); ia4;
317              ia4 = TAILQ_NEXT(ia4, ia_link))
318         {
319                 if ((ia4->ia_ifa.ifa_ifp->if_flags & IFF_BROADCAST) == 0)
320                         continue;
321                 if (ip->ip_src.s_addr == ia4->ia_broadaddr.sin_addr.s_addr)
322                         return 0;
323         }
324
325         /* ingress filters on outer source */
326         if ((sc->gif_if.if_flags & IFF_LINK2) == 0 && ifp) {
327                 struct sockaddr_in sin;
328                 struct rtentry *rt;
329
330                 bzero(&sin, sizeof(sin));
331                 sin.sin_family = AF_INET;
332                 sin.sin_len = sizeof(struct sockaddr_in);
333                 sin.sin_addr = ip->ip_src;
334                 rt = rtalloc1((struct sockaddr *)&sin, 0, 0UL);
335                 if (!rt || rt->rt_ifp != ifp) {
336 #if 0
337                         log(LOG_WARNING, "%s: packet from 0x%x dropped "
338                             "due to ingress filter\n", if_name(&sc->gif_if),
339                             (u_int32_t)ntohl(sin.sin_addr.s_addr));
340 #endif
341                         if (rt)
342                                 rtfree(rt);
343                         return 0;
344                 }
345                 rtfree(rt);
346         }
347
348         return 32 * 2;
349 }
350
351 /*
352  * we know that we are in IFF_UP, outer address available, and outer family
353  * matched the physical addr family.  see gif_encapcheck().
354  */
355 int
356 gif_encapcheck4(m, off, proto, arg)
357         const struct mbuf *m;
358         int off;
359         int proto;
360         void *arg;
361 {
362         struct ip ip;
363         struct gif_softc *sc;
364         struct ifnet *ifp;
365
366         /* sanity check done in caller */
367         sc = (struct gif_softc *)arg;
368
369         /* LINTED const cast */
370         m_copydata(__DECONST(struct mbuf *, m), 0, sizeof(ip), (caddr_t)&ip);
371         ifp = ((m->m_flags & M_PKTHDR) != 0) ? m->m_pkthdr.rcvif : NULL;
372
373         return gif_validate4(&ip, sc, ifp);
374 }
375
376 int
377 in_gif_attach(sc)
378         struct gif_softc *sc;
379 {
380         sc->encap_cookie4 = encap_attach_func(AF_INET, -1, gif_encapcheck,
381             &in_gif_protosw, sc);
382         if (sc->encap_cookie4 == NULL)
383                 return EEXIST;
384         return 0;
385 }
386
387 int
388 in_gif_detach(sc)
389         struct gif_softc *sc;
390 {
391         int error;
392
393         error = encap_detach(sc->encap_cookie4);
394         if (error == 0)
395                 sc->encap_cookie4 = NULL;
396         return error;
397 }