tcp: Implement asynchronous pru_connect
[dragonfly.git] / sys / sys / protosw.h
1 /*-
2  * Copyright (c) 1982, 1986, 1993
3  *      The Regents of the University of California.  All rights reserved.
4  *
5  * Redistribution and use in source and binary forms, with or without
6  * modification, are permitted provided that the following conditions
7  * are met:
8  * 1. Redistributions of source code must retain the above copyright
9  *    notice, this list of conditions and the following disclaimer.
10  * 2. Redistributions in binary form must reproduce the above copyright
11  *    notice, this list of conditions and the following disclaimer in the
12  *    documentation and/or other materials provided with the distribution.
13  * 3. All advertising materials mentioning features or use of this software
14  *    must display the following acknowledgement:
15  *      This product includes software developed by the University of
16  *      California, Berkeley and its contributors.
17  * 4. Neither the name of the University nor the names of its contributors
18  *    may be used to endorse or promote products derived from this software
19  *    without specific prior written permission.
20  *
21  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
22  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
23  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
24  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
25  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
26  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
27  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
28  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
29  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
30  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
31  * SUCH DAMAGE.
32  *
33  *      @(#)protosw.h   8.1 (Berkeley) 6/2/93
34  * $FreeBSD: src/sys/sys/protosw.h,v 1.28.2.2 2001/07/03 11:02:01 ume Exp $
35  * $DragonFly: src/sys/sys/protosw.h,v 1.24 2008/10/27 02:56:30 sephe Exp $
36  */
37
38 #ifndef _SYS_PROTOSW_H_
39 #define _SYS_PROTOSW_H_
40
41 #ifndef _SYS_TYPES_H_
42 #include <sys/types.h>
43 #endif
44
45 /* Forward declare these structures referenced from prototypes below. */
46 struct mbuf;
47 struct thread;
48 struct sockaddr;
49 struct socket;
50 struct sockopt;
51
52 struct pr_output_info {
53         pid_t   p_pid;
54 };
55
56 #if defined(_KERNEL) || defined(_KERNEL_STRUCTURES)
57
58 /*
59  * netmsg_t union of possible netmsgs typically sent to protocol threads.
60  */
61 typedef union netmsg *netmsg_t;
62
63 /*
64  * Protocol switch table.
65  *
66  * Each protocol has a handle initializing one of these structures,
67  * which is used for protocol-protocol and system-protocol communication.
68  *
69  * A protocol is called through the pr_init entry before any other.
70  * Thereafter it is called every 200ms through the pr_fasttimo entry and
71  * every 500ms through the pr_slowtimo for timer based actions.
72  * The system will call the pr_drain entry if it is low on space and
73  * this should throw away any non-critical data.
74  *
75  * Protocols pass data between themselves as chains of mbufs using
76  * the pr_input and pr_output hooks.  Pr_input passes data up (towards
77  * the users) and pr_output passes it down (towards the interfaces); control
78  * information passes up and down on pr_ctlinput and pr_ctloutput.
79  * The protocol is responsible for the space occupied by any the
80  * arguments to these entries and must dispose it.
81  *
82  * In retrospect, it would be a lot nicer to use an interface
83  * similar to the vnode VOP interface.
84  */
85 struct protosw {
86         short   pr_type;                /* socket type used for */
87         const struct domain *pr_domain; /* domain protocol a member of */
88         short   pr_protocol;            /* protocol number */
89         short   pr_flags;               /* see below */
90
91         /*
92          * Protocol hooks.  These are typically called directly within the
93          * context of a protocol thread based on the toeplitz hash.
94          *
95          * pr_input() is called using the port supplied by the toeplitz
96          *            hash via the netisr port function.
97          *
98          * pr_ctlinput() is called using the port supplied by pr_ctlport
99          *
100          * pr_ctloutput() and pr_output() are typically called
101          */
102         int     (*pr_input)(struct mbuf **, int *, int);
103                                         /* input to protocol (from below) */
104         int     (*pr_output)(struct mbuf *, struct socket *, ...);
105                                         /* output to protocol (from above) */
106         void    (*pr_ctlinput)(union netmsg *);
107                                         /* control input (from below) */
108         void    (*pr_ctloutput)(union netmsg *);
109                                         /* control output (from above) */
110         struct lwkt_port *(*pr_ctlport)(int, struct sockaddr *, void *);
111
112         /*
113          * Utility hooks, not called with any particular context.
114          */
115         void    (*pr_init) (void);      /* initialization hook */
116         void    (*pr_fasttimo) (void);  /* fast timeout (200ms) */
117         void    (*pr_slowtimo) (void);  /* slow timeout (500ms) */
118         void    (*pr_drain) (void);     /* flush any excess space possible */
119
120         struct  pr_usrreqs *pr_usrreqs; /* messaged requests to proto thread */
121 };
122
123 #endif
124
125 #define PR_SLOWHZ       2               /* 2 slow timeouts per second */
126 #define PR_FASTHZ       5               /* 5 fast timeouts per second */
127
128 /*
129  * Values for pr_flags.
130  * PR_ADDR requires PR_ATOMIC;
131  * PR_ADDR and PR_CONNREQUIRED are mutually exclusive.
132  * PR_IMPLOPCL means that the protocol allows sendto without prior connect,
133  *      and the protocol understands the MSG_EOF flag.  The first property is
134  *      is only relevant if PR_CONNREQUIRED is set (otherwise sendto is allowed
135  *      anyhow).
136  */
137 #define PR_ATOMIC       0x01            /* exchange atomic messages only */
138 #define PR_ADDR         0x02            /* addresses given with messages */
139 #define PR_CONNREQUIRED 0x04            /* connection required by protocol */
140 #define PR_WANTRCVD     0x08            /* want PRU_RCVD calls */
141 #define PR_RIGHTS       0x10            /* passes capabilities */
142 #define PR_IMPLOPCL     0x20            /* implied open/close */
143 #define PR_LASTHDR      0x40            /* enforce ipsec policy; last header */
144 #define PR_ADDR_OPT     0x80            /* allow addresses during delivery */
145 #define PR_MPSAFE       0x0100          /* protocal is MPSAFE */
146 #define PR_SYNC_PORT    0x0200          /* synchronous port (no proto thrds) */
147 #define PR_ASYNC_SEND   0x0400          /* async pru_send */
148 #define PR_ASYNC_RCVD   0x0800          /* async pru_rcvd */
149 #define PR_ASEND_HOLDTD 0x1000          /* async pru_send hold orig thread */
150 #define PR_ACONN_HOLDTD 0x2000          /* async pru_connect hold orig thread */
151
152 /*
153  * The arguments to usrreq are:
154  *      (*protosw[].pr_usrreq)(up, req, m, nam, opt);
155  * where up is a (struct socket *), req is one of these requests,
156  * m is a optional mbuf chain containing a message,
157  * nam is an optional mbuf chain containing an address,
158  * and opt is a pointer to a socketopt structure or nil.
159  * The protocol is responsible for disposal of the mbuf chain m,
160  * the caller is responsible for any space held by nam and opt.
161  * A non-zero return from usrreq gives an
162  * UNIX error number which should be passed to higher level software.
163  */
164 #define PRU_ATTACH              0       /* attach protocol to up */
165 #define PRU_DETACH              1       /* detach protocol from up */
166 #define PRU_BIND                2       /* bind socket to address */
167 #define PRU_LISTEN              3       /* listen for connection */
168 #define PRU_CONNECT             4       /* establish connection to peer */
169 #define PRU_ACCEPT              5       /* accept connection from peer */
170 #define PRU_DISCONNECT          6       /* disconnect from peer */
171 #define PRU_SHUTDOWN            7       /* won't send any more data */
172 #define PRU_RCVD                8       /* have taken data; more room now */
173 #define PRU_SEND                9       /* send this data */
174 #define PRU_ABORT               10      /* abort (fast DISCONNECT, DETATCH) */
175 #define PRU_CONTROL             11      /* control operations on protocol */
176 #define PRU_SENSE               12      /* return status into m */
177 #define PRU_RCVOOB              13      /* retrieve out of band data */
178 #define PRU_SENDOOB             14      /* send out of band data */
179 #define PRU_SOCKADDR            15      /* fetch socket's address */
180 #define PRU_PEERADDR            16      /* fetch peer's address */
181 #define PRU_CONNECT2            17      /* connect two sockets */
182 #define PRU_RESERVED1           18      /* formerly PRU_SOPOLL */
183 /* begin for protocols internal use */
184 #define PRU_FASTTIMO            19      /* 200ms timeout */
185 #define PRU_SLOWTIMO            20      /* 500ms timeout */
186 #define PRU_PROTORCV            21      /* receive from below */
187 #define PRU_PROTOSEND           22      /* send to below */
188 /* end for protocol's internal use */
189 #define PRU_SEND_EOF            23      /* send and close */
190 #define PRU_PRED                24
191 #define PRU_CTLOUTPUT           25      /* get/set opts */
192 #define PRU_NREQ                26
193
194 #ifdef PRUREQUESTS
195 const char *prurequests[] = {
196         "ATTACH",       "DETACH",       "BIND",         "LISTEN",
197         "CONNECT",      "ACCEPT",       "DISCONNECT",   "SHUTDOWN",
198         "RCVD",         "SEND",         "ABORT",        "CONTROL",
199         "SENSE",        "RCVOOB",       "SENDOOB",      "SOCKADDR",
200         "PEERADDR",     "CONNECT2",     "",
201         "FASTTIMO",     "SLOWTIMO",     "PROTORCV",     "PROTOSEND",
202         "SEND_EOF",     "PREDICATE"
203 };
204 #endif
205
206 #if defined(_KERNEL) || defined(_KERNEL_STRUCTURES)
207
208 struct ifnet;
209 struct stat;
210 struct ucred;
211 struct uio;
212 struct sockbuf;
213
214 struct pru_attach_info {
215         struct rlimit *sb_rlimit;
216         struct ucred *p_ucred;
217         struct vnode *fd_rdir;
218 };
219
220 /*
221  * These are netmsg'd requests almost universally in the context of the
222  * appropriate protocol thread.  Exceptions:
223  *
224  *      pru_sosend() - called synchronously from user context, typically
225  *                     runs generic kernel code and then messages via
226  *                     pru_send().
227  *
228  *      pru_soreceive() - called synchronously from user context.  Typically
229  *                        runs generic kernel code and remains synchronous.
230  *
231  *      pru_savefaddr() - called synchronoutly by protocol thread. Typically
232  *                        save the foreign address into socket.so_faddr.
233  *
234  *      pru_preconnect() - called synchronously from user context.  Typically
235  *                         prepares for later asynchronous pru_connect, e.g.
236  *                         sets ISCONNECTING.  Non-NULL means asynchronous
237  *                         pru_connect is supported.
238  */
239 struct pr_usrreqs {
240         void    (*pru_abort) (netmsg_t msg);
241         void    (*pru_accept) (netmsg_t msg);
242         void    (*pru_attach) (netmsg_t msg);
243         void    (*pru_bind) (netmsg_t msg);
244         void    (*pru_connect) (netmsg_t msg);
245         void    (*pru_connect2) (netmsg_t msg);
246         void    (*pru_control) (netmsg_t msg);
247         void    (*pru_detach) (netmsg_t msg);
248         void    (*pru_disconnect) (netmsg_t msg);
249         void    (*pru_listen) (netmsg_t msg);
250         void    (*pru_peeraddr) (netmsg_t msg);
251         void    (*pru_rcvd) (netmsg_t msg);
252         void    (*pru_rcvoob) (netmsg_t msg);
253         void    (*pru_send) (netmsg_t msg);
254         void    (*pru_sense) (netmsg_t msg);
255         void    (*pru_shutdown) (netmsg_t msg);
256         void    (*pru_sockaddr) (netmsg_t msg);
257
258         /*
259          * These are direct calls.  Note that sosend() will sometimes
260          * be converted into an implied connect (pru_connect) with the
261          * mbufs and flags forwarded in pru_connect's netmsg.  It is
262          * otherwise typically converted to a send (pru_send).
263          *
264          * soreceive() typically remains synchronous in the user's context.
265          *
266          * Any converted calls are netmsg's to the socket's protocol thread.
267          */
268         int     (*pru_sosend) (struct socket *so, struct sockaddr *addr,
269                                    struct uio *uio, struct mbuf *top,
270                                    struct mbuf *control, int flags,
271                                    struct thread *td);
272         int     (*pru_soreceive) (struct socket *so, 
273                                       struct sockaddr **paddr,
274                                       struct uio *uio,
275                                       struct sockbuf *sio,
276                                       struct mbuf **controlp, int *flagsp);
277
278         /* synchronously called by protocol thread */
279         void    (*pru_savefaddr) (struct socket *so,
280                                       const struct sockaddr *addr);
281
282         /* synchronously called by user thread. */
283         int     (*pru_preconnect) (struct socket *so,
284                                       const struct sockaddr *addr,
285                                       struct thread *td);
286 };
287
288 typedef int (*pru_sosend_fn_t) (struct socket *so, struct sockaddr *addr,
289                                         struct uio *uio, struct mbuf *top,
290                                         struct mbuf *control, int flags,
291                                         struct thread *td);
292 typedef int (*pru_soreceive_fn_t) (struct socket *so, struct sockaddr **paddr,
293                                         struct uio *uio,
294                                         struct sockbuf *sio,
295                                         struct mbuf **controlp,
296                                         int *flagsp);
297
298 void    pr_generic_notsupp(netmsg_t msg);
299 void    pru_sense_null(netmsg_t msg);
300
301 int     pru_sosend_notsupp(struct socket *so, struct sockaddr *addr,
302                                 struct uio *uio, struct mbuf *top,
303                                 struct mbuf *control, int flags,
304                                 struct thread *td);
305 int     pru_soreceive_notsupp(struct socket *so,
306                                 struct sockaddr **paddr,
307                                 struct uio *uio,
308                                 struct sockbuf *sio,
309                                 struct mbuf **controlp, int *flagsp);
310
311 struct lwkt_port *cpu0_soport(struct socket *, struct sockaddr *,
312                               struct mbuf **);
313 struct lwkt_port *cpu0_ctlport(int, struct sockaddr *, void *);
314
315 #endif /* _KERNEL || _KERNEL_STRUCTURES */
316
317 /*
318  * The arguments to the ctlinput routine are
319  *      (*protosw[].pr_ctlinput)(cmd, sa, arg);
320  * where cmd is one of the commands below, sa is a pointer to a sockaddr,
321  * and arg is a `void *' argument used within a protocol family.
322  */
323 #define PRC_IFDOWN              0       /* interface transition */
324 #define PRC_ROUTEDEAD           1       /* select new route if possible ??? */
325 #define PRC_IFUP                2       /* interface has come back up */
326 #define PRC_QUENCH2             3       /* DEC congestion bit says slow down */
327 #define PRC_QUENCH              4       /* some one said to slow down */
328 #define PRC_MSGSIZE             5       /* message size forced drop */
329 #define PRC_HOSTDEAD            6       /* host appears to be down */
330 #define PRC_HOSTUNREACH         7       /* deprecated (use PRC_UNREACH_HOST) */
331 #define PRC_UNREACH_NET         8       /* no route to network */
332 #define PRC_UNREACH_HOST        9       /* no route to host */
333 #define PRC_UNREACH_PROTOCOL    10      /* dst says bad protocol */
334 #define PRC_UNREACH_PORT        11      /* bad port # */
335 /* was  PRC_UNREACH_NEEDFRAG    12         (use PRC_MSGSIZE) */
336 #define PRC_UNREACH_SRCFAIL     13      /* source route failed */
337 #define PRC_REDIRECT_NET        14      /* net routing redirect */
338 #define PRC_REDIRECT_HOST       15      /* host routing redirect */
339 #define PRC_REDIRECT_TOSNET     16      /* redirect for type of service & net */
340 #define PRC_REDIRECT_TOSHOST    17      /* redirect for tos & host */
341 #define PRC_TIMXCEED_INTRANS    18      /* packet lifetime expired in transit */
342 #define PRC_TIMXCEED_REASS      19      /* lifetime expired on reass q */
343 #define PRC_PARAMPROB           20      /* header incorrect */
344 #define PRC_UNREACH_ADMIN_PROHIB        21      /* packet administrativly prohibited */
345
346 #define PRC_NCMDS               22
347
348 #define PRC_IS_REDIRECT(cmd)    \
349         ((cmd) >= PRC_REDIRECT_NET && (cmd) <= PRC_REDIRECT_TOSHOST)
350
351 #ifdef PRCREQUESTS
352 const char *prcrequests[] = {
353         "IFDOWN", "ROUTEDEAD", "IFUP", "DEC-BIT-QUENCH2",
354         "QUENCH", "MSGSIZE", "HOSTDEAD", "#7",
355         "NET-UNREACH", "HOST-UNREACH", "PROTO-UNREACH", "PORT-UNREACH",
356         "#12", "SRCFAIL-UNREACH", "NET-REDIRECT", "HOST-REDIRECT",
357         "TOSNET-REDIRECT", "TOSHOST-REDIRECT", "TX-INTRANS", "TX-REASS",
358         "PARAMPROB", "ADMIN-UNREACH"
359 };
360 #endif
361
362 /*
363  * The arguments to ctloutput are:
364  *      (*protosw[].pr_ctloutput)(req, so, level, optname, optval, p);
365  * req is one of the actions listed below, so is a (struct socket *),
366  * level is an indication of which protocol layer the option is intended.
367  * optname is a protocol dependent socket option request,
368  * optval is a pointer to a mbuf-chain pointer, for value-return results.
369  * The protocol is responsible for disposal of the mbuf chain *optval
370  * if supplied,
371  * the caller is responsible for any space held by *optval, when returned.
372  * A non-zero return from usrreq gives an
373  * UNIX error number which should be passed to higher level software.
374  */
375 #define PRCO_GETOPT     0
376 #define PRCO_SETOPT     1
377
378 #define PRCO_NCMDS      2
379
380 #ifdef PRCOREQUESTS
381 const char *prcorequests[] = {
382         "GETOPT", "SETOPT",
383 };
384 #endif
385
386 /*
387  * Kernel prototypes
388  */
389 #ifdef _KERNEL
390
391 void    kpfctlinput (int, struct sockaddr *);
392 void    kpfctlinput2 (int, struct sockaddr *, void *);
393 struct protosw *pffindproto (int family, int protocol, int type);
394 struct protosw *pffindtype (int family, int type);
395
396 #define PR_GET_MPLOCK(_pr) \
397 do { \
398         if (((_pr)->pr_flags & PR_MPSAFE) == 0) \
399                 get_mplock(); \
400 } while (0)
401
402 #define PR_REL_MPLOCK(_pr) \
403 do { \
404         if (((_pr)->pr_flags & PR_MPSAFE) == 0) \
405                 rel_mplock(); \
406 } while (0)
407
408 #endif  /* _KERNEL */
409
410 #endif  /* _SYS_PROTOSW_H_ */