Add the lchflags() syscall.
[dragonfly.git] / lib / libc / sys / kqueue.2
1 .\" Copyright (c) 2000 Jonathan Lemon
2 .\" All rights reserved.
3 .\"
4 .\" Redistribution and use in source and binary forms, with or without
5 .\" modification, are permitted provided that the following conditions
6 .\" are met:
7 .\" 1. Redistributions of source code must retain the above copyright
8 .\"    notice, this list of conditions and the following disclaimer.
9 .\" 2. Redistributions in binary form must reproduce the above copyright
10 .\"    notice, this list of conditions and the following disclaimer in the
11 .\"    documentation and/or other materials provided with the distribution.
12 .\"
13 .\" THIS SOFTWARE IS PROVIDED ``AS IS'' AND
14 .\" ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
15 .\" IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
16 .\" ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
17 .\" FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
18 .\" DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
19 .\" OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
20 .\" HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
21 .\" LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
22 .\" OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
23 .\" SUCH DAMAGE.
24 .\"
25 .\" $FreeBSD: src/lib/libc/sys/kqueue.2,v 1.1.2.16 2002/07/02 21:05:08 mp Exp $
26 .\" $DragonFly: src/lib/libc/sys/kqueue.2,v 1.7 2008/05/02 02:05:04 swildner Exp $
27 .\"
28 .Dd April 14, 2000
29 .Dt KQUEUE 2
30 .Os
31 .Sh NAME
32 .Nm kqueue ,
33 .Nm kevent
34 .Nd kernel event notification mechanism
35 .Sh LIBRARY
36 .Lb libc
37 .Sh SYNOPSIS
38 .In sys/types.h
39 .In sys/event.h
40 .In sys/time.h
41 .Ft int
42 .Fn kqueue "void"
43 .Ft int
44 .Fn kevent "int kq" "const struct kevent *changelist" "int nchanges" "struct kevent *eventlist" "int nevents" "const struct timespec *timeout"
45 .Fn EV_SET "&kev" ident filter flags fflags data udata
46 .Sh DESCRIPTION
47 .Fn kqueue
48 provides a generic method of notifying the user when an event
49 happens or a condition holds, based on the results of small
50 pieces of kernel code termed filters.
51 A kevent is identified by the (ident, filter) pair; there may only
52 be one unique kevent per kqueue.
53 .Pp
54 The filter is executed upon the initial registration of a kevent
55 in order to detect whether a preexisting condition is present, and is also
56 executed whenever an event is passed to the filter for evaluation.
57 If the filter determines that the condition should be reported,
58 then the kevent is placed on the kqueue for the user to retrieve.
59 .Pp
60 The filter is also run when the user attempts to retrieve the kevent
61 from the kqueue.
62 If the filter indicates that the condition that triggered
63 the event no longer holds, the kevent is removed from the kqueue and
64 is not returned.
65 .Pp
66 Multiple events which trigger the filter do not result in multiple
67 kevents being placed on the kqueue; instead, the filter will aggregate
68 the events into a single struct kevent.
69 Calling
70 .Fn close
71 on a file descriptor will remove any kevents that reference the descriptor.
72 .Pp
73 .Fn kqueue
74 creates a new kernel event queue and returns a descriptor.
75 The queue is not inherited by a child created with
76 .Xr fork 2 .
77 However, if
78 .Xr rfork 2
79 is called without the
80 .Dv RFFDG
81 flag, then the descriptor table is shared,
82 which will allow sharing of the kqueue between two processes.
83 .Pp
84 .Fn kevent
85 is used to register events with the queue, and return any pending
86 events to the user.
87 .Fa changelist
88 is a pointer to an array of
89 .Va kevent
90 structures, as defined in
91 .In sys/event.h .
92 All changes contained in the
93 .Fa changelist
94 are applied before any pending events are read from the queue.
95 .Fa nchanges
96 gives the size of
97 .Fa changelist .
98 .Fa eventlist
99 is a pointer to an array of kevent structures.
100 .Fa nevents
101 determines the size of
102 .Fa eventlist .
103 If
104 .Fa timeout
105 is a non-NULL pointer, it specifies a maximum interval to wait
106 for an event, which will be interpreted as a struct timespec.
107 If
108 .Fa timeout
109 is a NULL pointer,
110 .Fn kevent
111 waits indefinitely.
112 To effect a poll, the
113 .Fa timeout
114 argument should be non-NULL, pointing to a zero-valued
115 .Va timespec
116 structure.
117 The same array may be used for the
118 .Fa changelist
119 and
120 .Fa eventlist .
121 .Pp
122 .Fn EV_SET
123 is a macro which is provided for ease of initializing a
124 kevent structure.
125 .Pp
126 The
127 .Va kevent
128 structure is defined as:
129 .Bd -literal
130 struct kevent {
131         uintptr_t ident;        /* identifier for this event */
132         short     filter;       /* filter for event */
133         u_short   flags;        /* action flags for kqueue */
134         u_int     fflags;       /* filter flag value */
135         intptr_t  data;         /* filter data value */
136         void      *udata;       /* opaque user data identifier */
137 };
138 .Ed
139 .Pp
140 The fields of
141 .Fa struct kevent
142 are:
143 .Bl -tag -width XXXfilter
144 .It ident
145 Value used to identify this event.
146 The exact interpretation is determined by the attached filter,
147 but often is a file descriptor.
148 .It filter
149 Identifies the kernel filter used to process this event.
150 The pre-defined system filters are described below.
151 .It flags
152 Actions to perform on the event.
153 .It fflags
154 Filter-specific flags.
155 .It data
156 Filter-specific data value.
157 .It udata
158 Opaque user-defined value passed through the kernel unchanged.
159 .El
160 .Pp
161 The
162 .Va flags
163 field can contain the following values:
164 .Bl -tag -width ".Dv EV_ONESHOT"
165 .It Dv EV_ADD
166 Adds the event to the kqueue.
167 Re-adding an existing event will modify the parameters of the original
168 event, and not result in a duplicate entry.
169 Adding an event automatically enables it, unless overridden by the
170 .Dv EV_DISABLE
171 flag.
172 .It Dv EV_ENABLE
173 Permit
174 .Fn kevent
175 to return the event if it is triggered.
176 .It Dv EV_DISABLE
177 Disable the event so
178 .Fn kevent
179 will not return it.
180 The filter itself is not disabled.
181 .It Dv EV_DELETE
182 Removes the event from the kqueue.
183 Events which are attached to file descriptors are automatically
184 deleted on the last close of the descriptor.
185 .It Dv EV_ONESHOT
186 Causes the event to return only the first occurrence of the filter
187 being triggered.
188 After the user retrieves the event from the kqueue, it is deleted.
189 .It Dv EV_CLEAR
190 After the event is retrieved by the user, its state is reset.
191 This is useful for filters which report state transitions
192 instead of the current state.
193 Note that some filters may automatically set this flag internally.
194 .It Dv EV_EOF
195 Filters may set this flag to indicate filter-specific EOF condition.
196 .It Dv EV_ERROR
197 See
198 .Sx RETURN VALUES
199 below.
200 .El
201 .Pp
202 The predefined system filters are listed below.
203 Arguments may be passed to and from the filter via the
204 .Va fflags
205 and
206 .Va data
207 fields in the kevent structure.
208 .Bl -tag -width ".Dv EVFILT_SIGNAL"
209 .It Dv EVFILT_READ
210 Takes a descriptor as the identifier, and returns whenever
211 there is data available to read.
212 The behavior of the filter is slightly different depending
213 on the descriptor type.
214 .Bl -tag -width 2n
215 .It Sockets
216 Sockets which have previously been passed to
217 .Fn listen
218 return when there is an incoming connection pending.
219 .Va data
220 contains the size of the listen backlog.
221 .Pp
222 Other socket descriptors return when there is data to be read,
223 subject to the
224 .Dv SO_RCVLOWAT
225 value of the socket buffer.
226 This may be overridden with a per-filter low water mark at the
227 time the filter is added by setting the
228 .Dv NOTE_LOWAT
229 flag in
230 .Va fflags ,
231 and specifying the new low water mark in
232 .Va data .
233 On return,
234 .Va data
235 contains the number of bytes in the socket buffer.
236 .Pp
237 If the read direction of the socket has shutdown, then the filter also sets
238 .Dv EV_EOF
239 in
240 .Va flags ,
241 and returns the socket error (if any) in
242 .Va fflags .
243 It is possible for EOF to be returned (indicating the connection is gone)
244 while there is still data pending in the socket buffer.
245 .It Vnodes
246 Returns when the file pointer is not at the end of file.
247 .Va data
248 contains the offset from current position to end of file,
249 and may be negative.
250 .It "Fifos, Pipes"
251 Returns when the there is data to read;
252 .Va data
253 contains the number of bytes available.
254 .Pp
255 When the last writer disconnects, the filter will set
256 .Dv EV_EOF
257 in
258 .Va flags .
259 This may be cleared by passing in
260 .Dv EV_CLEAR ,
261 at which point the filter will resume waiting for data to become
262 available before returning.
263 .El
264 .It Dv EVFILT_WRITE
265 Takes a descriptor as the identifier, and returns whenever
266 it is possible to write to the descriptor.
267 For sockets, pipes and fifos,
268 .Va data
269 will contain the amount of space remaining in the write buffer.
270 The filter will set
271 .Dv EV_EOF
272 when the reader disconnects, and for the fifo case, this may be cleared
273 by use of
274 .Dv EV_CLEAR .
275 Note that this filter is not supported for vnodes.
276 .Pp
277 For sockets, the low water mark and socket error handling is
278 identical to the
279 .Dv EVFILT_READ
280 case.
281 .It Dv EVFILT_AIO
282 The sigevent portion of the AIO request is filled in, with
283 .Va sigev_notify_kqueue
284 containing the descriptor of the kqueue that the event should
285 be attached to,
286 .Va sigev_value
287 containing the udata value, and
288 .Va sigev_notify
289 set to
290 .Dv SIGEV_KEVENT .
291 When the aio_* function is called, the event will be registered
292 with the specified kqueue, and the
293 .Va ident
294 argument set to the
295 .Fa struct aiocb
296 returned by the aio_* function.
297 The filter returns under the same conditions as aio_error.
298 .Pp
299 Alternatively, a kevent structure may be initialized, with
300 .Va ident
301 containing the descriptor of the kqueue, and the
302 address of the kevent structure placed in the
303 .Va aio_lio_opcode
304 field of the AIO request.
305 However, this approach will not work on architectures with 64-bit
306 pointers, and should be considered deprecated.
307 .It Dv EVFILT_VNODE
308 Takes a file descriptor as the identifier and the events to watch for in
309 .Va fflags ,
310 and returns when one or more of the requested events occurs on the descriptor.
311 The events to monitor are:
312 .Bl -tag -width ".Dv NOTE_RENAME"
313 .It Dv NOTE_DELETE
314 .Fn unlink
315 was called on the file referenced by the descriptor.
316 .It Dv NOTE_WRITE
317 A write occurred on the file referenced by the descriptor.
318 .It Dv NOTE_EXTEND
319 The file referenced by the descriptor was extended.
320 .It Dv NOTE_ATTRIB
321 The file referenced by the descriptor had its attributes changed.
322 .It Dv NOTE_LINK
323 The link count on the file changed.
324 .It Dv NOTE_RENAME
325 The file referenced by the descriptor was renamed.
326 .It Dv NOTE_REVOKE
327 Access to the file was revoked via
328 .Xr revoke 2
329 or the underlying fileystem was unmounted.
330 .El
331 .Pp
332 On return,
333 .Va fflags
334 contains the events which triggered the filter.
335 .It Dv EVFILT_PROC
336 Takes the process ID to monitor as the identifier and the events to watch for
337 in
338 .Va fflags ,
339 and returns when the process performs one or more of the requested events.
340 If a process can normally see another process, it can attach an event to it.
341 The events to monitor are:
342 .Bl -tag -width ".Dv NOTE_TRACKERR"
343 .It Dv NOTE_EXIT
344 The process has exited.
345 .It Dv NOTE_FORK
346 The process has called
347 .Fn fork .
348 .It Dv NOTE_EXEC
349 The process has executed a new process via
350 .Xr execve 2
351 or similar call.
352 .It Dv NOTE_TRACK
353 Follow a process across
354 .Fn fork
355 calls.
356 The parent process will return with
357 .Dv NOTE_TRACK
358 set in the
359 .Va fflags
360 field, while the child process will return with
361 .Dv NOTE_CHILD
362 set in
363 .Va fflags
364 and the parent PID in
365 .Va data .
366 .It Dv NOTE_TRACKERR
367 This flag is returned if the system was unable to attach an event to
368 the child process, usually due to resource limitations.
369 .El
370 .Pp
371 On return,
372 .Va fflags
373 contains the events which triggered the filter.
374 .It Dv EVFILT_SIGNAL
375 Takes the signal number to monitor as the identifier and returns
376 when the given signal is delivered to the process.
377 This coexists with the
378 .Fn signal
379 and
380 .Fn sigaction
381 facilities, and has a lower precedence.
382 The filter will record all attempts to deliver a signal to a process,
383 even if the signal has been marked as
384 .Dv SIG_IGN .
385 Event notification happens after normal signal delivery processing.
386 .Va data
387 returns the number of times the signal has occurred since the last call to
388 .Fn kevent .
389 This filter automatically sets the
390 .Dv EV_CLEAR
391 flag internally.
392 .It Dv EVFILT_TIMER
393 Establishes an arbitrary timer identified by
394 .Va ident .
395 When adding a timer,
396 .Va data
397 specifies the timeout period in milliseconds.
398 The timer will be periodic unless
399 .Dv EV_ONESHOT
400 is specified.
401 On return,
402 .Va data
403 contains the number of times the timeout has expired since the last call to
404 .Fn kevent .
405 This filter automatically sets the
406 .Dv EV_CLEAR
407 flag internally.
408 .El
409 .Sh RETURN VALUES
410 .Fn kqueue
411 creates a new kernel event queue and returns a file descriptor.
412 If there was an error creating the kernel event queue, a value of -1 is
413 returned and
414 .Va errno
415 set.
416 .Pp
417 .Fn kevent
418 returns the number of events placed in the
419 .Fa eventlist ,
420 up to the value given by
421 .Fa nevents .
422 If an error occurs while processing an element of the
423 .Fa changelist
424 and there is enough room in the
425 .Fa eventlist ,
426 then the event will be placed in the
427 .Fa eventlist
428 with
429 .Dv EV_ERROR
430 set in
431 .Va flags
432 and the system error in
433 .Va data .
434 Otherwise,
435 .Dv -1
436 will be returned, and
437 .Va errno
438 will be set to indicate the error condition.
439 If the time limit expires, then
440 .Fn kevent
441 returns 0.
442 .Sh ERRORS
443 The
444 .Fn kqueue
445 function fails if:
446 .Bl -tag -width Er
447 .It Bq Er ENOMEM
448 The kernel failed to allocate enough memory for the kernel queue.
449 .It Bq Er EMFILE
450 The per-process descriptor table is full.
451 .It Bq Er ENFILE
452 The system file table is full.
453 .El
454 .Pp
455 The
456 .Fn kevent
457 function fails if:
458 .Bl -tag -width Er
459 .It Bq Er EACCES
460 The process does not have permission to register a filter.
461 .It Bq Er EFAULT
462 There was an error reading or writing the
463 .Va kevent
464 structure.
465 .It Bq Er EBADF
466 The specified descriptor is invalid.
467 .It Bq Er EINTR
468 A signal was delivered before the timeout expired and before any
469 events were placed on the kqueue for return.
470 .It Bq Er EINVAL
471 The specified time limit or filter is invalid.
472 .It Bq Er ENOENT
473 The event could not be found to be modified or deleted.
474 .It Bq Er ENOMEM
475 No memory was available to register the event.
476 .It Bq Er ESRCH
477 The specified process to attach to does not exist.
478 .El
479 .Sh SEE ALSO
480 .Xr aio_error 2 ,
481 .Xr aio_read 2 ,
482 .Xr aio_return 2 ,
483 .Xr poll 2 ,
484 .Xr read 2 ,
485 .Xr select 2 ,
486 .Xr sigaction 2 ,
487 .Xr write 2 ,
488 .Xr signal 3
489 .Sh HISTORY
490 The
491 .Fn kqueue
492 and
493 .Fn kevent
494 functions first appeared in
495 .Fx 4.1 .
496 .Sh AUTHORS
497 The
498 .Fn kqueue
499 system and this manual page were written by
500 .An Jonathan Lemon Aq jlemon@FreeBSD.org .
501 .Sh BUGS
502 It is currently not possible to watch a
503 .Xr vnode 9
504 that resides on anything but
505 a UFS file system.