DEVFS - Modification of clone behaviour; general cleanup; xtime
[dragonfly.git] / sys / vfs / devfs / devfs_core.c
1 /*
2  * Copyright (c) 2009 The DragonFly Project.  All rights reserved.
3  *
4  * This code is derived from software contributed to The DragonFly Project
5  * by Alex Hornung <ahornung@gmail.com>
6  *
7  * Redistribution and use in source and binary forms, with or without
8  * modification, are permitted provided that the following conditions
9  * are met:
10  *
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer.
13  * 2. Redistributions in binary form must reproduce the above copyright
14  *    notice, this list of conditions and the following disclaimer in
15  *    the documentation and/or other materials provided with the
16  *    distribution.
17  * 3. Neither the name of The DragonFly Project nor the names of its
18  *    contributors may be used to endorse or promote products derived
19  *    from this software without specific, prior written permission.
20  *
21  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22  * ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23  * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
24  * FOR A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE
25  * COPYRIGHT HOLDERS OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
26  * INCIDENTAL, SPECIAL, EXEMPLARY OR CONSEQUENTIAL DAMAGES (INCLUDING,
27  * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
28  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED
29  * AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
30  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
31  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
32  * SUCH DAMAGE.
33  */
34 #include <sys/param.h>
35 #include <sys/systm.h>
36 #include <sys/kernel.h>
37 #include <sys/mount.h>
38 #include <sys/vnode.h>
39 #include <sys/types.h>
40 #include <sys/lock.h>
41 #include <sys/msgport.h>
42 #include <sys/msgport2.h>
43 #include <sys/spinlock2.h>
44 #include <sys/sysctl.h>
45 #include <sys/ucred.h>
46 #include <sys/param.h>
47 #include <sys/sysref2.h>
48 #include <sys/systm.h>
49 #include <vfs/devfs/devfs.h>
50 #include <vfs/devfs/devfs_rules.h>
51
52 MALLOC_DEFINE(M_DEVFS, "devfs", "Device File System (devfs) allocations");
53 DEVFS_DECLARE_CLONE_BITMAP(ops_id);
54 /*
55  * SYSREF Integration - reference counting, allocation,
56  * sysid and syslink integration.
57  */
58 static void devfs_cdev_terminate(cdev_t dev);
59 static struct sysref_class     cdev_sysref_class = {
60         .name =         "cdev",
61         .mtype =        M_DEVFS,
62         .proto =        SYSREF_PROTO_DEV,
63         .offset =       offsetof(struct cdev, si_sysref),
64         .objsize =      sizeof(struct cdev),
65         .mag_capacity = 32,
66         .flags =        0,
67         .ops =  {
68                 .terminate = (sysref_terminate_func_t)devfs_cdev_terminate
69         }
70 };
71
72 static struct objcache  *devfs_node_cache;
73 static struct objcache  *devfs_msg_cache;
74 static struct objcache  *devfs_dev_cache;
75
76 static struct objcache_malloc_args devfs_node_malloc_args = {
77         sizeof(struct devfs_node), M_DEVFS };
78 struct objcache_malloc_args devfs_msg_malloc_args = {
79         sizeof(struct devfs_msg), M_DEVFS };
80 struct objcache_malloc_args devfs_dev_malloc_args = {
81         sizeof(struct cdev), M_DEVFS };
82
83 static struct devfs_dev_head devfs_dev_list =
84                 TAILQ_HEAD_INITIALIZER(devfs_dev_list);
85 static struct devfs_mnt_head devfs_mnt_list =
86                 TAILQ_HEAD_INITIALIZER(devfs_mnt_list);
87 static struct devfs_chandler_head devfs_chandler_list =
88                 TAILQ_HEAD_INITIALIZER(devfs_chandler_list);
89 static struct devfs_alias_head devfs_alias_list =
90                 TAILQ_HEAD_INITIALIZER(devfs_alias_list);
91
92 struct lock             devfs_lock;
93 static struct lwkt_port devfs_dispose_port;
94 static struct lwkt_port devfs_msg_port;
95 static struct thread    *td_core;
96
97 static struct spinlock  ino_lock;
98 static ino_t    d_ino;
99 static int      devfs_debug_enable;
100 static int      devfs_run;
101
102 static ino_t devfs_fetch_ino(void);
103 static int devfs_create_all_dev_worker(struct devfs_node *);
104 static int devfs_create_dev_worker(cdev_t, uid_t, gid_t, int);
105 static int devfs_destroy_dev_worker(cdev_t);
106 static int devfs_destroy_subnames_worker(char *);
107 static int devfs_destroy_dev_by_ops_worker(struct dev_ops *, int);
108 static int devfs_propagate_dev(cdev_t, int);
109 static int devfs_unlink_dev(cdev_t dev);
110 static void devfs_msg_exec(devfs_msg_t msg);
111
112 static int devfs_chandler_add_worker(const char *, d_clone_t *);
113 static int devfs_chandler_del_worker(const char *);
114
115 static void devfs_msg_autofree_reply(lwkt_port_t, lwkt_msg_t);
116 static void devfs_msg_core(void *);
117
118 static int devfs_find_device_by_name_worker(devfs_msg_t);
119 static int devfs_find_device_by_udev_worker(devfs_msg_t);
120
121 static int devfs_apply_reset_rules_caller(char *, int);
122
123 static int devfs_scan_callback_worker(devfs_scan_t *);
124
125 static struct devfs_node *devfs_resolve_or_create_dir(struct devfs_node *,
126                 char *, size_t, int);
127
128 static int devfs_make_alias_worker(struct devfs_alias *);
129 static int devfs_alias_remove(cdev_t);
130 static int devfs_alias_reap(void);
131 static int devfs_alias_propagate(struct devfs_alias *);
132 static int devfs_alias_apply(struct devfs_node *, struct devfs_alias *);
133 static int devfs_alias_check_create(struct devfs_node *);
134
135 static int devfs_clr_subnames_flag_worker(char *, uint32_t);
136 static int devfs_destroy_subnames_without_flag_worker(char *, uint32_t);
137
138 static void *devfs_reaperp_callback(struct devfs_node *, void *);
139 static void *devfs_gc_dirs_callback(struct devfs_node *, void *);
140 static void *devfs_gc_links_callback(struct devfs_node *, struct devfs_node *);
141 static void *
142 devfs_inode_to_vnode_worker_callback(struct devfs_node *, ino_t *);
143
144 /*
145  * devfs_debug() is a SYSCTL and TUNABLE controlled debug output function
146  * using kvprintf
147  */
148 int
149 devfs_debug(int level, char *fmt, ...)
150 {
151         __va_list ap;
152
153         __va_start(ap, fmt);
154         if (level <= devfs_debug_enable)
155                 kvprintf(fmt, ap);
156         __va_end(ap);
157
158         return 0;
159 }
160
161 /*
162  * devfs_allocp() Allocates a new devfs node with the specified
163  * parameters. The node is also automatically linked into the topology
164  * if a parent is specified. It also calls the rule and alias stuff to
165  * be applied on the new node
166  */
167 struct devfs_node *
168 devfs_allocp(devfs_nodetype devfsnodetype, char *name,
169              struct devfs_node *parent, struct mount *mp, cdev_t dev)
170 {
171         struct devfs_node *node = NULL;
172         size_t namlen = strlen(name);
173
174         node = objcache_get(devfs_node_cache, M_WAITOK);
175         bzero(node, sizeof(*node));
176
177         atomic_add_int(&(DEVFS_MNTDATA(mp)->leak_count), 1);
178
179         node->d_dev = NULL;
180         node->nchildren = 1;
181         node->mp = mp;
182         node->d_dir.d_ino = devfs_fetch_ino();
183
184         /*
185          * Cookie jar for children. Leave 0 and 1 for '.' and '..' entries
186          * respectively.
187          */
188         node->cookie_jar = 2;
189
190         /*
191          * Access Control members
192          */
193         node->mode = DEVFS_DEFAULT_MODE;
194         node->uid = DEVFS_DEFAULT_UID;
195         node->gid = DEVFS_DEFAULT_GID;
196
197         switch (devfsnodetype) {
198         case Proot:
199                 /*
200                  * Ensure that we don't recycle the root vnode by marking it as
201                  * linked into the topology.
202                  */
203                 node->flags |= DEVFS_NODE_LINKED;
204         case Pdir:
205                 TAILQ_INIT(DEVFS_DENODE_HEAD(node));
206                 node->d_dir.d_type = DT_DIR;
207                 node->nchildren = 2;
208                 break;
209
210         case Plink:
211                 node->d_dir.d_type = DT_LNK;
212                 break;
213
214         case Preg:
215                 node->d_dir.d_type = DT_REG;
216                 break;
217
218         case Pdev:
219                 if (dev != NULL) {
220                         node->d_dir.d_type = DT_CHR;
221                         node->d_dev = dev;
222
223                         node->mode = dev->si_perms;
224                         node->uid = dev->si_uid;
225                         node->gid = dev->si_gid;
226
227                         devfs_alias_check_create(node);
228                 }
229                 break;
230
231         default:
232                 panic("devfs_allocp: unknown node type");
233         }
234
235         node->v_node = NULL;
236         node->node_type = devfsnodetype;
237
238         /* Initialize the dirent structure of each devfs vnode */
239         KKASSERT(namlen < 256);
240         node->d_dir.d_namlen = namlen;
241         node->d_dir.d_name = kmalloc(namlen+1, M_DEVFS, M_WAITOK);
242         memcpy(node->d_dir.d_name, name, namlen);
243         node->d_dir.d_name[namlen] = '\0';
244
245         /* Initialize the parent node element */
246         node->parent = parent;
247
248         /* Apply rules */
249         devfs_rule_check_apply(node, NULL);
250
251         /* Initialize *time members */
252         nanotime(&node->atime);
253         node->mtime = node->ctime = node->atime;
254
255         /*
256          * Associate with parent as last step, clean out namecache
257          * reference.
258          */
259         if ((parent != NULL) &&
260             ((parent->node_type == Proot) || (parent->node_type == Pdir))) {
261                 parent->nchildren++;
262                 node->cookie = parent->cookie_jar++;
263                 node->flags |= DEVFS_NODE_LINKED;
264                 TAILQ_INSERT_TAIL(DEVFS_DENODE_HEAD(parent), node, link);
265
266                 /* This forces negative namecache lookups to clear */
267                 ++mp->mnt_namecache_gen;
268         }
269
270         return node;
271 }
272
273 /*
274  * devfs_allocv() allocates a new vnode based on a devfs node.
275  */
276 int
277 devfs_allocv(struct vnode **vpp, struct devfs_node *node)
278 {
279         struct vnode *vp;
280         int error = 0;
281
282         KKASSERT(node);
283
284 try_again:
285         while ((vp = node->v_node) != NULL) {
286                 error = vget(vp, LK_EXCLUSIVE);
287                 if (error != ENOENT) {
288                         *vpp = vp;
289                         goto out;
290                 }
291         }
292
293         if ((error = getnewvnode(VT_DEVFS, node->mp, vpp, 0, 0)) != 0)
294                 goto out;
295
296         vp = *vpp;
297
298         if (node->v_node != NULL) {
299                 vp->v_type = VBAD;
300                 vx_put(vp);
301                 goto try_again;
302         }
303
304         vp->v_data = node;
305         node->v_node = vp;
306
307         switch (node->node_type) {
308         case Proot:
309                 vp->v_flag |= VROOT;
310         case Pdir:
311                 vp->v_type = VDIR;
312                 break;
313
314         case Plink:
315                 vp->v_type = VLNK;
316                 break;
317
318         case Preg:
319                 vp->v_type = VREG;
320                 break;
321
322         case Pdev:
323                 vp->v_type = VCHR;
324                 KKASSERT(node->d_dev);
325
326                 vp->v_uminor = node->d_dev->si_uminor;
327                 vp->v_umajor = 0;
328
329                 v_associate_rdev(vp, node->d_dev);
330                 vp->v_ops = &node->mp->mnt_vn_spec_ops;
331                 break;
332
333         default:
334                 panic("devfs_allocv: unknown node type");
335         }
336
337 out:
338         return error;
339 }
340
341 /*
342  * devfs_allocvp allocates both a devfs node (with the given settings) and a vnode
343  * based on the newly created devfs node.
344  */
345 int
346 devfs_allocvp(struct mount *mp, struct vnode **vpp, devfs_nodetype devfsnodetype,
347                 char *name, struct devfs_node *parent, cdev_t dev)
348 {
349         struct devfs_node *node;
350
351         node = devfs_allocp(devfsnodetype, name, parent, mp, dev);
352
353         if (node != NULL)
354                 devfs_allocv(vpp, node);
355         else
356                 *vpp = NULL;
357
358         return 0;
359 }
360
361 /*
362  * Destroy the devfs_node.  The node must be unlinked from the topology.
363  *
364  * This function will also destroy any vnode association with the node
365  * and device.
366  *
367  * The cdev_t itself remains intact.
368  */
369 int
370 devfs_freep(struct devfs_node *node)
371 {
372         struct vnode *vp;
373
374         KKASSERT(node);
375         KKASSERT(((node->flags & DEVFS_NODE_LINKED) == 0) ||
376                  (node->node_type == Proot));
377         KKASSERT((node->flags & DEVFS_DESTROYED) == 0);
378
379         atomic_subtract_int(&(DEVFS_MNTDATA(node->mp)->leak_count), 1);
380         if (node->symlink_name) {
381                 kfree(node->symlink_name, M_DEVFS);
382                 node->symlink_name = NULL;
383         }
384
385         /*
386          * Remove the node from the orphan list if it is still on it.
387          */
388         if (node->flags & DEVFS_ORPHANED)
389                 devfs_tracer_del_orphan(node);
390
391         /*
392          * Disassociate the vnode from the node.  This also prevents the
393          * vnode's reclaim code from double-freeing the node.
394          *
395          * The vget is needed to safely modify the vp.  It also serves
396          * to cycle the refs and terminate the vnode if it happens to
397          * be inactive, otherwise namecache references may not get cleared.
398          */
399         while ((vp = node->v_node) != NULL) {
400                 if (vget(vp, LK_EXCLUSIVE | LK_RETRY) != 0)
401                         break;
402                 v_release_rdev(vp);
403                 vp->v_data = NULL;
404                 node->v_node = NULL;
405                 vput(vp);
406         }
407         if (node->d_dir.d_name)
408                 kfree(node->d_dir.d_name, M_DEVFS);
409         node->flags |= DEVFS_DESTROYED;
410
411         objcache_put(devfs_node_cache, node);
412
413         return 0;
414 }
415
416 /*
417  * Unlink the devfs node from the topology and add it to the orphan list.
418  * The node will later be destroyed by freep.
419  *
420  * Any vnode association, including the v_rdev and v_data, remains intact
421  * until the freep.
422  */
423 int
424 devfs_unlinkp(struct devfs_node *node)
425 {
426         struct devfs_node *parent;
427         KKASSERT(node);
428
429         /*
430          * Add the node to the orphan list, so it is referenced somewhere, to
431          * so we don't leak it.
432          */
433         devfs_tracer_add_orphan(node);
434
435         parent = node->parent;
436
437         /*
438          * If the parent is known we can unlink the node out of the topology
439          */
440         if (parent)     {
441                 TAILQ_REMOVE(DEVFS_DENODE_HEAD(parent), node, link);
442                 parent->nchildren--;
443                 KKASSERT((parent->nchildren >= 0));
444                 node->flags &= ~DEVFS_NODE_LINKED;
445         }
446         node->parent = NULL;
447         return 0;
448 }
449
450 void *
451 devfs_iterate_topology(struct devfs_node *node,
452                 devfs_iterate_callback_t *callback, void *arg1)
453 {
454         struct devfs_node *node1, *node2;
455         void *ret = NULL;
456
457         if ((node->node_type == Proot) || (node->node_type == Pdir)) {
458                 if (node->nchildren > 2) {
459                         TAILQ_FOREACH_MUTABLE(node1, DEVFS_DENODE_HEAD(node),
460                                                         link, node2) {
461                                 if ((ret = devfs_iterate_topology(node1, callback, arg1)))
462                                         return ret;
463                         }
464                 }
465         }
466
467         ret = callback(node, arg1);
468         return ret;
469 }
470
471 /*
472  * devfs_reaperp() is a recursive function that iterates through all the
473  * topology, unlinking and freeing all devfs nodes.
474  */
475 static void *
476 devfs_reaperp_callback(struct devfs_node *node, void *unused)
477 {
478         devfs_unlinkp(node);
479         devfs_freep(node);
480
481         return NULL;
482 }
483
484 static void *
485 devfs_gc_dirs_callback(struct devfs_node *node, void *unused)
486 {
487         if (node->node_type == Pdir) {
488                 if (node->nchildren == 2) {
489                         devfs_unlinkp(node);
490                         devfs_freep(node);
491                 }
492         }
493
494         return NULL;
495 }
496
497 static void *
498 devfs_gc_links_callback(struct devfs_node *node, struct devfs_node *target)
499 {
500         if ((node->node_type == Plink) && (node->link_target == target)) {
501                 devfs_unlinkp(node);
502                 devfs_freep(node);
503         }
504
505         return NULL;
506 }
507
508 /*
509  * devfs_gc() is devfs garbage collector. It takes care of unlinking and
510  * freeing a node, but also removes empty directories and links that link
511  * via devfs auto-link mechanism to the node being deleted.
512  */
513 int
514 devfs_gc(struct devfs_node *node)
515 {
516         struct devfs_node *root_node = DEVFS_MNTDATA(node->mp)->root_node;
517
518         if (node->nlinks > 0)
519                 devfs_iterate_topology(root_node,
520                                 (devfs_iterate_callback_t *)devfs_gc_links_callback, node);
521
522         devfs_unlinkp(node);
523         devfs_iterate_topology(root_node,
524                         (devfs_iterate_callback_t *)devfs_gc_dirs_callback, NULL);
525
526         devfs_freep(node);
527
528         return 0;
529 }
530
531 /*
532  * devfs_create_dev() is the asynchronous entry point for device creation.
533  * It just sends a message with the relevant details to the devfs core.
534  *
535  * This function will reference the passed device.  The reference is owned
536  * by devfs and represents all of the device's node associations.
537  */
538 int
539 devfs_create_dev(cdev_t dev, uid_t uid, gid_t gid, int perms)
540 {
541         reference_dev(dev);
542         devfs_msg_send_dev(DEVFS_DEVICE_CREATE, dev, uid, gid, perms);
543
544         return 0;
545 }
546
547 /*
548  * devfs_destroy_dev() is the asynchronous entry point for device destruction.
549  * It just sends a message with the relevant details to the devfs core.
550  */
551 int
552 devfs_destroy_dev(cdev_t dev)
553 {
554         devfs_msg_send_dev(DEVFS_DEVICE_DESTROY, dev, 0, 0, 0);
555         return 0;
556 }
557
558 /*
559  * devfs_mount_add() is the synchronous entry point for adding a new devfs
560  * mount.  It sends a synchronous message with the relevant details to the
561  * devfs core.
562  */
563 int
564 devfs_mount_add(struct devfs_mnt_data *mnt)
565 {
566         devfs_msg_t msg;
567
568         msg = devfs_msg_get();
569         msg->mdv_mnt = mnt;
570         msg = devfs_msg_send_sync(DEVFS_MOUNT_ADD, msg);
571         devfs_msg_put(msg);
572
573         return 0;
574 }
575
576 /*
577  * devfs_mount_del() is the synchronous entry point for removing a devfs mount.
578  * It sends a synchronous message with the relevant details to the devfs core.
579  */
580 int
581 devfs_mount_del(struct devfs_mnt_data *mnt)
582 {
583         devfs_msg_t msg;
584
585         msg = devfs_msg_get();
586         msg->mdv_mnt = mnt;
587         msg = devfs_msg_send_sync(DEVFS_MOUNT_DEL, msg);
588         devfs_msg_put(msg);
589
590         return 0;
591 }
592
593 /*
594  * devfs_destroy_subnames() is the synchronous entry point for device
595  * destruction by subname. It just sends a message with the relevant details to
596  * the devfs core.
597  */
598 int
599 devfs_destroy_subnames(char *name)
600 {
601         devfs_msg_t msg;
602
603         msg = devfs_msg_get();
604         msg->mdv_load = name;
605         msg = devfs_msg_send_sync(DEVFS_DESTROY_SUBNAMES, msg);
606         devfs_msg_put(msg);
607         return 0;
608 }
609
610 int
611 devfs_clr_subnames_flag(char *name, uint32_t flag)
612 {
613         devfs_msg_t msg;
614
615         msg = devfs_msg_get();
616         msg->mdv_flags.name = name;
617         msg->mdv_flags.flag = flag;
618         msg = devfs_msg_send_sync(DEVFS_CLR_SUBNAMES_FLAG, msg);
619         devfs_msg_put(msg);
620
621         return 0;
622 }
623
624 int
625 devfs_destroy_subnames_without_flag(char *name, uint32_t flag)
626 {
627         devfs_msg_t msg;
628
629         msg = devfs_msg_get();
630         msg->mdv_flags.name = name;
631         msg->mdv_flags.flag = flag;
632         msg = devfs_msg_send_sync(DEVFS_DESTROY_SUBNAMES_WO_FLAG, msg);
633         devfs_msg_put(msg);
634
635         return 0;
636 }
637
638 /*
639  * devfs_create_all_dev is the asynchronous entry point to trigger device
640  * node creation.  It just sends a message with the relevant details to
641  * the devfs core.
642  */
643 int
644 devfs_create_all_dev(struct devfs_node *root)
645 {
646         devfs_msg_send_generic(DEVFS_CREATE_ALL_DEV, root);
647         return 0;
648 }
649
650 /*
651  * devfs_destroy_dev_by_ops is the asynchronous entry point to destroy all
652  * devices with a specific set of dev_ops and minor.  It just sends a
653  * message with the relevant details to the devfs core.
654  */
655 int
656 devfs_destroy_dev_by_ops(struct dev_ops *ops, int minor)
657 {
658         devfs_msg_send_ops(DEVFS_DESTROY_DEV_BY_OPS, ops, minor);
659         return 0;
660 }
661
662 /*
663  * devfs_clone_handler_add is the synchronous entry point to add a new
664  * clone handler.  It just sends a message with the relevant details to
665  * the devfs core.
666  */
667 int
668 devfs_clone_handler_add(const char *name, d_clone_t *nhandler)
669 {
670         devfs_msg_t msg;
671
672         msg = devfs_msg_get();
673         msg->mdv_chandler.name = name;
674         msg->mdv_chandler.nhandler = nhandler;
675         msg = devfs_msg_send_sync(DEVFS_CHANDLER_ADD, msg);
676         devfs_msg_put(msg);
677         return 0;
678 }
679
680 /*
681  * devfs_clone_handler_del is the synchronous entry point to remove a
682  * clone handler.  It just sends a message with the relevant details to
683  * the devfs core.
684  */
685 int
686 devfs_clone_handler_del(const char *name)
687 {
688         devfs_msg_t msg;
689
690         msg = devfs_msg_get();
691         msg->mdv_chandler.name = name;
692         msg->mdv_chandler.nhandler = NULL;
693         msg = devfs_msg_send_sync(DEVFS_CHANDLER_DEL, msg);
694         devfs_msg_put(msg);
695         return 0;
696 }
697
698 /*
699  * devfs_find_device_by_name is the synchronous entry point to find a
700  * device given its name.  It sends a synchronous message with the
701  * relevant details to the devfs core and returns the answer.
702  */
703 cdev_t
704 devfs_find_device_by_name(const char *fmt, ...)
705 {
706         cdev_t found = NULL;
707         devfs_msg_t msg;
708         char target[PATH_MAX+1];
709         __va_list ap;
710         int i;
711
712         if (fmt == NULL)
713                 return NULL;
714
715         __va_start(ap, fmt);
716         i = kvcprintf(fmt, NULL, target, 10, ap);
717         target[i] = '\0';
718         __va_end(ap);
719
720         msg = devfs_msg_get();
721         msg->mdv_name = target;
722         msg = devfs_msg_send_sync(DEVFS_FIND_DEVICE_BY_NAME, msg);
723         found = msg->mdv_cdev;
724         devfs_msg_put(msg);
725
726         return found;
727 }
728
729 /*
730  * devfs_find_device_by_udev is the synchronous entry point to find a
731  * device given its udev number.  It sends a synchronous message with
732  * the relevant details to the devfs core and returns the answer.
733  */
734 cdev_t
735 devfs_find_device_by_udev(udev_t udev)
736 {
737         cdev_t found = NULL;
738         devfs_msg_t msg;
739
740         msg = devfs_msg_get();
741         msg->mdv_udev = udev;
742         msg = devfs_msg_send_sync(DEVFS_FIND_DEVICE_BY_UDEV, msg);
743         found = msg->mdv_cdev;
744         devfs_msg_put(msg);
745
746         devfs_debug(DEVFS_DEBUG_DEBUG,
747                     "devfs_find_device_by_udev found? %s  -end:3-\n",
748                     ((found) ? found->si_name:"NO"));
749         return found;
750 }
751
752 struct vnode *
753 devfs_inode_to_vnode(struct mount *mp, ino_t target)
754 {
755         struct vnode *vp = NULL;
756         devfs_msg_t msg;
757
758         if (mp == NULL)
759                 return NULL;
760
761         msg = devfs_msg_get();
762         msg->mdv_ino.mp = mp;
763         msg->mdv_ino.ino = target;
764         msg = devfs_msg_send_sync(DEVFS_INODE_TO_VNODE, msg);
765         vp = msg->mdv_ino.vp;
766         vn_lock(vp, LK_EXCLUSIVE | LK_RETRY);
767         devfs_msg_put(msg);
768
769         return vp;
770 }
771
772 /*
773  * devfs_make_alias is the asynchronous entry point to register an alias
774  * for a device.  It just sends a message with the relevant details to the
775  * devfs core.
776  */
777 int
778 devfs_make_alias(const char *name, cdev_t dev_target)
779 {
780         struct devfs_alias *alias;
781         size_t len;
782
783         len = strlen(name);
784
785         alias = kmalloc(sizeof(struct devfs_alias), M_DEVFS, M_WAITOK);
786         alias->name = kstrdup(name, M_DEVFS);
787         alias->namlen = len;
788         alias->dev_target = dev_target;
789
790         devfs_msg_send_generic(DEVFS_MAKE_ALIAS, alias);
791         return 0;
792 }
793
794 /*
795  * devfs_apply_rules is the asynchronous entry point to trigger application
796  * of all rules.  It just sends a message with the relevant details to the
797  * devfs core.
798  */
799 int
800 devfs_apply_rules(char *mntto)
801 {
802         char *new_name;
803
804         new_name = kstrdup(mntto, M_DEVFS);
805         devfs_msg_send_name(DEVFS_APPLY_RULES, new_name);
806
807         return 0;
808 }
809
810 /*
811  * devfs_reset_rules is the asynchronous entry point to trigger reset of all
812  * rules. It just sends a message with the relevant details to the devfs core.
813  */
814 int
815 devfs_reset_rules(char *mntto)
816 {
817         char *new_name;
818
819         new_name = kstrdup(mntto, M_DEVFS);
820         devfs_msg_send_name(DEVFS_RESET_RULES, new_name);
821
822         return 0;
823 }
824
825
826 /*
827  * devfs_scan_callback is the asynchronous entry point to call a callback
828  * on all cdevs.
829  * It just sends a message with the relevant details to the devfs core.
830  */
831 int
832 devfs_scan_callback(devfs_scan_t *callback)
833 {
834         devfs_msg_t msg;
835
836         KKASSERT(sizeof(callback) == sizeof(void *));
837
838         msg = devfs_msg_get();
839         msg->mdv_load = callback;
840         msg = devfs_msg_send_sync(DEVFS_SCAN_CALLBACK, msg);
841         devfs_msg_put(msg);
842
843         return 0;
844 }
845
846
847 /*
848  * Acts as a message drain. Any message that is replied to here gets destroyed
849  * and the memory freed.
850  */
851 static void
852 devfs_msg_autofree_reply(lwkt_port_t port, lwkt_msg_t msg)
853 {
854         devfs_msg_put((devfs_msg_t)msg);
855 }
856
857 /*
858  * devfs_msg_get allocates a new devfs msg and returns it.
859  */
860 devfs_msg_t
861 devfs_msg_get()
862 {
863         return objcache_get(devfs_msg_cache, M_WAITOK);
864 }
865
866 /*
867  * devfs_msg_put deallocates a given devfs msg.
868  */
869 int
870 devfs_msg_put(devfs_msg_t msg)
871 {
872         objcache_put(devfs_msg_cache, msg);
873         return 0;
874 }
875
876 /*
877  * devfs_msg_send is the generic asynchronous message sending facility
878  * for devfs. By default the reply port is the automatic disposal port.
879  *
880  * If the current thread is the devfs_msg_port thread we execute the
881  * operation synchronously.
882  */
883 void
884 devfs_msg_send(uint32_t cmd, devfs_msg_t devfs_msg)
885 {
886         lwkt_port_t port = &devfs_msg_port;
887
888         lwkt_initmsg(&devfs_msg->hdr, &devfs_dispose_port, 0);
889
890         devfs_msg->hdr.u.ms_result = cmd;
891
892         if (port->mpu_td == curthread) {
893                 devfs_msg_exec(devfs_msg);
894                 lwkt_replymsg(&devfs_msg->hdr, 0);
895         } else {
896                 lwkt_sendmsg(port, (lwkt_msg_t)devfs_msg);
897         }
898 }
899
900 /*
901  * devfs_msg_send_sync is the generic synchronous message sending
902  * facility for devfs. It initializes a local reply port and waits
903  * for the core's answer. This answer is then returned.
904  */
905 devfs_msg_t
906 devfs_msg_send_sync(uint32_t cmd, devfs_msg_t devfs_msg)
907 {
908         struct lwkt_port rep_port;
909         devfs_msg_t     msg_incoming;
910         lwkt_port_t port = &devfs_msg_port;
911
912         lwkt_initport_thread(&rep_port, curthread);
913         lwkt_initmsg(&devfs_msg->hdr, &rep_port, 0);
914
915         devfs_msg->hdr.u.ms_result = cmd;
916
917         lwkt_sendmsg(port, (lwkt_msg_t)devfs_msg);
918         msg_incoming = lwkt_waitport(&rep_port, 0);
919
920         return msg_incoming;
921 }
922
923 /*
924  * sends a message with a generic argument.
925  */
926 void
927 devfs_msg_send_generic(uint32_t cmd, void *load)
928 {
929         devfs_msg_t devfs_msg = devfs_msg_get();
930
931         devfs_msg->mdv_load = load;
932         devfs_msg_send(cmd, devfs_msg);
933 }
934
935 /*
936  * sends a message with a name argument.
937  */
938 void
939 devfs_msg_send_name(uint32_t cmd, char *name)
940 {
941         devfs_msg_t devfs_msg = devfs_msg_get();
942
943         devfs_msg->mdv_name = name;
944         devfs_msg_send(cmd, devfs_msg);
945 }
946
947 /*
948  * sends a message with a mount argument.
949  */
950 void
951 devfs_msg_send_mount(uint32_t cmd, struct devfs_mnt_data *mnt)
952 {
953         devfs_msg_t devfs_msg = devfs_msg_get();
954
955         devfs_msg->mdv_mnt = mnt;
956         devfs_msg_send(cmd, devfs_msg);
957 }
958
959 /*
960  * sends a message with an ops argument.
961  */
962 void
963 devfs_msg_send_ops(uint32_t cmd, struct dev_ops *ops, int minor)
964 {
965         devfs_msg_t devfs_msg = devfs_msg_get();
966
967         devfs_msg->mdv_ops.ops = ops;
968         devfs_msg->mdv_ops.minor = minor;
969         devfs_msg_send(cmd, devfs_msg);
970 }
971
972 /*
973  * sends a message with a clone handler argument.
974  */
975 void
976 devfs_msg_send_chandler(uint32_t cmd, char *name, d_clone_t handler)
977 {
978         devfs_msg_t devfs_msg = devfs_msg_get();
979
980         devfs_msg->mdv_chandler.name = name;
981         devfs_msg->mdv_chandler.nhandler = handler;
982         devfs_msg_send(cmd, devfs_msg);
983 }
984
985 /*
986  * sends a message with a device argument.
987  */
988 void
989 devfs_msg_send_dev(uint32_t cmd, cdev_t dev, uid_t uid, gid_t gid, int perms)
990 {
991         devfs_msg_t devfs_msg = devfs_msg_get();
992
993         devfs_msg->mdv_dev.dev = dev;
994         devfs_msg->mdv_dev.uid = uid;
995         devfs_msg->mdv_dev.gid = gid;
996         devfs_msg->mdv_dev.perms = perms;
997
998         devfs_msg_send(cmd, devfs_msg);
999 }
1000
1001 /*
1002  * sends a message with a link argument.
1003  */
1004 void
1005 devfs_msg_send_link(uint32_t cmd, char *name, char *target, struct mount *mp)
1006 {
1007         devfs_msg_t devfs_msg = devfs_msg_get();
1008
1009         devfs_msg->mdv_link.name = name;
1010         devfs_msg->mdv_link.target = target;
1011         devfs_msg->mdv_link.mp = mp;
1012         devfs_msg_send(cmd, devfs_msg);
1013 }
1014
1015 /*
1016  * devfs_msg_core is the main devfs thread. It handles all incoming messages
1017  * and calls the relevant worker functions. By using messages it's assured
1018  * that events occur in the correct order.
1019  */
1020 static void
1021 devfs_msg_core(void *arg)
1022 {
1023         devfs_msg_t msg;
1024
1025         devfs_run = 1;
1026         lwkt_initport_thread(&devfs_msg_port, curthread);
1027         wakeup(td_core);
1028
1029         while (devfs_run) {
1030                 msg = (devfs_msg_t)lwkt_waitport(&devfs_msg_port, 0);
1031                 devfs_debug(DEVFS_DEBUG_DEBUG,
1032                                 "devfs_msg_core, new msg: %x\n",
1033                                 (unsigned int)msg->hdr.u.ms_result);
1034                 devfs_msg_exec(msg);
1035                 lwkt_replymsg(&msg->hdr, 0);
1036         }
1037         wakeup(td_core);
1038         lwkt_exit();
1039 }
1040
1041 static void
1042 devfs_msg_exec(devfs_msg_t msg)
1043 {
1044         struct devfs_mnt_data *mnt;
1045         struct devfs_node *node;
1046         cdev_t  dev;
1047
1048         /*
1049          * Acquire the devfs lock to ensure safety of all called functions
1050          */
1051         lockmgr(&devfs_lock, LK_EXCLUSIVE);
1052
1053         switch (msg->hdr.u.ms_result) {
1054         case DEVFS_DEVICE_CREATE:
1055                 dev = msg->mdv_dev.dev;
1056                 devfs_create_dev_worker(dev,
1057                                         msg->mdv_dev.uid,
1058                                         msg->mdv_dev.gid,
1059                                         msg->mdv_dev.perms);
1060                 break;
1061         case DEVFS_DEVICE_DESTROY:
1062                 dev = msg->mdv_dev.dev;
1063                 devfs_destroy_dev_worker(dev);
1064                 break;
1065         case DEVFS_DESTROY_SUBNAMES:
1066                 devfs_destroy_subnames_worker(msg->mdv_load);
1067                 break;
1068         case DEVFS_DESTROY_DEV_BY_OPS:
1069                 devfs_destroy_dev_by_ops_worker(msg->mdv_ops.ops,
1070                                                 msg->mdv_ops.minor);
1071                 break;
1072         case DEVFS_CREATE_ALL_DEV:
1073                 node = (struct devfs_node *)msg->mdv_load;
1074                 devfs_create_all_dev_worker(node);
1075                 break;
1076         case DEVFS_MOUNT_ADD:
1077                 mnt = msg->mdv_mnt;
1078                 TAILQ_INSERT_TAIL(&devfs_mnt_list, mnt, link);
1079                 devfs_create_all_dev_worker(mnt->root_node);
1080                 break;
1081         case DEVFS_MOUNT_DEL:
1082                 mnt = msg->mdv_mnt;
1083                 TAILQ_REMOVE(&devfs_mnt_list, mnt, link);
1084                 devfs_iterate_topology(mnt->root_node, devfs_reaperp_callback,
1085                                        NULL);
1086                 if (mnt->leak_count) {
1087                         devfs_debug(DEVFS_DEBUG_SHOW,
1088                                     "Leaked %d devfs_node elements!\n",
1089                                     mnt->leak_count);
1090                 }
1091                 break;
1092         case DEVFS_CHANDLER_ADD:
1093                 devfs_chandler_add_worker(msg->mdv_chandler.name,
1094                                 msg->mdv_chandler.nhandler);
1095                 break;
1096         case DEVFS_CHANDLER_DEL:
1097                 devfs_chandler_del_worker(msg->mdv_chandler.name);
1098                 break;
1099         case DEVFS_FIND_DEVICE_BY_NAME:
1100                 devfs_find_device_by_name_worker(msg);
1101                 break;
1102         case DEVFS_FIND_DEVICE_BY_UDEV:
1103                 devfs_find_device_by_udev_worker(msg);
1104                 break;
1105         case DEVFS_MAKE_ALIAS:
1106                 devfs_make_alias_worker((struct devfs_alias *)msg->mdv_load);
1107                 break;
1108         case DEVFS_APPLY_RULES:
1109                 devfs_apply_reset_rules_caller(msg->mdv_name, 1);
1110                 break;
1111         case DEVFS_RESET_RULES:
1112                 devfs_apply_reset_rules_caller(msg->mdv_name, 0);
1113                 break;
1114         case DEVFS_SCAN_CALLBACK:
1115                 devfs_scan_callback_worker((devfs_scan_t *)msg->mdv_load);
1116                 break;
1117         case DEVFS_CLR_SUBNAMES_FLAG:
1118                 devfs_clr_subnames_flag_worker(msg->mdv_flags.name,
1119                                 msg->mdv_flags.flag);
1120                 break;
1121         case DEVFS_DESTROY_SUBNAMES_WO_FLAG:
1122                 devfs_destroy_subnames_without_flag_worker(msg->mdv_flags.name,
1123                                 msg->mdv_flags.flag);
1124                 break;
1125         case DEVFS_INODE_TO_VNODE:
1126                 msg->mdv_ino.vp = devfs_iterate_topology(
1127                         DEVFS_MNTDATA(msg->mdv_ino.mp)->root_node,
1128                         (devfs_iterate_callback_t *)devfs_inode_to_vnode_worker_callback,
1129                         &msg->mdv_ino.ino);
1130                 break;
1131         case DEVFS_TERMINATE_CORE:
1132                 devfs_run = 0;
1133                 break;
1134         case DEVFS_SYNC:
1135                 break;
1136         default:
1137                 devfs_debug(DEVFS_DEBUG_WARNING,
1138                             "devfs_msg_core: unknown message "
1139                             "received at core\n");
1140                 break;
1141         }
1142         lockmgr(&devfs_lock, LK_RELEASE);
1143 }
1144
1145 /*
1146  * Worker function to insert a new dev into the dev list and initialize its
1147  * permissions. It also calls devfs_propagate_dev which in turn propagates
1148  * the change to all mount points.
1149  *
1150  * The passed dev is already referenced.  This reference is eaten by this
1151  * function and represents the dev's linkage into devfs_dev_list.
1152  */
1153 static int
1154 devfs_create_dev_worker(cdev_t dev, uid_t uid, gid_t gid, int perms)
1155 {
1156         KKASSERT(dev);
1157
1158         dev->si_uid = uid;
1159         dev->si_gid = gid;
1160         dev->si_perms = perms;
1161
1162         devfs_link_dev(dev);
1163         devfs_propagate_dev(dev, 1);
1164
1165         return 0;
1166 }
1167
1168 /*
1169  * Worker function to delete a dev from the dev list and free the cdev.
1170  * It also calls devfs_propagate_dev which in turn propagates the change
1171  * to all mount points.
1172  */
1173 static int
1174 devfs_destroy_dev_worker(cdev_t dev)
1175 {
1176         int error;
1177
1178         KKASSERT(dev);
1179         KKASSERT((lockstatus(&devfs_lock, curthread)) == LK_EXCLUSIVE);
1180
1181         error = devfs_unlink_dev(dev);
1182         devfs_propagate_dev(dev, 0);
1183         if (error == 0)
1184                 release_dev(dev);       /* link ref */
1185         release_dev(dev);
1186         release_dev(dev);
1187
1188         return 0;
1189 }
1190
1191 /*
1192  * Worker function to destroy all devices with a certain basename.
1193  * Calls devfs_destroy_dev_worker for the actual destruction.
1194  */
1195 static int
1196 devfs_destroy_subnames_worker(char *name)
1197 {
1198         cdev_t dev, dev1;
1199         size_t len = strlen(name);
1200
1201         TAILQ_FOREACH_MUTABLE(dev, &devfs_dev_list, link, dev1) {
1202                 if ((!strncmp(dev->si_name, name, len)) &&
1203                                 (dev->si_name[len] != '\0')) {
1204                         devfs_destroy_dev_worker(dev);
1205                 }
1206         }
1207         return 0;
1208 }
1209
1210 static int
1211 devfs_clr_subnames_flag_worker(char *name, uint32_t flag)
1212 {
1213         cdev_t dev, dev1;
1214         size_t len = strlen(name);
1215
1216         TAILQ_FOREACH_MUTABLE(dev, &devfs_dev_list, link, dev1) {
1217                 if ((!strncmp(dev->si_name, name, len)) &&
1218                                 (dev->si_name[len] != '\0')) {
1219                         dev->si_flags &= ~flag;
1220                 }
1221         }
1222
1223         return 0;
1224 }
1225
1226 static int
1227 devfs_destroy_subnames_without_flag_worker(char *name, uint32_t flag)
1228 {
1229         cdev_t dev, dev1;
1230         size_t len = strlen(name);
1231
1232         TAILQ_FOREACH_MUTABLE(dev, &devfs_dev_list, link, dev1) {
1233                 if ((!strncmp(dev->si_name, name, len)) &&
1234                                 (dev->si_name[len] != '\0')) {
1235                         if (!(dev->si_flags & flag)) {
1236                                 devfs_destroy_dev_worker(dev);
1237                         }
1238                 }
1239         }
1240
1241         return 0;
1242 }
1243
1244 /*
1245  * Worker function that creates all device nodes on top of a devfs
1246  * root node.
1247  */
1248 static int
1249 devfs_create_all_dev_worker(struct devfs_node *root)
1250 {
1251         cdev_t dev;
1252
1253         KKASSERT(root);
1254
1255         TAILQ_FOREACH(dev, &devfs_dev_list, link) {
1256                 devfs_create_device_node(root, dev, NULL, NULL);
1257         }
1258
1259         return 0;
1260 }
1261
1262 /*
1263  * Worker function that destroys all devices that match a specific
1264  * dev_ops and/or minor. If minor is less than 0, it is not matched
1265  * against. It also propagates all changes.
1266  */
1267 static int
1268 devfs_destroy_dev_by_ops_worker(struct dev_ops *ops, int minor)
1269 {
1270         cdev_t dev, dev1;
1271
1272         KKASSERT(ops);
1273
1274         TAILQ_FOREACH_MUTABLE(dev, &devfs_dev_list, link, dev1) {
1275                 if (dev->si_ops != ops)
1276                         continue;
1277                 if ((minor < 0) || (dev->si_uminor == minor)) {
1278                         devfs_destroy_dev_worker(dev);
1279                 }
1280         }
1281
1282         return 0;
1283 }
1284
1285 /*
1286  * Worker function that registers a new clone handler in devfs.
1287  */
1288 static int
1289 devfs_chandler_add_worker(const char *name, d_clone_t *nhandler)
1290 {
1291         struct devfs_clone_handler *chandler = NULL;
1292         u_char len = strlen(name);
1293
1294         if (len == 0)
1295                 return 1;
1296
1297         TAILQ_FOREACH(chandler, &devfs_chandler_list, link) {
1298                 if (chandler->namlen != len)
1299                         continue;
1300
1301                 if (!memcmp(chandler->name, name, len)) {
1302                         /* Clonable basename already exists */
1303                         return 1;
1304                 }
1305         }
1306
1307         chandler = kmalloc(sizeof(*chandler), M_DEVFS, M_WAITOK | M_ZERO);
1308         chandler->name = kstrdup(name, M_DEVFS);
1309         chandler->namlen = len;
1310         chandler->nhandler = nhandler;
1311
1312         TAILQ_INSERT_TAIL(&devfs_chandler_list, chandler, link);
1313         return 0;
1314 }
1315
1316 /*
1317  * Worker function that removes a given clone handler from the
1318  * clone handler list.
1319  */
1320 static int
1321 devfs_chandler_del_worker(const char *name)
1322 {
1323         struct devfs_clone_handler *chandler, *chandler2;
1324         u_char len = strlen(name);
1325
1326         if (len == 0)
1327                 return 1;
1328
1329         TAILQ_FOREACH_MUTABLE(chandler, &devfs_chandler_list, link, chandler2) {
1330                 if (chandler->namlen != len)
1331                         continue;
1332                 if (memcmp(chandler->name, name, len))
1333                         continue;
1334
1335                 TAILQ_REMOVE(&devfs_chandler_list, chandler, link);
1336                 kfree(chandler->name, M_DEVFS);
1337                 kfree(chandler, M_DEVFS);
1338                 break;
1339         }
1340
1341         return 0;
1342 }
1343
1344 /*
1345  * Worker function that finds a given device name and changes
1346  * the message received accordingly so that when replied to,
1347  * the answer is returned to the caller.
1348  */
1349 static int
1350 devfs_find_device_by_name_worker(devfs_msg_t devfs_msg)
1351 {
1352         struct devfs_alias *alias;
1353         cdev_t dev;
1354         cdev_t found = NULL;
1355
1356         TAILQ_FOREACH(dev, &devfs_dev_list, link) {
1357                 if (strcmp(devfs_msg->mdv_name, dev->si_name) == 0) {
1358                         found = dev;
1359                         break;
1360                 }
1361         }
1362         if (found == NULL) {
1363                 TAILQ_FOREACH(alias, &devfs_alias_list, link) {
1364                         if (strcmp(devfs_msg->mdv_name, alias->name) == 0) {
1365                                 found = alias->dev_target;
1366                                 break;
1367                         }
1368                 }
1369         }
1370         devfs_msg->mdv_cdev = found;
1371
1372         return 0;
1373 }
1374
1375 /*
1376  * Worker function that finds a given device udev and changes
1377  * the message received accordingly so that when replied to,
1378  * the answer is returned to the caller.
1379  */
1380 static int
1381 devfs_find_device_by_udev_worker(devfs_msg_t devfs_msg)
1382 {
1383         cdev_t dev, dev1;
1384         cdev_t found = NULL;
1385
1386         TAILQ_FOREACH_MUTABLE(dev, &devfs_dev_list, link, dev1) {
1387                 if (((udev_t)dev->si_inode) == devfs_msg->mdv_udev) {
1388                         found = dev;
1389                         break;
1390                 }
1391         }
1392         devfs_msg->mdv_cdev = found;
1393
1394         return 0;
1395 }
1396
1397 /*
1398  * Worker function that inserts a given alias into the
1399  * alias list, and propagates the alias to all mount
1400  * points.
1401  */
1402 static int
1403 devfs_make_alias_worker(struct devfs_alias *alias)
1404 {
1405         struct devfs_alias *alias2;
1406         size_t len = strlen(alias->name);
1407         int found = 0;
1408
1409         TAILQ_FOREACH(alias2, &devfs_alias_list, link) {
1410                 if (len != alias2->namlen)
1411                         continue;
1412
1413                 if (!memcmp(alias->name, alias2->name, len)) {
1414                         found = 1;
1415                         break;
1416                 }
1417         }
1418
1419         if (!found) {
1420                 /*
1421                  * The alias doesn't exist yet, so we add it to the alias list
1422                  */
1423                 TAILQ_INSERT_TAIL(&devfs_alias_list, alias, link);
1424                 devfs_alias_propagate(alias);
1425         } else {
1426                 devfs_debug(DEVFS_DEBUG_WARNING,
1427                             "Warning: duplicate devfs_make_alias for %s\n",
1428                             alias->name);
1429                 kfree(alias->name, M_DEVFS);
1430                 kfree(alias, M_DEVFS);
1431         }
1432
1433         return 0;
1434 }
1435
1436 /*
1437  * Function that removes and frees all aliases.
1438  */
1439 static int
1440 devfs_alias_reap(void)
1441 {
1442         struct devfs_alias *alias, *alias2;
1443
1444         TAILQ_FOREACH_MUTABLE(alias, &devfs_alias_list, link, alias2) {
1445                 TAILQ_REMOVE(&devfs_alias_list, alias, link);
1446                 kfree(alias, M_DEVFS);
1447         }
1448         return 0;
1449 }
1450
1451 /*
1452  * Function that removes an alias matching a specific cdev and frees
1453  * it accordingly.
1454  */
1455 static int
1456 devfs_alias_remove(cdev_t dev)
1457 {
1458         struct devfs_alias *alias, *alias2;
1459
1460         TAILQ_FOREACH_MUTABLE(alias, &devfs_alias_list, link, alias2) {
1461                 if (alias->dev_target == dev) {
1462                         TAILQ_REMOVE(&devfs_alias_list, alias, link);
1463                         kfree(alias, M_DEVFS);
1464                 }
1465         }
1466         return 0;
1467 }
1468
1469 /*
1470  * This function propagates a new alias to all mount points.
1471  */
1472 static int
1473 devfs_alias_propagate(struct devfs_alias *alias)
1474 {
1475         struct devfs_mnt_data *mnt;
1476
1477         TAILQ_FOREACH(mnt, &devfs_mnt_list, link) {
1478                 devfs_alias_apply(mnt->root_node, alias);
1479         }
1480         return 0;
1481 }
1482
1483 /*
1484  * This function is a recursive function iterating through
1485  * all device nodes in the topology and, if applicable,
1486  * creating the relevant alias for a device node.
1487  */
1488 static int
1489 devfs_alias_apply(struct devfs_node *node, struct devfs_alias *alias)
1490 {
1491         struct devfs_node *node1, *node2;
1492
1493         KKASSERT(alias != NULL);
1494
1495         if ((node->node_type == Proot) || (node->node_type == Pdir)) {
1496                 if (node->nchildren > 2) {
1497                         TAILQ_FOREACH_MUTABLE(node1, DEVFS_DENODE_HEAD(node), link, node2) {
1498                                 devfs_alias_apply(node1, alias);
1499                         }
1500                 }
1501         } else {
1502                 if (node->d_dev == alias->dev_target)
1503                         devfs_alias_create(alias->name, node, 0);
1504         }
1505         return 0;
1506 }
1507
1508 /*
1509  * This function checks if any alias possibly is applicable
1510  * to the given node. If so, the alias is created.
1511  */
1512 static int
1513 devfs_alias_check_create(struct devfs_node *node)
1514 {
1515         struct devfs_alias *alias;
1516
1517         TAILQ_FOREACH(alias, &devfs_alias_list, link) {
1518                 if (node->d_dev == alias->dev_target)
1519                         devfs_alias_create(alias->name, node, 0);
1520         }
1521         return 0;
1522 }
1523
1524 /*
1525  * This function creates an alias with a given name
1526  * linking to a given devfs node. It also increments
1527  * the link count on the target node.
1528  */
1529 int
1530 devfs_alias_create(char *name_orig, struct devfs_node *target, int rule_based)
1531 {
1532         struct mount *mp = target->mp;
1533         struct devfs_node *parent = DEVFS_MNTDATA(mp)->root_node;
1534         struct devfs_node *linknode;
1535         char *create_path = NULL;
1536         char *name, name_buf[PATH_MAX];
1537
1538         KKASSERT((lockstatus(&devfs_lock, curthread)) == LK_EXCLUSIVE);
1539
1540         devfs_resolve_name_path(name_orig, name_buf, &create_path, &name);
1541
1542         if (create_path)
1543                 parent = devfs_resolve_or_create_path(parent, create_path, 1);
1544
1545
1546         if (devfs_find_device_node_by_name(parent, name)) {
1547                 devfs_debug(DEVFS_DEBUG_WARNING,
1548                             "Node already exists: %s "
1549                             "(devfs_make_alias_worker)!\n",
1550                             name);
1551                 return 1;
1552         }
1553
1554
1555         linknode = devfs_allocp(Plink, name, parent, mp, NULL);
1556         if (linknode == NULL)
1557                 return 1;
1558
1559         linknode->link_target = target;
1560         target->nlinks++;
1561
1562         if (rule_based)
1563                 linknode->flags |= DEVFS_RULE_CREATED;
1564
1565         return 0;
1566 }
1567
1568 /*
1569  * This function is called by the core and handles mount point
1570  * strings. It either calls the relevant worker (devfs_apply_
1571  * reset_rules_worker) on all mountpoints or only a specific
1572  * one.
1573  */
1574 static int
1575 devfs_apply_reset_rules_caller(char *mountto, int apply)
1576 {
1577         struct devfs_mnt_data *mnt;
1578         size_t len = strlen(mountto);
1579
1580         if (mountto[0] == '*') {
1581                 TAILQ_FOREACH(mnt, &devfs_mnt_list, link) {
1582                         devfs_iterate_topology(mnt->root_node,
1583                                         (apply)?(devfs_rule_check_apply):(devfs_rule_reset_node),
1584                                         NULL);
1585                 }
1586         } else {
1587                 TAILQ_FOREACH(mnt, &devfs_mnt_list, link) {
1588                         if ((len != mnt->mntonnamelen))
1589                                 continue;
1590
1591                         if (!memcmp(mnt->mp->mnt_stat.f_mntonname, mountto, len)) {
1592                                 devfs_iterate_topology(mnt->root_node,
1593                                         (apply)?(devfs_rule_check_apply):(devfs_rule_reset_node),
1594                                         NULL);
1595                                 break;
1596                         }
1597                 }
1598         }
1599
1600         kfree(mountto, M_DEVFS);
1601         return 0;
1602 }
1603
1604 /*
1605  * This function calls a given callback function for
1606  * every dev node in the devfs dev list.
1607  */
1608 static int
1609 devfs_scan_callback_worker(devfs_scan_t *callback)
1610 {
1611         cdev_t dev, dev1;
1612
1613         TAILQ_FOREACH_MUTABLE(dev, &devfs_dev_list, link, dev1) {
1614                 callback(dev);
1615         }
1616
1617         return 0;
1618 }
1619
1620 /*
1621  * This function tries to resolve a given directory, or if not
1622  * found and creation requested, creates the given directory.
1623  */
1624 static struct devfs_node *
1625 devfs_resolve_or_create_dir(struct devfs_node *parent, char *dir_name,
1626                             size_t name_len, int create)
1627 {
1628         struct devfs_node *node, *found = NULL;
1629
1630         TAILQ_FOREACH(node, DEVFS_DENODE_HEAD(parent), link) {
1631                 if (name_len != node->d_dir.d_namlen)
1632                         continue;
1633
1634                 if (!memcmp(dir_name, node->d_dir.d_name, name_len)) {
1635                         found = node;
1636                         break;
1637                 }
1638         }
1639
1640         if ((found == NULL) && (create)) {
1641                 found = devfs_allocp(Pdir, dir_name, parent, parent->mp, NULL);
1642         }
1643
1644         return found;
1645 }
1646
1647 /*
1648  * This function tries to resolve a complete path. If creation is requested,
1649  * if a given part of the path cannot be resolved (because it doesn't exist),
1650  * it is created.
1651  */
1652 struct devfs_node *
1653 devfs_resolve_or_create_path(struct devfs_node *parent, char *path, int create)
1654 {
1655         struct devfs_node *node = parent;
1656         char buf[PATH_MAX];
1657         size_t idx = 0;
1658
1659
1660         if (path == NULL)
1661                 return parent;
1662
1663
1664         for (; *path != '\0' ; path++) {
1665                 if (*path != '/') {
1666                         buf[idx++] = *path;
1667                 } else {
1668                         buf[idx] = '\0';
1669                         node = devfs_resolve_or_create_dir(node, buf, idx, create);
1670                         if (node == NULL)
1671                                 return NULL;
1672                         idx = 0;
1673                 }
1674         }
1675         buf[idx] = '\0';
1676         return devfs_resolve_or_create_dir(node, buf, idx, create);
1677 }
1678
1679 /*
1680  * Takes a full path and strips it into a directory path and a name.
1681  * For a/b/c/foo, it returns foo in namep and a/b/c in pathp. It
1682  * requires a working buffer with enough size to keep the whole
1683  * fullpath.
1684  */
1685 int
1686 devfs_resolve_name_path(char *fullpath, char *buf, char **pathp, char **namep)
1687 {
1688         char *name = NULL;
1689         char *path = NULL;
1690         size_t len = strlen(fullpath) + 1;
1691         int i;
1692
1693         KKASSERT((fullpath != NULL) && (buf != NULL));
1694         KKASSERT((pathp != NULL) && (namep != NULL));
1695
1696         memcpy(buf, fullpath, len);
1697
1698         for (i = len-1; i>= 0; i--) {
1699                 if (buf[i] == '/') {
1700                         buf[i] = '\0';
1701                         name = &(buf[i+1]);
1702                         path = buf;
1703                         break;
1704                 }
1705         }
1706
1707         *pathp = path;
1708
1709         if (name) {
1710                 *namep = name;
1711         } else {
1712                 *namep = buf;
1713         }
1714
1715         return 0;
1716 }
1717
1718 /*
1719  * This function creates a new devfs node for a given device.  It can
1720  * handle a complete path as device name, and accordingly creates
1721  * the path and the final device node.
1722  *
1723  * The reference count on the passed dev remains unchanged.
1724  */
1725 struct devfs_node *
1726 devfs_create_device_node(struct devfs_node *root, cdev_t dev,
1727                          char *dev_name, char *path_fmt, ...)
1728 {
1729         struct devfs_node *parent, *node = NULL;
1730         char *path = NULL;
1731         char *name, name_buf[PATH_MAX];
1732         __va_list ap;
1733         int i, found;
1734
1735         char *create_path = NULL;
1736         char *names = "pqrsPQRS";
1737
1738         if (path_fmt != NULL) {
1739                 path = kmalloc(PATH_MAX+1, M_DEVFS, M_WAITOK);
1740
1741                 __va_start(ap, path_fmt);
1742                 i = kvcprintf(path_fmt, NULL, path, 10, ap);
1743                 path[i] = '\0';
1744                 __va_end(ap);
1745         }
1746
1747         parent = devfs_resolve_or_create_path(root, path, 1);
1748         KKASSERT(parent);
1749
1750         devfs_resolve_name_path(
1751                         ((dev_name == NULL) && (dev))?(dev->si_name):(dev_name),
1752                         name_buf, &create_path, &name);
1753
1754         if (create_path)
1755                 parent = devfs_resolve_or_create_path(parent, create_path, 1);
1756
1757
1758         if (devfs_find_device_node_by_name(parent, name)) {
1759                 devfs_debug(DEVFS_DEBUG_WARNING, "devfs_create_device_node: "
1760                         "DEVICE %s ALREADY EXISTS!!! Ignoring creation request.\n", name);
1761                 goto out;
1762         }
1763
1764         node = devfs_allocp(Pdev, name, parent, parent->mp, dev);
1765         nanotime(&parent->mtime);
1766 #if 0
1767         /*
1768          * Ugly unix98 pty magic, to hide pty master (ptm) devices and their
1769          * directory
1770          */
1771         if ((dev) && (strlen(dev->si_name) >= 4) &&
1772                         (!memcmp(dev->si_name, "ptm/", 4))) {
1773                 node->parent->flags |= DEVFS_HIDDEN;
1774                 node->flags |= DEVFS_HIDDEN;
1775         }
1776 #endif
1777
1778         /*
1779          * Ugly pty magic, to tag pty devices as such and hide them if needed.
1780          */
1781         if ((strlen(name) >= 3) && (!memcmp(name, "pty", 3)))
1782                 node->flags |= (DEVFS_PTY | DEVFS_INVISIBLE);
1783
1784         if ((strlen(name) >= 3) && (!memcmp(name, "tty", 3))) {
1785                 found = 0;
1786                 for (i = 0; i < strlen(names); i++) {
1787                         if (name[3] == names[i]) {
1788                                 found = 1;
1789                                 break;
1790                         }
1791                 }
1792                 if (found)
1793                         node->flags |= (DEVFS_PTY | DEVFS_INVISIBLE);
1794         }
1795
1796 out:
1797         if (path_fmt != NULL)
1798                 kfree(path, M_DEVFS);
1799
1800         return node;
1801 }
1802
1803 /*
1804  * This function finds a given device node in the topology with a given
1805  * cdev.
1806  */
1807 void *
1808 devfs_find_device_node_callback(struct devfs_node *node, cdev_t target)
1809 {
1810         if ((node->node_type == Pdev) && (node->d_dev == target)) {
1811                 return node;
1812         }
1813
1814         return NULL;
1815 }
1816
1817 /*
1818  * This function finds a device node in the given parent directory by its
1819  * name and returns it.
1820  */
1821 struct devfs_node *
1822 devfs_find_device_node_by_name(struct devfs_node *parent, char *target)
1823 {
1824         struct devfs_node *node, *found = NULL;
1825         size_t len = strlen(target);
1826
1827         TAILQ_FOREACH(node, DEVFS_DENODE_HEAD(parent), link) {
1828                 if (len != node->d_dir.d_namlen)
1829                         continue;
1830
1831                 if (!memcmp(node->d_dir.d_name, target, len)) {
1832                         found = node;
1833                         break;
1834                 }
1835         }
1836
1837         return found;
1838 }
1839
1840 static void *
1841 devfs_inode_to_vnode_worker_callback(struct devfs_node *node, ino_t *inop)
1842 {
1843         struct vnode *vp = NULL;
1844         ino_t target = *inop;
1845
1846         if (node->d_dir.d_ino == target) {
1847                 if (node->v_node) {
1848                         vp = node->v_node;
1849                         vget(vp, LK_EXCLUSIVE | LK_RETRY);
1850                         vn_unlock(vp);
1851                 } else {
1852                         devfs_allocv(&vp, node);
1853                         vn_unlock(vp);
1854                 }
1855         }
1856
1857         return vp;
1858 }
1859
1860 /*
1861  * This function takes a cdev and removes its devfs node in the
1862  * given topology.  The cdev remains intact.
1863  */
1864 int
1865 devfs_destroy_device_node(struct devfs_node *root, cdev_t target)
1866 {
1867         struct devfs_node *node, *parent;
1868         char *name, name_buf[PATH_MAX];
1869         char *create_path = NULL;
1870
1871         KKASSERT(target);
1872
1873         memcpy(name_buf, target->si_name, strlen(target->si_name)+1);
1874
1875         devfs_resolve_name_path(target->si_name, name_buf, &create_path, &name);
1876
1877         if (create_path)
1878                 parent = devfs_resolve_or_create_path(root, create_path, 0);
1879         else
1880                 parent = root;
1881
1882         if (parent == NULL)
1883                 return 1;
1884
1885         node = devfs_find_device_node_by_name(parent, name);
1886
1887         if (node) {
1888                 nanotime(&node->parent->mtime);
1889                 devfs_gc(node);
1890         }
1891
1892         return 0;
1893 }
1894
1895 /*
1896  * Just set perms and ownership for given node.
1897  */
1898 int
1899 devfs_set_perms(struct devfs_node *node, uid_t uid, gid_t gid,
1900                 u_short mode, u_long flags)
1901 {
1902         node->mode = mode;
1903         node->uid = uid;
1904         node->gid = gid;
1905
1906         return 0;
1907 }
1908
1909 /*
1910  * Propagates a device attach/detach to all mount
1911  * points. Also takes care of automatic alias removal
1912  * for a deleted cdev.
1913  */
1914 static int
1915 devfs_propagate_dev(cdev_t dev, int attach)
1916 {
1917         struct devfs_mnt_data *mnt;
1918
1919         TAILQ_FOREACH(mnt, &devfs_mnt_list, link) {
1920                 if (attach) {
1921                         /* Device is being attached */
1922                         devfs_create_device_node(mnt->root_node, dev,
1923                                                  NULL, NULL );
1924                 } else {
1925                         /* Device is being detached */
1926                         devfs_alias_remove(dev);
1927                         devfs_destroy_device_node(mnt->root_node, dev);
1928                 }
1929         }
1930         return 0;
1931 }
1932
1933 /*
1934  * devfs_node_to_path takes a node and a buffer of a size of
1935  * at least PATH_MAX, resolves the full path from the root
1936  * node and writes it in a humanly-readable format into the
1937  * buffer.
1938  * If DEVFS_STASH_DEPTH is less than the directory level up
1939  * to the root node, only the last DEVFS_STASH_DEPTH levels
1940  * of the path are resolved.
1941  */
1942 int
1943 devfs_node_to_path(struct devfs_node *node, char *buffer)
1944 {
1945 #define DEVFS_STASH_DEPTH       32
1946         struct devfs_node *node_stash[DEVFS_STASH_DEPTH];
1947         int i, offset;
1948         memset(buffer, 0, PATH_MAX);
1949
1950         for (i = 0; (i < DEVFS_STASH_DEPTH) && (node->node_type != Proot); i++) {
1951                 node_stash[i] = node;
1952                 node = node->parent;
1953         }
1954         i--;
1955
1956         for (offset = 0; i >= 0; i--) {
1957                 memcpy(buffer+offset, node_stash[i]->d_dir.d_name,
1958                                 node_stash[i]->d_dir.d_namlen);
1959                 offset += node_stash[i]->d_dir.d_namlen;
1960                 if (i > 0) {
1961                         *(buffer+offset) = '/';
1962                         offset++;
1963                 }
1964         }
1965 #undef DEVFS_STASH_DEPTH
1966         return 0;
1967 }
1968
1969 /*
1970  * devfs_clone either returns a basename from a complete name by
1971  * returning the length of the name without trailing digits, or,
1972  * if clone != 0, calls the device's clone handler to get a new
1973  * device, which in turn is returned in devp.
1974  */
1975 cdev_t
1976 devfs_clone(cdev_t dev, const char *name, size_t len, int mode,
1977                 struct ucred *cred)
1978 {
1979         int error;
1980         struct devfs_clone_handler *chandler;
1981         struct dev_clone_args ap;
1982
1983         TAILQ_FOREACH(chandler, &devfs_chandler_list, link) {
1984                 if (chandler->namlen != len)
1985                         continue;
1986                 if ((!memcmp(chandler->name, name, len)) && (chandler->nhandler)) {
1987                         lockmgr(&devfs_lock, LK_RELEASE);
1988                         devfs_config();
1989                         lockmgr(&devfs_lock, LK_EXCLUSIVE);
1990
1991                         ap.a_head.a_dev = dev;
1992                         ap.a_dev = NULL;
1993                         ap.a_name = name;
1994                         ap.a_namelen = len;
1995                         ap.a_mode = mode;
1996                         ap.a_cred = cred;
1997                         error = (chandler->nhandler)(&ap);
1998                         if (error)
1999                                 continue;
2000
2001                         return ap.a_dev;
2002                 }
2003         }
2004
2005         return NULL;
2006 }
2007
2008
2009 /*
2010  * Registers a new orphan in the orphan list.
2011  */
2012 void
2013 devfs_tracer_add_orphan(struct devfs_node *node)
2014 {
2015         struct devfs_orphan *orphan;
2016
2017         KKASSERT(node);
2018         orphan = kmalloc(sizeof(struct devfs_orphan), M_DEVFS, M_WAITOK);
2019         orphan->node = node;
2020
2021         KKASSERT((node->flags & DEVFS_ORPHANED) == 0);
2022         node->flags |= DEVFS_ORPHANED;
2023         TAILQ_INSERT_TAIL(DEVFS_ORPHANLIST(node->mp), orphan, link);
2024 }
2025
2026 /*
2027  * Removes an orphan from the orphan list.
2028  */
2029 void
2030 devfs_tracer_del_orphan(struct devfs_node *node)
2031 {
2032         struct devfs_orphan *orphan;
2033
2034         KKASSERT(node);
2035
2036         TAILQ_FOREACH(orphan, DEVFS_ORPHANLIST(node->mp), link) {
2037                 if (orphan->node == node) {
2038                         node->flags &= ~DEVFS_ORPHANED;
2039                         TAILQ_REMOVE(DEVFS_ORPHANLIST(node->mp), orphan, link);
2040                         kfree(orphan, M_DEVFS);
2041                         break;
2042                 }
2043         }
2044 }
2045
2046 /*
2047  * Counts the orphans in the orphan list, and if cleanup
2048  * is specified, also frees the orphan and removes it from
2049  * the list.
2050  */
2051 size_t
2052 devfs_tracer_orphan_count(struct mount *mp, int cleanup)
2053 {
2054         struct devfs_orphan *orphan, *orphan2;
2055         size_t count = 0;
2056
2057         TAILQ_FOREACH_MUTABLE(orphan, DEVFS_ORPHANLIST(mp), link, orphan2)      {
2058                 count++;
2059                 /*
2060                  * If we are instructed to clean up, we do so.
2061                  */
2062                 if (cleanup) {
2063                         TAILQ_REMOVE(DEVFS_ORPHANLIST(mp), orphan, link);
2064                         orphan->node->flags &= ~DEVFS_ORPHANED;
2065                         devfs_freep(orphan->node);
2066                         kfree(orphan, M_DEVFS);
2067                 }
2068         }
2069
2070         return count;
2071 }
2072
2073 /*
2074  * Fetch an ino_t from the global d_ino by increasing it
2075  * while spinlocked.
2076  */
2077 static ino_t
2078 devfs_fetch_ino(void)
2079 {
2080         ino_t   ret;
2081
2082         spin_lock_wr(&ino_lock);
2083         ret = d_ino++;
2084         spin_unlock_wr(&ino_lock);
2085
2086         return ret;
2087 }
2088
2089 /*
2090  * Allocates a new cdev and initializes it's most basic
2091  * fields.
2092  */
2093 cdev_t
2094 devfs_new_cdev(struct dev_ops *ops, int minor)
2095 {
2096         cdev_t dev = sysref_alloc(&cdev_sysref_class);
2097         sysref_activate(&dev->si_sysref);
2098         reference_dev(dev);
2099         memset(dev, 0, offsetof(struct cdev, si_sysref));
2100
2101         dev->si_uid = 0;
2102         dev->si_gid = 0;
2103         dev->si_perms = 0;
2104         dev->si_drv1 = NULL;
2105         dev->si_drv2 = NULL;
2106         dev->si_lastread = 0;           /* time_second */
2107         dev->si_lastwrite = 0;          /* time_second */
2108
2109         dev->si_ops = ops;
2110         dev->si_flags = 0;
2111         dev->si_umajor = 0;
2112         dev->si_uminor = minor;
2113         dev->si_inode = makeudev(devfs_reference_ops(ops), minor);
2114
2115         return dev;
2116 }
2117
2118 static void
2119 devfs_cdev_terminate(cdev_t dev)
2120 {
2121         int locked = 0;
2122
2123         /* Check if it is locked already. if not, we acquire the devfs lock */
2124         if (!(lockstatus(&devfs_lock, curthread)) == LK_EXCLUSIVE) {
2125                 lockmgr(&devfs_lock, LK_EXCLUSIVE);
2126                 locked = 1;
2127         }
2128
2129         /* Propagate destruction, just in case */
2130         devfs_propagate_dev(dev, 0);
2131
2132         /* If we acquired the lock, we also get rid of it */
2133         if (locked)
2134                 lockmgr(&devfs_lock, LK_RELEASE);
2135
2136         devfs_release_ops(dev->si_ops);
2137
2138         /* Finally destroy the device */
2139         sysref_put(&dev->si_sysref);
2140 }
2141
2142 /*
2143  * Links a given cdev into the dev list.
2144  */
2145 int
2146 devfs_link_dev(cdev_t dev)
2147 {
2148         KKASSERT((dev->si_flags & SI_DEVFS_LINKED) == 0);
2149         dev->si_flags |= SI_DEVFS_LINKED;
2150         TAILQ_INSERT_TAIL(&devfs_dev_list, dev, link);
2151
2152         return 0;
2153 }
2154
2155 /*
2156  * Removes a given cdev from the dev list.  The caller is responsible for
2157  * releasing the reference on the device associated with the linkage.
2158  *
2159  * Returns EALREADY if the dev has already been unlinked.
2160  */
2161 static int
2162 devfs_unlink_dev(cdev_t dev)
2163 {
2164         if ((dev->si_flags & SI_DEVFS_LINKED)) {
2165                 TAILQ_REMOVE(&devfs_dev_list, dev, link);
2166                 dev->si_flags &= ~SI_DEVFS_LINKED;
2167                 return (0);
2168         }
2169         return (EALREADY);
2170 }
2171
2172 int
2173 devfs_node_is_accessible(struct devfs_node *node)
2174 {
2175         if ((node) && (!(node->flags & DEVFS_HIDDEN)))
2176                 return 1;
2177         else
2178                 return 0;
2179 }
2180
2181 int
2182 devfs_reference_ops(struct dev_ops *ops)
2183 {
2184         int unit;
2185
2186         if (ops->head.refs == 0) {
2187                 ops->head.id = devfs_clone_bitmap_get(&DEVFS_CLONE_BITMAP(ops_id), 255);
2188                 if (ops->head.id == -1) {
2189                         /* Ran out of unique ids */
2190                         devfs_debug(DEVFS_DEBUG_WARNING,
2191                                         "devfs_reference_ops: WARNING: ran out of unique ids\n");
2192                 }
2193         }
2194         unit = ops->head.id;
2195         ++ops->head.refs;
2196
2197         return unit;
2198 }
2199
2200 void
2201 devfs_release_ops(struct dev_ops *ops)
2202 {
2203         --ops->head.refs;
2204
2205         if (ops->head.refs == 0) {
2206                 devfs_clone_bitmap_put(&DEVFS_CLONE_BITMAP(ops_id), ops->head.id);
2207         }
2208 }
2209
2210 void
2211 devfs_config(void)
2212 {
2213         devfs_msg_t msg;
2214
2215         msg = devfs_msg_get();
2216         msg = devfs_msg_send_sync(DEVFS_SYNC, msg);
2217         devfs_msg_put(msg);
2218 }
2219
2220 /*
2221  * Called on init of devfs; creates the objcaches and
2222  * spawns off the devfs core thread. Also initializes
2223  * locks.
2224  */
2225 static void
2226 devfs_init(void)
2227 {
2228         devfs_debug(DEVFS_DEBUG_DEBUG, "devfs_init() called\n");
2229         /* Create objcaches for nodes, msgs and devs */
2230         devfs_node_cache = objcache_create("devfs-node-cache", 0, 0,
2231                                            NULL, NULL, NULL,
2232                                            objcache_malloc_alloc,
2233                                            objcache_malloc_free,
2234                                            &devfs_node_malloc_args );
2235
2236         devfs_msg_cache = objcache_create("devfs-msg-cache", 0, 0,
2237                                           NULL, NULL, NULL,
2238                                           objcache_malloc_alloc,
2239                                           objcache_malloc_free,
2240                                           &devfs_msg_malloc_args );
2241
2242         devfs_dev_cache = objcache_create("devfs-dev-cache", 0, 0,
2243                                           NULL, NULL, NULL,
2244                                           objcache_malloc_alloc,
2245                                           objcache_malloc_free,
2246                                           &devfs_dev_malloc_args );
2247
2248         devfs_clone_bitmap_init(&DEVFS_CLONE_BITMAP(ops_id));
2249
2250         /* Initialize the reply-only port which acts as a message drain */
2251         lwkt_initport_replyonly(&devfs_dispose_port, devfs_msg_autofree_reply);
2252
2253         /* Initialize *THE* devfs lock */
2254         lockinit(&devfs_lock, "devfs_core lock", 0, 0);
2255
2256
2257         lwkt_create(devfs_msg_core, /*args*/NULL, &td_core, NULL,
2258                     0, 0, "devfs_msg_core");
2259
2260         tsleep(td_core/*devfs_id*/, 0, "devfsc", 0);
2261
2262         devfs_debug(DEVFS_DEBUG_DEBUG, "devfs_init finished\n");
2263 }
2264
2265 /*
2266  * Called on unload of devfs; takes care of destroying the core
2267  * and the objcaches. Also removes aliases that are no longer needed.
2268  */
2269 static void
2270 devfs_uninit(void)
2271 {
2272         devfs_debug(DEVFS_DEBUG_DEBUG, "devfs_uninit() called\n");
2273
2274         devfs_msg_send(DEVFS_TERMINATE_CORE, NULL);
2275
2276         tsleep(td_core/*devfs_id*/, 0, "devfsc", 0);
2277         tsleep(td_core/*devfs_id*/, 0, "devfsc", 10000);
2278
2279         devfs_clone_bitmap_uninit(&DEVFS_CLONE_BITMAP(ops_id));
2280
2281         /* Destroy the objcaches */
2282         objcache_destroy(devfs_msg_cache);
2283         objcache_destroy(devfs_node_cache);
2284         objcache_destroy(devfs_dev_cache);
2285
2286         devfs_alias_reap();
2287 }
2288
2289 /*
2290  * This is a sysctl handler to assist userland devname(3) to
2291  * find the device name for a given udev.
2292  */
2293 static int
2294 devfs_sysctl_devname_helper(SYSCTL_HANDLER_ARGS)
2295 {
2296         udev_t  udev;
2297         cdev_t  found;
2298         int             error;
2299
2300
2301         if ((error = SYSCTL_IN(req, &udev, sizeof(udev_t))))
2302                 return (error);
2303
2304         devfs_debug(DEVFS_DEBUG_DEBUG, "devfs sysctl, received udev: %d\n", udev);
2305
2306         if (udev == NOUDEV)
2307                 return(EINVAL);
2308
2309         if ((found = devfs_find_device_by_udev(udev)) == NULL)
2310                 return(ENOENT);
2311
2312         return(SYSCTL_OUT(req, found->si_name, strlen(found->si_name) + 1));
2313 }
2314
2315
2316 SYSCTL_PROC(_kern, OID_AUTO, devname, CTLTYPE_OPAQUE|CTLFLAG_RW|CTLFLAG_ANYBODY,
2317                         NULL, 0, devfs_sysctl_devname_helper, "", "helper for devname(3)");
2318
2319 static SYSCTL_NODE(_vfs, OID_AUTO, devfs, CTLFLAG_RW, 0, "devfs");
2320 TUNABLE_INT("vfs.devfs.debug", &devfs_debug_enable);
2321 SYSCTL_INT(_vfs_devfs, OID_AUTO, debug, CTLFLAG_RW, &devfs_debug_enable,
2322                 0, "Enable DevFS debugging");
2323
2324 SYSINIT(vfs_devfs_register, SI_SUB_PRE_DRIVERS, SI_ORDER_FIRST,
2325                 devfs_init, NULL);
2326 SYSUNINIT(vfs_devfs_register, SI_SUB_PRE_DRIVERS, SI_ORDER_ANY,
2327                 devfs_uninit, NULL);