DEVFS - Add required vget when disassociating a vnode from a node.
[dragonfly.git] / sys / vfs / devfs / devfs_core.c
1 /*
2  * Copyright (c) 2009 The DragonFly Project.  All rights reserved.
3  *
4  * This code is derived from software contributed to The DragonFly Project
5  * by Alex Hornung <ahornung@gmail.com>
6  *
7  * Redistribution and use in source and binary forms, with or without
8  * modification, are permitted provided that the following conditions
9  * are met:
10  *
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer.
13  * 2. Redistributions in binary form must reproduce the above copyright
14  *    notice, this list of conditions and the following disclaimer in
15  *    the documentation and/or other materials provided with the
16  *    distribution.
17  * 3. Neither the name of The DragonFly Project nor the names of its
18  *    contributors may be used to endorse or promote products derived
19  *    from this software without specific, prior written permission.
20  *
21  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22  * ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23  * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
24  * FOR A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE
25  * COPYRIGHT HOLDERS OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
26  * INCIDENTAL, SPECIAL, EXEMPLARY OR CONSEQUENTIAL DAMAGES (INCLUDING,
27  * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
28  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED
29  * AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
30  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
31  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
32  * SUCH DAMAGE.
33  */
34 #include <sys/param.h>
35 #include <sys/systm.h>
36 #include <sys/kernel.h>
37 #include <sys/mount.h>
38 #include <sys/vnode.h>
39 #include <sys/types.h>
40 #include <sys/lock.h>
41 #include <sys/msgport.h>
42 #include <sys/msgport2.h>
43 #include <sys/spinlock2.h>
44 #include <sys/sysctl.h>
45 #include <sys/ucred.h>
46 #include <sys/param.h>
47 #include <sys/sysref2.h>
48 #include <sys/systm.h>
49 #include <vfs/devfs/devfs.h>
50 #include <vfs/devfs/devfs_rules.h>
51
52 MALLOC_DEFINE(M_DEVFS, "devfs", "Device File System (devfs) allocations");
53 DEVFS_DECLARE_CLONE_BITMAP(ops_id);
54 /*
55  * SYSREF Integration - reference counting, allocation,
56  * sysid and syslink integration.
57  */
58 static void devfs_cdev_terminate(cdev_t dev);
59 static struct sysref_class     cdev_sysref_class = {
60         .name =         "cdev",
61         .mtype =        M_DEVFS,
62         .proto =        SYSREF_PROTO_DEV,
63         .offset =       offsetof(struct cdev, si_sysref),
64         .objsize =      sizeof(struct cdev),
65         .mag_capacity = 32,
66         .flags =        0,
67         .ops =  {
68                 .terminate = (sysref_terminate_func_t)devfs_cdev_terminate
69         }
70 };
71
72 static struct objcache  *devfs_node_cache;
73 static struct objcache  *devfs_msg_cache;
74 static struct objcache  *devfs_dev_cache;
75
76 static struct objcache_malloc_args devfs_node_malloc_args = {
77         sizeof(struct devfs_node), M_DEVFS };
78 struct objcache_malloc_args devfs_msg_malloc_args = {
79         sizeof(struct devfs_msg), M_DEVFS };
80 struct objcache_malloc_args devfs_dev_malloc_args = {
81         sizeof(struct cdev), M_DEVFS };
82
83 static struct devfs_dev_head devfs_dev_list =
84                 TAILQ_HEAD_INITIALIZER(devfs_dev_list);
85 static struct devfs_mnt_head devfs_mnt_list =
86                 TAILQ_HEAD_INITIALIZER(devfs_mnt_list);
87 static struct devfs_chandler_head devfs_chandler_list =
88                 TAILQ_HEAD_INITIALIZER(devfs_chandler_list);
89 static struct devfs_alias_head devfs_alias_list =
90                 TAILQ_HEAD_INITIALIZER(devfs_alias_list);
91
92 struct lock             devfs_lock;
93 static struct lwkt_port devfs_dispose_port;
94 static struct lwkt_port devfs_msg_port;
95 static struct thread    *td_core;
96
97 static struct spinlock  ino_lock;
98 static ino_t    d_ino;
99 static int      devfs_debug_enable;
100 static int      devfs_run;
101
102 static ino_t devfs_fetch_ino(void);
103 static int devfs_gc_dirs(struct devfs_node *);
104 static int devfs_gc_links(struct devfs_node *, struct devfs_node *, size_t);
105 static int devfs_create_all_dev_worker(struct devfs_node *);
106 static int devfs_create_dev_worker(cdev_t, uid_t, gid_t, int);
107 static int devfs_destroy_dev_worker(cdev_t);
108 static int devfs_destroy_subnames_worker(char *);
109 static int devfs_destroy_dev_by_ops_worker(struct dev_ops *, int);
110 static int devfs_propagate_dev(cdev_t, int);
111 static int devfs_unlink_dev(cdev_t dev);
112 static void devfs_msg_exec(devfs_msg_t msg);
113
114 static int devfs_chandler_add_worker(char *, d_clone_t *);
115 static int devfs_chandler_del_worker(char *);
116
117 static void devfs_msg_autofree_reply(lwkt_port_t, lwkt_msg_t);
118 static void devfs_msg_core(void *);
119
120 static int devfs_find_device_by_name_worker(devfs_msg_t);
121 static int devfs_find_device_by_udev_worker(devfs_msg_t);
122
123 static struct vnode *devfs_inode_to_vnode_worker(struct devfs_node *, ino_t);
124
125 static int devfs_apply_reset_rules_caller(char *, int);
126 static int devfs_apply_reset_rules_worker(struct devfs_node *, int);
127
128 static int devfs_scan_callback_worker(devfs_scan_t *);
129
130 static struct devfs_node *devfs_resolve_or_create_dir(struct devfs_node *,
131                 char *, size_t, int);
132
133 static int devfs_make_alias_worker(struct devfs_alias *);
134 static int devfs_alias_remove(cdev_t);
135 static int devfs_alias_reap(void);
136 static int devfs_alias_propagate(struct devfs_alias *);
137 static int devfs_alias_apply(struct devfs_node *, struct devfs_alias *);
138 static int devfs_alias_check_create(struct devfs_node *);
139
140 static int devfs_clr_subnames_flag_worker(char *, uint32_t);
141 static int devfs_destroy_subnames_without_flag_worker(char *, uint32_t);
142
143 /*
144  * devfs_debug() is a SYSCTL and TUNABLE controlled debug output function
145  * using kvprintf
146  */
147 int
148 devfs_debug(int level, char *fmt, ...)
149 {
150         __va_list ap;
151
152         __va_start(ap, fmt);
153         if (level <= devfs_debug_enable)
154                 kvprintf(fmt, ap);
155         __va_end(ap);
156
157         return 0;
158 }
159
160 /*
161  * devfs_allocp() Allocates a new devfs node with the specified
162  * parameters. The node is also automatically linked into the topology
163  * if a parent is specified. It also calls the rule and alias stuff to
164  * be applied on the new node
165  */
166 struct devfs_node *
167 devfs_allocp(devfs_nodetype devfsnodetype, char *name,
168              struct devfs_node *parent, struct mount *mp, cdev_t dev)
169 {
170         struct devfs_node *node = NULL;
171         size_t namlen = strlen(name);
172
173         node = objcache_get(devfs_node_cache, M_WAITOK);
174         bzero(node, sizeof(*node));
175
176         atomic_add_int(&(DEVFS_MNTDATA(mp)->leak_count), 1);
177
178         node->d_dev = NULL;
179         node->nchildren = 1;
180         node->mp = mp;
181         node->d_dir.d_ino = devfs_fetch_ino();
182
183         /*
184          * Cookie jar for children. Leave 0 and 1 for '.' and '..' entries
185          * respectively.
186          */
187         node->cookie_jar = 2;
188
189         /*
190          * Access Control members
191          */
192         node->mode = DEVFS_DEFAULT_MODE;
193         node->uid = DEVFS_DEFAULT_UID;
194         node->gid = DEVFS_DEFAULT_GID;
195
196         switch (devfsnodetype) {
197         case Proot:
198                 /*
199                  * Ensure that we don't recycle the root vnode by marking it as
200                  * linked into the topology.
201                  */
202                 node->flags |= DEVFS_NODE_LINKED;
203         case Pdir:
204                 TAILQ_INIT(DEVFS_DENODE_HEAD(node));
205                 node->d_dir.d_type = DT_DIR;
206                 node->nchildren = 2;
207                 break;
208
209         case Plink:
210                 node->d_dir.d_type = DT_LNK;
211                 break;
212
213         case Preg:
214                 node->d_dir.d_type = DT_REG;
215                 break;
216
217         case Pdev:
218                 if (dev != NULL) {
219                         node->d_dir.d_type = DT_CHR;
220                         node->d_dev = dev;
221
222                         node->mode = dev->si_perms;
223                         node->uid = dev->si_uid;
224                         node->gid = dev->si_gid;
225
226                         devfs_alias_check_create(node);
227                 }
228                 break;
229
230         default:
231                 panic("devfs_allocp: unknown node type");
232         }
233
234         node->v_node = NULL;
235         node->node_type = devfsnodetype;
236
237         /* Initialize the dirent structure of each devfs vnode */
238         KKASSERT(namlen < 256);
239         node->d_dir.d_namlen = namlen;
240         node->d_dir.d_name = kmalloc(namlen+1, M_DEVFS, M_WAITOK);
241         memcpy(node->d_dir.d_name, name, namlen);
242         node->d_dir.d_name[namlen] = '\0';
243
244         /* Initialize the parent node element */
245         node->parent = parent;
246
247         /* Apply rules */
248         devfs_rule_check_apply(node);
249
250         /* Initialize *time members */
251         nanotime(&node->atime);
252         node->mtime = node->ctime = node->atime;
253
254         /*
255          * Associate with parent as last step, clean out namecache
256          * reference.
257          */
258         if ((parent != NULL) &&
259             ((parent->node_type == Proot) || (parent->node_type == Pdir))) {
260                 parent->nchildren++;
261                 node->cookie = parent->cookie_jar++;
262                 node->flags |= DEVFS_NODE_LINKED;
263                 TAILQ_INSERT_TAIL(DEVFS_DENODE_HEAD(parent), node, link);
264
265                 /* This forces negative namecache lookups to clear */
266                 ++mp->mnt_namecache_gen;
267         }
268
269         return node;
270 }
271
272 /*
273  * devfs_allocv() allocates a new vnode based on a devfs node.
274  */
275 int
276 devfs_allocv(struct vnode **vpp, struct devfs_node *node)
277 {
278         struct vnode *vp;
279         int error = 0;
280
281         KKASSERT(node);
282
283 try_again:
284         while ((vp = node->v_node) != NULL) {
285                 error = vget(vp, LK_EXCLUSIVE);
286                 if (error != ENOENT) {
287                         *vpp = vp;
288                         goto out;
289                 }
290         }
291
292         if ((error = getnewvnode(VT_DEVFS, node->mp, vpp, 0, 0)) != 0)
293                 goto out;
294
295         vp = *vpp;
296
297         if (node->v_node != NULL) {
298                 vp->v_type = VBAD;
299                 vx_put(vp);
300                 goto try_again;
301         }
302
303         vp->v_data = node;
304         node->v_node = vp;
305
306         switch (node->node_type) {
307         case Proot:
308                 vp->v_flag |= VROOT;
309         case Pdir:
310                 vp->v_type = VDIR;
311                 break;
312
313         case Plink:
314                 vp->v_type = VLNK;
315                 break;
316
317         case Preg:
318                 vp->v_type = VREG;
319                 break;
320
321         case Pdev:
322                 vp->v_type = VCHR;
323                 KKASSERT(node->d_dev);
324
325                 vp->v_uminor = node->d_dev->si_uminor;
326                 vp->v_umajor = 0;
327
328                 v_associate_rdev(vp, node->d_dev);
329                 vp->v_ops = &node->mp->mnt_vn_spec_ops;
330                 break;
331
332         default:
333                 panic("devfs_allocv: unknown node type");
334         }
335
336 out:
337         return error;
338 }
339
340 /*
341  * devfs_allocvp allocates both a devfs node (with the given settings) and a vnode
342  * based on the newly created devfs node.
343  */
344 int
345 devfs_allocvp(struct mount *mp, struct vnode **vpp, devfs_nodetype devfsnodetype,
346                 char *name, struct devfs_node *parent, cdev_t dev)
347 {
348         struct devfs_node *node;
349
350         node = devfs_allocp(devfsnodetype, name, parent, mp, dev);
351
352         if (node != NULL)
353                 devfs_allocv(vpp, node);
354         else
355                 *vpp = NULL;
356
357         return 0;
358 }
359
360 /*
361  * Destroy the devfs_node.  The node must be unlinked from the topology.
362  *
363  * This function will also destroy any vnode association with the node
364  * and device.
365  *
366  * The cdev_t itself remains intact.
367  */
368 int
369 devfs_freep(struct devfs_node *node)
370 {
371         struct vnode *vp;
372
373         KKASSERT(node);
374         KKASSERT(((node->flags & DEVFS_NODE_LINKED) == 0) ||
375                  (node->node_type == Proot));
376         KKASSERT((node->flags & DEVFS_DESTROYED) == 0);
377
378         atomic_subtract_int(&(DEVFS_MNTDATA(node->mp)->leak_count), 1);
379         if (node->symlink_name) {
380                 kfree(node->symlink_name, M_DEVFS);
381                 node->symlink_name = NULL;
382         }
383
384         /*
385          * Remove the node from the orphan list if it is still on it.
386          */
387         if (node->flags & DEVFS_ORPHANED)
388                 devfs_tracer_del_orphan(node);
389
390         /*
391          * Disassociate the vnode from the node.  This also prevents the
392          * vnode's reclaim code from double-freeing the node.
393          *
394          * The vget is needed to safely modify the vp.  It also serves
395          * to cycle the refs and terminate the vnode if it happens to
396          * be inactive, otherwise namecache references may not get cleared.
397          */
398         while ((vp = node->v_node) != NULL) {
399                 if (vget(vp, LK_EXCLUSIVE | LK_RETRY) != 0)
400                         break;
401                 v_release_rdev(vp);
402                 vp->v_data = NULL;
403                 node->v_node = NULL;
404                 vput(vp);
405         }
406         if (node->d_dir.d_name)
407                 kfree(node->d_dir.d_name, M_DEVFS);
408         node->flags |= DEVFS_DESTROYED;
409
410         objcache_put(devfs_node_cache, node);
411
412         return 0;
413 }
414
415 /*
416  * Unlink the devfs node from the topology and add it to the orphan list.
417  * The node will later be destroyed by freep.
418  *
419  * Any vnode association, including the v_rdev and v_data, remains intact
420  * until the freep.
421  */
422 int
423 devfs_unlinkp(struct devfs_node *node)
424 {
425         struct devfs_node *parent;
426         KKASSERT(node);
427
428         /*
429          * Add the node to the orphan list, so it is referenced somewhere, to
430          * so we don't leak it.
431          */
432         devfs_tracer_add_orphan(node);
433
434         parent = node->parent;
435
436         /*
437          * If the parent is known we can unlink the node out of the topology
438          */
439         if (parent)     {
440                 TAILQ_REMOVE(DEVFS_DENODE_HEAD(parent), node, link);
441                 parent->nchildren--;
442                 KKASSERT((parent->nchildren >= 0));
443                 node->flags &= ~DEVFS_NODE_LINKED;
444         }
445         node->parent = NULL;
446         return 0;
447 }
448
449 /*
450  * devfs_reaperp() is a recursive function that iterates through all the
451  * topology, unlinking and freeing all devfs nodes.
452  */
453 int
454 devfs_reaperp(struct devfs_node *node)
455 {
456         struct devfs_node *node1, *node2;
457
458         if ((node->node_type == Proot) || (node->node_type == Pdir)) {
459                 if (node->nchildren > 2) {
460                         TAILQ_FOREACH_MUTABLE(node1, DEVFS_DENODE_HEAD(node),
461                                                         link, node2) {
462                                 devfs_reaperp(node1);
463                         }
464                 }
465         }
466         devfs_unlinkp(node);
467         devfs_freep(node);
468
469         return 0;
470 }
471
472 /*
473  * devfs_gc() is devfs garbage collector. It takes care of unlinking and
474  * freeing a node, but also removes empty directories and links that link
475  * via devfs auto-link mechanism to the node being deleted.
476  */
477 int
478 devfs_gc(struct devfs_node *node)
479 {
480         struct devfs_node *root_node = DEVFS_MNTDATA(node->mp)->root_node;
481
482         devfs_gc_links(root_node, node, node->nlinks);
483         devfs_unlinkp(node);
484         devfs_gc_dirs(root_node);
485
486         devfs_freep(node);
487
488         return 0;
489 }
490
491 /*
492  * devfs_gc_dirs() is a helper function for devfs_gc, unlinking and freeing
493  * empty directories.
494  */
495 static int
496 devfs_gc_dirs(struct devfs_node *node)
497 {
498         struct devfs_node *node1, *node2;
499
500         if ((node->node_type == Proot) || (node->node_type == Pdir)) {
501                 if (node->nchildren > 2) {
502                         TAILQ_FOREACH_MUTABLE(node1, DEVFS_DENODE_HEAD(node),
503                                                   link, node2) {
504                                 devfs_gc_dirs(node1);
505                         }
506                 }
507
508                 if (node->nchildren == 2) {
509                         devfs_unlinkp(node);
510                         devfs_freep(node);
511                 }
512         }
513
514         return 0;
515 }
516
517 /*
518  * devfs_gc_links() is a helper function for devfs_gc, unlinking and freeing
519  * eauto-linked nodes linking to the node being deleted.
520  */
521 static int
522 devfs_gc_links(struct devfs_node *node, struct devfs_node *target,
523                size_t nlinks)
524 {
525         struct devfs_node *node1, *node2;
526
527         if (nlinks > 0) {
528                 if ((node->node_type == Proot) || (node->node_type == Pdir)) {
529                         if (node->nchildren > 2) {
530                                 TAILQ_FOREACH_MUTABLE(node1, DEVFS_DENODE_HEAD(node),
531                                                         link, node2) {
532                                         nlinks = devfs_gc_links(node1, target, nlinks);
533                                 }
534                         }
535                 } else if (node->link_target == target) {
536                         nlinks--;
537                         devfs_unlinkp(node);
538                         devfs_freep(node);
539                 }
540         }
541
542         KKASSERT(nlinks >= 0);
543
544         return nlinks;
545 }
546
547 /*
548  * devfs_create_dev() is the asynchronous entry point for device creation.
549  * It just sends a message with the relevant details to the devfs core.
550  *
551  * This function will reference the passed device.  The reference is owned
552  * by devfs and represents all of the device's node associations.
553  */
554 int
555 devfs_create_dev(cdev_t dev, uid_t uid, gid_t gid, int perms)
556 {
557         reference_dev(dev);
558         devfs_msg_send_dev(DEVFS_DEVICE_CREATE, dev, uid, gid, perms);
559
560         return 0;
561 }
562
563 /*
564  * devfs_destroy_dev() is the asynchronous entry point for device destruction.
565  * It just sends a message with the relevant details to the devfs core.
566  */
567 int
568 devfs_destroy_dev(cdev_t dev)
569 {
570         devfs_msg_send_dev(DEVFS_DEVICE_DESTROY, dev, 0, 0, 0);
571         return 0;
572 }
573
574 /*
575  * devfs_mount_add() is the synchronous entry point for adding a new devfs
576  * mount.  It sends a synchronous message with the relevant details to the
577  * devfs core.
578  */
579 int
580 devfs_mount_add(struct devfs_mnt_data *mnt)
581 {
582         devfs_msg_t msg;
583
584         msg = devfs_msg_get();
585         msg->mdv_mnt = mnt;
586         msg = devfs_msg_send_sync(DEVFS_MOUNT_ADD, msg);
587         devfs_msg_put(msg);
588
589         return 0;
590 }
591
592 /*
593  * devfs_mount_del() is the synchronous entry point for removing a devfs mount.
594  * It sends a synchronous message with the relevant details to the devfs core.
595  */
596 int
597 devfs_mount_del(struct devfs_mnt_data *mnt)
598 {
599         devfs_msg_t msg;
600
601         msg = devfs_msg_get();
602         msg->mdv_mnt = mnt;
603         msg = devfs_msg_send_sync(DEVFS_MOUNT_DEL, msg);
604         devfs_msg_put(msg);
605
606         return 0;
607 }
608
609 /*
610  * devfs_destroy_subnames() is the synchronous entry point for device
611  * destruction by subname. It just sends a message with the relevant details to
612  * the devfs core.
613  */
614 int
615 devfs_destroy_subnames(char *name)
616 {
617         devfs_msg_t msg;
618
619         msg = devfs_msg_get();
620         msg->mdv_load = name;
621         msg = devfs_msg_send_sync(DEVFS_DESTROY_SUBNAMES, msg);
622         devfs_msg_put(msg);
623         return 0;
624 }
625
626 int
627 devfs_clr_subnames_flag(char *name, uint32_t flag)
628 {
629         devfs_msg_t msg;
630
631         msg = devfs_msg_get();
632         msg->mdv_flags.name = name;
633         msg->mdv_flags.flag = flag;
634         msg = devfs_msg_send_sync(DEVFS_CLR_SUBNAMES_FLAG, msg);
635         devfs_msg_put(msg);
636
637         return 0;
638 }
639
640 int
641 devfs_destroy_subnames_without_flag(char *name, uint32_t flag)
642 {
643         devfs_msg_t msg;
644
645         msg = devfs_msg_get();
646         msg->mdv_flags.name = name;
647         msg->mdv_flags.flag = flag;
648         msg = devfs_msg_send_sync(DEVFS_DESTROY_SUBNAMES_WO_FLAG, msg);
649         devfs_msg_put(msg);
650
651         return 0;
652 }
653
654 /*
655  * devfs_create_all_dev is the asynchronous entry point to trigger device
656  * node creation.  It just sends a message with the relevant details to
657  * the devfs core.
658  */
659 int
660 devfs_create_all_dev(struct devfs_node *root)
661 {
662         devfs_msg_send_generic(DEVFS_CREATE_ALL_DEV, root);
663         return 0;
664 }
665
666 /*
667  * devfs_destroy_dev_by_ops is the asynchronous entry point to destroy all
668  * devices with a specific set of dev_ops and minor.  It just sends a
669  * message with the relevant details to the devfs core.
670  */
671 int
672 devfs_destroy_dev_by_ops(struct dev_ops *ops, int minor)
673 {
674         devfs_msg_send_ops(DEVFS_DESTROY_DEV_BY_OPS, ops, minor);
675         return 0;
676 }
677
678 /*
679  * devfs_clone_handler_add is the synchronous entry point to add a new
680  * clone handler.  It just sends a message with the relevant details to
681  * the devfs core.
682  */
683 int
684 devfs_clone_handler_add(char *name, d_clone_t *nhandler)
685 {
686         devfs_msg_t msg;
687
688         msg = devfs_msg_get();
689         msg->mdv_chandler.name = name;
690         msg->mdv_chandler.nhandler = nhandler;
691         msg = devfs_msg_send_sync(DEVFS_CHANDLER_ADD, msg);
692         devfs_msg_put(msg);
693         return 0;
694 }
695
696 /*
697  * devfs_clone_handler_del is the synchronous entry point to remove a
698  * clone handler.  It just sends a message with the relevant details to
699  * the devfs core.
700  */
701 int
702 devfs_clone_handler_del(char *name)
703 {
704         devfs_msg_t msg;
705
706         msg = devfs_msg_get();
707         msg->mdv_chandler.name = name;
708         msg->mdv_chandler.nhandler = NULL;
709         msg = devfs_msg_send_sync(DEVFS_CHANDLER_DEL, msg);
710         devfs_msg_put(msg);
711         return 0;
712 }
713
714 /*
715  * devfs_find_device_by_name is the synchronous entry point to find a
716  * device given its name.  It sends a synchronous message with the
717  * relevant details to the devfs core and returns the answer.
718  */
719 cdev_t
720 devfs_find_device_by_name(const char *fmt, ...)
721 {
722         cdev_t found = NULL;
723         devfs_msg_t msg;
724         char target[PATH_MAX+1];
725         __va_list ap;
726         int i;
727
728         if (fmt == NULL)
729                 return NULL;
730
731         __va_start(ap, fmt);
732         i = kvcprintf(fmt, NULL, target, 10, ap);
733         target[i] = '\0';
734         __va_end(ap);
735
736         msg = devfs_msg_get();
737         msg->mdv_name = target;
738         msg = devfs_msg_send_sync(DEVFS_FIND_DEVICE_BY_NAME, msg);
739         found = msg->mdv_cdev;
740         devfs_msg_put(msg);
741
742         return found;
743 }
744
745 /*
746  * devfs_find_device_by_udev is the synchronous entry point to find a
747  * device given its udev number.  It sends a synchronous message with
748  * the relevant details to the devfs core and returns the answer.
749  */
750 cdev_t
751 devfs_find_device_by_udev(udev_t udev)
752 {
753         cdev_t found = NULL;
754         devfs_msg_t msg;
755
756         msg = devfs_msg_get();
757         msg->mdv_udev = udev;
758         msg = devfs_msg_send_sync(DEVFS_FIND_DEVICE_BY_UDEV, msg);
759         found = msg->mdv_cdev;
760         devfs_msg_put(msg);
761
762         devfs_debug(DEVFS_DEBUG_DEBUG,
763                     "devfs_find_device_by_udev found? %s  -end:3-\n",
764                     ((found) ? found->si_name:"NO"));
765         return found;
766 }
767
768 struct vnode *
769 devfs_inode_to_vnode(struct mount *mp, ino_t target)
770 {
771         struct vnode *vp = NULL;
772         devfs_msg_t msg;
773
774         if (mp == NULL)
775                 return NULL;
776
777         msg = devfs_msg_get();
778         msg->mdv_ino.mp = mp;
779         msg->mdv_ino.ino = target;
780         msg = devfs_msg_send_sync(DEVFS_INODE_TO_VNODE, msg);
781         vp = msg->mdv_ino.vp;
782         vn_lock(vp, LK_EXCLUSIVE | LK_RETRY);
783         devfs_msg_put(msg);
784
785         return vp;
786 }
787
788 /*
789  * devfs_make_alias is the asynchronous entry point to register an alias
790  * for a device.  It just sends a message with the relevant details to the
791  * devfs core.
792  */
793 int
794 devfs_make_alias(char *name, cdev_t dev_target)
795 {
796         struct devfs_alias *alias;
797         size_t len;
798
799         len = strlen(name);
800
801         alias = kmalloc(sizeof(struct devfs_alias), M_DEVFS, M_WAITOK);
802         alias->name = kmalloc(len + 1, M_DEVFS, M_WAITOK);
803         memcpy(alias->name, name, len + 1);
804         alias->namlen = len;
805         alias->dev_target = dev_target;
806
807         devfs_msg_send_generic(DEVFS_MAKE_ALIAS, alias);
808         return 0;
809 }
810
811 /*
812  * devfs_apply_rules is the asynchronous entry point to trigger application
813  * of all rules.  It just sends a message with the relevant details to the
814  * devfs core.
815  */
816 int
817 devfs_apply_rules(char *mntto)
818 {
819         char *new_name;
820         size_t  namelen;
821
822         namelen = strlen(mntto) + 1;
823         new_name = kmalloc(namelen, M_DEVFS, M_WAITOK);
824         memcpy(new_name, mntto, namelen);
825         devfs_msg_send_name(DEVFS_APPLY_RULES, new_name);
826
827         return 0;
828 }
829
830 /*
831  * devfs_reset_rules is the asynchronous entry point to trigger reset of all
832  * rules. It just sends a message with the relevant details to the devfs core.
833  */
834 int
835 devfs_reset_rules(char *mntto)
836 {
837         char *new_name;
838         size_t  namelen;
839
840         namelen = strlen(mntto) + 1;
841         new_name = kmalloc(namelen, M_DEVFS, M_WAITOK);
842         memcpy(new_name, mntto, namelen);
843         devfs_msg_send_name(DEVFS_RESET_RULES, new_name);
844
845         return 0;
846 }
847
848
849 /*
850  * devfs_scan_callback is the asynchronous entry point to call a callback
851  * on all cdevs.
852  * It just sends a message with the relevant details to the devfs core.
853  */
854 int
855 devfs_scan_callback(devfs_scan_t *callback)
856 {
857         devfs_msg_t msg;
858
859         KKASSERT(sizeof(callback) == sizeof(void *));
860
861         msg = devfs_msg_get();
862         msg->mdv_load = callback;
863         msg = devfs_msg_send_sync(DEVFS_SCAN_CALLBACK, msg);
864         devfs_msg_put(msg);
865
866         return 0;
867 }
868
869
870 /*
871  * Acts as a message drain. Any message that is replied to here gets destroyed
872  * and the memory freed.
873  */
874 static void
875 devfs_msg_autofree_reply(lwkt_port_t port, lwkt_msg_t msg)
876 {
877         devfs_msg_put((devfs_msg_t)msg);
878 }
879
880 /*
881  * devfs_msg_get allocates a new devfs msg and returns it.
882  */
883 devfs_msg_t
884 devfs_msg_get()
885 {
886         return objcache_get(devfs_msg_cache, M_WAITOK);
887 }
888
889 /*
890  * devfs_msg_put deallocates a given devfs msg.
891  */
892 int
893 devfs_msg_put(devfs_msg_t msg)
894 {
895         objcache_put(devfs_msg_cache, msg);
896         return 0;
897 }
898
899 /*
900  * devfs_msg_send is the generic asynchronous message sending facility
901  * for devfs. By default the reply port is the automatic disposal port.
902  *
903  * If the current thread is the devfs_msg_port thread we execute the
904  * operation synchronously.
905  */
906 void
907 devfs_msg_send(uint32_t cmd, devfs_msg_t devfs_msg)
908 {
909         lwkt_port_t port = &devfs_msg_port;
910
911         lwkt_initmsg(&devfs_msg->hdr, &devfs_dispose_port, 0);
912
913         devfs_msg->hdr.u.ms_result = cmd;
914
915         if (port->mpu_td == curthread) {
916                 devfs_msg_exec(devfs_msg);
917                 lwkt_replymsg(&devfs_msg->hdr, 0);
918         } else {
919                 lwkt_sendmsg(port, (lwkt_msg_t)devfs_msg);
920         }
921 }
922
923 /*
924  * devfs_msg_send_sync is the generic synchronous message sending
925  * facility for devfs. It initializes a local reply port and waits
926  * for the core's answer. This answer is then returned.
927  */
928 devfs_msg_t
929 devfs_msg_send_sync(uint32_t cmd, devfs_msg_t devfs_msg)
930 {
931         struct lwkt_port rep_port;
932         devfs_msg_t     msg_incoming;
933         lwkt_port_t port = &devfs_msg_port;
934
935         lwkt_initport_thread(&rep_port, curthread);
936         lwkt_initmsg(&devfs_msg->hdr, &rep_port, 0);
937
938         devfs_msg->hdr.u.ms_result = cmd;
939
940         lwkt_sendmsg(port, (lwkt_msg_t)devfs_msg);
941         msg_incoming = lwkt_waitport(&rep_port, 0);
942
943         return msg_incoming;
944 }
945
946 /*
947  * sends a message with a generic argument.
948  */
949 void
950 devfs_msg_send_generic(uint32_t cmd, void *load)
951 {
952         devfs_msg_t devfs_msg = devfs_msg_get();
953
954         devfs_msg->mdv_load = load;
955         devfs_msg_send(cmd, devfs_msg);
956 }
957
958 /*
959  * sends a message with a name argument.
960  */
961 void
962 devfs_msg_send_name(uint32_t cmd, char *name)
963 {
964         devfs_msg_t devfs_msg = devfs_msg_get();
965
966         devfs_msg->mdv_name = name;
967         devfs_msg_send(cmd, devfs_msg);
968 }
969
970 /*
971  * sends a message with a mount argument.
972  */
973 void
974 devfs_msg_send_mount(uint32_t cmd, struct devfs_mnt_data *mnt)
975 {
976         devfs_msg_t devfs_msg = devfs_msg_get();
977
978         devfs_msg->mdv_mnt = mnt;
979         devfs_msg_send(cmd, devfs_msg);
980 }
981
982 /*
983  * sends a message with an ops argument.
984  */
985 void
986 devfs_msg_send_ops(uint32_t cmd, struct dev_ops *ops, int minor)
987 {
988         devfs_msg_t devfs_msg = devfs_msg_get();
989
990         devfs_msg->mdv_ops.ops = ops;
991         devfs_msg->mdv_ops.minor = minor;
992         devfs_msg_send(cmd, devfs_msg);
993 }
994
995 /*
996  * sends a message with a clone handler argument.
997  */
998 void
999 devfs_msg_send_chandler(uint32_t cmd, char *name, d_clone_t handler)
1000 {
1001         devfs_msg_t devfs_msg = devfs_msg_get();
1002
1003         devfs_msg->mdv_chandler.name = name;
1004         devfs_msg->mdv_chandler.nhandler = handler;
1005         devfs_msg_send(cmd, devfs_msg);
1006 }
1007
1008 /*
1009  * sends a message with a device argument.
1010  */
1011 void
1012 devfs_msg_send_dev(uint32_t cmd, cdev_t dev, uid_t uid, gid_t gid, int perms)
1013 {
1014         devfs_msg_t devfs_msg = devfs_msg_get();
1015
1016         devfs_msg->mdv_dev.dev = dev;
1017         devfs_msg->mdv_dev.uid = uid;
1018         devfs_msg->mdv_dev.gid = gid;
1019         devfs_msg->mdv_dev.perms = perms;
1020
1021         devfs_msg_send(cmd, devfs_msg);
1022 }
1023
1024 /*
1025  * sends a message with a link argument.
1026  */
1027 void
1028 devfs_msg_send_link(uint32_t cmd, char *name, char *target, struct mount *mp)
1029 {
1030         devfs_msg_t devfs_msg = devfs_msg_get();
1031
1032         devfs_msg->mdv_link.name = name;
1033         devfs_msg->mdv_link.target = target;
1034         devfs_msg->mdv_link.mp = mp;
1035         devfs_msg_send(cmd, devfs_msg);
1036 }
1037
1038 /*
1039  * devfs_msg_core is the main devfs thread. It handles all incoming messages
1040  * and calls the relevant worker functions. By using messages it's assured
1041  * that events occur in the correct order.
1042  */
1043 static void
1044 devfs_msg_core(void *arg)
1045 {
1046         devfs_msg_t msg;
1047
1048         devfs_run = 1;
1049         lwkt_initport_thread(&devfs_msg_port, curthread);
1050         wakeup(td_core);
1051
1052         while (devfs_run) {
1053                 msg = (devfs_msg_t)lwkt_waitport(&devfs_msg_port, 0);
1054                 devfs_debug(DEVFS_DEBUG_DEBUG,
1055                                 "devfs_msg_core, new msg: %x\n",
1056                                 (unsigned int)msg->hdr.u.ms_result);
1057                 devfs_msg_exec(msg);
1058                 lwkt_replymsg(&msg->hdr, 0);
1059         }
1060         wakeup(td_core);
1061         lwkt_exit();
1062 }
1063
1064 static void
1065 devfs_msg_exec(devfs_msg_t msg)
1066 {
1067         struct devfs_mnt_data *mnt;
1068         struct devfs_node *node;
1069         cdev_t  dev;
1070
1071         /*
1072          * Acquire the devfs lock to ensure safety of all called functions
1073          */
1074         lockmgr(&devfs_lock, LK_EXCLUSIVE);
1075
1076         switch (msg->hdr.u.ms_result) {
1077         case DEVFS_DEVICE_CREATE:
1078                 dev = msg->mdv_dev.dev;
1079                 devfs_create_dev_worker(dev,
1080                                         msg->mdv_dev.uid,
1081                                         msg->mdv_dev.gid,
1082                                         msg->mdv_dev.perms);
1083                 break;
1084         case DEVFS_DEVICE_DESTROY:
1085                 dev = msg->mdv_dev.dev;
1086                 devfs_destroy_dev_worker(dev);
1087                 break;
1088         case DEVFS_DESTROY_SUBNAMES:
1089                 devfs_destroy_subnames_worker(msg->mdv_load);
1090                 break;
1091         case DEVFS_DESTROY_DEV_BY_OPS:
1092                 devfs_destroy_dev_by_ops_worker(msg->mdv_ops.ops,
1093                                                 msg->mdv_ops.minor);
1094                 break;
1095         case DEVFS_CREATE_ALL_DEV:
1096                 node = (struct devfs_node *)msg->mdv_load;
1097                 devfs_create_all_dev_worker(node);
1098                 break;
1099         case DEVFS_MOUNT_ADD:
1100                 mnt = msg->mdv_mnt;
1101                 TAILQ_INSERT_TAIL(&devfs_mnt_list, mnt, link);
1102                 devfs_create_all_dev_worker(mnt->root_node);
1103                 break;
1104         case DEVFS_MOUNT_DEL:
1105                 mnt = msg->mdv_mnt;
1106                 TAILQ_REMOVE(&devfs_mnt_list, mnt, link);
1107                 devfs_reaperp(mnt->root_node);
1108                 if (mnt->leak_count) {
1109                         devfs_debug(DEVFS_DEBUG_SHOW,
1110                                     "Leaked %d devfs_node elements!\n",
1111                                     mnt->leak_count);
1112                 }
1113                 break;
1114         case DEVFS_CHANDLER_ADD:
1115                 devfs_chandler_add_worker(msg->mdv_chandler.name,
1116                                 msg->mdv_chandler.nhandler);
1117                 break;
1118         case DEVFS_CHANDLER_DEL:
1119                 devfs_chandler_del_worker(msg->mdv_chandler.name);
1120                 break;
1121         case DEVFS_FIND_DEVICE_BY_NAME:
1122                 devfs_find_device_by_name_worker(msg);
1123                 break;
1124         case DEVFS_FIND_DEVICE_BY_UDEV:
1125                 devfs_find_device_by_udev_worker(msg);
1126                 break;
1127         case DEVFS_MAKE_ALIAS:
1128                 devfs_make_alias_worker((struct devfs_alias *)msg->mdv_load);
1129                 break;
1130         case DEVFS_APPLY_RULES:
1131                 devfs_apply_reset_rules_caller(msg->mdv_name, 1);
1132                 break;
1133         case DEVFS_RESET_RULES:
1134                 devfs_apply_reset_rules_caller(msg->mdv_name, 0);
1135                 break;
1136         case DEVFS_SCAN_CALLBACK:
1137                 devfs_scan_callback_worker((devfs_scan_t *)msg->mdv_load);
1138                 break;
1139         case DEVFS_CLR_SUBNAMES_FLAG:
1140                 devfs_clr_subnames_flag_worker(msg->mdv_flags.name,
1141                                 msg->mdv_flags.flag);
1142                 break;
1143         case DEVFS_DESTROY_SUBNAMES_WO_FLAG:
1144                 devfs_destroy_subnames_without_flag_worker(msg->mdv_flags.name,
1145                                 msg->mdv_flags.flag);
1146                 break;
1147         case DEVFS_INODE_TO_VNODE:
1148                 msg->mdv_ino.vp = devfs_inode_to_vnode_worker(
1149                                 DEVFS_MNTDATA(msg->mdv_ino.mp)->root_node,
1150                                 msg->mdv_ino.ino);
1151                 break;
1152         case DEVFS_TERMINATE_CORE:
1153                 devfs_run = 0;
1154                 break;
1155         case DEVFS_SYNC:
1156                 break;
1157         default:
1158                 devfs_debug(DEVFS_DEBUG_WARNING,
1159                             "devfs_msg_core: unknown message "
1160                             "received at core\n");
1161                 break;
1162         }
1163         lockmgr(&devfs_lock, LK_RELEASE);
1164 }
1165
1166 /*
1167  * Worker function to insert a new dev into the dev list and initialize its
1168  * permissions. It also calls devfs_propagate_dev which in turn propagates
1169  * the change to all mount points.
1170  *
1171  * The passed dev is already referenced.  This reference is eaten by this
1172  * function and represents the dev's linkage into devfs_dev_list.
1173  */
1174 static int
1175 devfs_create_dev_worker(cdev_t dev, uid_t uid, gid_t gid, int perms)
1176 {
1177         KKASSERT(dev);
1178
1179         dev->si_uid = uid;
1180         dev->si_gid = gid;
1181         dev->si_perms = perms;
1182
1183         devfs_link_dev(dev);
1184         devfs_propagate_dev(dev, 1);
1185
1186         return 0;
1187 }
1188
1189 /*
1190  * Worker function to delete a dev from the dev list and free the cdev.
1191  * It also calls devfs_propagate_dev which in turn propagates the change
1192  * to all mount points.
1193  */
1194 static int
1195 devfs_destroy_dev_worker(cdev_t dev)
1196 {
1197         int error;
1198
1199         KKASSERT(dev);
1200         KKASSERT((lockstatus(&devfs_lock, curthread)) == LK_EXCLUSIVE);
1201
1202         error = devfs_unlink_dev(dev);
1203         devfs_propagate_dev(dev, 0);
1204         if (error == 0)
1205                 release_dev(dev);       /* link ref */
1206         release_dev(dev);
1207         release_dev(dev);
1208
1209         return 0;
1210 }
1211
1212 /*
1213  * Worker function to destroy all devices with a certain basename.
1214  * Calls devfs_destroy_dev_worker for the actual destruction.
1215  */
1216 static int
1217 devfs_destroy_subnames_worker(char *name)
1218 {
1219         cdev_t dev, dev1;
1220         size_t len = strlen(name);
1221
1222         TAILQ_FOREACH_MUTABLE(dev, &devfs_dev_list, link, dev1) {
1223                 if ((!strncmp(dev->si_name, name, len)) &&
1224                                 (dev->si_name[len] != '\0')) {
1225                         devfs_destroy_dev_worker(dev);
1226                 }
1227         }
1228         return 0;
1229 }
1230
1231 static int
1232 devfs_clr_subnames_flag_worker(char *name, uint32_t flag)
1233 {
1234         cdev_t dev, dev1;
1235         size_t len = strlen(name);
1236
1237         TAILQ_FOREACH_MUTABLE(dev, &devfs_dev_list, link, dev1) {
1238                 if ((!strncmp(dev->si_name, name, len)) &&
1239                                 (dev->si_name[len] != '\0')) {
1240                         dev->si_flags &= ~flag;
1241                 }
1242         }
1243
1244         return 0;
1245 }
1246
1247 static int
1248 devfs_destroy_subnames_without_flag_worker(char *name, uint32_t flag)
1249 {
1250         cdev_t dev, dev1;
1251         size_t len = strlen(name);
1252
1253         TAILQ_FOREACH_MUTABLE(dev, &devfs_dev_list, link, dev1) {
1254                 if ((!strncmp(dev->si_name, name, len)) &&
1255                                 (dev->si_name[len] != '\0')) {
1256                         if (!(dev->si_flags & flag)) {
1257                                 devfs_destroy_dev_worker(dev);
1258                         }
1259                 }
1260         }
1261
1262         return 0;
1263 }
1264
1265 /*
1266  * Worker function that creates all device nodes on top of a devfs
1267  * root node.
1268  */
1269 static int
1270 devfs_create_all_dev_worker(struct devfs_node *root)
1271 {
1272         cdev_t dev;
1273
1274         KKASSERT(root);
1275
1276         TAILQ_FOREACH(dev, &devfs_dev_list, link) {
1277                 devfs_create_device_node(root, dev, NULL, NULL);
1278         }
1279
1280         return 0;
1281 }
1282
1283 /*
1284  * Worker function that destroys all devices that match a specific
1285  * dev_ops and/or minor. If minor is less than 0, it is not matched
1286  * against. It also propagates all changes.
1287  */
1288 static int
1289 devfs_destroy_dev_by_ops_worker(struct dev_ops *ops, int minor)
1290 {
1291         cdev_t dev, dev1;
1292
1293         KKASSERT(ops);
1294
1295         TAILQ_FOREACH_MUTABLE(dev, &devfs_dev_list, link, dev1) {
1296                 if (dev->si_ops != ops)
1297                         continue;
1298                 if ((minor < 0) || (dev->si_uminor == minor)) {
1299                         devfs_destroy_dev_worker(dev);
1300                 }
1301         }
1302
1303         return 0;
1304 }
1305
1306 /*
1307  * Worker function that registers a new clone handler in devfs.
1308  */
1309 static int
1310 devfs_chandler_add_worker(char *name, d_clone_t *nhandler)
1311 {
1312         struct devfs_clone_handler *chandler = NULL;
1313         u_char len = strlen(name);
1314
1315         if (len == 0)
1316                 return 1;
1317
1318         TAILQ_FOREACH(chandler, &devfs_chandler_list, link) {
1319                 if (chandler->namlen != len)
1320                         continue;
1321
1322                 if (!memcmp(chandler->name, name, len)) {
1323                         /* Clonable basename already exists */
1324                         return 1;
1325                 }
1326         }
1327
1328         chandler = kmalloc(sizeof(*chandler), M_DEVFS, M_WAITOK | M_ZERO);
1329         chandler->name = kmalloc(len+1, M_DEVFS, M_WAITOK);
1330         memcpy(chandler->name, name, len+1);
1331         chandler->namlen = len;
1332         chandler->nhandler = nhandler;
1333
1334         TAILQ_INSERT_TAIL(&devfs_chandler_list, chandler, link);
1335         return 0;
1336 }
1337
1338 /*
1339  * Worker function that removes a given clone handler from the
1340  * clone handler list.
1341  */
1342 static int
1343 devfs_chandler_del_worker(char *name)
1344 {
1345         struct devfs_clone_handler *chandler, *chandler2;
1346         u_char len = strlen(name);
1347
1348         if (len == 0)
1349                 return 1;
1350
1351         TAILQ_FOREACH_MUTABLE(chandler, &devfs_chandler_list, link, chandler2) {
1352                 if (chandler->namlen != len)
1353                         continue;
1354                 if (memcmp(chandler->name, name, len))
1355                         continue;
1356
1357                 TAILQ_REMOVE(&devfs_chandler_list, chandler, link);
1358                 kfree(chandler->name, M_DEVFS);
1359                 kfree(chandler, M_DEVFS);
1360                 break;
1361         }
1362
1363         return 0;
1364 }
1365
1366 /*
1367  * Worker function that finds a given device name and changes
1368  * the message received accordingly so that when replied to,
1369  * the answer is returned to the caller.
1370  */
1371 static int
1372 devfs_find_device_by_name_worker(devfs_msg_t devfs_msg)
1373 {
1374         struct devfs_alias *alias;
1375         cdev_t dev;
1376         cdev_t found = NULL;
1377
1378         TAILQ_FOREACH(dev, &devfs_dev_list, link) {
1379                 if (strcmp(devfs_msg->mdv_name, dev->si_name) == 0) {
1380                         found = dev;
1381                         break;
1382                 }
1383         }
1384         if (found == NULL) {
1385                 TAILQ_FOREACH(alias, &devfs_alias_list, link) {
1386                         if (strcmp(devfs_msg->mdv_name, alias->name) == 0) {
1387                                 found = alias->dev_target;
1388                                 break;
1389                         }
1390                 }
1391         }
1392         devfs_msg->mdv_cdev = found;
1393
1394         return 0;
1395 }
1396
1397 /*
1398  * Worker function that finds a given device udev and changes
1399  * the message received accordingly so that when replied to,
1400  * the answer is returned to the caller.
1401  */
1402 static int
1403 devfs_find_device_by_udev_worker(devfs_msg_t devfs_msg)
1404 {
1405         cdev_t dev, dev1;
1406         cdev_t found = NULL;
1407
1408         TAILQ_FOREACH_MUTABLE(dev, &devfs_dev_list, link, dev1) {
1409                 if (((udev_t)dev->si_inode) == devfs_msg->mdv_udev) {
1410                         found = dev;
1411                         break;
1412                 }
1413         }
1414         devfs_msg->mdv_cdev = found;
1415
1416         return 0;
1417 }
1418
1419 /*
1420  * Worker function that inserts a given alias into the
1421  * alias list, and propagates the alias to all mount
1422  * points.
1423  */
1424 static int
1425 devfs_make_alias_worker(struct devfs_alias *alias)
1426 {
1427         struct devfs_alias *alias2;
1428         size_t len = strlen(alias->name);
1429         int found = 0;
1430
1431         TAILQ_FOREACH(alias2, &devfs_alias_list, link) {
1432                 if (len != alias2->namlen)
1433                         continue;
1434
1435                 if (!memcmp(alias->name, alias2->name, len)) {
1436                         found = 1;
1437                         break;
1438                 }
1439         }
1440
1441         if (!found) {
1442                 /*
1443                  * The alias doesn't exist yet, so we add it to the alias list
1444                  */
1445                 TAILQ_INSERT_TAIL(&devfs_alias_list, alias, link);
1446                 devfs_alias_propagate(alias);
1447         } else {
1448                 devfs_debug(DEVFS_DEBUG_WARNING,
1449                             "Warning: duplicate devfs_make_alias for %s\n",
1450                             alias->name);
1451                 kfree(alias->name, M_DEVFS);
1452                 kfree(alias, M_DEVFS);
1453         }
1454
1455         return 0;
1456 }
1457
1458 /*
1459  * Function that removes and frees all aliases.
1460  */
1461 static int
1462 devfs_alias_reap(void)
1463 {
1464         struct devfs_alias *alias, *alias2;
1465
1466         TAILQ_FOREACH_MUTABLE(alias, &devfs_alias_list, link, alias2) {
1467                 TAILQ_REMOVE(&devfs_alias_list, alias, link);
1468                 kfree(alias, M_DEVFS);
1469         }
1470         return 0;
1471 }
1472
1473 /*
1474  * Function that removes an alias matching a specific cdev and frees
1475  * it accordingly.
1476  */
1477 static int
1478 devfs_alias_remove(cdev_t dev)
1479 {
1480         struct devfs_alias *alias, *alias2;
1481
1482         TAILQ_FOREACH_MUTABLE(alias, &devfs_alias_list, link, alias2) {
1483                 if (alias->dev_target == dev) {
1484                         TAILQ_REMOVE(&devfs_alias_list, alias, link);
1485                         kfree(alias, M_DEVFS);
1486                 }
1487         }
1488         return 0;
1489 }
1490
1491 /*
1492  * This function propagates a new alias to all mount points.
1493  */
1494 static int
1495 devfs_alias_propagate(struct devfs_alias *alias)
1496 {
1497         struct devfs_mnt_data *mnt;
1498
1499         TAILQ_FOREACH(mnt, &devfs_mnt_list, link) {
1500                 devfs_alias_apply(mnt->root_node, alias);
1501         }
1502         return 0;
1503 }
1504
1505 /*
1506  * This function is a recursive function iterating through
1507  * all device nodes in the topology and, if applicable,
1508  * creating the relevant alias for a device node.
1509  */
1510 static int
1511 devfs_alias_apply(struct devfs_node *node, struct devfs_alias *alias)
1512 {
1513         struct devfs_node *node1, *node2;
1514
1515         KKASSERT(alias != NULL);
1516
1517         if ((node->node_type == Proot) || (node->node_type == Pdir)) {
1518                 if (node->nchildren > 2) {
1519                         TAILQ_FOREACH_MUTABLE(node1, DEVFS_DENODE_HEAD(node), link, node2) {
1520                                 devfs_alias_apply(node1, alias);
1521                         }
1522                 }
1523         } else {
1524                 if (node->d_dev == alias->dev_target)
1525                         devfs_alias_create(alias->name, node);
1526         }
1527         return 0;
1528 }
1529
1530 /*
1531  * This function checks if any alias possibly is applicable
1532  * to the given node. If so, the alias is created.
1533  */
1534 static int
1535 devfs_alias_check_create(struct devfs_node *node)
1536 {
1537         struct devfs_alias *alias;
1538
1539         TAILQ_FOREACH(alias, &devfs_alias_list, link) {
1540                 if (node->d_dev == alias->dev_target)
1541                         devfs_alias_create(alias->name, node);
1542         }
1543         return 0;
1544 }
1545
1546 /*
1547  * This function creates an alias with a given name
1548  * linking to a given devfs node. It also increments
1549  * the link count on the target node.
1550  */
1551 int
1552 devfs_alias_create(char *name_orig, struct devfs_node *target)
1553 {
1554         struct mount *mp = target->mp;
1555         struct devfs_node *parent = DEVFS_MNTDATA(mp)->root_node;
1556         struct devfs_node *linknode;
1557         char *create_path = NULL;
1558         char *name, name_buf[PATH_MAX];
1559
1560         KKASSERT((lockstatus(&devfs_lock, curthread)) == LK_EXCLUSIVE);
1561
1562         devfs_resolve_name_path(name_orig, name_buf, &create_path, &name);
1563
1564         if (create_path)
1565                 parent = devfs_resolve_or_create_path(parent, create_path, 1);
1566
1567
1568         if (devfs_find_device_node_by_name(parent, name)) {
1569                 devfs_debug(DEVFS_DEBUG_WARNING,
1570                             "Node already exists: %s "
1571                             "(devfs_make_alias_worker)!\n",
1572                             name);
1573                 return 1;
1574         }
1575
1576
1577         linknode = devfs_allocp(Plink, name, parent, mp, NULL);
1578         if (linknode == NULL)
1579                 return 1;
1580
1581         linknode->link_target = target;
1582         target->nlinks++;
1583
1584         return 0;
1585 }
1586
1587 /*
1588  * This function is called by the core and handles mount point
1589  * strings. It either calls the relevant worker (devfs_apply_
1590  * reset_rules_worker) on all mountpoints or only a specific
1591  * one.
1592  */
1593 static int
1594 devfs_apply_reset_rules_caller(char *mountto, int apply)
1595 {
1596         struct devfs_mnt_data *mnt;
1597         size_t len = strlen(mountto);
1598
1599         if (mountto[0] == '*') {
1600                 TAILQ_FOREACH(mnt, &devfs_mnt_list, link) {
1601                         devfs_apply_reset_rules_worker(mnt->root_node, apply);
1602                 }
1603         } else {
1604                 TAILQ_FOREACH(mnt, &devfs_mnt_list, link) {
1605                         if ((len != mnt->mntonnamelen))
1606                                 continue;
1607
1608                         if (!memcmp(mnt->mp->mnt_stat.f_mntonname, mountto, len)) {
1609                                 devfs_apply_reset_rules_worker(mnt->root_node, apply);
1610                                 break;
1611                         }
1612                 }
1613         }
1614
1615         kfree(mountto, M_DEVFS);
1616         return 0;
1617 }
1618
1619 /*
1620  * This worker function applies or resets, depending on the arguments, a rule
1621  * to the whole given topology. *RECURSIVE*
1622  */
1623 static int
1624 devfs_apply_reset_rules_worker(struct devfs_node *node, int apply)
1625 {
1626         struct devfs_node *node1, *node2;
1627
1628         if ((node->node_type == Proot) || (node->node_type == Pdir)) {
1629                 if (node->nchildren > 2) {
1630                         TAILQ_FOREACH_MUTABLE(node1, DEVFS_DENODE_HEAD(node), link, node2) {
1631                                 devfs_apply_reset_rules_worker(node1, apply);
1632                         }
1633                 }
1634         }
1635
1636         if (apply)
1637                 devfs_rule_check_apply(node);
1638         else
1639                 devfs_rule_reset_node(node);
1640
1641         return 0;
1642 }
1643
1644
1645 /*
1646  * This function calls a given callback function for
1647  * every dev node in the devfs dev list.
1648  */
1649 static int
1650 devfs_scan_callback_worker(devfs_scan_t *callback)
1651 {
1652         cdev_t dev, dev1;
1653
1654         TAILQ_FOREACH_MUTABLE(dev, &devfs_dev_list, link, dev1) {
1655                 callback(dev);
1656         }
1657
1658         return 0;
1659 }
1660
1661
1662 /*
1663  * This function tries to resolve a given directory, or if not
1664  * found and creation requested, creates the given directory.
1665  */
1666 static struct devfs_node *
1667 devfs_resolve_or_create_dir(struct devfs_node *parent, char *dir_name,
1668                             size_t name_len, int create)
1669 {
1670         struct devfs_node *node, *found = NULL;
1671
1672         TAILQ_FOREACH(node, DEVFS_DENODE_HEAD(parent), link) {
1673                 if (name_len != node->d_dir.d_namlen)
1674                         continue;
1675
1676                 if (!memcmp(dir_name, node->d_dir.d_name, name_len)) {
1677                         found = node;
1678                         break;
1679                 }
1680         }
1681
1682         if ((found == NULL) && (create)) {
1683                 found = devfs_allocp(Pdir, dir_name, parent, parent->mp, NULL);
1684         }
1685
1686         return found;
1687 }
1688
1689 /*
1690  * This function tries to resolve a complete path. If creation is requested,
1691  * if a given part of the path cannot be resolved (because it doesn't exist),
1692  * it is created.
1693  */
1694 struct devfs_node *
1695 devfs_resolve_or_create_path(struct devfs_node *parent, char *path, int create)
1696 {
1697         struct devfs_node *node = parent;
1698         char buf[PATH_MAX];
1699         size_t idx = 0;
1700
1701
1702         if (path == NULL)
1703                 return parent;
1704
1705
1706         for (; *path != '\0' ; path++) {
1707                 if (*path != '/') {
1708                         buf[idx++] = *path;
1709                 } else {
1710                         buf[idx] = '\0';
1711                         node = devfs_resolve_or_create_dir(node, buf, idx, create);
1712                         if (node == NULL)
1713                                 return NULL;
1714                         idx = 0;
1715                 }
1716         }
1717         buf[idx] = '\0';
1718         return devfs_resolve_or_create_dir(node, buf, idx, create);
1719 }
1720
1721 /*
1722  * Takes a full path and strips it into a directory path and a name.
1723  * For a/b/c/foo, it returns foo in namep and a/b/c in pathp. It
1724  * requires a working buffer with enough size to keep the whole
1725  * fullpath.
1726  */
1727 int
1728 devfs_resolve_name_path(char *fullpath, char *buf, char **pathp, char **namep)
1729 {
1730         char *name = NULL;
1731         char *path = NULL;
1732         size_t len = strlen(fullpath) + 1;
1733         int i;
1734
1735         KKASSERT((fullpath != NULL) && (buf != NULL));
1736         KKASSERT((pathp != NULL) && (namep != NULL));
1737
1738         memcpy(buf, fullpath, len);
1739
1740         for (i = len-1; i>= 0; i--) {
1741                 if (buf[i] == '/') {
1742                         buf[i] = '\0';
1743                         name = &(buf[i+1]);
1744                         path = buf;
1745                         break;
1746                 }
1747         }
1748
1749         *pathp = path;
1750
1751         if (name) {
1752                 *namep = name;
1753         } else {
1754                 *namep = buf;
1755         }
1756
1757         return 0;
1758 }
1759
1760 /*
1761  * This function creates a new devfs node for a given device.  It can
1762  * handle a complete path as device name, and accordingly creates
1763  * the path and the final device node.
1764  *
1765  * The reference count on the passed dev remains unchanged.
1766  */
1767 struct devfs_node *
1768 devfs_create_device_node(struct devfs_node *root, cdev_t dev,
1769                          char *dev_name, char *path_fmt, ...)
1770 {
1771         struct devfs_node *parent, *node = NULL;
1772         char *path = NULL;
1773         char *name, name_buf[PATH_MAX];
1774         __va_list ap;
1775         int i, found;
1776
1777         char *create_path = NULL;
1778         char *names = "pqrsPQRS";
1779
1780         if (path_fmt != NULL) {
1781                 path = kmalloc(PATH_MAX+1, M_DEVFS, M_WAITOK);
1782
1783                 __va_start(ap, path_fmt);
1784                 i = kvcprintf(path_fmt, NULL, path, 10, ap);
1785                 path[i] = '\0';
1786                 __va_end(ap);
1787         }
1788
1789         parent = devfs_resolve_or_create_path(root, path, 1);
1790         KKASSERT(parent);
1791
1792         devfs_resolve_name_path(
1793                         ((dev_name == NULL) && (dev))?(dev->si_name):(dev_name),
1794                         name_buf, &create_path, &name);
1795
1796         if (create_path)
1797                 parent = devfs_resolve_or_create_path(parent, create_path, 1);
1798
1799
1800         if (devfs_find_device_node_by_name(parent, name)) {
1801                 devfs_debug(DEVFS_DEBUG_WARNING, "devfs_create_device_node: "
1802                         "DEVICE %s ALREADY EXISTS!!! Ignoring creation request.\n", name);
1803                 goto out;
1804         }
1805
1806         node = devfs_allocp(Pdev, name, parent, parent->mp, dev);
1807
1808 #if 0
1809         /*
1810          * Ugly unix98 pty magic, to hide pty master (ptm) devices and their
1811          * directory
1812          */
1813         if ((dev) && (strlen(dev->si_name) >= 4) &&
1814                         (!memcmp(dev->si_name, "ptm/", 4))) {
1815                 node->parent->flags |= DEVFS_HIDDEN;
1816                 node->flags |= DEVFS_HIDDEN;
1817         }
1818 #endif
1819
1820         /*
1821          * Ugly pty magic, to tag pty devices as such and hide them if needed.
1822          */
1823         if ((strlen(name) >= 3) && (!memcmp(name, "pty", 3)))
1824                 node->flags |= (DEVFS_PTY | DEVFS_INVISIBLE);
1825
1826         if ((strlen(name) >= 3) && (!memcmp(name, "tty", 3))) {
1827                 found = 0;
1828                 for (i = 0; i < strlen(names); i++) {
1829                         if (name[3] == names[i]) {
1830                                 found = 1;
1831                                 break;
1832                         }
1833                 }
1834                 if (found)
1835                         node->flags |= (DEVFS_PTY | DEVFS_INVISIBLE);
1836         }
1837
1838 out:
1839         if (path_fmt != NULL)
1840                 kfree(path, M_DEVFS);
1841
1842         return node;
1843 }
1844
1845 /*
1846  * This function finds a given device node in the topology with a given
1847  * cdev.
1848  */
1849 struct devfs_node *
1850 devfs_find_device_node(struct devfs_node *node, cdev_t target)
1851 {
1852         struct devfs_node *node1, *node2, *found = NULL;
1853
1854         if ((node->node_type == Proot) || (node->node_type == Pdir)) {
1855                 if (node->nchildren > 2) {
1856                         TAILQ_FOREACH_MUTABLE(node1, DEVFS_DENODE_HEAD(node), link, node2) {
1857                                 if ((found = devfs_find_device_node(node1, target)))
1858                                         return found;
1859                         }
1860                 }
1861         } else if (node->node_type == Pdev) {
1862                 if (node->d_dev == target)
1863                         return node;
1864         }
1865
1866         return NULL;
1867 }
1868
1869 /*
1870  * This function finds a device node in the topology by its
1871  * name and returns it.
1872  */
1873 struct devfs_node *
1874 devfs_find_device_node_by_name(struct devfs_node *parent, char *target)
1875 {
1876         struct devfs_node *node, *found = NULL;
1877         size_t len = strlen(target);
1878
1879         TAILQ_FOREACH(node, DEVFS_DENODE_HEAD(parent), link) {
1880                 if (len != node->d_dir.d_namlen)
1881                         continue;
1882
1883                 if (!memcmp(node->d_dir.d_name, target, len)) {
1884                         found = node;
1885                         break;
1886                 }
1887         }
1888
1889         return found;
1890 }
1891
1892 static struct vnode*
1893 devfs_inode_to_vnode_worker(struct devfs_node *node, ino_t target)
1894 {
1895         struct devfs_node *node1, *node2;
1896         struct vnode*   vp;
1897
1898         if ((node->node_type == Proot) || (node->node_type == Pdir)) {
1899                 if (node->nchildren > 2) {
1900                         TAILQ_FOREACH_MUTABLE(node1, DEVFS_DENODE_HEAD(node), link, node2) {
1901                                 if ((vp = devfs_inode_to_vnode_worker(node1, target)))
1902                                         return vp;
1903                         }
1904                 }
1905         }
1906
1907         if (node->d_dir.d_ino == target) {
1908                 if (node->v_node) {
1909                         vp = node->v_node;
1910                         vget(vp, LK_EXCLUSIVE | LK_RETRY);
1911                         vn_unlock(vp);
1912                 } else {
1913                         devfs_allocv(&vp, node);
1914                         vn_unlock(vp);
1915                 }
1916                 return vp;
1917         }
1918
1919         return NULL;
1920 }
1921
1922 /*
1923  * This function takes a cdev and removes its devfs node in the
1924  * given topology.  The cdev remains intact.
1925  */
1926 int
1927 devfs_destroy_device_node(struct devfs_node *root, cdev_t target)
1928 {
1929         struct devfs_node *node, *parent;
1930         char *name, name_buf[PATH_MAX];
1931         char *create_path = NULL;
1932
1933         KKASSERT(target);
1934
1935         memcpy(name_buf, target->si_name, strlen(target->si_name)+1);
1936
1937         devfs_resolve_name_path(target->si_name, name_buf, &create_path, &name);
1938
1939         if (create_path)
1940                 parent = devfs_resolve_or_create_path(root, create_path, 0);
1941         else
1942                 parent = root;
1943
1944         if (parent == NULL)
1945                 return 1;
1946
1947         node = devfs_find_device_node_by_name(parent, name);
1948
1949         if (node)
1950                 devfs_gc(node);
1951
1952         return 0;
1953 }
1954
1955 /*
1956  * Just set perms and ownership for given node.
1957  */
1958 int
1959 devfs_set_perms(struct devfs_node *node, uid_t uid, gid_t gid,
1960                 u_short mode, u_long flags)
1961 {
1962         node->mode = mode;
1963         node->uid = uid;
1964         node->gid = gid;
1965
1966         return 0;
1967 }
1968
1969 /*
1970  * Propagates a device attach/detach to all mount
1971  * points. Also takes care of automatic alias removal
1972  * for a deleted cdev.
1973  */
1974 static int
1975 devfs_propagate_dev(cdev_t dev, int attach)
1976 {
1977         struct devfs_mnt_data *mnt;
1978
1979         TAILQ_FOREACH(mnt, &devfs_mnt_list, link) {
1980                 if (attach) {
1981                         /* Device is being attached */
1982                         devfs_create_device_node(mnt->root_node, dev,
1983                                                  NULL, NULL );
1984                 } else {
1985                         /* Device is being detached */
1986                         devfs_alias_remove(dev);
1987                         devfs_destroy_device_node(mnt->root_node, dev);
1988                 }
1989         }
1990         return 0;
1991 }
1992
1993 /*
1994  * devfs_node_to_path takes a node and a buffer of a size of
1995  * at least PATH_MAX, resolves the full path from the root
1996  * node and writes it in a humanly-readable format into the
1997  * buffer.
1998  * If DEVFS_STASH_DEPTH is less than the directory level up
1999  * to the root node, only the last DEVFS_STASH_DEPTH levels
2000  * of the path are resolved.
2001  */
2002 int
2003 devfs_node_to_path(struct devfs_node *node, char *buffer)
2004 {
2005 #define DEVFS_STASH_DEPTH       32
2006         struct devfs_node *node_stash[DEVFS_STASH_DEPTH];
2007         int i, offset;
2008         memset(buffer, 0, PATH_MAX);
2009
2010         for (i = 0; (i < DEVFS_STASH_DEPTH) && (node->node_type != Proot); i++) {
2011                 node_stash[i] = node;
2012                 node = node->parent;
2013         }
2014         i--;
2015
2016         for (offset = 0; i >= 0; i--) {
2017                 memcpy(buffer+offset, node_stash[i]->d_dir.d_name,
2018                                 node_stash[i]->d_dir.d_namlen);
2019                 offset += node_stash[i]->d_dir.d_namlen;
2020                 if (i > 0) {
2021                         *(buffer+offset) = '/';
2022                         offset++;
2023                 }
2024         }
2025 #undef DEVFS_STASH_DEPTH
2026         return 0;
2027 }
2028
2029 /*
2030  * devfs_clone either returns a basename from a complete name by
2031  * returning the length of the name without trailing digits, or,
2032  * if clone != 0, calls the device's clone handler to get a new
2033  * device, which in turn is returned in devp.
2034  */
2035 int
2036 devfs_clone(char *name, size_t *namlenp, cdev_t *devp, int clone,
2037                 struct ucred *cred)
2038 {
2039         KKASSERT(namlenp);
2040
2041         size_t len = *namlenp;
2042         int error = 1;
2043         struct devfs_clone_handler *chandler;
2044         struct dev_clone_args ap;
2045
2046         if (!clone) {
2047                 for (; (len > 0) && (DEVFS_ISDIGIT(name[len-1])); len--);
2048         }
2049
2050         TAILQ_FOREACH(chandler, &devfs_chandler_list, link) {
2051                 if ((chandler->namlen == len) &&
2052                     (!memcmp(chandler->name, name, len)) &&
2053                     (chandler->nhandler)) {
2054                         if (clone) {
2055                                 ap.a_dev = NULL;
2056                                 ap.a_name = name;
2057                                 ap.a_namelen = len;
2058                                 ap.a_cred = cred;
2059                                 error = (chandler->nhandler)(&ap);
2060                                 KKASSERT(devp);
2061                                 *devp = ap.a_dev;
2062                         } else {
2063                                 *namlenp = len;
2064                                 error = 0;
2065                         }
2066
2067                         break;
2068                 }
2069         }
2070
2071         return error;
2072 }
2073
2074
2075 /*
2076  * Registers a new orphan in the orphan list.
2077  */
2078 void
2079 devfs_tracer_add_orphan(struct devfs_node *node)
2080 {
2081         struct devfs_orphan *orphan;
2082
2083         KKASSERT(node);
2084         orphan = kmalloc(sizeof(struct devfs_orphan), M_DEVFS, M_WAITOK);
2085         orphan->node = node;
2086
2087         KKASSERT((node->flags & DEVFS_ORPHANED) == 0);
2088         node->flags |= DEVFS_ORPHANED;
2089         TAILQ_INSERT_TAIL(DEVFS_ORPHANLIST(node->mp), orphan, link);
2090 }
2091
2092 /*
2093  * Removes an orphan from the orphan list.
2094  */
2095 void
2096 devfs_tracer_del_orphan(struct devfs_node *node)
2097 {
2098         struct devfs_orphan *orphan;
2099
2100         KKASSERT(node);
2101
2102         TAILQ_FOREACH(orphan, DEVFS_ORPHANLIST(node->mp), link) {
2103                 if (orphan->node == node) {
2104                         node->flags &= ~DEVFS_ORPHANED;
2105                         TAILQ_REMOVE(DEVFS_ORPHANLIST(node->mp), orphan, link);
2106                         kfree(orphan, M_DEVFS);
2107                         break;
2108                 }
2109         }
2110 }
2111
2112 /*
2113  * Counts the orphans in the orphan list, and if cleanup
2114  * is specified, also frees the orphan and removes it from
2115  * the list.
2116  */
2117 size_t
2118 devfs_tracer_orphan_count(struct mount *mp, int cleanup)
2119 {
2120         struct devfs_orphan *orphan, *orphan2;
2121         size_t count = 0;
2122
2123         TAILQ_FOREACH_MUTABLE(orphan, DEVFS_ORPHANLIST(mp), link, orphan2)      {
2124                 count++;
2125                 /*
2126                  * If we are instructed to clean up, we do so.
2127                  */
2128                 if (cleanup) {
2129                         TAILQ_REMOVE(DEVFS_ORPHANLIST(mp), orphan, link);
2130                         orphan->node->flags &= ~DEVFS_ORPHANED;
2131                         devfs_freep(orphan->node);
2132                         kfree(orphan, M_DEVFS);
2133                 }
2134         }
2135
2136         return count;
2137 }
2138
2139 /*
2140  * Fetch an ino_t from the global d_ino by increasing it
2141  * while spinlocked.
2142  */
2143 static ino_t
2144 devfs_fetch_ino(void)
2145 {
2146         ino_t   ret;
2147
2148         spin_lock_wr(&ino_lock);
2149         ret = d_ino++;
2150         spin_unlock_wr(&ino_lock);
2151
2152         return ret;
2153 }
2154
2155 /*
2156  * Allocates a new cdev and initializes it's most basic
2157  * fields.
2158  */
2159 cdev_t
2160 devfs_new_cdev(struct dev_ops *ops, int minor)
2161 {
2162         cdev_t dev = sysref_alloc(&cdev_sysref_class);
2163         sysref_activate(&dev->si_sysref);
2164         reference_dev(dev);
2165         memset(dev, 0, offsetof(struct cdev, si_sysref));
2166
2167         dev->si_uid = 0;
2168         dev->si_gid = 0;
2169         dev->si_perms = 0;
2170         dev->si_drv1 = NULL;
2171         dev->si_drv2 = NULL;
2172         dev->si_lastread = 0;           /* time_second */
2173         dev->si_lastwrite = 0;          /* time_second */
2174
2175         dev->si_ops = ops;
2176         dev->si_flags = 0;
2177         dev->si_umajor = 0;
2178         dev->si_uminor = minor;
2179         dev->si_inode = makeudev(devfs_reference_ops(ops), minor);
2180
2181         return dev;
2182 }
2183
2184 static void
2185 devfs_cdev_terminate(cdev_t dev)
2186 {
2187         int locked = 0;
2188
2189         /* Check if it is locked already. if not, we acquire the devfs lock */
2190         if (!(lockstatus(&devfs_lock, curthread)) == LK_EXCLUSIVE) {
2191                 lockmgr(&devfs_lock, LK_EXCLUSIVE);
2192                 locked = 1;
2193         }
2194
2195         /* Propagate destruction, just in case */
2196         devfs_propagate_dev(dev, 0);
2197
2198         /* If we acquired the lock, we also get rid of it */
2199         if (locked)
2200                 lockmgr(&devfs_lock, LK_RELEASE);
2201
2202         devfs_release_ops(dev->si_ops);
2203
2204         /* Finally destroy the device */
2205         sysref_put(&dev->si_sysref);
2206 }
2207
2208 /*
2209  * Links a given cdev into the dev list.
2210  */
2211 int
2212 devfs_link_dev(cdev_t dev)
2213 {
2214         KKASSERT((dev->si_flags & SI_DEVFS_LINKED) == 0);
2215         dev->si_flags |= SI_DEVFS_LINKED;
2216         TAILQ_INSERT_TAIL(&devfs_dev_list, dev, link);
2217
2218         return 0;
2219 }
2220
2221 /*
2222  * Removes a given cdev from the dev list.  The caller is responsible for
2223  * releasing the reference on the device associated with the linkage.
2224  *
2225  * Returns EALREADY if the dev has already been unlinked.
2226  */
2227 static int
2228 devfs_unlink_dev(cdev_t dev)
2229 {
2230         if ((dev->si_flags & SI_DEVFS_LINKED)) {
2231                 TAILQ_REMOVE(&devfs_dev_list, dev, link);
2232                 dev->si_flags &= ~SI_DEVFS_LINKED;
2233                 return (0);
2234         }
2235         return (EALREADY);
2236 }
2237
2238 int
2239 devfs_node_is_accessible(struct devfs_node *node)
2240 {
2241         if ((node) && (!(node->flags & DEVFS_HIDDEN)))
2242                 return 1;
2243         else
2244                 return 0;
2245 }
2246
2247 int
2248 devfs_reference_ops(struct dev_ops *ops)
2249 {
2250         int unit;
2251
2252         if (ops->head.refs == 0) {
2253                 ops->head.id = devfs_clone_bitmap_get(&DEVFS_CLONE_BITMAP(ops_id), 255);
2254                 if (ops->head.id == -1) {
2255                         /* Ran out of unique ids */
2256                         devfs_debug(DEVFS_DEBUG_WARNING,
2257                                         "devfs_reference_ops: WARNING: ran out of unique ids\n");
2258                 }
2259         }
2260         unit = ops->head.id;
2261         ++ops->head.refs;
2262
2263         return unit;
2264 }
2265
2266 void
2267 devfs_release_ops(struct dev_ops *ops)
2268 {
2269         --ops->head.refs;
2270
2271         if (ops->head.refs == 0) {
2272                 devfs_clone_bitmap_put(&DEVFS_CLONE_BITMAP(ops_id), ops->head.id);
2273         }
2274 }
2275
2276 void
2277 devfs_config(void)
2278 {
2279         devfs_msg_t msg;
2280
2281         msg = devfs_msg_get();
2282         msg = devfs_msg_send_sync(DEVFS_SYNC, msg);
2283         devfs_msg_put(msg);
2284 }
2285
2286 /*
2287  * Called on init of devfs; creates the objcaches and
2288  * spawns off the devfs core thread. Also initializes
2289  * locks.
2290  */
2291 static void
2292 devfs_init(void)
2293 {
2294         devfs_debug(DEVFS_DEBUG_DEBUG, "devfs_init() called\n");
2295         /* Create objcaches for nodes, msgs and devs */
2296         devfs_node_cache = objcache_create("devfs-node-cache", 0, 0,
2297                                            NULL, NULL, NULL,
2298                                            objcache_malloc_alloc,
2299                                            objcache_malloc_free,
2300                                            &devfs_node_malloc_args );
2301
2302         devfs_msg_cache = objcache_create("devfs-msg-cache", 0, 0,
2303                                           NULL, NULL, NULL,
2304                                           objcache_malloc_alloc,
2305                                           objcache_malloc_free,
2306                                           &devfs_msg_malloc_args );
2307
2308         devfs_dev_cache = objcache_create("devfs-dev-cache", 0, 0,
2309                                           NULL, NULL, NULL,
2310                                           objcache_malloc_alloc,
2311                                           objcache_malloc_free,
2312                                           &devfs_dev_malloc_args );
2313
2314         devfs_clone_bitmap_init(&DEVFS_CLONE_BITMAP(ops_id));
2315
2316         /* Initialize the reply-only port which acts as a message drain */
2317         lwkt_initport_replyonly(&devfs_dispose_port, devfs_msg_autofree_reply);
2318
2319         /* Initialize *THE* devfs lock */
2320         lockinit(&devfs_lock, "devfs_core lock", 0, 0);
2321
2322
2323         lwkt_create(devfs_msg_core, /*args*/NULL, &td_core, NULL,
2324                     0, 0, "devfs_msg_core");
2325
2326         tsleep(td_core/*devfs_id*/, 0, "devfsc", 0);
2327
2328         devfs_debug(DEVFS_DEBUG_DEBUG, "devfs_init finished\n");
2329 }
2330
2331 /*
2332  * Called on unload of devfs; takes care of destroying the core
2333  * and the objcaches. Also removes aliases that are no longer needed.
2334  */
2335 static void
2336 devfs_uninit(void)
2337 {
2338         devfs_debug(DEVFS_DEBUG_DEBUG, "devfs_uninit() called\n");
2339
2340         devfs_msg_send(DEVFS_TERMINATE_CORE, NULL);
2341
2342         tsleep(td_core/*devfs_id*/, 0, "devfsc", 0);
2343         tsleep(td_core/*devfs_id*/, 0, "devfsc", 10000);
2344
2345         devfs_clone_bitmap_uninit(&DEVFS_CLONE_BITMAP(ops_id));
2346
2347         /* Destroy the objcaches */
2348         objcache_destroy(devfs_msg_cache);
2349         objcache_destroy(devfs_node_cache);
2350         objcache_destroy(devfs_dev_cache);
2351
2352         devfs_alias_reap();
2353 }
2354
2355 /*
2356  * This is a sysctl handler to assist userland devname(3) to
2357  * find the device name for a given udev.
2358  */
2359 static int
2360 devfs_sysctl_devname_helper(SYSCTL_HANDLER_ARGS)
2361 {
2362         udev_t  udev;
2363         cdev_t  found;
2364         int             error;
2365
2366
2367         if ((error = SYSCTL_IN(req, &udev, sizeof(udev_t))))
2368                 return (error);
2369
2370         devfs_debug(DEVFS_DEBUG_DEBUG, "devfs sysctl, received udev: %d\n", udev);
2371
2372         if (udev == NOUDEV)
2373                 return(EINVAL);
2374
2375         if ((found = devfs_find_device_by_udev(udev)) == NULL)
2376                 return(ENOENT);
2377
2378         return(SYSCTL_OUT(req, found->si_name, strlen(found->si_name) + 1));
2379 }
2380
2381
2382 SYSCTL_PROC(_kern, OID_AUTO, devname, CTLTYPE_OPAQUE|CTLFLAG_RW|CTLFLAG_ANYBODY,
2383                         NULL, 0, devfs_sysctl_devname_helper, "", "helper for devname(3)");
2384
2385 static SYSCTL_NODE(_vfs, OID_AUTO, devfs, CTLFLAG_RW, 0, "devfs");
2386 TUNABLE_INT("vfs.devfs.debug", &devfs_debug_enable);
2387 SYSCTL_INT(_vfs_devfs, OID_AUTO, debug, CTLFLAG_RW, &devfs_debug_enable,
2388                 0, "Enable DevFS debugging");
2389
2390 SYSINIT(vfs_devfs_register, SI_SUB_PRE_DRIVERS, SI_ORDER_FIRST,
2391                 devfs_init, NULL);
2392 SYSUNINIT(vfs_devfs_register, SI_SUB_PRE_DRIVERS, SI_ORDER_ANY,
2393                 devfs_uninit, NULL);