kernel - Add v_token_name to gd_cnt
[dragonfly.git] / sys / kern / lwkt_token.c
1 /*
2  * Copyright (c) 2003,2004,2009 The DragonFly Project.  All rights reserved.
3  * 
4  * This code is derived from software contributed to The DragonFly Project
5  * by Matthew Dillon <dillon@backplane.com>
6  * 
7  * Redistribution and use in source and binary forms, with or without
8  * modification, are permitted provided that the following conditions
9  * are met:
10  * 
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer.
13  * 2. Redistributions in binary form must reproduce the above copyright
14  *    notice, this list of conditions and the following disclaimer in
15  *    the documentation and/or other materials provided with the
16  *    distribution.
17  * 3. Neither the name of The DragonFly Project nor the names of its
18  *    contributors may be used to endorse or promote products derived
19  *    from this software without specific, prior written permission.
20  * 
21  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22  * ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23  * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
24  * FOR A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE
25  * COPYRIGHT HOLDERS OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
26  * INCIDENTAL, SPECIAL, EXEMPLARY OR CONSEQUENTIAL DAMAGES (INCLUDING,
27  * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
28  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED
29  * AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
30  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
31  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
32  * SUCH DAMAGE.
33  */
34
35 /*
36  * lwkt_token - Implement soft token locks.
37  *
38  * Tokens are locks which serialize a thread only while the thread is
39  * running.  If the thread blocks all tokens are released, then reacquired
40  * when the thread resumes.
41  *
42  * This implementation requires no critical sections or spin locks, but
43  * does use atomic_cmpset_ptr().
44  *
45  * Tokens may be recursively acquired by the same thread.  However the
46  * caller must be sure to release such tokens in reverse order.
47  */
48 #include <sys/param.h>
49 #include <sys/systm.h>
50 #include <sys/kernel.h>
51 #include <sys/proc.h>
52 #include <sys/rtprio.h>
53 #include <sys/queue.h>
54 #include <sys/sysctl.h>
55 #include <sys/ktr.h>
56 #include <sys/kthread.h>
57 #include <machine/cpu.h>
58 #include <sys/lock.h>
59 #include <sys/caps.h>
60 #include <sys/spinlock.h>
61
62 #include <sys/thread2.h>
63 #include <sys/spinlock2.h>
64 #include <sys/mplock2.h>
65
66 #include <vm/vm.h>
67 #include <vm/vm_param.h>
68 #include <vm/vm_kern.h>
69 #include <vm/vm_object.h>
70 #include <vm/vm_page.h>
71 #include <vm/vm_map.h>
72 #include <vm/vm_pager.h>
73 #include <vm/vm_extern.h>
74 #include <vm/vm_zone.h>
75
76 #include <machine/stdarg.h>
77 #include <machine/smp.h>
78
79 extern int lwkt_sched_debug;
80
81 #ifndef LWKT_NUM_POOL_TOKENS
82 #define LWKT_NUM_POOL_TOKENS    4001    /* prime number */
83 #endif
84
85 static lwkt_token       pool_tokens[LWKT_NUM_POOL_TOKENS];
86
87 #define TOKEN_STRING    "REF=%p TOK=%p TD=%p"
88 #define TOKEN_ARGS      lwkt_tokref_t ref, lwkt_token_t tok, struct thread *td
89 #define CONTENDED_STRING        TOKEN_STRING " (contention started)"
90 #define UNCONTENDED_STRING      TOKEN_STRING " (contention stopped)"
91 #if !defined(KTR_TOKENS)
92 #define KTR_TOKENS      KTR_ALL
93 #endif
94
95 KTR_INFO_MASTER(tokens);
96 KTR_INFO(KTR_TOKENS, tokens, fail, 0, TOKEN_STRING, TOKEN_ARGS);
97 KTR_INFO(KTR_TOKENS, tokens, succ, 1, TOKEN_STRING, TOKEN_ARGS);
98 #if 0
99 KTR_INFO(KTR_TOKENS, tokens, release, 2, TOKEN_STRING, TOKEN_ARGS);
100 KTR_INFO(KTR_TOKENS, tokens, remote, 3, TOKEN_STRING, TOKEN_ARGS);
101 KTR_INFO(KTR_TOKENS, tokens, reqremote, 4, TOKEN_STRING, TOKEN_ARGS);
102 KTR_INFO(KTR_TOKENS, tokens, reqfail, 5, TOKEN_STRING, TOKEN_ARGS);
103 KTR_INFO(KTR_TOKENS, tokens, drain, 6, TOKEN_STRING, TOKEN_ARGS);
104 KTR_INFO(KTR_TOKENS, tokens, contention_start, 7, CONTENDED_STRING, TOKEN_ARGS);
105 KTR_INFO(KTR_TOKENS, tokens, contention_stop, 7, UNCONTENDED_STRING, TOKEN_ARGS);
106 #endif
107
108 #define logtoken(name, ref)                                             \
109         KTR_LOG(tokens_ ## name, ref, ref->tr_tok, curthread)
110
111 /*
112  * Global tokens.  These replace the MP lock for major subsystem locking.
113  * These tokens are initially used to lockup both global and individual
114  * operations.
115  *
116  * Once individual structures get their own locks these tokens are used
117  * only to protect global lists & other variables and to interlock
118  * allocations and teardowns and such.
119  *
120  * The UP initializer causes token acquisition to also acquire the MP lock
121  * for maximum compatibility.  The feature may be enabled and disabled at
122  * any time, the MP state is copied to the tokref when the token is acquired
123  * and will not race against sysctl changes.
124  */
125 struct lwkt_token mp_token = LWKT_TOKEN_INITIALIZER(mp_token);
126 struct lwkt_token pmap_token = LWKT_TOKEN_INITIALIZER(pmap_token);
127 struct lwkt_token dev_token = LWKT_TOKEN_INITIALIZER(dev_token);
128 struct lwkt_token vm_token = LWKT_TOKEN_INITIALIZER(vm_token);
129 struct lwkt_token vmspace_token = LWKT_TOKEN_INITIALIZER(vmspace_token);
130 struct lwkt_token kvm_token = LWKT_TOKEN_INITIALIZER(kvm_token);
131 struct lwkt_token proc_token = LWKT_TOKEN_INITIALIZER(proc_token);
132 struct lwkt_token tty_token = LWKT_TOKEN_INITIALIZER(tty_token);
133 struct lwkt_token vnode_token = LWKT_TOKEN_INITIALIZER(vnode_token);
134 struct lwkt_token vmobj_token = LWKT_TOKEN_INITIALIZER(vmobj_token);
135
136 static int lwkt_token_spin = 5;
137 SYSCTL_INT(_lwkt, OID_AUTO, token_spin, CTLFLAG_RW,
138     &lwkt_token_spin, 0, "Decontention spin loops");
139 static int lwkt_token_delay = 0;
140 SYSCTL_INT(_lwkt, OID_AUTO, token_delay, CTLFLAG_RW,
141     &lwkt_token_delay, 0, "Decontention spin delay in ns");
142
143 /*
144  * The collision count is bumped every time the LWKT scheduler fails
145  * to acquire needed tokens in addition to a normal lwkt_gettoken()
146  * stall.
147  */
148 SYSCTL_LONG(_lwkt, OID_AUTO, mp_collisions, CTLFLAG_RW,
149     &mp_token.t_collisions, 0, "Collision counter of mp_token");
150 SYSCTL_LONG(_lwkt, OID_AUTO, pmap_collisions, CTLFLAG_RW,
151     &pmap_token.t_collisions, 0, "Collision counter of pmap_token");
152 SYSCTL_LONG(_lwkt, OID_AUTO, dev_collisions, CTLFLAG_RW,
153     &dev_token.t_collisions, 0, "Collision counter of dev_token");
154 SYSCTL_LONG(_lwkt, OID_AUTO, vm_collisions, CTLFLAG_RW,
155     &vm_token.t_collisions, 0, "Collision counter of vm_token");
156 SYSCTL_LONG(_lwkt, OID_AUTO, vmspace_collisions, CTLFLAG_RW,
157     &vmspace_token.t_collisions, 0, "Collision counter of vmspace_token");
158 SYSCTL_LONG(_lwkt, OID_AUTO, kvm_collisions, CTLFLAG_RW,
159     &kvm_token.t_collisions, 0, "Collision counter of kvm_token");
160 SYSCTL_LONG(_lwkt, OID_AUTO, proc_collisions, CTLFLAG_RW,
161     &proc_token.t_collisions, 0, "Collision counter of proc_token");
162 SYSCTL_LONG(_lwkt, OID_AUTO, tty_collisions, CTLFLAG_RW,
163     &tty_token.t_collisions, 0, "Collision counter of tty_token");
164 SYSCTL_LONG(_lwkt, OID_AUTO, vnode_collisions, CTLFLAG_RW,
165     &vnode_token.t_collisions, 0, "Collision counter of vnode_token");
166
167 #ifdef DEBUG_LOCKS_LATENCY
168
169 static long tokens_add_latency;
170 SYSCTL_LONG(_debug, OID_AUTO, tokens_add_latency, CTLFLAG_RW,
171             &tokens_add_latency, 0,
172             "Add spinlock latency");
173
174 #endif
175
176
177 static int _lwkt_getalltokens_sorted(thread_t td);
178
179 #ifdef SMP
180 /*
181  * Acquire the initial mplock
182  *
183  * (low level boot only)
184  */
185 void
186 cpu_get_initial_mplock(void)
187 {
188         KKASSERT(mp_token.t_ref == NULL);
189         if (lwkt_trytoken(&mp_token) == FALSE)
190                 panic("cpu_get_initial_mplock");
191 }
192 #endif
193
194 /*
195  * Return a pool token given an address.  Use a prime number to reduce
196  * overlaps.
197  */
198 static __inline
199 lwkt_token_t
200 _lwkt_token_pool_lookup(void *ptr)
201 {
202         u_int i;
203
204         i = (u_int)(uintptr_t)ptr % LWKT_NUM_POOL_TOKENS;
205         return(&pool_tokens[i]);
206 }
207
208 /*
209  * Initialize a tokref_t prior to making it visible in the thread's
210  * token array.
211  */
212 static __inline
213 void
214 _lwkt_tokref_init(lwkt_tokref_t ref, lwkt_token_t tok, thread_t td, long excl)
215 {
216         ref->tr_tok = tok;
217         ref->tr_count = excl;
218         ref->tr_owner = td;
219 }
220
221 /*
222  * Attempt to acquire a shared or exclusive token.  Returns TRUE on success,
223  * FALSE on failure.
224  *
225  * If TOK_EXCLUSIVE is set in mode we are attempting to get an exclusive
226  * token, otherwise are attempting to get a shared token.
227  *
228  * If TOK_EXCLREQ is set in mode this is a blocking operation, otherwise
229  * it is a non-blocking operation (for both exclusive or shared acquisions).
230  */
231 static __inline
232 int
233 _lwkt_trytokref(lwkt_tokref_t ref, thread_t td, long mode)
234 {
235         lwkt_token_t tok;
236         lwkt_tokref_t oref;
237         long count;
238
239         tok = ref->tr_tok;
240         KASSERT(((mode & TOK_EXCLREQ) == 0 ||   /* non blocking */
241                 td->td_gd->gd_intr_nesting_level == 0 ||
242                 panic_cpu_gd == mycpu),
243                 ("Attempt to acquire token %p not already "
244                 "held in hard code section", tok));
245
246         if (mode & TOK_EXCLUSIVE) {
247                 /*
248                  * Attempt to get an exclusive token
249                  */
250                 for (;;) {
251                         count = tok->t_count;
252                         oref = tok->t_ref;      /* can be NULL */
253                         cpu_ccfence();
254                         if ((count & ~TOK_EXCLREQ) == 0) {
255                                 /*
256                                  * It is possible to get the exclusive bit.
257                                  * We must clear TOK_EXCLREQ on successful
258                                  * acquisition.
259                                  */
260                                 if (atomic_cmpset_long(&tok->t_count, count,
261                                                        (count & ~TOK_EXCLREQ) |
262                                                        TOK_EXCLUSIVE)) {
263                                         KKASSERT(tok->t_ref == NULL);
264                                         tok->t_ref = ref;
265                                         return TRUE;
266                                 }
267                                 /* retry */
268                         } else if ((count & TOK_EXCLUSIVE) &&
269                                    oref >= &td->td_toks_base &&
270                                    oref < td->td_toks_stop) {
271                                 /*
272                                  * Our thread already holds the exclusive
273                                  * bit, we treat this tokref as a shared
274                                  * token (sorta) to make the token release
275                                  * code easier.
276                                  *
277                                  * NOTE: oref cannot race above if it
278                                  *       happens to be ours, so we're good.
279                                  *       But we must still have a stable
280                                  *       variable for both parts of the
281                                  *       comparison.
282                                  *
283                                  * NOTE: Since we already have an exclusive
284                                  *       lock and don't need to check EXCLREQ
285                                  *       we can just use an atomic_add here
286                                  */
287                                 atomic_add_long(&tok->t_count, TOK_INCR);
288                                 ref->tr_count &= ~TOK_EXCLUSIVE;
289                                 return TRUE;
290                         } else if ((mode & TOK_EXCLREQ) &&
291                                    (count & TOK_EXCLREQ) == 0) {
292                                 /*
293                                  * Unable to get the exclusive bit but being
294                                  * asked to set the exclusive-request bit.
295                                  * Since we are going to retry anyway just
296                                  * set the bit unconditionally.
297                                  */
298                                 atomic_set_long(&tok->t_count, TOK_EXCLREQ);
299                                 return FALSE;
300                         } else {
301                                 /*
302                                  * Unable to get the exclusive bit and not
303                                  * being asked to set the exclusive-request
304                                  * (aka lwkt_trytoken()), or EXCLREQ was
305                                  * already set.
306                                  */
307                                 cpu_pause();
308                                 return FALSE;
309                         }
310                         /* retry */
311                 }
312         } else {
313                 /*
314                  * Attempt to get a shared token.  Note that TOK_EXCLREQ
315                  * for shared tokens simply means the caller intends to
316                  * block.  We never actually set the bit in tok->t_count.
317                  */
318                 for (;;) {
319                         count = tok->t_count;
320                         oref = tok->t_ref;      /* can be NULL */
321                         cpu_ccfence();
322                         if ((count & (TOK_EXCLUSIVE/*|TOK_EXCLREQ*/)) == 0) {
323                                 /* XXX EXCLREQ should work */
324                                 /*
325                                  * It is possible to get the token shared.
326                                  */
327                                 if (atomic_cmpset_long(&tok->t_count, count,
328                                                        count + TOK_INCR)) {
329                                         return TRUE;
330                                 }
331                                 /* retry */
332                         } else if ((count & TOK_EXCLUSIVE) &&
333                                    oref >= &td->td_toks_base &&
334                                    oref < td->td_toks_stop) {
335                                 /*
336                                  * We own the exclusive bit on the token so
337                                  * we can in fact also get it shared.
338                                  */
339                                 atomic_add_long(&tok->t_count, TOK_INCR);
340                                 return TRUE;
341                         } else {
342                                 /*
343                                  * We failed to get the token shared
344                                  */
345                                 return FALSE;
346                         }
347                         /* retry */
348                 }
349         }
350 }
351
352 static __inline
353 int
354 _lwkt_trytokref_spin(lwkt_tokref_t ref, thread_t td, long mode)
355 {
356         int spin;
357
358         if (_lwkt_trytokref(ref, td, mode)) {
359 #ifdef DEBUG_LOCKS_LATENCY
360                 long j;
361                 for (j = tokens_add_latency; j > 0; --j)
362                         cpu_ccfence();
363 #endif
364                 return TRUE;
365         }
366         for (spin = lwkt_token_spin; spin > 0; --spin) {
367                 if (lwkt_token_delay)
368                         tsc_delay(lwkt_token_delay);
369                 else
370                         cpu_pause();
371                 if (_lwkt_trytokref(ref, td, mode)) {
372 #ifdef DEBUG_LOCKS_LATENCY
373                         long j;
374                         for (j = tokens_add_latency; j > 0; --j)
375                                 cpu_ccfence();
376 #endif
377                         return TRUE;
378                 }
379         }
380         return FALSE;
381 }
382
383 /*
384  * Release a token that we hold.
385  */
386 static __inline
387 void
388 _lwkt_reltokref(lwkt_tokref_t ref, thread_t td)
389 {
390         lwkt_token_t tok;
391         long count;
392
393         tok = ref->tr_tok;
394         for (;;) {
395                 count = tok->t_count;
396                 cpu_ccfence();
397                 if (tok->t_ref == ref) {
398                         /*
399                          * We are an exclusive holder.  We must clear tr_ref
400                          * before we clear the TOK_EXCLUSIVE bit.  If we are
401                          * unable to clear the bit we must restore
402                          * tok->t_ref.
403                          */
404                         KKASSERT(count & TOK_EXCLUSIVE);
405                         tok->t_ref = NULL;
406                         if (atomic_cmpset_long(&tok->t_count, count,
407                                                count & ~TOK_EXCLUSIVE)) {
408                                 return;
409                         }
410                         tok->t_ref = ref;
411                         /* retry */
412                 } else {
413                         /*
414                          * We are a shared holder
415                          */
416                         KKASSERT(count & TOK_COUNTMASK);
417                         if (atomic_cmpset_long(&tok->t_count, count,
418                                                count - TOK_INCR)) {
419                                 return;
420                         }
421                         /* retry */
422                 }
423                 /* retry */
424         }
425 }
426
427 /*
428  * Obtain all the tokens required by the specified thread on the current
429  * cpu, return 0 on failure and non-zero on success.  If a failure occurs
430  * any partially acquired tokens will be released prior to return.
431  *
432  * lwkt_getalltokens is called by the LWKT scheduler to re-acquire all
433  * tokens that the thread had to release when it switched away.
434  *
435  * If spinning is non-zero this function acquires the tokens in a particular
436  * order to deal with potential deadlocks.  We simply use address order for
437  * the case.
438  *
439  * Called from a critical section.
440  */
441 int
442 lwkt_getalltokens(thread_t td, int spinning)
443 {
444         lwkt_tokref_t scan;
445         lwkt_token_t tok;
446
447         if (spinning)
448                 return(_lwkt_getalltokens_sorted(td));
449
450         /*
451          * Acquire tokens in forward order, assign or validate tok->t_ref.
452          */
453         for (scan = &td->td_toks_base; scan < td->td_toks_stop; ++scan) {
454                 tok = scan->tr_tok;
455                 for (;;) {
456                         /*
457                          * Only try really hard on the last token
458                          */
459                         if (scan == td->td_toks_stop - 1) {
460                             if (_lwkt_trytokref_spin(scan, td, scan->tr_count))
461                                     break;
462                         } else {
463                             if (_lwkt_trytokref(scan, td, scan->tr_count))
464                                     break;
465                         }
466
467                         /*
468                          * Otherwise we failed to acquire all the tokens.
469                          * Release whatever we did get.
470                          */
471                         strncpy(td->td_gd->gd_cnt.v_token_name,
472                                 tok->t_desc,
473                                 sizeof(td->td_gd->gd_cnt.v_token_name) - 1);
474
475                         if (lwkt_sched_debug > 0) {
476                                 --lwkt_sched_debug;
477                                 kprintf("toka %p %s %s\n",
478                                         tok, tok->t_desc, td->td_comm);
479                         }
480                         td->td_wmesg = tok->t_desc;
481                         ++tok->t_collisions;
482                         while (--scan >= &td->td_toks_base)
483                                 _lwkt_reltokref(scan, td);
484                         return(FALSE);
485                 }
486         }
487         return (TRUE);
488 }
489
490 /*
491  * Release all tokens owned by the specified thread on the current cpu.
492  *
493  * This code is really simple.  Even in cases where we own all the tokens
494  * note that t_ref may not match the scan for recursively held tokens which
495  * are held deeper in the stack, or for the case where a lwkt_getalltokens()
496  * failed.
497  *
498  * Tokens are released in reverse order to reduce chasing race failures.
499  * 
500  * Called from a critical section.
501  */
502 void
503 lwkt_relalltokens(thread_t td)
504 {
505         lwkt_tokref_t scan;
506
507         /*
508          * Weird order is to try to avoid a panic loop
509          */
510         if (td->td_toks_have) {
511                 scan = td->td_toks_have;
512                 td->td_toks_have = NULL;
513         } else {
514                 scan = td->td_toks_stop;
515         }
516         while (--scan >= &td->td_toks_base)
517                 _lwkt_reltokref(scan, td);
518 }
519
520 /*
521  * This is the decontention version of lwkt_getalltokens().  The tokens are
522  * acquired in address-sorted order to deal with any deadlocks.  Ultimately
523  * token failures will spin into the scheduler and get here.
524  *
525  * Called from critical section
526  */
527 static
528 int
529 _lwkt_getalltokens_sorted(thread_t td)
530 {
531         lwkt_tokref_t sort_array[LWKT_MAXTOKENS];
532         lwkt_tokref_t scan;
533         lwkt_token_t tok;
534         int i;
535         int j;
536         int n;
537
538         /*
539          * Sort the token array.  Yah yah, I know this isn't fun.
540          *
541          * NOTE: Recursively acquired tokens are ordered the same as in the
542          *       td_toks_array so we can always get the earliest one first.
543          */
544         i = 0;
545         scan = &td->td_toks_base;
546         while (scan < td->td_toks_stop) {
547                 for (j = 0; j < i; ++j) {
548                         if (scan->tr_tok < sort_array[j]->tr_tok)
549                                 break;
550                 }
551                 if (j != i) {
552                         bcopy(sort_array + j, sort_array + j + 1,
553                               (i - j) * sizeof(lwkt_tokref_t));
554                 }
555                 sort_array[j] = scan;
556                 ++scan;
557                 ++i;
558         }
559         n = i;
560
561         /*
562          * Acquire tokens in forward order, assign or validate tok->t_ref.
563          */
564         for (i = 0; i < n; ++i) {
565                 scan = sort_array[i];
566                 tok = scan->tr_tok;
567                 for (;;) {
568                         /*
569                          * Only try really hard on the last token
570                          */
571                         if (scan == td->td_toks_stop - 1) {
572                             if (_lwkt_trytokref_spin(scan, td, scan->tr_count))
573                                     break;
574                         } else {
575                             if (_lwkt_trytokref(scan, td, scan->tr_count))
576                                     break;
577                         }
578
579                         /*
580                          * Otherwise we failed to acquire all the tokens.
581                          * Release whatever we did get.
582                          */
583                         if (lwkt_sched_debug > 0) {
584                                 --lwkt_sched_debug;
585                                 kprintf("tokb %p %s %s\n",
586                                         tok, tok->t_desc, td->td_comm);
587                         }
588                         td->td_wmesg = tok->t_desc;
589                         ++tok->t_collisions;
590                         while (--i >= 0) {
591                                 scan = sort_array[i];
592                                 _lwkt_reltokref(scan, td);
593                         }
594                         return(FALSE);
595                 }
596         }
597
598         /*
599          * We were successful, there is no need for another core to signal
600          * us.
601          */
602         return (TRUE);
603 }
604
605 /*
606  * Get a serializing token.  This routine can block.
607  */
608 void
609 lwkt_gettoken(lwkt_token_t tok)
610 {
611         thread_t td = curthread;
612         lwkt_tokref_t ref;
613
614         ref = td->td_toks_stop;
615         KKASSERT(ref < &td->td_toks_end);
616         ++td->td_toks_stop;
617         cpu_ccfence();
618         _lwkt_tokref_init(ref, tok, td, TOK_EXCLUSIVE|TOK_EXCLREQ);
619
620 #ifdef DEBUG_LOCKS
621         /*
622          * Taking an exclusive token after holding it shared will
623          * livelock. Scan for that case and assert.
624          */
625         lwkt_tokref_t tk;
626         int found = 0;
627         for (tk = &td->td_toks_base; tk < ref; tk++) {
628                 if (tk->tr_tok != tok)
629                         continue;
630                 
631                 found++;
632                 if (tk->tr_count & TOK_EXCLUSIVE) 
633                         goto good;
634         }
635         /* We found only shared instances of this token if found >0 here */
636         KASSERT((found == 0), ("Token %p s/x livelock", tok));
637 good:
638 #endif
639
640         if (_lwkt_trytokref_spin(ref, td, TOK_EXCLUSIVE|TOK_EXCLREQ))
641                 return;
642
643         /*
644          * Give up running if we can't acquire the token right now.
645          *
646          * Since the tokref is already active the scheduler now
647          * takes care of acquisition, so we need only call
648          * lwkt_switch().
649          *
650          * Since we failed this was not a recursive token so upon
651          * return tr_tok->t_ref should be assigned to this specific
652          * ref.
653          */
654         td->td_wmesg = tok->t_desc;
655         ++tok->t_collisions;
656         logtoken(fail, ref);
657         td->td_toks_have = td->td_toks_stop - 1;
658         lwkt_switch();
659         logtoken(succ, ref);
660         KKASSERT(tok->t_ref == ref);
661 }
662
663 /*
664  * Similar to gettoken but we acquire a shared token instead of an exclusive
665  * token.
666  */
667 void
668 lwkt_gettoken_shared(lwkt_token_t tok)
669 {
670         thread_t td = curthread;
671         lwkt_tokref_t ref;
672
673         ref = td->td_toks_stop;
674         KKASSERT(ref < &td->td_toks_end);
675         ++td->td_toks_stop;
676         cpu_ccfence();
677         _lwkt_tokref_init(ref, tok, td, TOK_EXCLREQ);
678
679 #ifdef DEBUG_LOCKS
680         /*
681          * Taking a pool token in shared mode is a bad idea; other
682          * addresses deeper in the call stack may hash to the same pool
683          * token and you may end up with an exclusive-shared livelock.
684          * Warn in this condition.
685          */
686         if ((tok >= &pool_tokens[0]) &&
687             (tok < &pool_tokens[LWKT_NUM_POOL_TOKENS]))
688                 kprintf("Warning! Taking pool token %p in shared mode\n", tok);
689 #endif
690
691
692         if (_lwkt_trytokref_spin(ref, td, TOK_EXCLREQ))
693                 return;
694
695         /*
696          * Give up running if we can't acquire the token right now.
697          *
698          * Since the tokref is already active the scheduler now
699          * takes care of acquisition, so we need only call
700          * lwkt_switch().
701          *
702          * Since we failed this was not a recursive token so upon
703          * return tr_tok->t_ref should be assigned to this specific
704          * ref.
705          */
706         td->td_wmesg = tok->t_desc;
707         ++tok->t_collisions;
708         logtoken(fail, ref);
709         td->td_toks_have = td->td_toks_stop - 1;
710         lwkt_switch();
711         logtoken(succ, ref);
712 }
713
714 /*
715  * Attempt to acquire a token, return TRUE on success, FALSE on failure.
716  *
717  * We setup the tokref in case we actually get the token (if we switch later
718  * it becomes mandatory so we set TOK_EXCLREQ), but we call trytokref without
719  * TOK_EXCLREQ in case we fail.
720  */
721 int
722 lwkt_trytoken(lwkt_token_t tok)
723 {
724         thread_t td = curthread;
725         lwkt_tokref_t ref;
726
727         ref = td->td_toks_stop;
728         KKASSERT(ref < &td->td_toks_end);
729         ++td->td_toks_stop;
730         cpu_ccfence();
731         _lwkt_tokref_init(ref, tok, td, TOK_EXCLUSIVE|TOK_EXCLREQ);
732
733         if (_lwkt_trytokref(ref, td, TOK_EXCLUSIVE))
734                 return TRUE;
735
736         /*
737          * Failed, unpend the request
738          */
739         cpu_ccfence();
740         --td->td_toks_stop;
741         ++tok->t_collisions;
742         return FALSE;
743 }
744
745
746 void
747 lwkt_gettoken_hard(lwkt_token_t tok)
748 {
749         lwkt_gettoken(tok);
750         crit_enter_hard();
751 }
752
753 lwkt_token_t
754 lwkt_getpooltoken(void *ptr)
755 {
756         lwkt_token_t tok;
757
758         tok = _lwkt_token_pool_lookup(ptr);
759         lwkt_gettoken(tok);
760         return (tok);
761 }
762
763 /*
764  * Release a serializing token.
765  *
766  * WARNING!  All tokens must be released in reverse order.  This will be
767  *           asserted.
768  */
769 void
770 lwkt_reltoken(lwkt_token_t tok)
771 {
772         thread_t td = curthread;
773         lwkt_tokref_t ref;
774
775         /*
776          * Remove ref from thread token list and assert that it matches
777          * the token passed in.  Tokens must be released in reverse order.
778          */
779         ref = td->td_toks_stop - 1;
780         KKASSERT(ref >= &td->td_toks_base && ref->tr_tok == tok);
781         _lwkt_reltokref(ref, td);
782         cpu_sfence();
783         td->td_toks_stop = ref;
784 }
785
786 void
787 lwkt_reltoken_hard(lwkt_token_t tok)
788 {
789         lwkt_reltoken(tok);
790         crit_exit_hard();
791 }
792
793 /*
794  * It is faster for users of lwkt_getpooltoken() to use the returned
795  * token and just call lwkt_reltoken(), but for convenience we provide
796  * this function which looks the token up based on the ident.
797  */
798 void
799 lwkt_relpooltoken(void *ptr)
800 {
801         lwkt_token_t tok = _lwkt_token_pool_lookup(ptr);
802         lwkt_reltoken(tok);
803 }
804
805 /*
806  * Return a count of the number of token refs the thread has to the
807  * specified token, whether it currently owns the token or not.
808  */
809 int
810 lwkt_cnttoken(lwkt_token_t tok, thread_t td)
811 {
812         lwkt_tokref_t scan;
813         int count = 0;
814
815         for (scan = &td->td_toks_base; scan < td->td_toks_stop; ++scan) {
816                 if (scan->tr_tok == tok)
817                         ++count;
818         }
819         return(count);
820 }
821
822 /*
823  * Pool tokens are used to provide a type-stable serializing token
824  * pointer that does not race against disappearing data structures.
825  *
826  * This routine is called in early boot just after we setup the BSP's
827  * globaldata structure.
828  */
829 void
830 lwkt_token_pool_init(void)
831 {
832         int i;
833
834         for (i = 0; i < LWKT_NUM_POOL_TOKENS; ++i)
835                 lwkt_token_init(&pool_tokens[i], "pool");
836 }
837
838 lwkt_token_t
839 lwkt_token_pool_lookup(void *ptr)
840 {
841         return (_lwkt_token_pool_lookup(ptr));
842 }
843
844 /*
845  * Initialize a token.  
846  */
847 void
848 lwkt_token_init(lwkt_token_t tok, const char *desc)
849 {
850         tok->t_count = 0;
851         tok->t_ref = NULL;
852         tok->t_collisions = 0;
853         tok->t_desc = desc;
854 }
855
856 void
857 lwkt_token_uninit(lwkt_token_t tok)
858 {
859         /* empty */
860 }
861
862 /*
863  * Exchange the two most recent tokens on the tokref stack.  This allows
864  * you to release a token out of order.
865  *
866  * We have to be careful about the case where the top two tokens are
867  * the same token.  In this case tok->t_ref will point to the deeper
868  * ref and must remain pointing to the deeper ref.  If we were to swap
869  * it the first release would clear the token even though a second
870  * ref is still present.
871  *
872  * Only exclusively held tokens contain a reference to the tokref which
873  * has to be flipped along with the swap.
874  */
875 void
876 lwkt_token_swap(void)
877 {
878         lwkt_tokref_t ref1, ref2;
879         lwkt_token_t tok1, tok2;
880         long count1, count2;
881         thread_t td = curthread;
882
883         crit_enter();
884
885         ref1 = td->td_toks_stop - 1;
886         ref2 = td->td_toks_stop - 2;
887         KKASSERT(ref1 >= &td->td_toks_base);
888         KKASSERT(ref2 >= &td->td_toks_base);
889
890         tok1 = ref1->tr_tok;
891         tok2 = ref2->tr_tok;
892         count1 = ref1->tr_count;
893         count2 = ref2->tr_count;
894
895         if (tok1 != tok2) {
896                 ref1->tr_tok = tok2;
897                 ref1->tr_count = count2;
898                 ref2->tr_tok = tok1;
899                 ref2->tr_count = count1;
900                 if (tok1->t_ref == ref1)
901                         tok1->t_ref = ref2;
902                 if (tok2->t_ref == ref2)
903                         tok2->t_ref = ref1;
904         }
905
906         crit_exit();
907 }