Move remaining scheduler-specific functions into the usched abstraction.
[dragonfly.git] / usr.bin / top / machine.c
1 /*
2  * top - a top users display for Unix
3  *
4  * SYNOPSIS:  For FreeBSD-2.x and later
5  *
6  * DESCRIPTION:
7  * Originally written for BSD4.4 system by Christos Zoulas.
8  * Ported to FreeBSD 2.x by Steven Wallace && Wolfram Schneider
9  * Order support hacked in from top-3.5beta6/machine/m_aix41.c
10  *   by Monte Mitzelfelt (for latest top see http://www.groupsys.com/topinfo/)
11  *
12  * This is the machine-dependent module for FreeBSD 2.2
13  * Works for:
14  *      FreeBSD 2.2.x, 3.x, 4.x, and probably FreeBSD 2.1.x
15  *
16  * LIBS: -lkvm
17  *
18  * AUTHOR:  Christos Zoulas <christos@ee.cornell.edu>
19  *          Steven Wallace  <swallace@freebsd.org>
20  *          Wolfram Schneider <wosch@FreeBSD.org>
21  *          Hiten Pandya <hmp@backplane.com>
22  *
23  * $FreeBSD: src/usr.bin/top/machine.c,v 1.29.2.2 2001/07/31 20:27:05 tmm Exp $
24  * $DragonFly: src/usr.bin/top/machine.c,v 1.16 2005/06/26 04:36:35 dillon Exp $
25  */
26
27
28 #include <sys/time.h>
29 #include <sys/types.h>
30 #include <sys/signal.h>
31 #include <sys/param.h>
32
33 #include "os.h"
34 #include <err.h>
35 #include <kvm.h>
36 #include <stdio.h>
37 #include <math.h>
38 #include <pwd.h>
39 #include <sys/errno.h>
40 #include <sys/sysctl.h>
41 #include <sys/file.h>
42 #include <sys/time.h>
43 #include <sys/user.h>
44 #include <sys/vmmeter.h>
45 #include <sys/resource.h>
46 #include <sys/rtprio.h>
47
48 /* Swap */
49 #include <stdlib.h>
50 #include <sys/conf.h>
51
52 #include <osreldate.h> /* for changes in kernel structures */
53
54 #include <sys/kinfo.h>
55 #include <kinfo.h>
56 #include "top.h"
57 #include "machine.h"
58
59 static int check_nlist(struct nlist *);
60 static int getkval(unsigned long, int *, int, char *);
61 extern char* printable(char *);
62 int swapmode(int *retavail, int *retfree);
63 static int smpmode;
64 static int namelength;
65 static int cmdlength;
66
67 /* 
68  * needs to be a global symbol, so wrapper can be
69  * modified accordingly.
70  */
71 static int show_threads = 0;
72
73 /* get_process_info passes back a handle.  This is what it looks like: */
74
75 struct handle
76 {
77     struct kinfo_proc **next_proc;      /* points to next valid proc pointer */
78     int remaining;              /* number of pointers remaining */
79 };
80
81 /* declarations for load_avg */
82 #include "loadavg.h"
83
84 #define PP(pp, field) ((pp)->kp_proc . field)
85 #define EP(pp, field) ((pp)->kp_eproc . field)
86 #define TP(pp, field) ((pp)->kp_thread . field)
87 #define VP(pp, field) ((pp)->kp_eproc.e_vm . field)
88
89 /* define what weighted cpu is.  */
90 #define weighted_cpu(pct, pp) (PP((pp), p_swtime) == 0 ? 0.0 : \
91                          ((pct) / (1.0 - exp(PP((pp), p_swtime) * logcpu))))
92
93 /* what we consider to be process size: */
94 #define PROCSIZE(pp) (VP((pp), vm_map.size) / 1024)
95
96 /*
97  *  These definitions control the format of the per-process area
98  */
99
100 static char smp_header[] =
101   "  PID %-*.*s PRI NICE  SIZE    RES STATE  C   TIME   WCPU    CPU COMMAND";
102
103 #define smp_Proc_format \
104         "%5d %-*.*s %3d %3d%7s %6s %-6.6s %1x%7s %5.2f%% %5.2f%% %.*s"
105
106 static char up_header[] =
107   "  PID %-*.*s PRI NICE  SIZE    RES STATE    TIME   WCPU    CPU COMMAND";
108
109 #define up_Proc_format \
110         "%5d %-*.*s %3d %3d%7s %6s %-6.6s%.0d%7s %5.2f%% %5.2f%% %.*s"
111
112
113
114 /* process state names for the "STATE" column of the display */
115 /* the extra nulls in the string "run" are for adding a slash and
116    the processor number when needed */
117
118 char *state_abbrev[] =
119 {
120     "", "START", "RUN\0\0\0", "SLEEP", "STOP", "ZOMB",
121 };
122
123
124 static kvm_t *kd;
125
126 /* values that we stash away in _init and use in later routines */
127
128 static double logcpu;
129
130 static long lastpid;
131 static long cnt;
132 static int ccpu;
133
134 /* these are for calculating cpu state percentages */
135
136 static struct kinfo_cputime cp_time, cp_old;
137
138 /* these are for detailing the process states */
139
140 int process_states[6];
141 char *procstatenames[] = {
142     "", " starting, ", " running, ", " sleeping, ", " stopped, ",
143     " zombie, ",
144     NULL
145 };
146
147 /* these are for detailing the cpu states */
148 #define CPU_STATES 5
149 int cpu_states[CPU_STATES];
150 char *cpustatenames[CPU_STATES + 1] = {
151     "user", "nice", "system", "interrupt", "idle", NULL
152 };
153
154 /* these are for detailing the memory statistics */
155
156 int memory_stats[7];
157 char *memorynames[] = {
158     "K Active, ", "K Inact, ", "K Wired, ", "K Cache, ", "K Buf, ", "K Free",
159     NULL
160 };
161
162 int swap_stats[7];
163 char *swapnames[] = {
164 /*   0           1            2           3            4       5 */
165     "K Total, ", "K Used, ", "K Free, ", "% Inuse, ", "K In, ", "K Out",
166     NULL
167 };
168
169
170 /* these are for keeping track of the proc array */
171
172 static int nproc;
173 static int onproc = -1;
174 static int pref_len;
175 static struct kinfo_proc *pbase;
176 static struct kinfo_proc **pref;
177
178 /* these are for getting the memory statistics */
179
180 static int pageshift;           /* log base 2 of the pagesize */
181
182 /* define pagetok in terms of pageshift */
183
184 #define pagetok(size) ((size) << pageshift)
185
186 #ifdef ORDER
187 /* sorting orders. first is default */
188 char *ordernames[] = {
189     "cpu", "size", "res", "time", "pri", "thr", NULL
190 };
191 #endif
192
193 static void
194 cputime_percentages(int out[CPU_STATES], struct kinfo_cputime *new,
195                     struct kinfo_cputime *old)
196 {
197         struct kinfo_cputime diffs;
198         int i;
199         uint64_t total_change, half_total;
200
201         /* initialization */
202         total_change = 0;
203
204         diffs.cp_user = new->cp_user - old->cp_user;
205         diffs.cp_nice = new->cp_nice - old->cp_nice;
206         diffs.cp_sys = new->cp_sys - old->cp_sys;
207         diffs.cp_intr = new->cp_intr - old->cp_intr;
208         diffs.cp_idle = new->cp_idle - old->cp_idle;
209         total_change = diffs.cp_user + diffs.cp_nice + diffs.cp_sys +
210             diffs.cp_intr + diffs.cp_idle;
211         old->cp_user = new->cp_user;
212         old->cp_nice = new->cp_nice;
213         old->cp_sys = new->cp_sys;
214         old->cp_intr = new->cp_intr;
215         old->cp_idle = new->cp_idle;
216
217         /* avoid divide by zero potential */
218         if (total_change == 0)
219                 total_change = 1;
220
221         /* calculate percentages based on overall change, rounding up */
222         half_total = total_change >> 1;
223
224         out[0] = ((diffs.cp_user * 1000LL + half_total) / total_change);
225         out[1] = ((diffs.cp_nice * 1000LL + half_total) / total_change);
226         out[2] = ((diffs.cp_sys * 1000LL + half_total) / total_change);
227         out[3] = ((diffs.cp_intr * 1000LL + half_total) / total_change);
228         out[4] = ((diffs.cp_idle * 1000LL + half_total) / total_change);
229 }
230
231 int
232 machine_init(struct statics *statics)
233 {
234     register int i = 0;
235     register int pagesize;
236     size_t modelen;
237     struct passwd *pw;
238
239     modelen = sizeof(smpmode);
240     if ((sysctlbyname("machdep.smp_active", &smpmode, &modelen, NULL, 0) < 0 &&
241          sysctlbyname("smp.smp_active", &smpmode, &modelen, NULL, 0) < 0) ||
242         modelen != sizeof(smpmode))
243             smpmode = 0;
244
245     while ((pw = getpwent()) != NULL) {
246         if (strlen(pw->pw_name) > namelength)
247             namelength = strlen(pw->pw_name);
248     }
249     if (namelength < 8)
250         namelength = 8;
251     if (smpmode && namelength > 13)
252         namelength = 13;
253     else if (namelength > 15)
254         namelength = 15;
255
256     if ((kd = kvm_open(NULL, NULL, NULL, O_RDONLY, "kvm_open")) == NULL)
257         return -1;
258
259     if (kinfo_get_sched_ccpu(&ccpu)) {
260         fprintf(stderr, "top: kinfo_get_sched_ccpu failed\n");
261         return(-1);
262     }
263
264     /* this is used in calculating WCPU -- calculate it ahead of time */
265     logcpu = log(loaddouble(ccpu));
266
267     pbase = NULL;
268     pref = NULL;
269     nproc = 0;
270     onproc = -1;
271     /* get the page size with "getpagesize" and calculate pageshift from it */
272     pagesize = getpagesize();
273     pageshift = 0;
274     while (pagesize > 1)
275     {
276         pageshift++;
277         pagesize >>= 1;
278     }
279
280     /* we only need the amount of log(2)1024 for our conversion */
281     pageshift -= LOG1024;
282
283     /* fill in the statics information */
284     statics->procstate_names = procstatenames;
285     statics->cpustate_names = cpustatenames;
286     statics->memory_names = memorynames;
287     statics->swap_names = swapnames;
288 #ifdef ORDER
289     statics->order_names = ordernames;
290 #endif
291
292     /* all done! */
293     return(0);
294 }
295
296 char *format_header(register char *uname_field)
297 {
298     register char *ptr;
299     static char Header[128];
300
301     snprintf(Header, sizeof(Header), smpmode ? smp_header : up_header,
302              namelength, namelength, uname_field);
303
304     if (screen_width <= 79)
305         cmdlength = 80;
306     else
307         cmdlength = 89;
308
309     cmdlength = cmdlength - strlen(Header) + 6;
310
311     return Header;
312 }
313
314 static int swappgsin = -1;
315 static int swappgsout = -1;
316 extern struct timeval timeout;
317
318 void
319 get_system_info(struct system_info *si)
320 {
321     long total;
322     int mib[2];
323     struct timeval boottime;
324     size_t bt_size;
325
326     if (kinfo_get_sched_cputime(&cp_time))
327         err(1, "kinfo_get_sched_cputime failed");
328
329     getloadavg(si->load_avg, 3);
330
331     lastpid = 0;
332
333     /* convert cp_time counts to percentages */
334     cputime_percentages(cpu_states, &cp_time, &cp_old);
335
336     /* sum memory & swap statistics */
337     {
338         struct vmmeter vmm;
339         struct vmstats vms;
340         int vms_size = sizeof(vms);
341         int vmm_size = sizeof(vmm);
342         static unsigned int swap_delay = 0;
343         static int swapavail = 0;
344         static int swapfree = 0;
345         static int bufspace = 0;
346
347         if (sysctlbyname("vm.vmstats", &vms, &vms_size, NULL, 0)) {
348                 perror("sysctlbyname: vm.vmstats");
349                 exit(1);
350         }
351         if (sysctlbyname("vm.vmmeter", &vmm, &vmm_size, NULL, 0)) {
352                 perror("sysctlbyname: vm.vmmeter");
353                 exit(1);
354         }
355         if (kinfo_get_vfs_bufspace(&bufspace)) {
356                 perror("kinfo_get_vfs_bufspace");
357                 exit(1);
358         }
359
360         /* convert memory stats to Kbytes */
361         memory_stats[0] = pagetok(vms.v_active_count);
362         memory_stats[1] = pagetok(vms.v_inactive_count);
363         memory_stats[2] = pagetok(vms.v_wire_count);
364         memory_stats[3] = pagetok(vms.v_cache_count);
365         memory_stats[4] = bufspace / 1024;
366         memory_stats[5] = pagetok(vms.v_free_count);
367         memory_stats[6] = -1;
368
369         /* first interval */
370         if (swappgsin < 0) {
371             swap_stats[4] = 0;
372             swap_stats[5] = 0;
373         } 
374
375         /* compute differences between old and new swap statistic */
376         else {
377             swap_stats[4] = pagetok(((vmm.v_swappgsin - swappgsin)));
378             swap_stats[5] = pagetok(((vmm.v_swappgsout - swappgsout)));
379         }
380
381         swappgsin = vmm.v_swappgsin;
382         swappgsout = vmm.v_swappgsout;
383
384         /* call CPU heavy swapmode() only for changes */
385         if (swap_stats[4] > 0 || swap_stats[5] > 0 || swap_delay == 0) {
386             swap_stats[3] = swapmode(&swapavail, &swapfree);
387             swap_stats[0] = swapavail;
388             swap_stats[1] = swapavail - swapfree;
389             swap_stats[2] = swapfree;
390         }
391         swap_delay = 1;
392         swap_stats[6] = -1;
393     }
394
395     /* set arrays and strings */
396     si->cpustates = cpu_states;
397     si->memory = memory_stats;
398     si->swap = swap_stats;
399
400
401     if(lastpid > 0) {
402         si->last_pid = lastpid;
403     } else {
404         si->last_pid = -1;
405     }
406
407     /*
408      * Print how long system has been up.
409      * (Found by looking getting "boottime" from the kernel)
410      */
411     mib[0] = CTL_KERN;
412     mib[1] = KERN_BOOTTIME;
413     bt_size = sizeof(boottime);
414     if (sysctl(mib, 2, &boottime, &bt_size, NULL, 0) != -1 &&
415         boottime.tv_sec != 0) {
416         si->boottime = boottime;
417     } else {
418         si->boottime.tv_sec = -1;
419     }
420 }
421
422 static struct handle handle;
423
424 caddr_t get_process_info(struct system_info *si, struct process_select *sel,
425                          int (*compare)())
426 {
427     register int i;
428     register int total_procs;
429     register int active_procs;
430     register struct kinfo_proc **prefp;
431     register struct kinfo_proc *pp;
432
433     /* these are copied out of sel for speed */
434     int show_idle;
435     int show_self;
436     int show_system;
437     int show_only_threads;
438     int show_uid;
439     int show_command;
440
441     
442     pbase = kvm_getprocs(kd, KERN_PROC_ALL, 0, &nproc);
443     if (nproc > onproc)
444         pref = (struct kinfo_proc **) realloc(pref, sizeof(struct kinfo_proc *)
445                 * (onproc = nproc));
446     if (pref == NULL || pbase == NULL) {
447         (void) fprintf(stderr, "top: Out of memory.\n");
448         quit(23);
449     }
450     /* get a pointer to the states summary array */
451     si->procstates = process_states;
452
453     /* set up flags which define what we are going to select */
454     show_idle = sel->idle;
455     show_self = sel->self;
456     show_system = sel->system;
457     show_threads = sel->threads;
458     show_only_threads = sel->only_threads;
459     show_uid = sel->uid != -1;
460     show_command = sel->command != NULL;
461
462     /* count up process states and get pointers to interesting procs */
463     total_procs = 0;
464     active_procs = 0;
465     memset((char *)process_states, 0, sizeof(process_states));
466     prefp = pref;
467     for (pp = pbase, i = 0; i < nproc; pp++, i++)
468     {
469         /*
470          *  Place pointers to each valid proc structure in pref[].
471          *  Process slots that are actually in use have a non-zero
472          *  status field.  Processes with P_SYSTEM set are system
473          *  processes---these get ignored unless show_sysprocs is set.
474          */
475         if ((show_threads && (TP(pp, td_proc) == NULL)) ||
476             (!show_only_threads && (PP(pp, p_stat) != 0 &&
477             (show_self != PP(pp, p_pid)) &&
478             (show_system || ((PP(pp, p_flag) & P_SYSTEM) == 0)))))
479         {
480             total_procs++;
481             process_states[(unsigned char) PP(pp, p_stat)]++;
482             if ((show_threads && (TP(pp, td_proc) == NULL)) ||
483                 (!show_only_threads && (PP(pp, p_stat) != SZOMB) &&
484                 (show_idle || (PP(pp, p_pctcpu) != 0) ||
485                  (PP(pp, p_stat) == SRUN)) &&
486                 (!show_uid || EP(pp, e_ucred.cr_ruid) == (uid_t)sel->uid)))
487             {
488                 *prefp++ = pp;
489                 active_procs++;
490             }
491         }
492     }
493
494     /* if requested, sort the "interesting" processes */
495     if (compare != NULL)
496     {
497         qsort((char *)pref, active_procs, sizeof(struct kinfo_proc *), compare);
498     }
499
500     /* remember active and total counts */
501     si->p_total = total_procs;
502     si->p_active = pref_len = active_procs;
503
504     /* pass back a handle */
505     handle.next_proc = pref;
506     handle.remaining = active_procs;
507     return((caddr_t)&handle);
508 }
509
510 char fmt[128];          /* static area where result is built */
511
512 char *format_next_process(caddr_t handle, char *(*get_userid)())
513 {
514     struct kinfo_proc *pp;
515     long cputime;
516     double pct;
517     struct handle *hp;
518     char status[16];
519     char const *wrapper;
520     int state;
521     int nice;
522
523     /* find and remember the next proc structure */
524     hp = (struct handle *)handle;
525     pp = *(hp->next_proc++);
526     hp->remaining--;
527     
528     /* set the wrapper for the process/thread name */
529     if ((PP(pp, p_flag) & P_INMEM) == 0)
530          wrapper = "[]"; /* swapped process [pname] */
531     else if (((PP(pp, p_flag) & P_SYSTEM) != 0) && (TP(pp, td_proc) != NULL))
532          wrapper = "()"; /* system process (pname) */
533     else if (show_threads && (TP(pp, td_proc) == NULL))
534          wrapper = "<>"; /* pure kernel threads <thread> */
535     else
536          wrapper = NULL;
537   
538     /* get the process's command name */
539     if (wrapper != NULL) {
540         char *comm = TP(pp, td_comm);
541 #define COMSIZ sizeof(TP(pp, td_comm))
542         char buf[COMSIZ];
543         (void) strncpy(buf, comm, COMSIZ);
544         comm[0] = wrapper[0];
545         (void) strncpy(&comm[1], buf, COMSIZ - 2);
546         comm[COMSIZ - 2] = '\0';
547         (void) strncat(comm, &wrapper[1], COMSIZ - 1);
548         comm[COMSIZ - 1] = '\0';
549     }
550
551     /*
552      * Convert the process's runtime from microseconds to seconds.  This
553      * time includes the interrupt time although that is not wanted here.
554      * ps(1) is similarly sloppy.
555      */
556     cputime = (EP(pp, e_uticks) + EP(pp, e_sticks)) / 1000000;
557
558     /* calculate the base for cpu percentages */
559     pct = pctdouble(PP(pp, p_pctcpu));
560
561     /* generate "STATE" field */
562     switch (state = PP(pp, p_stat)) {
563         case SRUN:
564             if (smpmode && TP(pp, td_flags) & TDF_RUNNING)
565                 sprintf(status, "CPU%d", EP(pp, e_cpuid));
566             else
567                 strcpy(status, "RUN");
568             break;
569         case SSLEEP:
570             if (TP(pp, td_wmesg) != NULL) {
571                 sprintf(status, "%.6s", EP(pp, e_wmesg));
572                 break;
573             }
574             /* fall through */
575         default:
576
577             if (state >= 0 &&
578                 state < sizeof(state_abbrev) / sizeof(*state_abbrev))
579                     sprintf(status, "%.6s", state_abbrev[(unsigned char) state]);
580             else
581                     sprintf(status, "?%5d", state);
582             break;
583     }
584
585     /*
586      * idle time 0 - 31 -> nice value +21 - +52
587      * normal time      -> nice value -20 - +20 
588      * real time 0 - 31 -> nice value -52 - -21
589      * thread    0 - 31 -> nice value -53 -
590      */
591     switch(PP(pp, p_rtprio.type)) {
592     case RTP_PRIO_REALTIME:
593         nice = PRIO_MIN - 1 - RTP_PRIO_MAX + PP(pp, p_rtprio.prio);
594         break;
595     case RTP_PRIO_IDLE:
596         nice = PRIO_MAX + 1 + PP(pp, p_rtprio.prio);
597         break;
598     case RTP_PRIO_THREAD:
599         nice = PRIO_MIN - 1 - RTP_PRIO_MAX - PP(pp, p_rtprio.prio);
600         break;
601     default:
602         nice = PP(pp, p_nice);
603         break;
604     }
605
606
607     /* format this entry */
608     snprintf(fmt, sizeof(fmt),
609             smpmode ? smp_Proc_format : up_Proc_format,
610             PP(pp, p_pid),
611             namelength, namelength,
612             (*get_userid)(EP(pp, e_ucred.cr_ruid)),
613             (show_threads && (TP(pp, td_proc) == NULL)) ? TP(pp, td_pri) :
614                 PP(pp, p_usdata.bsd4.priority),
615             nice,
616             format_k2(PROCSIZE(pp)),
617             format_k2(pagetok(VP(pp, vm_rssize))),
618             status,
619             smpmode ? EP(pp, e_cpuid) : 0,
620             format_time(cputime),
621             100.0 * weighted_cpu(pct, pp),
622             100.0 * pct,
623             cmdlength,
624             printable(TP(pp, td_comm)));
625
626     /* return the result */
627     return(fmt);
628 }
629
630
631 /*
632  * check_nlist(nlst) - checks the nlist to see if any symbols were not
633  *              found.  For every symbol that was not found, a one-line
634  *              message is printed to stderr.  The routine returns the
635  *              number of symbols NOT found.
636  */
637
638 static int check_nlist(register struct nlist *nlst)
639 {
640     register int i;
641
642     /* check to see if we got ALL the symbols we requested */
643     /* this will write one line to stderr for every symbol not found */
644
645     i = 0;
646     while (nlst->n_name != NULL)
647     {
648         if (nlst->n_type == 0)
649         {
650             /* this one wasn't found */
651             (void) fprintf(stderr, "kernel: no symbol named `%s'\n",
652                            nlst->n_name);
653             i = 1;
654         }
655         nlst++;
656     }
657
658     return(i);
659 }
660
661 /* comparison routines for qsort */
662
663 /*
664  *  proc_compare - comparison function for "qsort"
665  *      Compares the resource consumption of two processes using five
666  *      distinct keys.  The keys (in descending order of importance) are:
667  *      percent cpu, cpu ticks, state, resident set size, total virtual
668  *      memory usage.  The process states are ordered as follows (from least
669  *      to most important):  WAIT, zombie, sleep, stop, start, run.  The
670  *      array declaration below maps a process state index into a number
671  *      that reflects this ordering.
672  */
673
674 static unsigned char sorted_state[] =
675 {
676     0,  /* not used             */
677     3,  /* sleep                */
678     1,  /* ABANDONED (WAIT)     */
679     6,  /* run                  */
680     5,  /* start                */
681     2,  /* zombie               */
682     4   /* stop                 */
683 };
684  
685
686 #define ORDERKEY_PCTCPU \
687   if (lresult = (long) PP(p2, p_pctcpu) - (long) PP(p1, p_pctcpu), \
688      (result = lresult > 0 ? 1 : lresult < 0 ? -1 : 0) == 0)
689
690 #define CPTICKS(p)      (EP(p, e_uticks) + EP(p, e_sticks))
691
692 #define ORDERKEY_CPTICKS \
693   if ((result = CPTICKS(p2) > CPTICKS(p1) ? 1 : \
694                 CPTICKS(p2) < CPTICKS(p1) ? -1 : 0) == 0)
695
696 #define ORDERKEY_STATE \
697   if ((result = sorted_state[(unsigned char) PP(p2, p_stat)] - \
698                 sorted_state[(unsigned char) PP(p1, p_stat)]) == 0)
699
700 #define ORDERKEY_PRIO \
701   if ((result = PP(p2, p_usdata.bsd4.priority) - PP(p1, p_usdata.bsd4.priority)) == 0)
702
703 #define ORDERKEY_KTHREADS \
704   if ((result = (TP(p1, td_proc) == NULL) - (TP(p2, td_proc) == NULL)) == 0)
705
706 #define ORDERKEY_KTHREADS_PRIO \
707   if ((result = TP(p2, td_pri) - TP(p1, td_pri)) == 0)
708
709 #define ORDERKEY_RSSIZE \
710   if ((result = VP(p2, vm_rssize) - VP(p1, vm_rssize)) == 0) 
711
712 #define ORDERKEY_MEM \
713   if ( (result = PROCSIZE(p2) - PROCSIZE(p1)) == 0 )
714
715 /* compare_cpu - the comparison function for sorting by cpu percentage */
716
717 int
718 #ifdef ORDER
719 compare_cpu(struct proc **pp1, struct proc **pp2)
720 #else
721 proc_compare(struct proc **pp1, struct proc **pp2)
722 #endif
723 {
724     register struct kinfo_proc *p1;
725     register struct kinfo_proc *p2;
726     register int result;
727     register pctcpu lresult;
728
729     /* remove one level of indirection */
730     p1 = *(struct kinfo_proc **) pp1;
731     p2 = *(struct kinfo_proc **) pp2;
732
733     ORDERKEY_PCTCPU
734     ORDERKEY_CPTICKS
735     ORDERKEY_STATE
736     ORDERKEY_PRIO
737     ORDERKEY_RSSIZE
738     ORDERKEY_MEM
739     ;
740
741     return(result);
742 }
743
744 #ifdef ORDER
745 /* compare routines */
746 int compare_size(), compare_res(), compare_time(), compare_prio(), compare_thr();
747
748 int (*proc_compares[])() = {
749     compare_cpu,
750     compare_size,
751     compare_res,
752     compare_time,
753     compare_prio,
754     compare_thr,
755     NULL
756 };
757
758 /* compare_size - the comparison function for sorting by total memory usage */
759
760 int
761 compare_size(struct proc **pp1, struct proc **pp2)
762 {
763     register struct kinfo_proc *p1;
764     register struct kinfo_proc *p2;
765     register int result;
766     register pctcpu lresult;
767
768     /* remove one level of indirection */
769     p1 = *(struct kinfo_proc **) pp1;
770     p2 = *(struct kinfo_proc **) pp2;
771
772     ORDERKEY_MEM
773     ORDERKEY_RSSIZE
774     ORDERKEY_PCTCPU
775     ORDERKEY_CPTICKS
776     ORDERKEY_STATE
777     ORDERKEY_PRIO
778     ;
779
780     return(result);
781 }
782
783 /* compare_res - the comparison function for sorting by resident set size */
784
785 int
786 compare_res(struct proc **pp1, struct proc **pp2)
787 {
788     register struct kinfo_proc *p1;
789     register struct kinfo_proc *p2;
790     register int result;
791     register pctcpu lresult;
792
793     /* remove one level of indirection */
794     p1 = *(struct kinfo_proc **) pp1;
795     p2 = *(struct kinfo_proc **) pp2;
796
797     ORDERKEY_RSSIZE
798     ORDERKEY_MEM
799     ORDERKEY_PCTCPU
800     ORDERKEY_CPTICKS
801     ORDERKEY_STATE
802     ORDERKEY_PRIO
803     ;
804
805     return(result);
806 }
807
808 /* compare_time - the comparison function for sorting by total cpu time */
809
810 int
811 compare_time(struct proc **pp1, struct proc **pp2)
812 {
813     register struct kinfo_proc *p1;
814     register struct kinfo_proc *p2;
815     register int result;
816     register pctcpu lresult;
817   
818     /* remove one level of indirection */
819     p1 = *(struct kinfo_proc **) pp1;
820     p2 = *(struct kinfo_proc **) pp2;
821
822     ORDERKEY_CPTICKS
823     ORDERKEY_PCTCPU
824     ORDERKEY_KTHREADS
825     ORDERKEY_KTHREADS_PRIO
826     ORDERKEY_STATE
827     ORDERKEY_PRIO
828     ORDERKEY_RSSIZE
829     ORDERKEY_MEM
830     ;
831
832       return(result);
833   }
834   
835 /* compare_prio - the comparison function for sorting by cpu percentage */
836
837 int
838 compare_prio(struct proc **pp1, struct proc **pp2)
839 {
840     register struct kinfo_proc *p1;
841     register struct kinfo_proc *p2;
842     register int result;
843     register pctcpu lresult;
844
845     /* remove one level of indirection */
846     p1 = *(struct kinfo_proc **) pp1;
847     p2 = *(struct kinfo_proc **) pp2;
848
849     ORDERKEY_KTHREADS
850     ORDERKEY_KTHREADS_PRIO
851     ORDERKEY_PRIO
852     ORDERKEY_CPTICKS
853     ORDERKEY_PCTCPU
854     ORDERKEY_STATE
855     ORDERKEY_RSSIZE
856     ORDERKEY_MEM
857     ;
858
859     return(result);
860 }
861
862 int
863 compare_thr(struct proc **pp1, struct proc **pp2)
864 {
865     register struct kinfo_proc *p1;
866     register struct kinfo_proc *p2;
867     register int result;
868     register pctcpu lresult;
869
870     /* remove one level of indirection */
871     p1 = *(struct kinfo_proc **) pp1;
872     p2 = *(struct kinfo_proc **) pp2;
873
874     ORDERKEY_KTHREADS
875     ORDERKEY_KTHREADS_PRIO
876     ORDERKEY_CPTICKS
877     ORDERKEY_PCTCPU
878     ORDERKEY_STATE
879     ORDERKEY_RSSIZE
880     ORDERKEY_MEM
881     ;
882
883     return(result);
884 }
885
886
887 #endif
888
889 /*
890  * proc_owner(pid) - returns the uid that owns process "pid", or -1 if
891  *              the process does not exist.
892  *              It is EXTREMLY IMPORTANT that this function work correctly.
893  *              If top runs setuid root (as in SVR4), then this function
894  *              is the only thing that stands in the way of a serious
895  *              security problem.  It validates requests for the "kill"
896  *              and "renice" commands.
897  */
898
899 int proc_owner(int pid)
900 {
901     register int cnt;
902     register struct kinfo_proc **prefp;
903     register struct kinfo_proc *pp;
904
905     prefp = pref;
906     cnt = pref_len;
907     while (--cnt >= 0)
908     {
909         pp = *prefp++;  
910         if (PP(pp, p_pid) == (pid_t)pid)
911         {
912             return((int)EP(pp, e_ucred.cr_ruid));
913         }
914     }
915     return(-1);
916 }
917
918
919 /*
920  * swapmode is based on a program called swapinfo written
921  * by Kevin Lahey <kml@rokkaku.atl.ga.us>.
922  */
923 int
924 swapmode(int *retavail, int *retfree)
925 {
926         int n;
927         int pagesize = getpagesize();
928         struct kvm_swap swapary[1];
929
930         *retavail = 0;
931         *retfree = 0;
932
933 #define CONVERT(v)      ((quad_t)(v) * pagesize / 1024)
934
935         n = kvm_getswapinfo(kd, swapary, 1, 0);
936         if (n < 0 || swapary[0].ksw_total == 0)
937                 return(0);
938
939         *retavail = CONVERT(swapary[0].ksw_total);
940         *retfree = CONVERT(swapary[0].ksw_total - swapary[0].ksw_used);
941
942         n = (int)((double)swapary[0].ksw_used * 100.0 /
943             (double)swapary[0].ksw_total);
944         return(n);
945 }