proc->thread stage 2: MAJOR revamping of system calls, ucred, jail API,
[dragonfly.git] / sys / kern / sysv_sem.c
1 /* $FreeBSD: src/sys/kern/sysv_sem.c,v 1.24.2.8 2002/10/22 20:45:03 fjoe Exp $ */
2 /* $DragonFly: src/sys/kern/sysv_sem.c,v 1.3 2003/06/23 17:55:41 dillon Exp $ */
3
4 /*
5  * Implementation of SVID semaphores
6  *
7  * Author:  Daniel Boulet
8  *
9  * This software is provided ``AS IS'' without any warranties of any kind.
10  */
11
12 #include "opt_sysvipc.h"
13
14 #include <sys/param.h>
15 #include <sys/systm.h>
16 #include <sys/sysproto.h>
17 #include <sys/kernel.h>
18 #include <sys/proc.h>
19 #include <sys/sem.h>
20 #include <sys/sysent.h>
21 #include <sys/sysctl.h>
22 #include <sys/malloc.h>
23 #include <sys/jail.h>
24
25 static MALLOC_DEFINE(M_SEM, "sem", "SVID compatible semaphores");
26
27 static void seminit __P((void *));
28
29 #ifndef _SYS_SYSPROTO_H_
30 struct __semctl_args;
31 int __semctl __P((struct proc *p, struct __semctl_args *uap));
32 struct semget_args;
33 int semget __P((struct proc *p, struct semget_args *uap));
34 struct semop_args;
35 int semop __P((struct proc *p, struct semop_args *uap));
36 #endif
37
38 static struct sem_undo *semu_alloc __P((struct proc *p));
39 static int semundo_adjust __P((struct proc *p, struct sem_undo **supptr, 
40                 int semid, int semnum, int adjval));
41 static void semundo_clear __P((int semid, int semnum));
42
43 /* XXX casting to (sy_call_t *) is bogus, as usual. */
44 static sy_call_t *semcalls[] = {
45         (sy_call_t *)__semctl, (sy_call_t *)semget,
46         (sy_call_t *)semop
47 };
48
49 static int      semtot = 0;
50 static struct semid_ds *sema;   /* semaphore id pool */
51 static struct sem *sem;         /* semaphore pool */
52 static struct sem_undo *semu_list; /* list of active undo structures */
53 static int      *semu;          /* undo structure pool */
54
55 struct sem {
56         u_short semval;         /* semaphore value */
57         pid_t   sempid;         /* pid of last operation */
58         u_short semncnt;        /* # awaiting semval > cval */
59         u_short semzcnt;        /* # awaiting semval = 0 */
60 };
61
62 /*
63  * Undo structure (one per process)
64  */
65 struct sem_undo {
66         struct  sem_undo *un_next;      /* ptr to next active undo structure */
67         struct  proc *un_proc;          /* owner of this structure */
68         short   un_cnt;                 /* # of active entries */
69         struct undo {
70                 short   un_adjval;      /* adjust on exit values */
71                 short   un_num;         /* semaphore # */
72                 int     un_id;          /* semid */
73         } un_ent[1];                    /* undo entries */
74 };
75
76 /*
77  * Configuration parameters
78  */
79 #ifndef SEMMNI
80 #define SEMMNI  10              /* # of semaphore identifiers */
81 #endif
82 #ifndef SEMMNS
83 #define SEMMNS  60              /* # of semaphores in system */
84 #endif
85 #ifndef SEMUME
86 #define SEMUME  10              /* max # of undo entries per process */
87 #endif
88 #ifndef SEMMNU
89 #define SEMMNU  30              /* # of undo structures in system */
90 #endif
91
92 /* shouldn't need tuning */
93 #ifndef SEMMAP
94 #define SEMMAP  30              /* # of entries in semaphore map */
95 #endif
96 #ifndef SEMMSL
97 #define SEMMSL  SEMMNS          /* max # of semaphores per id */
98 #endif
99 #ifndef SEMOPM
100 #define SEMOPM  100             /* max # of operations per semop call */
101 #endif
102
103 #define SEMVMX  32767           /* semaphore maximum value */
104 #define SEMAEM  16384           /* adjust on exit max value */
105
106 /*
107  * Due to the way semaphore memory is allocated, we have to ensure that
108  * SEMUSZ is properly aligned.
109  */
110
111 #define SEM_ALIGN(bytes) (((bytes) + (sizeof(long) - 1)) & ~(sizeof(long) - 1))
112
113 /* actual size of an undo structure */
114 #define SEMUSZ  SEM_ALIGN(offsetof(struct sem_undo, un_ent[SEMUME]))
115
116 /*
117  * Macro to find a particular sem_undo vector
118  */
119 #define SEMU(ix)        ((struct sem_undo *)(((intptr_t)semu)+ix * seminfo.semusz))
120
121 /*
122  * semaphore info struct
123  */
124 struct seminfo seminfo = {
125                 SEMMAP,         /* # of entries in semaphore map */
126                 SEMMNI,         /* # of semaphore identifiers */
127                 SEMMNS,         /* # of semaphores in system */
128                 SEMMNU,         /* # of undo structures in system */
129                 SEMMSL,         /* max # of semaphores per id */
130                 SEMOPM,         /* max # of operations per semop call */
131                 SEMUME,         /* max # of undo entries per process */
132                 SEMUSZ,         /* size in bytes of undo structure */
133                 SEMVMX,         /* semaphore maximum value */
134                 SEMAEM          /* adjust on exit max value */
135 };
136
137 TUNABLE_INT("kern.ipc.semmap", &seminfo.semmap);
138 TUNABLE_INT("kern.ipc.semmni", &seminfo.semmni);
139 TUNABLE_INT("kern.ipc.semmns", &seminfo.semmns);
140 TUNABLE_INT("kern.ipc.semmnu", &seminfo.semmnu);
141 TUNABLE_INT("kern.ipc.semmsl", &seminfo.semmsl);
142 TUNABLE_INT("kern.ipc.semopm", &seminfo.semopm);
143 TUNABLE_INT("kern.ipc.semume", &seminfo.semume);
144 TUNABLE_INT("kern.ipc.semusz", &seminfo.semusz);
145 TUNABLE_INT("kern.ipc.semvmx", &seminfo.semvmx);
146 TUNABLE_INT("kern.ipc.semaem", &seminfo.semaem);
147
148 SYSCTL_DECL(_kern_ipc);
149 SYSCTL_INT(_kern_ipc, OID_AUTO, semmap, CTLFLAG_RW, &seminfo.semmap, 0, "");
150 SYSCTL_INT(_kern_ipc, OID_AUTO, semmni, CTLFLAG_RD, &seminfo.semmni, 0, "");
151 SYSCTL_INT(_kern_ipc, OID_AUTO, semmns, CTLFLAG_RD, &seminfo.semmns, 0, "");
152 SYSCTL_INT(_kern_ipc, OID_AUTO, semmnu, CTLFLAG_RD, &seminfo.semmnu, 0, "");
153 SYSCTL_INT(_kern_ipc, OID_AUTO, semmsl, CTLFLAG_RW, &seminfo.semmsl, 0, "");
154 SYSCTL_INT(_kern_ipc, OID_AUTO, semopm, CTLFLAG_RD, &seminfo.semopm, 0, "");
155 SYSCTL_INT(_kern_ipc, OID_AUTO, semume, CTLFLAG_RD, &seminfo.semume, 0, "");
156 SYSCTL_INT(_kern_ipc, OID_AUTO, semusz, CTLFLAG_RD, &seminfo.semusz, 0, "");
157 SYSCTL_INT(_kern_ipc, OID_AUTO, semvmx, CTLFLAG_RW, &seminfo.semvmx, 0, "");
158 SYSCTL_INT(_kern_ipc, OID_AUTO, semaem, CTLFLAG_RW, &seminfo.semaem, 0, "");
159
160 #if 0
161 RO seminfo.semmap       /* SEMMAP unused */
162 RO seminfo.semmni
163 RO seminfo.semmns
164 RO seminfo.semmnu       /* undo entries per system */
165 RW seminfo.semmsl
166 RO seminfo.semopm       /* SEMOPM unused */
167 RO seminfo.semume
168 RO seminfo.semusz       /* param - derived from SEMUME for per-proc sizeof */
169 RO seminfo.semvmx       /* SEMVMX unused - user param */
170 RO seminfo.semaem       /* SEMAEM unused - user param */
171 #endif
172
173 static void
174 seminit(dummy)
175         void *dummy;
176 {
177         register int i;
178
179         sem = malloc(sizeof(struct sem) * seminfo.semmns, M_SEM, M_WAITOK);
180         if (sem == NULL)
181                 panic("sem is NULL");
182         sema = malloc(sizeof(struct semid_ds) * seminfo.semmni, M_SEM, M_WAITOK);
183         if (sema == NULL)
184                 panic("sema is NULL");
185         semu = malloc(seminfo.semmnu * seminfo.semusz, M_SEM, M_WAITOK);
186         if (semu == NULL)
187                 panic("semu is NULL");
188
189         for (i = 0; i < seminfo.semmni; i++) {
190                 sema[i].sem_base = 0;
191                 sema[i].sem_perm.mode = 0;
192         }
193         for (i = 0; i < seminfo.semmnu; i++) {
194                 register struct sem_undo *suptr = SEMU(i);
195                 suptr->un_proc = NULL;
196         }
197         semu_list = NULL;
198 }
199 SYSINIT(sysv_sem, SI_SUB_SYSV_SEM, SI_ORDER_FIRST, seminit, NULL)
200
201 /*
202  * Entry point for all SEM calls
203  *
204  * semsys_args(u_int which, a2, a3, ...) (VARARGS)
205  */
206 int
207 semsys(struct semsys_args *uap)
208 {
209         struct proc *p = curproc;
210
211         if (!jail_sysvipc_allowed && p->p_ucred->cr_prison != NULL)
212                 return (ENOSYS);
213
214         if (uap->which >= sizeof(semcalls)/sizeof(semcalls[0]))
215                 return (EINVAL);
216         return ((*semcalls[uap->which])(&uap->a2));
217 }
218
219 /*
220  * Allocate a new sem_undo structure for a process
221  * (returns ptr to structure or NULL if no more room)
222  */
223
224 static struct sem_undo *
225 semu_alloc(p)
226         struct proc *p;
227 {
228         register int i;
229         register struct sem_undo *suptr;
230         register struct sem_undo **supptr;
231         int attempt;
232
233         /*
234          * Try twice to allocate something.
235          * (we'll purge any empty structures after the first pass so
236          * two passes are always enough)
237          */
238
239         for (attempt = 0; attempt < 2; attempt++) {
240                 /*
241                  * Look for a free structure.
242                  * Fill it in and return it if we find one.
243                  */
244
245                 for (i = 0; i < seminfo.semmnu; i++) {
246                         suptr = SEMU(i);
247                         if (suptr->un_proc == NULL) {
248                                 suptr->un_next = semu_list;
249                                 semu_list = suptr;
250                                 suptr->un_cnt = 0;
251                                 suptr->un_proc = p;
252                                 return(suptr);
253                         }
254                 }
255
256                 /*
257                  * We didn't find a free one, if this is the first attempt
258                  * then try to free some structures.
259                  */
260
261                 if (attempt == 0) {
262                         /* All the structures are in use - try to free some */
263                         int did_something = 0;
264
265                         supptr = &semu_list;
266                         while ((suptr = *supptr) != NULL) {
267                                 if (suptr->un_cnt == 0)  {
268                                         suptr->un_proc = NULL;
269                                         *supptr = suptr->un_next;
270                                         did_something = 1;
271                                 } else
272                                         supptr = &(suptr->un_next);
273                         }
274
275                         /* If we didn't free anything then just give-up */
276                         if (!did_something)
277                                 return(NULL);
278                 } else {
279                         /*
280                          * The second pass failed even though we freed
281                          * something after the first pass!
282                          * This is IMPOSSIBLE!
283                          */
284                         panic("semu_alloc - second attempt failed");
285                 }
286         }
287         return (NULL);
288 }
289
290 /*
291  * Adjust a particular entry for a particular proc
292  */
293
294 static int
295 semundo_adjust(p, supptr, semid, semnum, adjval)
296         register struct proc *p;
297         struct sem_undo **supptr;
298         int semid, semnum;
299         int adjval;
300 {
301         register struct sem_undo *suptr;
302         register struct undo *sunptr;
303         int i;
304
305         /* Look for and remember the sem_undo if the caller doesn't provide
306            it */
307
308         suptr = *supptr;
309         if (suptr == NULL) {
310                 for (suptr = semu_list; suptr != NULL;
311                     suptr = suptr->un_next) {
312                         if (suptr->un_proc == p) {
313                                 *supptr = suptr;
314                                 break;
315                         }
316                 }
317                 if (suptr == NULL) {
318                         if (adjval == 0)
319                                 return(0);
320                         suptr = semu_alloc(p);
321                         if (suptr == NULL)
322                                 return(ENOSPC);
323                         *supptr = suptr;
324                 }
325         }
326
327         /*
328          * Look for the requested entry and adjust it (delete if adjval becomes
329          * 0).
330          */
331         sunptr = &suptr->un_ent[0];
332         for (i = 0; i < suptr->un_cnt; i++, sunptr++) {
333                 if (sunptr->un_id != semid || sunptr->un_num != semnum)
334                         continue;
335                 if (adjval == 0)
336                         sunptr->un_adjval = 0;
337                 else
338                         sunptr->un_adjval += adjval;
339                 if (sunptr->un_adjval == 0) {
340                         suptr->un_cnt--;
341                         if (i < suptr->un_cnt)
342                                 suptr->un_ent[i] =
343                                     suptr->un_ent[suptr->un_cnt];
344                 }
345                 return(0);
346         }
347
348         /* Didn't find the right entry - create it */
349         if (adjval == 0)
350                 return(0);
351         if (suptr->un_cnt != seminfo.semume) {
352                 sunptr = &suptr->un_ent[suptr->un_cnt];
353                 suptr->un_cnt++;
354                 sunptr->un_adjval = adjval;
355                 sunptr->un_id = semid; sunptr->un_num = semnum;
356         } else
357                 return(EINVAL);
358         return(0);
359 }
360
361 static void
362 semundo_clear(semid, semnum)
363         int semid, semnum;
364 {
365         register struct sem_undo *suptr;
366
367         for (suptr = semu_list; suptr != NULL; suptr = suptr->un_next) {
368                 register struct undo *sunptr = &suptr->un_ent[0];
369                 register int i = 0;
370
371                 while (i < suptr->un_cnt) {
372                         if (sunptr->un_id == semid) {
373                                 if (semnum == -1 || sunptr->un_num == semnum) {
374                                         suptr->un_cnt--;
375                                         if (i < suptr->un_cnt) {
376                                                 suptr->un_ent[i] =
377                                                   suptr->un_ent[suptr->un_cnt];
378                                                 continue;
379                                         }
380                                 }
381                                 if (semnum != -1)
382                                         break;
383                         }
384                         i++, sunptr++;
385                 }
386         }
387 }
388
389 /*
390  * Note that the user-mode half of this passes a union, not a pointer
391  */
392 #ifndef _SYS_SYSPROTO_H_
393 struct __semctl_args {
394         int     semid;
395         int     semnum;
396         int     cmd;
397         union   semun *arg;
398 };
399 #endif
400
401 int
402 __semctl(struct __semctl_args *uap)
403 {
404         struct proc *p = curproc;
405         int semid = uap->semid;
406         int semnum = uap->semnum;
407         int cmd = uap->cmd;
408         union semun *arg = uap->arg;
409         union semun real_arg;
410         struct ucred *cred = p->p_ucred;
411         int i, rval, eval;
412         struct semid_ds sbuf;
413         register struct semid_ds *semaptr;
414
415 #ifdef SEM_DEBUG
416         printf("call to semctl(%d, %d, %d, 0x%x)\n", semid, semnum, cmd, arg);
417 #endif
418
419         if (!jail_sysvipc_allowed && p->p_ucred->cr_prison != NULL)
420                 return (ENOSYS);
421
422         semid = IPCID_TO_IX(semid);
423         if (semid < 0 || semid >= seminfo.semmni)
424                 return(EINVAL);
425
426         semaptr = &sema[semid];
427         if ((semaptr->sem_perm.mode & SEM_ALLOC) == 0 ||
428             semaptr->sem_perm.seq != IPCID_TO_SEQ(uap->semid))
429                 return(EINVAL);
430
431         eval = 0;
432         rval = 0;
433
434         switch (cmd) {
435         case IPC_RMID:
436                 if ((eval = ipcperm(p, &semaptr->sem_perm, IPC_M)))
437                         return(eval);
438                 semaptr->sem_perm.cuid = cred->cr_uid;
439                 semaptr->sem_perm.uid = cred->cr_uid;
440                 semtot -= semaptr->sem_nsems;
441                 for (i = semaptr->sem_base - sem; i < semtot; i++)
442                         sem[i] = sem[i + semaptr->sem_nsems];
443                 for (i = 0; i < seminfo.semmni; i++) {
444                         if ((sema[i].sem_perm.mode & SEM_ALLOC) &&
445                             sema[i].sem_base > semaptr->sem_base)
446                                 sema[i].sem_base -= semaptr->sem_nsems;
447                 }
448                 semaptr->sem_perm.mode = 0;
449                 semundo_clear(semid, -1);
450                 wakeup((caddr_t)semaptr);
451                 break;
452
453         case IPC_SET:
454                 if ((eval = ipcperm(p, &semaptr->sem_perm, IPC_M)))
455                         return(eval);
456                 if ((eval = copyin(arg, &real_arg, sizeof(real_arg))) != 0)
457                         return(eval);
458                 if ((eval = copyin(real_arg.buf, (caddr_t)&sbuf,
459                     sizeof(sbuf))) != 0)
460                         return(eval);
461                 semaptr->sem_perm.uid = sbuf.sem_perm.uid;
462                 semaptr->sem_perm.gid = sbuf.sem_perm.gid;
463                 semaptr->sem_perm.mode = (semaptr->sem_perm.mode & ~0777) |
464                     (sbuf.sem_perm.mode & 0777);
465                 semaptr->sem_ctime = time_second;
466                 break;
467
468         case IPC_STAT:
469                 if ((eval = ipcperm(p, &semaptr->sem_perm, IPC_R)))
470                         return(eval);
471                 if ((eval = copyin(arg, &real_arg, sizeof(real_arg))) != 0)
472                         return(eval);
473                 eval = copyout((caddr_t)semaptr, real_arg.buf,
474                     sizeof(struct semid_ds));
475                 break;
476
477         case GETNCNT:
478                 if ((eval = ipcperm(p, &semaptr->sem_perm, IPC_R)))
479                         return(eval);
480                 if (semnum < 0 || semnum >= semaptr->sem_nsems)
481                         return(EINVAL);
482                 rval = semaptr->sem_base[semnum].semncnt;
483                 break;
484
485         case GETPID:
486                 if ((eval = ipcperm(p, &semaptr->sem_perm, IPC_R)))
487                         return(eval);
488                 if (semnum < 0 || semnum >= semaptr->sem_nsems)
489                         return(EINVAL);
490                 rval = semaptr->sem_base[semnum].sempid;
491                 break;
492
493         case GETVAL:
494                 if ((eval = ipcperm(p, &semaptr->sem_perm, IPC_R)))
495                         return(eval);
496                 if (semnum < 0 || semnum >= semaptr->sem_nsems)
497                         return(EINVAL);
498                 rval = semaptr->sem_base[semnum].semval;
499                 break;
500
501         case GETALL:
502                 if ((eval = ipcperm(p, &semaptr->sem_perm, IPC_R)))
503                         return(eval);
504                 if ((eval = copyin(arg, &real_arg, sizeof(real_arg))) != 0)
505                         return(eval);
506                 for (i = 0; i < semaptr->sem_nsems; i++) {
507                         eval = copyout((caddr_t)&semaptr->sem_base[i].semval,
508                             &real_arg.array[i], sizeof(real_arg.array[0]));
509                         if (eval != 0)
510                                 break;
511                 }
512                 break;
513
514         case GETZCNT:
515                 if ((eval = ipcperm(p, &semaptr->sem_perm, IPC_R)))
516                         return(eval);
517                 if (semnum < 0 || semnum >= semaptr->sem_nsems)
518                         return(EINVAL);
519                 rval = semaptr->sem_base[semnum].semzcnt;
520                 break;
521
522         case SETVAL:
523                 if ((eval = ipcperm(p, &semaptr->sem_perm, IPC_W)))
524                         return(eval);
525                 if (semnum < 0 || semnum >= semaptr->sem_nsems)
526                         return(EINVAL);
527                 if ((eval = copyin(arg, &real_arg, sizeof(real_arg))) != 0)
528                         return(eval);
529                 semaptr->sem_base[semnum].semval = real_arg.val;
530                 semundo_clear(semid, semnum);
531                 wakeup((caddr_t)semaptr);
532                 break;
533
534         case SETALL:
535                 if ((eval = ipcperm(p, &semaptr->sem_perm, IPC_W)))
536                         return(eval);
537                 if ((eval = copyin(arg, &real_arg, sizeof(real_arg))) != 0)
538                         return(eval);
539                 for (i = 0; i < semaptr->sem_nsems; i++) {
540                         eval = copyin(&real_arg.array[i],
541                             (caddr_t)&semaptr->sem_base[i].semval,
542                             sizeof(real_arg.array[0]));
543                         if (eval != 0)
544                                 break;
545                 }
546                 semundo_clear(semid, -1);
547                 wakeup((caddr_t)semaptr);
548                 break;
549
550         default:
551                 return(EINVAL);
552         }
553
554         if (eval == 0)
555                 p->p_retval[0] = rval;
556         return(eval);
557 }
558
559 #ifndef _SYS_SYSPROTO_H_
560 struct semget_args {
561         key_t   key;
562         int     nsems;
563         int     semflg;
564 };
565 #endif
566
567 int
568 semget(struct semget_args *uap)
569 {
570         struct proc *p = curproc;
571         int semid, eval;
572         int key = uap->key;
573         int nsems = uap->nsems;
574         int semflg = uap->semflg;
575         struct ucred *cred = p->p_ucred;
576
577 #ifdef SEM_DEBUG
578         printf("semget(0x%x, %d, 0%o)\n", key, nsems, semflg);
579 #endif
580
581         if (!jail_sysvipc_allowed && p->p_ucred->cr_prison != NULL)
582                 return (ENOSYS);
583
584         if (key != IPC_PRIVATE) {
585                 for (semid = 0; semid < seminfo.semmni; semid++) {
586                         if ((sema[semid].sem_perm.mode & SEM_ALLOC) &&
587                             sema[semid].sem_perm.key == key)
588                                 break;
589                 }
590                 if (semid < seminfo.semmni) {
591 #ifdef SEM_DEBUG
592                         printf("found public key\n");
593 #endif
594                         if ((eval = ipcperm(p, &sema[semid].sem_perm,
595                             semflg & 0700)))
596                                 return(eval);
597                         if (nsems > 0 && sema[semid].sem_nsems < nsems) {
598 #ifdef SEM_DEBUG
599                                 printf("too small\n");
600 #endif
601                                 return(EINVAL);
602                         }
603                         if ((semflg & IPC_CREAT) && (semflg & IPC_EXCL)) {
604 #ifdef SEM_DEBUG
605                                 printf("not exclusive\n");
606 #endif
607                                 return(EEXIST);
608                         }
609                         goto found;
610                 }
611         }
612
613 #ifdef SEM_DEBUG
614         printf("need to allocate the semid_ds\n");
615 #endif
616         if (key == IPC_PRIVATE || (semflg & IPC_CREAT)) {
617                 if (nsems <= 0 || nsems > seminfo.semmsl) {
618 #ifdef SEM_DEBUG
619                         printf("nsems out of range (0<%d<=%d)\n", nsems,
620                             seminfo.semmsl);
621 #endif
622                         return(EINVAL);
623                 }
624                 if (nsems > seminfo.semmns - semtot) {
625 #ifdef SEM_DEBUG
626                         printf("not enough semaphores left (need %d, got %d)\n",
627                             nsems, seminfo.semmns - semtot);
628 #endif
629                         return(ENOSPC);
630                 }
631                 for (semid = 0; semid < seminfo.semmni; semid++) {
632                         if ((sema[semid].sem_perm.mode & SEM_ALLOC) == 0)
633                                 break;
634                 }
635                 if (semid == seminfo.semmni) {
636 #ifdef SEM_DEBUG
637                         printf("no more semid_ds's available\n");
638 #endif
639                         return(ENOSPC);
640                 }
641 #ifdef SEM_DEBUG
642                 printf("semid %d is available\n", semid);
643 #endif
644                 sema[semid].sem_perm.key = key;
645                 sema[semid].sem_perm.cuid = cred->cr_uid;
646                 sema[semid].sem_perm.uid = cred->cr_uid;
647                 sema[semid].sem_perm.cgid = cred->cr_gid;
648                 sema[semid].sem_perm.gid = cred->cr_gid;
649                 sema[semid].sem_perm.mode = (semflg & 0777) | SEM_ALLOC;
650                 sema[semid].sem_perm.seq =
651                     (sema[semid].sem_perm.seq + 1) & 0x7fff;
652                 sema[semid].sem_nsems = nsems;
653                 sema[semid].sem_otime = 0;
654                 sema[semid].sem_ctime = time_second;
655                 sema[semid].sem_base = &sem[semtot];
656                 semtot += nsems;
657                 bzero(sema[semid].sem_base,
658                     sizeof(sema[semid].sem_base[0])*nsems);
659 #ifdef SEM_DEBUG
660                 printf("sembase = 0x%x, next = 0x%x\n", sema[semid].sem_base,
661                     &sem[semtot]);
662 #endif
663         } else {
664 #ifdef SEM_DEBUG
665                 printf("didn't find it and wasn't asked to create it\n");
666 #endif
667                 return(ENOENT);
668         }
669
670 found:
671         p->p_retval[0] = IXSEQ_TO_IPCID(semid, sema[semid].sem_perm);
672         return(0);
673 }
674
675 #ifndef _SYS_SYSPROTO_H_
676 struct semop_args {
677         int     semid;
678         struct  sembuf *sops;
679         u_int   nsops;
680 };
681 #endif
682
683 int
684 semop(struct semop_args *uap)
685 {
686         struct proc *p = curproc;
687         int semid = uap->semid;
688         u_int nsops = uap->nsops;
689         struct sembuf sops[MAX_SOPS];
690         register struct semid_ds *semaptr;
691         register struct sembuf *sopptr;
692         register struct sem *semptr;
693         struct sem_undo *suptr = NULL;
694         int i, j, eval;
695         int do_wakeup, do_undos;
696
697 #ifdef SEM_DEBUG
698         printf("call to semop(%d, 0x%x, %u)\n", semid, sops, nsops);
699 #endif
700
701         if (!jail_sysvipc_allowed && p->p_ucred->cr_prison != NULL)
702                 return (ENOSYS);
703
704         semid = IPCID_TO_IX(semid);     /* Convert back to zero origin */
705
706         if (semid < 0 || semid >= seminfo.semmni)
707                 return(EINVAL);
708
709         semaptr = &sema[semid];
710         if ((semaptr->sem_perm.mode & SEM_ALLOC) == 0)
711                 return(EINVAL);
712         if (semaptr->sem_perm.seq != IPCID_TO_SEQ(uap->semid))
713                 return(EINVAL);
714
715         if ((eval = ipcperm(p, &semaptr->sem_perm, IPC_W))) {
716 #ifdef SEM_DEBUG
717                 printf("eval = %d from ipaccess\n", eval);
718 #endif
719                 return(eval);
720         }
721
722         if (nsops > MAX_SOPS) {
723 #ifdef SEM_DEBUG
724                 printf("too many sops (max=%d, nsops=%u)\n", MAX_SOPS, nsops);
725 #endif
726                 return(E2BIG);
727         }
728
729         if ((eval = copyin(uap->sops, &sops, nsops * sizeof(sops[0]))) != 0) {
730 #ifdef SEM_DEBUG
731                 printf("eval = %d from copyin(%08x, %08x, %u)\n", eval,
732                     uap->sops, &sops, nsops * sizeof(sops[0]));
733 #endif
734                 return(eval);
735         }
736
737         /*
738          * Loop trying to satisfy the vector of requests.
739          * If we reach a point where we must wait, any requests already
740          * performed are rolled back and we go to sleep until some other
741          * process wakes us up.  At this point, we start all over again.
742          *
743          * This ensures that from the perspective of other tasks, a set
744          * of requests is atomic (never partially satisfied).
745          */
746         do_undos = 0;
747
748         for (;;) {
749                 do_wakeup = 0;
750
751                 for (i = 0; i < nsops; i++) {
752                         sopptr = &sops[i];
753
754                         if (sopptr->sem_num >= semaptr->sem_nsems)
755                                 return(EFBIG);
756
757                         semptr = &semaptr->sem_base[sopptr->sem_num];
758
759 #ifdef SEM_DEBUG
760                         printf("semop:  semaptr=%x, sem_base=%x, semptr=%x, sem[%d]=%d : op=%d, flag=%s\n",
761                             semaptr, semaptr->sem_base, semptr,
762                             sopptr->sem_num, semptr->semval, sopptr->sem_op,
763                             (sopptr->sem_flg & IPC_NOWAIT) ? "nowait" : "wait");
764 #endif
765
766                         if (sopptr->sem_op < 0) {
767                                 if (semptr->semval + sopptr->sem_op < 0) {
768 #ifdef SEM_DEBUG
769                                         printf("semop:  can't do it now\n");
770 #endif
771                                         break;
772                                 } else {
773                                         semptr->semval += sopptr->sem_op;
774                                         if (semptr->semval == 0 &&
775                                             semptr->semzcnt > 0)
776                                                 do_wakeup = 1;
777                                 }
778                                 if (sopptr->sem_flg & SEM_UNDO)
779                                         do_undos = 1;
780                         } else if (sopptr->sem_op == 0) {
781                                 if (semptr->semval > 0) {
782 #ifdef SEM_DEBUG
783                                         printf("semop:  not zero now\n");
784 #endif
785                                         break;
786                                 }
787                         } else {
788                                 if (semptr->semncnt > 0)
789                                         do_wakeup = 1;
790                                 semptr->semval += sopptr->sem_op;
791                                 if (sopptr->sem_flg & SEM_UNDO)
792                                         do_undos = 1;
793                         }
794                 }
795
796                 /*
797                  * Did we get through the entire vector?
798                  */
799                 if (i >= nsops)
800                         goto done;
801
802                 /*
803                  * No ... rollback anything that we've already done
804                  */
805 #ifdef SEM_DEBUG
806                 printf("semop:  rollback 0 through %d\n", i-1);
807 #endif
808                 for (j = 0; j < i; j++)
809                         semaptr->sem_base[sops[j].sem_num].semval -=
810                             sops[j].sem_op;
811
812                 /*
813                  * If the request that we couldn't satisfy has the
814                  * NOWAIT flag set then return with EAGAIN.
815                  */
816                 if (sopptr->sem_flg & IPC_NOWAIT)
817                         return(EAGAIN);
818
819                 if (sopptr->sem_op == 0)
820                         semptr->semzcnt++;
821                 else
822                         semptr->semncnt++;
823
824 #ifdef SEM_DEBUG
825                 printf("semop:  good night!\n");
826 #endif
827                 eval = tsleep((caddr_t)semaptr, (PZERO - 4) | PCATCH,
828                     "semwait", 0);
829 #ifdef SEM_DEBUG
830                 printf("semop:  good morning (eval=%d)!\n", eval);
831 #endif
832
833                 suptr = NULL;   /* sem_undo may have been reallocated */
834
835                 if (eval != 0)
836                         return(EINTR);
837 #ifdef SEM_DEBUG
838                 printf("semop:  good morning!\n");
839 #endif
840
841                 /*
842                  * Make sure that the semaphore still exists
843                  */
844                 if ((semaptr->sem_perm.mode & SEM_ALLOC) == 0 ||
845                     semaptr->sem_perm.seq != IPCID_TO_SEQ(uap->semid))
846                         return(EIDRM);
847
848                 /*
849                  * The semaphore is still alive.  Readjust the count of
850                  * waiting processes.
851                  */
852                 if (sopptr->sem_op == 0)
853                         semptr->semzcnt--;
854                 else
855                         semptr->semncnt--;
856         }
857
858 done:
859         /*
860          * Process any SEM_UNDO requests.
861          */
862         if (do_undos) {
863                 for (i = 0; i < nsops; i++) {
864                         /*
865                          * We only need to deal with SEM_UNDO's for non-zero
866                          * op's.
867                          */
868                         int adjval;
869
870                         if ((sops[i].sem_flg & SEM_UNDO) == 0)
871                                 continue;
872                         adjval = sops[i].sem_op;
873                         if (adjval == 0)
874                                 continue;
875                         eval = semundo_adjust(p, &suptr, semid,
876                             sops[i].sem_num, -adjval);
877                         if (eval == 0)
878                                 continue;
879
880                         /*
881                          * Oh-Oh!  We ran out of either sem_undo's or undo's.
882                          * Rollback the adjustments to this point and then
883                          * rollback the semaphore ups and down so we can return
884                          * with an error with all structures restored.  We
885                          * rollback the undo's in the exact reverse order that
886                          * we applied them.  This guarantees that we won't run
887                          * out of space as we roll things back out.
888                          */
889                         for (j = i - 1; j >= 0; j--) {
890                                 if ((sops[j].sem_flg & SEM_UNDO) == 0)
891                                         continue;
892                                 adjval = sops[j].sem_op;
893                                 if (adjval == 0)
894                                         continue;
895                                 if (semundo_adjust(p, &suptr, semid,
896                                     sops[j].sem_num, adjval) != 0)
897                                         panic("semop - can't undo undos");
898                         }
899
900                         for (j = 0; j < nsops; j++)
901                                 semaptr->sem_base[sops[j].sem_num].semval -=
902                                     sops[j].sem_op;
903
904 #ifdef SEM_DEBUG
905                         printf("eval = %d from semundo_adjust\n", eval);
906 #endif
907                         return(eval);
908                 } /* loop through the sops */
909         } /* if (do_undos) */
910
911         /* We're definitely done - set the sempid's */
912         for (i = 0; i < nsops; i++) {
913                 sopptr = &sops[i];
914                 semptr = &semaptr->sem_base[sopptr->sem_num];
915                 semptr->sempid = p->p_pid;
916         }
917
918         /* Do a wakeup if any semaphore was up'd. */
919         if (do_wakeup) {
920 #ifdef SEM_DEBUG
921                 printf("semop:  doing wakeup\n");
922 #endif
923                 wakeup((caddr_t)semaptr);
924 #ifdef SEM_DEBUG
925                 printf("semop:  back from wakeup\n");
926 #endif
927         }
928 #ifdef SEM_DEBUG
929         printf("semop:  done\n");
930 #endif
931         p->p_retval[0] = 0;
932         return(0);
933 }
934
935 /*
936  * Go through the undo structures for this process and apply the adjustments to
937  * semaphores.
938  */
939 void
940 semexit(p)
941         struct proc *p;
942 {
943         register struct sem_undo *suptr;
944         register struct sem_undo **supptr;
945         int did_something;
946
947         did_something = 0;
948
949         /*
950          * Go through the chain of undo vectors looking for one
951          * associated with this process.
952          */
953
954         for (supptr = &semu_list; (suptr = *supptr) != NULL;
955             supptr = &suptr->un_next) {
956                 if (suptr->un_proc == p)
957                         break;
958         }
959
960         if (suptr == NULL)
961                 return;
962
963 #ifdef SEM_DEBUG
964         printf("proc @%08x has undo structure with %d entries\n", p,
965             suptr->un_cnt);
966 #endif
967
968         /*
969          * If there are any active undo elements then process them.
970          */
971         if (suptr->un_cnt > 0) {
972                 int ix;
973
974                 for (ix = 0; ix < suptr->un_cnt; ix++) {
975                         int semid = suptr->un_ent[ix].un_id;
976                         int semnum = suptr->un_ent[ix].un_num;
977                         int adjval = suptr->un_ent[ix].un_adjval;
978                         struct semid_ds *semaptr;
979
980                         semaptr = &sema[semid];
981                         if ((semaptr->sem_perm.mode & SEM_ALLOC) == 0)
982                                 panic("semexit - semid not allocated");
983                         if (semnum >= semaptr->sem_nsems)
984                                 panic("semexit - semnum out of range");
985
986 #ifdef SEM_DEBUG
987                         printf("semexit:  %08x id=%d num=%d(adj=%d) ; sem=%d\n",
988                             suptr->un_proc, suptr->un_ent[ix].un_id,
989                             suptr->un_ent[ix].un_num,
990                             suptr->un_ent[ix].un_adjval,
991                             semaptr->sem_base[semnum].semval);
992 #endif
993
994                         if (adjval < 0) {
995                                 if (semaptr->sem_base[semnum].semval < -adjval)
996                                         semaptr->sem_base[semnum].semval = 0;
997                                 else
998                                         semaptr->sem_base[semnum].semval +=
999                                             adjval;
1000                         } else
1001                                 semaptr->sem_base[semnum].semval += adjval;
1002
1003                         wakeup((caddr_t)semaptr);
1004 #ifdef SEM_DEBUG
1005                         printf("semexit:  back from wakeup\n");
1006 #endif
1007                 }
1008         }
1009
1010         /*
1011          * Deallocate the undo vector.
1012          */
1013 #ifdef SEM_DEBUG
1014         printf("removing vector\n");
1015 #endif
1016         suptr->un_proc = NULL;
1017         *supptr = suptr->un_next;
1018 }