Merge from vendor branch GDB:
[dragonfly.git] / sys / i386 / i386 / mem.c
1 /*-
2  * Copyright (c) 1988 University of Utah.
3  * Copyright (c) 1982, 1986, 1990 The Regents of the University of California.
4  * All rights reserved.
5  *
6  * This code is derived from software contributed to Berkeley by
7  * the Systems Programming Group of the University of Utah Computer
8  * Science Department, and code derived from software contributed to
9  * Berkeley by William Jolitz.
10  *
11  * Redistribution and use in source and binary forms, with or without
12  * modification, are permitted provided that the following conditions
13  * are met:
14  * 1. Redistributions of source code must retain the above copyright
15  *    notice, this list of conditions and the following disclaimer.
16  * 2. Redistributions in binary form must reproduce the above copyright
17  *    notice, this list of conditions and the following disclaimer in the
18  *    documentation and/or other materials provided with the distribution.
19  * 3. All advertising materials mentioning features or use of this software
20  *    must display the following acknowledgement:
21  *      This product includes software developed by the University of
22  *      California, Berkeley and its contributors.
23  * 4. Neither the name of the University nor the names of its contributors
24  *    may be used to endorse or promote products derived from this software
25  *    without specific prior written permission.
26  *
27  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
28  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
29  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
30  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
31  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
32  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
33  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
34  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
35  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
36  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
37  * SUCH DAMAGE.
38  *
39  *      from: Utah $Hdr: mem.c 1.13 89/10/08$
40  *      from: @(#)mem.c 7.2 (Berkeley) 5/9/91
41  * $FreeBSD: src/sys/i386/i386/mem.c,v 1.79.2.9 2003/01/04 22:58:01 njl Exp $
42  * $DragonFly: src/sys/i386/i386/Attic/mem.c,v 1.16 2006/07/10 21:06:08 dillon Exp $
43  */
44
45 /*
46  * Memory special file
47  */
48
49 #include <sys/param.h>
50 #include <sys/systm.h>
51 #include <sys/buf.h>
52 #include <sys/conf.h>
53 #include <sys/fcntl.h>
54 #include <sys/filio.h>
55 #include <sys/ioccom.h>
56 #include <sys/kernel.h>
57 #include <sys/malloc.h>
58 #include <sys/memrange.h>
59 #include <sys/proc.h>
60 #include <sys/random.h>
61 #include <sys/signalvar.h>
62 #include <sys/uio.h>
63 #include <sys/vnode.h>
64
65 #include <machine/frame.h>
66 #include <machine/psl.h>
67 #include <machine/specialreg.h>
68 #include <i386/isa/intr_machdep.h>
69
70 #include <vm/vm.h>
71 #include <vm/pmap.h>
72 #include <vm/vm_extern.h>
73
74
75 static  d_open_t        mmopen;
76 static  d_close_t       mmclose;
77 static  d_read_t        mmrw;
78 static  d_ioctl_t       mmioctl;
79 static  d_mmap_t        memmmap;
80 static  d_poll_t        mmpoll;
81
82 #define CDEV_MAJOR 2
83 static struct cdevsw mem_cdevsw = {
84         /* name */      "mem",
85         /* maj */       CDEV_MAJOR,
86         /* flags */     D_MEM,
87         /* port */      NULL,
88         /* clone */     NULL,
89
90         /* open */      mmopen,
91         /* close */     mmclose,
92         /* read */      mmrw,
93         /* write */     mmrw,
94         /* ioctl */     mmioctl,
95         /* poll */      mmpoll,
96         /* mmap */      memmmap,
97         /* strategy */  nostrategy,
98         /* dump */      nodump,
99         /* psize */     nopsize
100 };
101
102 static int rand_bolt;
103 static caddr_t  zbuf;
104
105 MALLOC_DEFINE(M_MEMDESC, "memdesc", "memory range descriptors");
106 static int mem_ioctl (dev_t, u_long, caddr_t, int, struct thread *);
107 static int random_ioctl (dev_t, u_long, caddr_t, int, struct thread *);
108
109 struct mem_range_softc mem_range_softc;
110
111
112 static int
113 mmclose(dev_t dev, int flags, int fmt, struct thread *td)
114 {
115         struct proc *p = td->td_proc;
116
117         switch (minor(dev)) {
118         case 14:
119                 p->p_md.md_regs->tf_eflags &= ~PSL_IOPL;
120                 break;
121         default:
122                 break;
123         }
124         return (0);
125 }
126
127 static int
128 mmopen(dev_t dev, int flags, int fmt, struct thread *td)
129 {
130         int error;
131         struct proc *p = td->td_proc;
132
133         switch (minor(dev)) {
134         case 0:
135         case 1:
136                 if ((flags & FWRITE) && securelevel > 0)
137                         return (EPERM);
138                 break;
139         case 14:
140                 error = suser(td);
141                 if (error != 0)
142                         return (error);
143                 if (securelevel > 0)
144                         return (EPERM);
145                 p->p_md.md_regs->tf_eflags |= PSL_IOPL;
146                 break;
147         default:
148                 break;
149         }
150         return (0);
151 }
152
153 static int
154 mmrw(dev, uio, flags)
155         dev_t dev;
156         struct uio *uio;
157         int flags;
158 {
159         int o;
160         u_int c, v;
161         u_int poolsize;
162         struct iovec *iov;
163         int error = 0;
164         caddr_t buf = NULL;
165
166         while (uio->uio_resid > 0 && error == 0) {
167                 iov = uio->uio_iov;
168                 if (iov->iov_len == 0) {
169                         uio->uio_iov++;
170                         uio->uio_iovcnt--;
171                         if (uio->uio_iovcnt < 0)
172                                 panic("mmrw");
173                         continue;
174                 }
175                 switch (minor(dev)) {
176                 case 0:
177                         /*
178                          * minor device 0 is physical memory, /dev/mem 
179                          */
180                         v = uio->uio_offset;
181                         v &= ~PAGE_MASK;
182                         pmap_kenter((vm_offset_t)ptvmmap, v);
183                         o = (int)uio->uio_offset & PAGE_MASK;
184                         c = (u_int)(PAGE_SIZE - ((int)iov->iov_base & PAGE_MASK));
185                         c = min(c, (u_int)(PAGE_SIZE - o));
186                         c = min(c, (u_int)iov->iov_len);
187                         error = uiomove((caddr_t)&ptvmmap[o], (int)c, uio);
188                         pmap_kremove((vm_offset_t)ptvmmap);
189                         continue;
190
191                 case 1: {
192                         /*
193                          * minor device 1 is kernel memory, /dev/kmem 
194                          */
195                         vm_offset_t addr, eaddr;
196                         c = iov->iov_len;
197
198                         /*
199                          * Make sure that all of the pages are currently 
200                          * resident so that we don't create any zero-fill
201                          * pages.
202                          */
203                         addr = trunc_page(uio->uio_offset);
204                         eaddr = round_page(uio->uio_offset + c);
205
206                         if (addr < (vm_offset_t)VADDR(PTDPTDI, 0))
207                                 return EFAULT;
208                         if (eaddr >= (vm_offset_t)VADDR(APTDPTDI, 0))
209                                 return EFAULT;
210                         for (; addr < eaddr; addr += PAGE_SIZE) 
211                                 if (pmap_extract(kernel_pmap, addr) == 0)
212                                         return EFAULT;
213                         
214                         if (!kernacc((caddr_t)(int)uio->uio_offset, c,
215                             uio->uio_rw == UIO_READ ? 
216                             VM_PROT_READ : VM_PROT_WRITE))
217                                 return (EFAULT);
218                         error = uiomove((caddr_t)(int)uio->uio_offset, (int)c, uio);
219                         continue;
220                 }
221                 case 2:
222                         /*
223                          * minor device 2 is EOF/RATHOLE 
224                          */
225                         if (uio->uio_rw == UIO_READ)
226                                 return (0);
227                         c = iov->iov_len;
228                         break;
229                 case 3:
230                         /*
231                          * minor device 3 (/dev/random) is source of filth
232                          * on read, seeder on write
233                          */
234                         if (buf == NULL)
235                                 buf = malloc(PAGE_SIZE, M_TEMP, M_WAITOK);
236                         c = min(iov->iov_len, PAGE_SIZE);
237                         if (uio->uio_rw == UIO_WRITE) {
238                                 error = uiomove(buf, (int)c, uio);
239                                 if (error == 0)
240                                         error = add_buffer_randomness(buf, c);
241                         } else {
242                                 poolsize = read_random(buf, c);
243                                 if (poolsize == 0) {
244                                         if (buf)
245                                                 free(buf, M_TEMP);
246                                         if ((flags & IO_NDELAY) != 0)
247                                                 return (EWOULDBLOCK);
248                                         return (0);
249                                 }
250                                 c = min(c, poolsize);
251                                 error = uiomove(buf, (int)c, uio);
252                         }
253                         continue;
254                 case 4:
255                         /*
256                          * minor device 4 (/dev/urandom) is source of muck
257                          * on read, writes are disallowed.
258                          */
259                         c = min(iov->iov_len, PAGE_SIZE);
260                         if (uio->uio_rw == UIO_WRITE) {
261                                 error = EPERM;
262                                 break;
263                         }
264                         if (CURSIG(curproc) != 0) {
265                                 /*
266                                  * Use tsleep() to get the error code right.
267                                  * It should return immediately.
268                                  */
269                                 error = tsleep(&rand_bolt, PCATCH, "urand", 1);
270                                 if (error != 0 && error != EWOULDBLOCK)
271                                         continue;
272                         }
273                         if (buf == NULL)
274                                 buf = malloc(PAGE_SIZE, M_TEMP, M_WAITOK);
275                         poolsize = read_random_unlimited(buf, c);
276                         c = min(c, poolsize);
277                         error = uiomove(buf, (int)c, uio);
278                         continue;
279                 case 12:
280                         /*
281                          * minor device 12 (/dev/zero) is source of nulls 
282                          * on read, write are disallowed.
283                          */
284                         if (uio->uio_rw == UIO_WRITE) {
285                                 c = iov->iov_len;
286                                 break;
287                         }
288                         if (zbuf == NULL) {
289                                 zbuf = (caddr_t)
290                                     malloc(PAGE_SIZE, M_TEMP, M_WAITOK);
291                                 bzero(zbuf, PAGE_SIZE);
292                         }
293                         c = min(iov->iov_len, PAGE_SIZE);
294                         error = uiomove(zbuf, (int)c, uio);
295                         continue;
296                 default:
297                         return (ENODEV);
298                 }
299                 if (error)
300                         break;
301                 iov->iov_base += c;
302                 iov->iov_len -= c;
303                 uio->uio_offset += c;
304                 uio->uio_resid -= c;
305         }
306         if (buf)
307                 free(buf, M_TEMP);
308         return (error);
309 }
310
311
312
313
314 /*******************************************************\
315 * allow user processes to MMAP some memory sections     *
316 * instead of going through read/write                   *
317 \*******************************************************/
318 static int
319 memmmap(dev_t dev, vm_offset_t offset, int nprot)
320 {
321         switch (minor(dev))
322         {
323
324 /* minor device 0 is physical memory */
325         case 0:
326                 return i386_btop(offset);
327
328 /* minor device 1 is kernel memory */
329         case 1:
330                 return i386_btop(vtophys(offset));
331
332         default:
333                 return -1;
334         }
335 }
336
337 static int
338 mmioctl(dev_t dev, u_long cmd, caddr_t data, int flags, struct thread *td)
339 {
340
341         switch (minor(dev)) {
342         case 0:
343                 return mem_ioctl(dev, cmd, data, flags, td);
344         case 3:
345         case 4:
346                 return random_ioctl(dev, cmd, data, flags, td);
347         }
348         return (ENODEV);
349 }
350
351 /*
352  * Operations for changing memory attributes.
353  *
354  * This is basically just an ioctl shim for mem_range_attr_get
355  * and mem_range_attr_set.
356  */
357 static int 
358 mem_ioctl(dev_t dev, u_long cmd, caddr_t data, int flags, struct thread *td)
359 {
360         int nd, error = 0;
361         struct mem_range_op *mo = (struct mem_range_op *)data;
362         struct mem_range_desc *md;
363         
364         /* is this for us? */
365         if ((cmd != MEMRANGE_GET) &&
366             (cmd != MEMRANGE_SET))
367                 return (ENOTTY);
368
369         /* any chance we can handle this? */
370         if (mem_range_softc.mr_op == NULL)
371                 return (EOPNOTSUPP);
372
373         /* do we have any descriptors? */
374         if (mem_range_softc.mr_ndesc == 0)
375                 return (ENXIO);
376
377         switch (cmd) {
378         case MEMRANGE_GET:
379                 nd = imin(mo->mo_arg[0], mem_range_softc.mr_ndesc);
380                 if (nd > 0) {
381                         md = (struct mem_range_desc *)
382                                 malloc(nd * sizeof(struct mem_range_desc),
383                                        M_MEMDESC, M_WAITOK);
384                         error = mem_range_attr_get(md, &nd);
385                         if (!error)
386                                 error = copyout(md, mo->mo_desc, 
387                                         nd * sizeof(struct mem_range_desc));
388                         free(md, M_MEMDESC);
389                 } else {
390                         nd = mem_range_softc.mr_ndesc;
391                 }
392                 mo->mo_arg[0] = nd;
393                 break;
394                 
395         case MEMRANGE_SET:
396                 md = (struct mem_range_desc *)malloc(sizeof(struct mem_range_desc),
397                                                     M_MEMDESC, M_WAITOK);
398                 error = copyin(mo->mo_desc, md, sizeof(struct mem_range_desc));
399                 /* clamp description string */
400                 md->mr_owner[sizeof(md->mr_owner) - 1] = 0;
401                 if (error == 0)
402                         error = mem_range_attr_set(md, &mo->mo_arg[0]);
403                 free(md, M_MEMDESC);
404                 break;
405         }
406         return (error);
407 }
408
409 /*
410  * Implementation-neutral, kernel-callable functions for manipulating
411  * memory range attributes.
412  */
413 int
414 mem_range_attr_get(mrd, arg)
415         struct mem_range_desc *mrd;
416         int *arg;
417 {
418         /* can we handle this? */
419         if (mem_range_softc.mr_op == NULL)
420                 return (EOPNOTSUPP);
421
422         if (*arg == 0) {
423                 *arg = mem_range_softc.mr_ndesc;
424         } else {
425                 bcopy(mem_range_softc.mr_desc, mrd, (*arg) * sizeof(struct mem_range_desc));
426         }
427         return (0);
428 }
429
430 int
431 mem_range_attr_set(mrd, arg)
432         struct mem_range_desc *mrd;
433         int *arg;
434 {
435         /* can we handle this? */
436         if (mem_range_softc.mr_op == NULL)
437                 return (EOPNOTSUPP);
438
439         return (mem_range_softc.mr_op->set(&mem_range_softc, mrd, arg));
440 }
441
442 #ifdef SMP
443 void
444 mem_range_AP_init(void)
445 {
446         if (mem_range_softc.mr_op && mem_range_softc.mr_op->initAP)
447                 return (mem_range_softc.mr_op->initAP(&mem_range_softc));
448 }
449 #endif
450
451 static int 
452 random_ioctl(dev_t dev, u_long cmd, caddr_t data, int flags, struct thread *td)
453 {
454         int error;
455         int intr;
456         
457         /*
458          * Even inspecting the state is privileged, since it gives a hint
459          * about how easily the randomness might be guessed.
460          */
461         error = 0;
462
463         switch (cmd) {
464         /* Really handled in upper layer */
465         case FIOASYNC:
466                 break;
467         case MEM_SETIRQ:
468                 intr = *(int16_t *)data;
469                 if ((error = suser(td)) != 0)
470                         break;
471                 if (intr < 0 || intr >= MAX_INTS)
472                         return (EINVAL);
473                 register_randintr(intr);
474                 break;
475         case MEM_CLEARIRQ:
476                 intr = *(int16_t *)data;
477                 if ((error = suser(td)) != 0)
478                         break;
479                 if (intr < 0 || intr >= MAX_INTS)
480                         return (EINVAL);
481                 unregister_randintr(intr);
482                 break;
483         case MEM_RETURNIRQ:
484                 error = ENOTSUP;
485                 break;
486         case MEM_FINDIRQ:
487                 intr = *(int16_t *)data;
488                 if ((error = suser(td)) != 0)
489                         break;
490                 if (intr < 0 || intr >= MAX_INTS)
491                         return (EINVAL);
492                 intr = next_registered_randintr(intr);
493                 if (intr == MAX_INTS)
494                         return (ENOENT);
495                 *(u_int16_t *)data = intr;
496                 break;
497         default:
498                 error = ENOTSUP;
499                 break;
500         }
501         return (error);
502 }
503
504 int
505 mmpoll(dev_t dev, int events, struct thread *td)
506 {
507         switch (minor(dev)) {
508         case 3:         /* /dev/random */
509                 return random_poll(dev, events, td);
510         case 4:         /* /dev/urandom */
511         default:
512                 return seltrue(dev, events, td);
513         }
514 }
515
516 int
517 iszerodev(dev)
518         dev_t dev;
519 {
520         return ((major(dev) == mem_cdevsw.d_maj)
521           && minor(dev) == 12);
522 }
523
524 static void
525 mem_drvinit(void *unused)
526 {
527
528         /* Initialise memory range handling */
529         if (mem_range_softc.mr_op != NULL)
530                 mem_range_softc.mr_op->init(&mem_range_softc);
531
532         cdevsw_add(&mem_cdevsw, 0xf0, 0);
533         make_dev(&mem_cdevsw, 0, UID_ROOT, GID_KMEM, 0640, "mem");
534         make_dev(&mem_cdevsw, 1, UID_ROOT, GID_KMEM, 0640, "kmem");
535         make_dev(&mem_cdevsw, 2, UID_ROOT, GID_WHEEL, 0666, "null");
536         make_dev(&mem_cdevsw, 3, UID_ROOT, GID_WHEEL, 0644, "random");
537         make_dev(&mem_cdevsw, 4, UID_ROOT, GID_WHEEL, 0644, "urandom");
538         make_dev(&mem_cdevsw, 12, UID_ROOT, GID_WHEEL, 0666, "zero");
539         make_dev(&mem_cdevsw, 14, UID_ROOT, GID_WHEEL, 0600, "io");
540 }
541
542 SYSINIT(memdev,SI_SUB_DRIVERS,SI_ORDER_MIDDLE+CDEV_MAJOR,mem_drvinit,NULL)
543