d797a9338e03aca586d0c05645ec2393ea598c80
[dragonfly.git] / sys / emulation / linux / i386 / imgact_linux.c
1 /*-
2  * Copyright (c) 1994-1996 Søren Schmidt
3  * All rights reserved.
4  *
5  * Based heavily on /sys/kern/imgact_aout.c which is:
6  * Copyright (c) 1993, David Greenman
7  *
8  * Redistribution and use in source and binary forms, with or without
9  * modification, are permitted provided that the following conditions
10  * are met:
11  * 1. Redistributions of source code must retain the above copyright
12  *    notice, this list of conditions and the following disclaimer 
13  *    in this position and unchanged.
14  * 2. Redistributions in binary form must reproduce the above copyright
15  *    notice, this list of conditions and the following disclaimer in the
16  *    documentation and/or other materials provided with the distribution.
17  * 3. The name of the author may not be used to endorse or promote products
18  *    derived from this software withough specific prior written permission
19  *
20  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR ``AS IS'' AND ANY EXPRESS OR
21  * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
22  * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
23  * IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR ANY DIRECT, INDIRECT,
24  * INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT
25  * NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
26  * DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
27  * THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
28  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
29  * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
30  *
31  * $FreeBSD: src/sys/i386/linux/imgact_linux.c,v 1.35.2.2 2001/11/03 01:41:08 ps Exp $
32  * $DragonFly: src/sys/emulation/linux/i386/imgact_linux.c,v 1.7 2005/12/10 16:06:20 swildner Exp $
33  */
34
35 #include <sys/param.h>
36 #include <sys/systm.h>
37 #include <sys/resourcevar.h>
38 #include <sys/exec.h>
39 #include <sys/mman.h>
40 #include <sys/imgact.h>
41 #include <sys/imgact_aout.h>
42 #include <sys/kernel.h>
43 #include <sys/lock.h>
44 #include <sys/proc.h>
45 #include <sys/vnode.h>
46
47 #include <vm/vm.h>
48 #include <vm/vm_kern.h>
49 #include <vm/vm_param.h>
50 #include <vm/pmap.h>
51 #include <vm/vm_map.h>
52 #include <vm/vm_extern.h>
53
54 #include "linux.h"
55
56 static int      exec_linux_imgact (struct image_params *iparams);
57
58 static int
59 exec_linux_imgact(struct image_params *imgp)
60 {
61     const struct exec *a_out = (const struct exec *) imgp->image_header;
62     struct vmspace *vmspace;
63     vm_offset_t vmaddr;
64     unsigned long virtual_offset, file_offset;
65     vm_offset_t buffer;
66     unsigned long bss_size;
67     int error;
68
69     if (((a_out->a_magic >> 16) & 0xff) != 0x64)
70         return -1;
71
72     /*
73      * Set file/virtual offset based on a.out variant.
74      */
75     switch ((int)(a_out->a_magic & 0xffff)) {
76     case 0413:
77         virtual_offset = 0;
78         file_offset = 1024;
79         break;
80     case 0314:
81         virtual_offset = 4096;
82         file_offset = 0;
83         break;
84     default:
85         return (-1);
86     }
87     bss_size = round_page(a_out->a_bss);
88 #ifdef DEBUG
89     printf("imgact: text: %08lx, data: %08lx, bss: %08lx\n",
90         (u_long)a_out->a_text, (u_long)a_out->a_data, bss_size);
91 #endif
92
93     /*
94      * Check various fields in header for validity/bounds.
95      */
96     if (a_out->a_entry < virtual_offset ||
97         a_out->a_entry >= virtual_offset + a_out->a_text ||
98         a_out->a_text & PAGE_MASK || a_out->a_data & PAGE_MASK)
99         return (-1);
100
101     /* text + data can't exceed file size */
102     if (a_out->a_data + a_out->a_text > imgp->attr->va_size)
103         return (EFAULT);
104     /*
105      * text/data/bss must not exceed limits
106      */
107     if (a_out->a_text > maxtsiz ||
108         a_out->a_data + bss_size > imgp->proc->p_rlimit[RLIMIT_DATA].rlim_cur)
109         return (ENOMEM);
110
111     /*
112      * Destroy old process VM and create a new one (with a new stack)
113      */
114     exec_new_vmspace(imgp, NULL);
115     vmspace = imgp->proc->p_vmspace;
116
117     /*
118      * Check if file_offset page aligned,.
119      * Currently we cannot handle misalinged file offsets,
120      * and so we read in the entire image (what a waste).
121      */
122     if (file_offset & PAGE_MASK) {
123 #ifdef DEBUG
124         printf("imgact: Non page aligned binary %lu\n", file_offset);
125 #endif
126         /*
127          * Map text+data+bss read/write/execute
128          */
129         vmaddr = virtual_offset;
130         error = vm_map_find(&vmspace->vm_map, NULL, 0, &vmaddr,
131                             a_out->a_text + a_out->a_data + bss_size, FALSE,
132                             VM_PROT_ALL, VM_PROT_ALL, 0);
133         if (error)
134             return error;
135
136         error = vm_mmap(kernel_map, &buffer,
137                         round_page(a_out->a_text + a_out->a_data + file_offset),
138                         VM_PROT_READ, VM_PROT_READ, 0,
139                         (caddr_t) imgp->vp, trunc_page(file_offset));
140         if (error)
141             return error;
142
143         error = copyout((caddr_t)(void *)(uintptr_t)(buffer + file_offset),
144                         (caddr_t)vmaddr, a_out->a_text + a_out->a_data);
145
146         vm_map_remove(kernel_map, buffer,
147                       buffer + round_page(a_out->a_text + a_out->a_data + file_offset));
148
149         if (error)
150             return error;
151
152         /*
153          * remove write enable on the 'text' part
154          */
155         error = vm_map_protect(&vmspace->vm_map,
156                                vmaddr,
157                                vmaddr + a_out->a_text,
158                                VM_PROT_EXECUTE|VM_PROT_READ,
159                                TRUE);
160         if (error)
161             return error;
162     }
163     else {
164 #ifdef DEBUG
165         printf("imgact: Page aligned binary %lu\n", file_offset);
166 #endif
167         /*
168          * Map text+data read/execute
169          */
170         vmaddr = virtual_offset;
171         error = vm_mmap(&vmspace->vm_map, &vmaddr,
172                         a_out->a_text + a_out->a_data,
173                         VM_PROT_READ | VM_PROT_EXECUTE,
174                         VM_PROT_ALL,
175                         MAP_PRIVATE | MAP_FIXED,
176                         (caddr_t)imgp->vp, file_offset);
177         if (error)
178             return (error);
179     
180 #ifdef DEBUG
181         printf("imgact: startaddr=%08lx, length=%08lx\n",
182             (u_long)vmaddr, a_out->a_text + a_out->a_data);
183 #endif
184         /*
185          * allow read/write of data
186          */
187         error = vm_map_protect(&vmspace->vm_map,
188                                vmaddr + a_out->a_text,
189                                vmaddr + a_out->a_text + a_out->a_data,
190                                VM_PROT_ALL,
191                                FALSE);
192         if (error)
193             return (error);
194     
195         /*
196          * Allocate anon demand-zeroed area for uninitialized data
197          */
198         if (bss_size != 0) {
199             vmaddr = virtual_offset + a_out->a_text + a_out->a_data;
200             error = vm_map_find(&vmspace->vm_map, NULL, 0, &vmaddr, 
201                                 bss_size, FALSE, VM_PROT_ALL, VM_PROT_ALL, 0);
202             if (error)
203                 return (error);
204 #ifdef DEBUG
205             printf("imgact: bssaddr=%08lx, length=%08lx\n",
206                 (u_long)vmaddr, bss_size);
207 #endif
208
209         }
210         /* Indicate that this file should not be modified */
211         imgp->vp->v_flag |= VTEXT;
212     }
213     /* Fill in process VM information */
214     vmspace->vm_tsize = round_page(a_out->a_text) >> PAGE_SHIFT;
215     vmspace->vm_dsize = round_page(a_out->a_data + bss_size) >> PAGE_SHIFT;
216     vmspace->vm_taddr = (caddr_t)(void *)(uintptr_t)virtual_offset;
217     vmspace->vm_daddr = (caddr_t)(void *)(uintptr_t)
218         (virtual_offset + a_out->a_text);
219
220     /* Fill in image_params */
221     imgp->interpreted = 0;
222     imgp->entry_addr = a_out->a_entry;
223     
224     imgp->proc->p_sysent = &linux_sysvec;
225     return (0);
226 }
227
228 /*
229  * Tell kern_execve.c about it, with a little help from the linker.
230  */
231 static struct execsw linux_execsw = { exec_linux_imgact, "linux a.out" };
232 EXEC_SET(linuxaout, linux_execsw);