6ede6bc8cc85a66185be3d5d0561f70e579abc5e
[ikiwiki.git] / docs / developer / gsoc2010 / index.mdwn
1 [[!meta title="Google Summer of Code 2010"]]
2
3 [[!toc  levels=0]]
4
5 DragonFly BSD is planning to participate (pending acceptance) in the Google Summer of Code program for 2010.
6
7
8 Have a look at our SoC pages from [[2008|docs/developer/GoogleSoC2008/]] and [[2009|docs/developer/gsoc2009]] to get an overview about prior year's projects.  The [Projects Page](/docs/developer/ProjectsPage/) is also a potential source of ideas.
9
10
11 For more details on Google's Summer of Code: [Google's SoC page](http://socghop.appspot.com/)
12
13 Legend:
14
15 * Prerequisites: knowledge that the student should have before starting the project. It may be possible to acquire the knowledge in the course of the project, but the estimated difficulty would increase substantially.
16 * Difficulty: Estimated difficulty of the project, taking into account the complexity of the task and the time constraints of the GSoC program.
17 * Contact point: The person you should contact for any further information or clarifications.
18
19 #### Project ideas
20
21 ##### VFS Quota System
22 * Create a new kernel subsystem to manage quota's in a filesystem agnostic manner by interfacing with the kernel VFS layer.
23 * Create filesystem-agnostic quota support tools for userland that obtain information in the same manner as eg: du(1) instead of parsing the filesystem internals directly as the existing quota tools do (see quotacheck(8), repquota(8), edquota(8), ...).
24 * The quota file storage can be modeled after the existing UFS code that does the same, but should use the more general bytes, files and/or directories metrics instead of the somewhat UFS-specific blocks and inodes.
25
26 Meta information:
27
28 * Prerequisites: C, introductory filesystems internals
29 * Difficulty: Moderate
30 * Contact point: Samuel J. Greear <sjg@thesjg.com>
31
32 ---
33
34 ##### HAMMER Data dedup
35 * Add a data de-duplication mechanism to HAMMER.
36
37 * Potential data matches using CRCs during pruning runs,
38   verify duplicate data, collapse the B-Tree reference,
39   and account for the additional ref in the allocator.
40
41 Meta information:
42
43 * Prerequisites: C, modern filesystem internals
44 * Difficulty: Moderate
45 * Contact point: dillon
46
47 ---
48
49 ##### Implement i386 32-bit ABI for x86_64 64-bit kernel
50 * Add a 32-bit syscall table which translates 32-bit
51   system calls to 64-bit
52
53 * Add support for 32 bit compatibility mode operation
54   and ELF binary detection.
55
56 Meta information:
57
58 * Prerequisites: C
59 * Difficulty: Moderate
60 * Contact point: dillon
61
62 ---
63
64 ##### Implement ARC algorithm for vnode free list
65 * Vnode recycling is LRU and can't efficiently handle data sets which
66   exceed the maxvnode limit.
67
68 Meta information:
69
70 * Prerequisites: C, OS internals
71 * Difficulty: Modest
72 * Contact point: dillon
73
74 ---
75
76 ##### Implement swapoff
77 * We have swapon to add swap space, we need a swapoff to
78   remove it.
79
80 Meta information:
81
82 * Prerequisites: C, elementary OS memory management
83 * Difficulty: Modest
84 * Contact point: dillon
85
86 ---
87
88 ##### Implement SHA-2 password encryption
89 * Implement new default encryption for master.passwd
90
91 Meta information:
92
93 * Prerequisites: C
94 * Difficulty: Fairly easy
95 * Contact point: dillon
96
97 ---
98
99 ##### Graphics Kernel Memory Manager Support ( GEM )
100 * Support dealing with graphics NUMA in kernel space for modern graphics hardware
101 * http://en.wikipedia.org/wiki/Graphics_Execution_Manager
102
103 Meta information:
104
105 * Prerequisites: C, knowledge of modern computer graphics system architecture
106 * Difficulty: Moderate
107 * Contact point: kernel@crater.dragonflybsd.org
108
109 ---
110
111 ##### Make DragonFly NUMA-aware 
112
113 * Parse related ACPI tables 
114 * NUMA-aware memory allocation
115 * References:
116 [ACPI SLIT parser](http://mail-index.netbsd.org/tech-kern/2009/11/23/msg006518.html)
117 [ACPI SRAT parser](http://mail-index.netbsd.org/tech-kern/2009/11/23/msg006517.html)
118 [NetBSD NUMA diff](http://www.netbsd.org/~cegger/numa2.diff)
119 [NetBSD NUMA x86 diff](http://www.netbsd.org/~cegger/numa_x86.diff)
120
121 Meta information:
122
123 * Prerequisites: C, introductory computer architecture
124 * Difficulty: Easy
125 * Contact point: kernel@crater.dragonflybsd.org
126
127 ---
128
129 ##### Volume Management based on NetBSD's port of LVM2
130
131 NetBSD reimplemented Linux's device mapper (currently only implementing
132 the linear, zero and error targets; Linux has support for a variety of
133 targets, including crypt, stripe, snap, multipath) as dm(4). Device mapper
134 provides the functionality on which to implement volume management; NetBSD
135 has imported LVM2 (which is GPL), but it is possible to create different
136 tools for volume management (e.g. IBM's EVMS was also built on top of device
137 mapper).
138
139 The goal of this project is to port both the kernel code, dm(4), and the
140 LVM2 userspace libraries and tools from NetBSD. If time remains, the
141 student should also implement a proof of concept "stripe" target or, for the
142 more ambitious, a "crypt" target.
143
144 A possible roadmap for this project would be
145
146 1. Port the dm(4) code
147
148     This code uses proplib instead of binary ioctls for communicating with
149 userspace. Either port proplib, or convert the code to use ioctls.
150
151 1. Port the userspace tools
152
153     Integrate the tools in our source tree using a separate vendor branch, as
154 is normally done for contrib software (see development(7)). Make any
155 DragonFlyBSD-specific changes necessary.
156
157 1. (Optional) Implement either a "stripe" target or a crypt target.
158
159     The stripe target must be designed with robustness and extensibility in
160 mind, though it is not required to go all the way. It should be flexible
161 enough to allow for different RAID level implementations (at least 0, 1
162 and 5). Additionally, it should be possible to keep an internal (i.e. part
163 of the volume) log to speed up resyncing and parity checking. Implementing
164 those features would be ideal, but is not required.
165
166     The crypt target must allow for different ciphers and cipher parameters and
167 should make use of our in-kernel crypto infrastructure. It is probably
168 necessary to do the encryption asynchronously which will require extending
169 the current infrastructure.
170
171 Meta information:
172
173 * Prerequisites: C, elementary OS internals
174 * Difficulty: Medium
175 * Contact point: Aggelos Economopoulos <aoiko@cc.ece.ntua.gr>
176
177 ---
178
179 ##### Make DragonflyBSD Tickless
180 * By default, the clock cyclic fires at 100 Hz, regardless of whether or not any timeouts/callouts are scheduled to fire/expire. This is suboptimal from a power efficiency standpoint, as at least one of the system's CPUs never become quiescent/idle enough to be brought into a low power state.
181 This work involves re-implementing the services presently provided by clock() in a tickless (or event based) fashion, eliminating the need for the system to "wake up", only to realize that there's nothing to do on an otherwise idle system.
182 * http://hub.opensolaris.org/bin/view/Project+tickless/lbolt
183
184 Meta information:
185
186 * Prerequisites: C, OS internals
187 * Difficulty: ?
188 * Contact point: kernel@crater.dragonflybsd.org
189
190 ---
191
192 ##### Make the DragonflyBSD Dispatcher Power-aware
193 * CPU power management as it it implemented today is relatively isolated from the rest of the system. As such, it is forced to periodically poll to measure the utilization of the system's CPU resources.
194 * This project extends the kernel's existing topology aware scheduling facility to bring "power domain" awareness to the dispatcher. With this awareness in place, the dispatcher can implement coalescence dispatching policy to consolidate utilization onto a smaller subset of CPU domains, freeing up other domains to be power managed. In addition to being domain aware, the dispatcher will also tend to prefer to utilize domains already running at higher power/performance states...this will increase the duration and extent to which domains can remain quiescent, improving the kernel's ability to take advantage of features like deep C-states. Because the dispatcher will track power domain utilization along the way, it can drive active domain state changes in an event driven fashion, eliminating the need for the CPUPM subsystem to poll.
195 * http://hub.opensolaris.org/bin/view/Project+tesla/CPUPM
196
197 Meta information:
198
199 * Prerequisites: C
200 * Difficulty: ?
201 * Contact point: kernel@crater.dragonflybsd.org
202
203 ---
204
205 ##### Port DragonFly to ARM platform
206
207 Meta information:
208
209 * Prerequisites: C, ARM assembly, x86 assembly
210 * Difficulty: Extremely hard
211 * Contact point: kernel@crater.dragonflybsd.org
212
213 ---
214
215 ##### Port valgrind to DragonFlyBSD
216
217 Valgrind is a very useful tool on a system like DragonFly that's under heavy development. Since valgrind is very target specific, a student doing the port will have to get acquainted with many low level details of the system libraries and the user<->kernel interface (system calls, signal delivery, threading...). This is a project that should appeal to aspiring systems programmers. Ideally, we would want the port to be usable with vkernel processes, thus enabling complex checking of the core kernel code.
218
219 The goal of this project is to port valgrind to the DragonFlyBSD platform so that at least the memcheck tool runs sufficiently well to be useful. This is in itself a challenging task. If time remains, the student should try to get at least a trivial valgrind tool to work on a vkernel process.
220
221 Meta information:
222
223 * Prerequisites: C, x86 assembly, low-level OS internals
224 * Difficulty: Hard
225 * Contact point: Aggelos Economopoulos <aoiko@cc.ece.ntua.gr>
226
227 ---
228
229 ##### Adapt pkgsrc to create a package system with dependency independence.
230 * Create a set of tools that modifies how the pkgsrc packages are installed, allowing for the ability to upgrade individual packages, without stopping applications that depend on said packages from working. One method of achieving this is detailed at http://www.dragonflybsd.org/goals/#packages but other methods may be possible. PC-BSD have written a tool called PBI Builder which modifies FreeBSD ports for their dependency independence PBI system, this could be used as a starting point for the DragonFly BSD tools.
231
232 Meta information:
233
234 * Prerequisites: C
235 * Difficulty: ?
236 * Contact point: kernel@crater.dragonflybsd.org
237
238 ---
239
240 ##### Implement virtio drivers on DragonFly to speed up DragonFly as a KVM guest
241 * As virtualization is coming more and more and KVM will be a strong player in that field, it might be a good idea to be the first BSD to have a virtio implementation that enables us to run at a better speed in comparison to the other BSDs and maybe close to Linux on this virtualization platform.
242
243 Meta information:
244
245 * Prerequisites: C
246 * Difficulty: ?
247 * Contact point: kernel@crater.dragonflybsd.org
248
249 ---
250
251 ##### Port FUSE or PUFFS from FreeBSD/NetBSD
252
253 * http://www.netbsd.org/docs/puffs/
254 * This would make many userspace filesystems available to DragonFly, e.g. sshfs to mention only one.
255
256 Meta information:
257
258 * Prerequisites: C, elementary OS internals
259 * Difficulty: Medium
260 * Contact point: Michael Neumann <mneumann@ntecs.de>
261
262 ---
263
264 ##### Make vkernels checkpointable
265
266 * See checkpt(1).
267 * Teach the checkpt syscall how to checkpoint multiple vmspaces.
268 * Add code to the vkernel which gets triggered on SIGCKPT to dump/load e.g. the current state of network drivers.
269 * This would allow us to save and restore or even migrate a complete DragonFly operating system running on the vkernel platform.
270 This could be especially handy on laptops (if we'd get X11 operating in vkernels).
271 * See also: http://www.dragonflybsd.org/docs/developer/CheckpointFeatures/
272
273 Meta information:
274
275 * Prerequisites: C, OS internals
276 * Difficulty: Medium
277 * Contact point: Michael Neumann <mneumann@ntecs.de>
278
279 ---
280
281 ##### HAMMER compression
282
283 * Compress blocks as they get written to disk.
284 * Only file data (rec_type == DATA) should be compressed, not meta-data.
285 * the CRC should be that of the uncompressed data.
286 * ideally you'd need to associate the uncompressed data with the buffer cache buffer somehow, so that decompression is only performed once.
287 * compression could be turned on a per-file or per-pfs basis.
288 * gzip compression would be just fine at first.
289
290 Meta information:
291
292 * Prerequisites: C, filesystem internals
293 * Difficulty: Medium
294 * Contact point: Michael Neumann <mneumann@ntecs.de>
295
296 ---
297
298
299 ##### Port usb4bsd
300 * Port the whole usb4bsd stuff to DragonFly, as our own usb stack is too outdated.
301
302 * The usb4bsd branch of hselasky (?) has several userland wrappers and quite good abstraction to simplify the porting.
303
304 * (is polachok doing this or not?)
305
306 Meta information:
307
308 * Prerequisites: C, OS internals
309 * Difficulty: Moderate
310 * Contact point: kernel@crater.dragonflybsd.org
311
312 ---
313
314 ##### Userland System V Shared Memory / Semaphore / Message Queue implementation
315 * Implement some or all of these subsystems in their entirety, or as completely as possible in userland using a daemon, mmap and the DragonFly umtx_sleep(2)/umtx_wakeup(2) or other userland facilities.
316 * Any security or other major hurdles to this approach that would likely have to be implemented in-kernel should be noted in the students application.
317 * Test and benchmark the new facilities with heavy SysV consumers such as PostgreSQL
318 * Identify performance tradeoffs made in the userland implementation versus the existing kernel implementation. If time permits identify and apply solutions to these tradeoffs so that the userland implementation performs on par with or better than the kernel implementation.
319
320 Meta information:
321
322 * Prerequisites: C, x86 assembly
323 * Difficulty: Moderate
324 * Contact point: Samuel J. Greear <sjg@thesjg.com>
325
326 ---
327
328  (please add)