Kill data integrity framework. Vague, open ended, requires full-time team of engineer...
[ikiwiki.git] / docs / developer / gsoc2010 / index.mdwn
1 [[!meta title="Google Summer of Code 2010"]]
2
3 [[!toc  levels=0]]
4
5 DragonFly BSD is planning to participate (pending acceptance) in the Google Summer of Code program for 2010.
6
7
8 Have a look at our SoC pages from [[2008|docs/developer/GoogleSoC2008/]] and [[2009|docs/developer/gsoc2009]] to get an overview about prior year's projects.  The [Projects Page](/docs/developer/ProjectsPage/) is also a potential source of ideas.
9
10
11 For more details on Google's Summer of Code: [Google's SoC page](http://socghop.appspot.com/)
12
13
14 #### Project ideas
15
16 ##### VFS Quota System
17 1. Kernel and quota support in the VFS layer
18 1. Filesystem-agnostic quota support tools for userland
19
20 Meta information:
21
22 * Difficulty: ?
23 * Contact point: ?
24
25 ---
26
27 ##### HAMMER Data dedup
28 * Add a data de-duplication mechanism to HAMMER.
29
30 * Potential data matches using CRCs during pruning runs,
31   verify duplicate data, collapse the B-Tree reference,
32   and account for the additional ref in the allocator.
33
34 Meta information:
35
36 * Difficulty: Moderate
37 * Contact point: dillon
38
39 ---
40
41 ##### Implement i386 32-bit ABI for x86_64 64-bit kernel
42 * Add a 32-bit syscall table which translates 32-bit
43   system calls to 64-bit
44
45 * Add support for 32 bit compatibility mode operation
46   and ELF binary detection.
47
48 Meta information:
49
50 * Difficulty: Moderate
51 * Contact point: dillon
52
53 ---
54
55 ##### Implement ARC algorithm for vnode free list
56 * Vnode recycling is LRU and can't efficiently handle data sets which
57   exceed the maxvnode limit.
58
59 Meta information:
60
61 * Difficulty: Modest
62 * Contact point: dillon
63
64 ---
65
66 ##### Implement swapoff
67 * We have swapon to add swap space, we need a swapoff to
68   remove it.
69
70 Meta information:
71
72 * Difficulty: Modest
73 * Contact point: dillon
74
75 ---
76
77 ##### Implement SHA-2 password encryption
78 * Implement new default encryption for master.passwd
79
80 Meta information:
81
82 * Difficulty: Fairly easy
83 * Contact point: dillon
84
85 ---
86
87 ##### Graphics Kernel Memory Manager Support ( GEM )
88 * Support dealing with graphics NUMA in kernel space for modern graphics hardware
89 * http://en.wikipedia.org/wiki/Graphics_Execution_Manager
90
91 Meta information:
92
93 * Difficulty: ?
94 * Contact point: ?
95
96 ---
97
98 ##### Make DragonFly NUMA-aware 
99
100 * Parse related ACPI tables 
101 * NUMA-aware memory allocation
102 * References:
103 [ACPI SLIT parser](http://mail-index.netbsd.org/tech-kern/2009/11/23/msg006518.html)
104 [ACPI SRAT parser](http://mail-index.netbsd.org/tech-kern/2009/11/23/msg006517.html)
105 [NetBSD NUMA diff](http://www.netbsd.org/~cegger/numa2.diff)
106 [NetBSD NUMA x86 diff](http://www.netbsd.org/~cegger/numa_x86.diff)
107
108 Meta information:
109
110 * Difficulty: ?
111 * Contact point: ?
112
113 ---
114
115 ##### Volume Management based on NetBSD's port of LVM2
116
117 NetBSD reimplemented Linux's device mapper (currently only implementing
118 the linear, zero and error targets; Linux has support for a variety of
119 targets, including crypt, stripe, snap, multipath) as dm(4). Device mapper
120 provides the functionality on which to implement volume management; NetBSD
121 has imported LVM2 (which is GPL), but it is possible to create different
122 tools for volume management (e.g. IBM's EVMS was also built on top of device
123 mapper).
124
125 The goal of this project is to port both the kernel code, dm(4), and the
126 LVM2 userspace libraries and tools from NetBSD. If time remains, the
127 student should also implement a proof of concept "stripe" target or, for the
128 more ambitious, a "crypt" target.
129
130 A possible roadmap for this project would be
131
132 1. Port the dm(4) code
133
134     This code uses proplib instead of binary ioctls for communicating with
135 userspace. Either port proplib, or convert the code to use ioctls.
136
137 1. Port the userspace tools
138
139     Integrate the tools in our source tree using a separate vendor branch, as
140 is normally done for contrib software (see development(7)). Make any
141 DragonFlyBSD-specific changes necessary.
142
143 1. (Optional) Implement either a "stripe" target or a crypt target.
144
145     The stripe target must be designed with robustness and extensibility in
146 mind, though it is not required to go all the way. It should be flexible
147 enough to allow for different RAID level implementations (at least 0, 1
148 and 5). Additionally, it should be possible to keep an internal (i.e. part
149 of the volume) log to speed up resyncing and parity checking. Implementing
150 those features would be ideal, but is not required.
151
152     The crypt target must allow for different ciphers and cipher parameters and
153 should make use of our in-kernel crypto infrastructure. It is probably
154 necessary to do the encryption asynchronously which will require extending
155 the current infrastructure.
156
157 Meta information:
158
159 * Difficulty: Medium
160 * Contact point: Aggelos Economopoulos <aoiko@cc.ece.ntua.gr>
161
162 ---
163
164 ##### Make DragonflyBSD Tickless
165 * By default, the clock cyclic fires at 100 Hz, regardless of whether or not any timeouts/callouts are scheduled to fire/expire. This is suboptimal from a power efficiency standpoint, as at least one of the system's CPUs never become quiescent/idle enough to be brought into a low power state.
166 This work involves re-implementing the services presently provided by clock() in a tickless (or event based) fashion, eliminating the need for the system to "wake up", only to realize that there's nothing to do on an otherwise idle system.
167 * http://hub.opensolaris.org/bin/view/Project+tickless/lbolt
168
169 Meta information:
170
171 * Difficulty: ?
172 * Contact point: ?
173
174 ---
175
176 ##### Make the DragonflyBSD Dispatcher Power-aware
177 * CPU power management as it it implemented today is relatively isolated from the rest of the system. As such, it is forced to periodically poll to measure the utilization of the system's CPU resources.
178 * This project extends the kernel's existing topology aware scheduling facility to bring "power domain" awareness to the dispatcher. With this awareness in place, the dispatcher can implement coalescence dispatching policy to consolidate utilization onto a smaller subset of CPU domains, freeing up other domains to be power managed. In addition to being domain aware, the dispatcher will also tend to prefer to utilize domains already running at higher power/performance states...this will increase the duration and extent to which domains can remain quiescent, improving the kernel's ability to take advantage of features like deep C-states. Because the dispatcher will track power domain utilization along the way, it can drive active domain state changes in an event driven fashion, eliminating the need for the CPUPM subsystem to poll.
179 * http://hub.opensolaris.org/bin/view/Project+tesla/CPUPM
180
181 Meta information:
182
183 * Difficulty: ?
184 * Contact point: ?
185
186 ---
187
188 ##### Port DragonFly to ARM platform
189
190 Meta information:
191
192 * Difficulty: Extreme hard
193 * Contact point: ?
194
195 ---
196
197 ##### Port valgrind to DragonFlyBSD
198
199 Valgrind is a very useful tool on a system like DragonFly that's under heavy development. Since valgrind is very target specific, a student doing the port will have to get acquainted with many low level details of the system libraries and the user<->kernel interface (system calls, signal delivery, threading...). This is a project that should appeal to aspiring systems programmers. Ideally, we would want the port to be usable with vkernel processes, thus enabling complex checking of the core kernel code.
200
201 The goal of this project is to port valgrind to the DragonFlyBSD platform so that at least the memcheck tool runs sufficiently well to be useful. This is in itself a challenging task. If time remains, the student should try to get at least a trivial valgrind tool to work on a vkernel process.
202
203 Meta information:
204
205 * Difficulty: Hard
206 * Contact point: Aggelos Economopoulos <aoiko@cc.ece.ntua.gr>
207
208 ---
209
210 ##### Adapt pkgsrc to create a package system with dependency independence.
211 * Create a set of tools that modifies how the pkgsrc packages are installed, allowing for the ability to upgrade individual packages, without stopping applications that depend on said packages from working. One method of achieving this is detailed at http://www.dragonflybsd.org/goals/#packages but other methods may be possible. PC-BSD have written a tool called PBI Builder which modifies FreeBSD ports for their dependency independence PBI system, this could be used as a starting point for the DragonFly BSD tools.
212
213 Meta information:
214
215 * Difficulty: ?
216 * Contact point: ?
217
218 ---
219
220 ##### Implement virtio drivers on DragonFly to speed up DragonFly as a KVM guest
221 * As virtualization is coming more and more and KVM will be a strong player in that field, it might be a good idea to be the first BSD to have a virtio implementation that enables us to run at a better speed in comparison to the other BSDs and maybe close to Linux on this virtualization platform.
222
223 Meta information:
224
225 * Difficulty: ?
226 * Contact point: ?
227
228 ---
229
230 ##### Port FUSE or PUFFS from FreeBSD/NetBSD
231
232 * http://www.netbsd.org/docs/puffs/
233 * This would make many userspace filesystems available to DragonFly, e.g. sshfs to mention only one.
234
235 Meta information:
236
237 * Difficulty: Medium
238 * Contact point: Michael Neumann <mneumann@ntecs.de>
239
240 ---
241
242 ##### Make vkernels checkpointable
243
244 * See checkpt(1).
245 * Teach the checkpt syscall how to checkpoint multiple vmspaces.
246 * Add code to the vkernel which gets triggered on SIGCKPT to dump/load e.g. the current state of network drivers.
247 * This would allow us to save and restore or even migrate a complete DragonFly operating system running on the vkernel platform.
248 This could be especially handy on laptops (if we'd get X11 operating in vkernels).
249 * See also: http://www.dragonflybsd.org/docs/developer/CheckpointFeatures/
250
251 Meta information:
252
253 * Difficulty: Medium
254 * Contact point: Michael Neumann <mneumann@ntecs.de>
255
256 ---
257
258 ##### HAMMER compression
259
260 * Compress blocks as they get written to disk.
261 * Only file data (rec_type == DATA) should be compressed, not meta-data.
262 * the CRC should be that of the uncompressed data.
263 * ideally you'd need to associate the uncompressed data with the buffer cache buffer somehow, so that decompression is only performed once.
264 * compression could be turned on a per-file or per-pfs basis.
265 * gzip compression would be just fine at first.
266
267 Meta information:
268
269 * Difficulty: Medium
270 * Contact point: Michael Neumann <mneumann@ntecs.de>
271
272 ---
273
274  (please add)