(no commit message)
[ikiwiki.git] / docs / developer / ProjectsPage.mdwn
1 # DragonFly Projects 
2
3 This page shall serve as a common place to look if you're in search of a DragonFly related project. It's also the place to check if someone else is already working on it (to prevent project collision) or should be contacted.
4
5 Projects that can be clearly used for Google Code-In are marked with their category, where applicable.  Some unmarked items may be eligible; it depends on how the student wants to tackle the project.
6
7 [[!toc levels=3 ]]
8
9 ## Website projects 
10
11 ### One-liners
12 * Add traffic report, especially to lists requests that cause 404s (GCI:Research)
13 * Add the mail archive to the search index (GCI:Documentation)
14 * Download link right on the main page.  
15 * Fix RSS feed to have correct links
16 * Create layout for http://bugs.dragonflybsd.org that matches the main site.  (GCI:User Interface)
17 * Create short list of tasks for a new DragonFly user 
18 * How to upgrade the operating system (GCI:Training)
19 * How to get to a working desktop (GCI:Training)
20 * and where and how to report issues.(GCI:Documentation)
21
22 ### Post papers in the proper locations on the website
23 * Format conversion may be necessary
24 * Aggelos's papers from [http://leaf.dragonflybsd.org/~aggelos/] (http://leaf.dragonflybsd.org/~aggelos/) (netmp-paper.pdf and netmp.pdf) to Presentations
25 * ["A Peek at the vKernel" article](http://cvsweb.dragonflybsd.org/cvsweb/site/data/docs/articles/vkernel/vkernel.shtml?rev=1.3&content-type=text/x-cvsweb-markup) from old site
26 (GCI:Documentation)
27
28 ## Documentation projects 
29
30 ### One-liners
31 * Reorder `/usr/src/UPDATING` to put more relevant information at top; remove data no longer relevant.
32 * Help out in [http://bugs.dragonflybsd.org](http://bugs.dragonflybsd.org) (try to reproduce, diagnose, propose fixes ...)
33 * Organize, contribute to, and finish the C book project.
34
35 ### Handbook maintenance
36 * Check if the content applies to DragonFly.  If not, change it.
37 * Add new content and enhance the previous chapters
38 * Check for syntax error, typos and wiki errors. 
39 * Add prev/next buttons to all pages. (GCI:User Interface)
40
41
42 ### Write manpages
43 * sysref (GCI:Documentation or Research)
44
45 ## Userland projects 
46
47 ### One-liners
48 * Update the [[contributed software|docs/user/ContribSoftware]] which is out-of-date.
49 * Remove `NOINET6` build option
50 * `WARN` corrections to utilities (GCI:Code)
51 * Bring in code from other *BSDs:
52 * smbfs changes from FreeBSD (GCI:Code)
53 * rpc.lockd and rpc.statd sync with FreeBSD (GCI:Code)
54 * Add extended slice support to `fdisk`
55 * Install Coverity and fix the FreeBSD bugs that were uncovered by Coverity, but do not just blindly pull over the FreeBSD patches. Make sure that you first understand what the patch does.
56 * C99 Standards Conformance. The todo list is on [[/docs/developer/StandardsConformanceProject]] (GCI:Code)
57 * Setup a regression testing machine/system to register and find problems and new improvements. (GCI:Quality Assurance) 
58 * Networking performance / scalability ((GCI:Research)
59 * [[RegressionTest|/docs/developer/RegressionTest]] (GCI:Research)
60 * also check [[HowToStressTest|/docs/developer/HowToStressTest]] (GCI:Research)
61 * Add lwp support to ptrace/gdb/core dumps.
62 * Bringing in version 2.0 of the BSD Installer
63 * UTF8 support in the console
64
65 ### Scalability (algorithmic performance) (GCI:Research)
66 * [http://bulk.fefe.de/scalability/](http://bulk.fefe.de/scalability/) 
67 * [http://bulk.fefe.de/lk2006/talk.pdf](http://bulk.fefe.de/lk2006/talk.pdf)
68
69 ### Clean our code to make it [style(9)](http://leaf.dragonflybsd.org/cgi/web-man?command=style&section=ANY#style&sectionANY) compatible.  (GCI:Code)
70 * Compile and test your changes.
71 * Verify that the checksum (sha(1)) of the unmodified object matches the checksum of the cleaned object.  Check also with strip(1)+sha(1)  
72
73 ### Port BSD-licensed tools (ex: `grep`, `diff` and `sort`) (GCI:Code)
74 * The OpenBSD guys already did some work related to that.
75 * If you manage to bring the tools to DragonFly, check if everything works as expected (e.g. rc.d scripts, make world runs, ...).
76 * The new tools need to have at least all the features of the old GNU tools.
77
78 ### Randomize mmap() offsets
79 * [http://www.openbsd.org/papers/ven05-deraadt/index.html](http://www.openbsd.org/papers/ven05-deraadt/index.html)
80
81 ### GDB
82 * ptrace/gdb follow-fork-mode support and more (peek at linux)
83 * Change the build to create one libbfd for gdb and binutils
84 * Separate RPC code from NFS into separate library.
85
86 ### I/O diagnostic utilities
87 * A utility similar to top which displays I/O usage on a per-process basis
88 * Network, Disk
89
90 ### SMART capabilities
91 * Add to camcontrol
92 * Add to natacontrol (see NetBSD's atactl?)
93
94 ### Disk scheduling rc scripts (GCI:Code)
95 * Create a rc script to manage the disk/io scheduling system
96 * Perhaps 1 entry to "enable" it, and all disks will have mode set to "auto", in auto mode smart inquiries and other heuristics could attempt to determine the best i/o scheduler
97 * Per-device and device class or similar defaults should be definable in rc.conf also
98 * The bulk of this functionality could be implemented in a resurrected "dschedctl" utility and exposed through the rc interface using just a thin wrapper, allowing hotplug scripts and etc. an easier option to use the same facilities.
99
100 ### libHAMMER 
101 * HAMMER has the capability to expose very rich information to userland through ioctl's.
102 * Currently the hammer(8) utility makes use of this information in an ad-hoc manner.
103 * Port this core functionality into a public libhammer library so that other base and third party utilities may take advantage of it.
104 * See commit: cb7575e6a89409a2041a37fcfc22ce9e41297ab8 -- libHAMMER already exists, port functionality into it!
105
106 ### Clean up crypt(3) consumers
107 * crypt(3) can legitimately return NULL on error, but many consumers do not check for this, instead passing the return directly to str[n]cmp. Fix these cases.
108 * Fix these cases in pkgsrc as well.
109
110 ## Kernel projects 
111
112 ### One-liners
113 * Port the BSDL OSS code to DragonFly
114 * Complete Path MTU Discovery by adding a host route to remember the Path MTU and setting a timer to expire old host routes. See netinet/if_ether.c for an example of this mechanism as used by ARP. Periodically increase MTU of hosts that have had its MTU decreased.
115 * Look for places in the kernel that can benefit from Solaris-style caching of preconstructed slab allocator objects. If we can find enough of these uses, we can add this functionality to the kernel memory allocator.
116 * Implement [`sem_open()`](http://www.opengroup.org/onlinepubs/000095399/functions/sem_open.html), [`sem_close()`](http://www.opengroup.org/onlinepubs/000095399/functions/sem_close.html), and [`sem_unlink()`](http://www.opengroup.org/onlinepubs/000095399/functions/sem_unlink.html). (GCI:Code)
117 * Clean our code to make it [style(9)](http://leaf.dragonflybsd.org/cgi/web-man?command#style&sectionANY) compatible.  Compile and test your changes.  Verify that the checksum (sha(1)) of the unmodified object matches the checksum of the cleaned object.  Check also with strip(1)+sha(1)
118 * Setup a regression testing machine/system to register and find problems and new improvements. (GCI:Research)
119 * Port or update drivers from other systems.
120 * Port NFSv4.  [This mail](http://leaf.dragonflybsd.org/mailarchive/kernel/2008-01/msg00065.html) is a good starting point.
121 * clean up buildworld/kernel compilation warnings
122 * Port DTrace
123 * Port Linux emulation to x86-64
124
125 ### Code to port/sync from FreeBSD
126 * PCI code (to take advantage of power saving features)
127 * Bring in support for UFS2, just the changes to extend the width of some fields from 32 bits to 64 bits.  (GCI:Code)
128 * hardware drivers. 
129
130 ### Code to port/sync from OpenBSD
131 * Add support for the NoExecute bit as described in [http://www.openbsd.org/papers/auug04/index.html](http://www.openbsd.org/papers/auug04/index.html).
132 * After that, make user stacks and data heaps non-executable. (W^X)
133 * hardware drivers, specially wireless.
134
135 ### CPU scheduler
136 * A scheduler API supporting multiple scheduler implementations already exists
137 * Add a Solaris-like dispatcher framework that can handle more than one installed scheduling policy
138
139 ### I/O scheduler
140 * A pluggable kernel I/O scheduler already exists
141 * Implement additional disk scheduling policies
142
143 ### Implement boot cache
144 * Effectively a smart readahead.
145 * Store the pattern of incoming read requests of the boot disk. (Likely into an array structure for better linear readback, We mmap() the whole thing into RAM on boot.)
146 * Sort pattern into a playback list. (Burstsort or a simple quick sort to get things going?)
147 * Provide feedback of boot cache playback list hit rate for better adaptiveness.
148
149 ### Improve kernel boot speed
150 * Research source of delays in boot process, keyboard init, scsi?
151 * Better thread some hardware init, for example USB?
152 * Perhaps look to see how Linux can boot in one second, better pci scan code?
153 * "Some kernel work made it possible to do asynchronous initialization of some subsystems. For example, the modified kernel starts the Advanced Host Controller Interface (AHCI) initialization, to handle storage, at the same time as the Universal Host Controller Interface (UHCI), in order to handle USB" - http://lwn.net/Articles/299483/
154
155 ### Modify firmware framework 
156 * We currently use the firmware(9) FreeBSD also uses
157 * It would be more appropriate to avoid future problems with redistribution problems, etc, to adapt the wifi firmware stuff to use the firmware(9) we used to have before, which was able to load firmware files from userland (/etc/firmware).
158 * See "firmware discussion" thread on kernel@ mailing list, March-May 2010.
159 * Since it's not desired to just add another way of doing it, this project should include getting rid of loading firmwares as modules
160
161 ### Work relating to LWKT (LightWeightKernelThreading)
162 * Implement lazy IPI cross-processor lwkt message passing.
163 * Add timeout functionality to lwkt_waitmsg().
164
165 ### Filesystem extended attributes
166 * Generic VFS attributes layer
167 * Emulate attributes ala Darwin
168 * Allow filesystems to define their own attribute vop ops
169 * QUESTIONS: Attributes or subfiles? The consensus is that subfiles are better?
170
171 ### Capabilities
172 * Implement something resembling or inspired by POSIX.1e
173 * This implementation could possibly exist in userland and interlock with the kernel via a VFS Journal or HAMMER mirroring ioctl's.
174 * These should be capable of supporting NFSv4 capabilities.
175 * References: [1](http://leaf.dragonflybsd.org/mailarchive/kernel/2006-07/msg00012.html)
176
177 ### Hardware virtualization extensions
178 * Increase performance of virtual kernels
179 * Make use of hardware virtualization extensions, if supported, to manage vmspaces
180 * Implement a KVM-compatible virtualization device to support qemu
181 * Hardware IOMMU support is not a priority and if implemented must be strictly optional.
182
183 ### Remove zalloc
184 * zalloc is a deprecated kernel interface and all current consumers can be ported to objcache, with varying levels of difficulty.
185 * zlib, pv entries
186 * Once all consumers are ported, zalloc can be removed.
187
188 ### Document all sysctl's
189 * The description of sysctl's can be provided when the sysctl is declared and displayed in userland by passing the -d flag to the sysctl utility.
190 * Document all undocumented sysctl's
191 * Verify that the description of documented sysctl's is correct.
192
193 ### Convert kprintf-enabling sysctl's to KTR's
194 * Many sysctl's simply enable one or more kernel kprintf's
195 * This can be very easy, or can be very unwieldy
196 * Convert all of these cases to ktr's, while slightly less easy they are far easier to wield in all cases.
197
198 ### Tear out C/H/S disk reporting (GCI:Research)
199 * Cylinders/Heads/Sectors are an outdated concept and the system doesn't rely on them anymore.
200 * Verify the assumption that we don't rely on them in any way, shape or form.
201 * Tear the reporting out of the kernel/installer/etc.
202
203 ### Change vm_map lookup algorithm
204 * The vm_map lookups currently use a Red-Black tree, since 2005.
205 * It has been decided that using an array'ized bucket'ized hash table is probably a better approach.
206 * References: [1](http://kerneltrap.org/mailarchive/freebsd-current/2010/10/1/6260944) [2](http://leaf.dragonflybsd.org/mailarchive/kernel/2005-01/msg00122.html)
207
208 ### Trampoline Code Page instead of direct syscalls
209 * Map a read/execute trampoline page into every process, which has a syscall table, i.e. is used instead of "int" to enter the kernel. This way we can easily change the kernel enter method from "int" to e.g. "sysenter" without having to recompile userland applications, or even implement some syscalls in userspace.
210
211 ### Compressed in-memory swap device
212 * A device that uses physical memory as swap space, but compresses it.
213 * Do we support stacking of swap space? For example, one would have this compressed in-memory swap device with highest priority. Replaced objects will be put into the next priority swap device (e.g. a SSD), and so on.
214
215 ### mmap MAP_ALIGN
216 * Solaris's mmap support a flag, MAP_ALIGN, where the address to mmap acts as an alignment hint
217 * Our backing VM calls support an alignment parameter, but our public mmap does not
218 * This would allow nmalloc to allocate slabs (64k, 64k-aligned) without wastage
219
220 ### vnode dumps
221 * It would be beneficial to be able to have crash dumps written to an ordinary file in configurations where swap is not configured.
222
223 ### Kernel allocator feature enhancements
224 * Enhance objcache in a manner that will allow the initialization to specify allocation functions which will allocate and free entire slabs of memory, not just single objects.
225 * Rework the kmalloc allocator to sit on top of objcache (there are various dependencies to making this work).
226 * Create or sort out a metric for vnode/other cache object cycling rate that can indicate realistic memory pressure.
227 * Clear out free objcache slabs under memory pressure.
228 * Add reclaim functionality to objcache, such that it may ask consumers to free objects back into it under memory pressure.
229
230 ### Tear out serializers
231 * Serializers could be _carefully_ replaced with MTX locks
232
233 ### Tear out condvars
234 * Conditional vars -- condvar(9), could be replaced with other locking primitives and our tsleep/wakeup interlock.
235
236 ### Make karc4random in libkern per-cpu (or at least wrap its own token around it)
237 * Verify that it is possible and safe to do this, what care would need to be taken, especially with respect to the random seeding?
238 * Pull out locks around calls to karc4rand*
239
240 ### Improve kernel spinlock debug-ability
241 * Add a const char *descr  field to the spinlock structure.
242 * Adjust spin_init() and all use cases, SPINLOCK_INITIALIZER() could juse use macro string extensions (# head) to install the name there.
243 * Adjust error messages to print the spinlock desc field.
244 * This change will require a full world & kernel recompile.
245
246 ### Partially rewrite buffer cache
247 * Buffer cache buffers map VM pages from the filesystems VM-backed vnodes, the "buffer space" is the maximum amount of virtual space to allocate to these buffers.
248 * When the buffer_map KVA space gets fragmented it caused very expensive defrag operations, the buffer_map KVA was recently increased to double the actual buffer space to allow full space utilization in the face of fragmentation and reduce the frequency of defrag operations.
249 * Rewrite the buffer cache to have separate spaces or separate buffer pools for different sizes (16, 32, 64, 128, 256... up to max).
250 * The vm_map API is used to allocate kvm out of the buffer_map.  If the buffer's KVAs are preallocated then things can basically just be setup linearly at boot time.
251
252 ### Add informational hardware-related sysctl's
253 * MacOS X exports a bunch of cpu-specific sysctl's detailing sizes, layout, features, etc. Most/all of this could be detected by a userspace program, but exporting these makes the barrier of entry to cpu-conditional code lower.
254 * Research which of these sysctl's is the most useful and add them, using the same node names as OSX.
255 1. hw.vectorunit = 1
256 1. hw.busfrequency = 100000000
257 1. hw.cpufrequency = 3062000000
258 1. hw.cachelinesize = 64
259 1. hw.l1icachesize = 32768
260 1. hw.l1dcachesize = 32768
261 1. hw.l2settings = 1
262 1. hw.l2cachesize = 262144
263 1. hw.l3settings = 1
264 1. hw.l3cachesize = 6291456
265 1. hw.tbfrequency = 1000000000
266 1. hw.activecpu: 2
267 1. hw.physicalcpu: 2
268 1. hw.physicalcpu_max: 2
269 1. hw.logicalcpu: 2
270 1. hw.logicalcpu_max: 2
271 1. hw.cputype: 7
272 1. hw.cpusubtype: 4
273 1. hw.cpu64bit_capable: 1
274 1. hw.cpufamily: 1418770316
275 1. hw.cacheconfig: 2 1 1 1 0 0 0 0 0 0
276 1. hw.cachesize: 2147483648 32768 262144 6291456 0 0 0 0 0 0
277 1. hw.busfrequency: 100000000
278 1. hw.busfrequency_min: 100000000
279 1. hw.busfrequency_max: 100000000
280 1. hw.cpufrequency: 3062000000
281 1. hw.cpufrequency_min: 3062000000
282 1. hw.cpufrequency_max: 3062000000
283 1. hw.cachelinesize: 64
284 1. hw.l1icachesize: 32768
285 1. hw.l1dcachesize: 32768
286 1. hw.l2cachesize: 262144
287 1. hw.l3cachesize: 6291456
288 1. hw.tbfrequency: 1000000000
289 1. hw.packages: 2
290 1. hw.optional.floatingpoint: 1
291 1. hw.optional.mmx: 1
292 1. hw.optional.sse: 1
293 1. hw.optional.sse2: 1
294 1. hw.optional.sse3: 1
295 1. hw.optional.supplementalsse3: 1
296 1. hw.optional.sse4_1: 1
297 1. hw.optional.sse4_2: 1
298 1. hw.optional.x86_64: 1
299 1. hw.optional.aes: 1
300 1. hw.optional.avx1_0: 1
301 1. hw.optional.rdrand: 0
302 1. hw.optional.f16c: 0
303 1. hw.optional.enfstrg: 0
304 1. machdep.cpu.max_basic: 13
305 1. machdep.cpu.max_ext: 2147483656
306 1. machdep.cpu.vendor: GenuineIntel
307 1. machdep.cpu.brand_string: Intel(R) Core(TM) i5-3470 CPU @ 3.20GHz
308 1. machdep.cpu.family: 6
309 1. machdep.cpu.model: 42
310 1. machdep.cpu.extmodel: 2
311 1. machdep.cpu.extfamily: 0
312 1. machdep.cpu.stepping: 7
313 1. machdep.cpu.feature_bits: 262929407 2660770315
314 1. machdep.cpu.extfeature_bits: 672139520 1
315 1. machdep.cpu.signature: 132775
316 1. machdep.cpu.brand: 0
317 1. machdep.cpu.features: FPU VME DE PSE TSC MSR PAE MCE CX8 APIC SEP MTRR PGE MCA CMOV PAT PSE36 CLFSH DS MMX FXSR SSE SSE2 SS SSE3 PCLMULQDQ MON SSSE3 CX16 SSE4.1 SSE4.2 POPCNT AES VMM XSAVE OSXSAVE AVX1.0
318 1. machdep.cpu.extfeatures: SYSCALL XD EM64T LAHF RDTSCP TSCI
319 1. machdep.cpu.cores_per_package: 1
320 1. machdep.cpu.microcode_version: 16
321 1. machdep.cpu.processor_flag: 0
322 1. machdep.cpu.mwait.linesize_min: 4096
323 1. machdep.cpu.mwait.linesize_max: 4096
324 1. machdep.cpu.mwait.extensions: 3
325 1. machdep.cpu.mwait.sub_Cstates: 4384
326 1. machdep.cpu.xsave.extended_state: 7 832 832 0
327 1. machdep.cpu.arch_perf.version: 1
328 1. machdep.cpu.arch_perf.number: 8
329 1. machdep.cpu.arch_perf.width: 48
330 1. machdep.cpu.arch_perf.events_number: 7
331 1. machdep.cpu.arch_perf.events: 127
332 1. machdep.cpu.arch_perf.fixed_number: 0
333 1. machdep.cpu.arch_perf.fixed_width: 0
334 1. machdep.cpu.cache.linesize: 64
335 1. machdep.cpu.cache.L2_associativity: 8
336 1. machdep.cpu.cache.size: 256
337 1. machdep.cpu.tlb.inst.small: 128
338 1. machdep.cpu.tlb.data.small: 64
339 1. machdep.cpu.tlb.data.large: 32
340 1. machdep.cpu.tlb.shared: 512
341 1. machdep.cpu.address_bits.physical: 40
342 1. machdep.cpu.address_bits.virtual: 48
343 1. machdep.cpu.core_count: 1
344 1. machdep.cpu.thread_count: 1
345
346 ## Live images enhancement
347
348 The live images could be made easier to use by not assuming a QWERTY keyboard layout.
349
350 Not beeing able to choose a localized keyboard layout before having to type 'installer' or 'root' may be a deal breaker for some users.
351 A simple menu replacing login(1) and displaying the following three choices could be a good solution:
352
353 1. Set keyboard layout
354 2. Launch the installer
355 3. Login as root
356
357 For more theoretical projects and project concepts see [[ResearchProjects|/docs/developer/ResearchProjectsPage]]