5b3972a5262d3f768b8b9c32c47697e0ed0571f5
[ikiwiki.git] / docs / developer / ProjectsPage.mdwn
1 # DragonFly Projects 
2
3 This page shall serve as a common place to look if you're in search of a DragonFly related project. It's also the place to check if someone else is already working on it (to prevent project collision) or should be contacted.
4
5 Projects that can be clearly used for Google Code-In are marked with their category, where applicable.  Some unmarked items may be eligible; it depends on how the student wants to tackle the project.
6
7 [[!toc levels=3 ]]
8
9 ## Documentation projects 
10
11 ### Write manpages
12 * sysref (GCI:Documentation or Research)
13
14 ## Userland projects 
15
16 ### One-liners
17 * Bring in smbfs changes from FreeBSD (GCI:Code)
18 * rpc.lockd and rpc.statd sync with FreeBSD (GCI:Code)
19 * Add extended slice support to `fdisk`
20 * C99 Standards Conformance. The todo list is on [[/docs/developer/StandardsConformanceProject]] (GCI:Code)
21 * Add lwp support to ptrace/gdb/core dumps.
22 * UTF8 support in the console
23
24 ### dma
25 * Make dma(8) our default MTA
26 * Remove sendmail (optional)
27
28 ### Scalability (algorithmic performance) (GCI:Research)
29 * [http://bulk.fefe.de/scalability/](http://bulk.fefe.de/scalability/) 
30 * [http://bulk.fefe.de/lk2006/talk.pdf](http://bulk.fefe.de/lk2006/talk.pdf)
31
32 ### Clean our code to make it [style(9)](http://leaf.dragonflybsd.org/cgi/web-man?command=style&section=ANY#style&sectionANY) compatible.  (GCI:Code)
33 * Compile and test your changes.
34 * Verify that the checksum (sha(1)) of the unmodified object matches the checksum of the cleaned object.  Check also with strip(1)+sha(1)  
35
36 ### Port BSD-licensed tools (ex: `grep`, `diff` and `sort`) (GCI:Code)
37 * The OpenBSD guys already did some work related to that.
38 * If you manage to bring the tools to DragonFly, check if everything works as expected (e.g. rc.d scripts, make world runs, ...).
39
40 ### GDB
41 * ptrace/gdb follow-fork-mode support and more (peek at linux)
42 * Change the build to create one libbfd for gdb and binutils
43 * Separate RPC code from NFS into separate library.
44
45 ### I/O diagnostic utilities
46 * A utility similar to top which displays I/O usage on a per-process basis
47 * Network, Disk
48
49 ### SMART capabilities
50 * Add to camcontrol
51 * Add to natacontrol (see NetBSD's atactl?)
52
53 ### Disk scheduling rc scripts (GCI:Code)
54 * Create a rc script to manage the disk/io scheduling system
55 * Perhaps 1 entry to "enable" it, and all disks will have mode set to "auto", in auto mode smart inquiries and other heuristics could attempt to determine the best i/o scheduler
56 * Per-device and device class or similar defaults should be definable in rc.conf also
57 * The bulk of this functionality could be implemented in a resurrected "dschedctl" utility and exposed through the rc interface using just a thin wrapper, allowing hotplug scripts and etc. an easier option to use the same facilities.
58
59 ### libHAMMER 
60 * HAMMER has the capability to expose very rich information to userland through ioctl's.
61 * Currently the hammer(8) utility makes use of this information in an ad-hoc manner.
62 * Port this core functionality into a public libhammer library so that other base and third party utilities may take advantage of it.
63 * See commit: cb7575e6a89409a2041a37fcfc22ce9e41297ab8 -- libHAMMER already exists, port functionality into it!
64
65 ### Clean up crypt(3) consumers
66 * crypt(3) can legitimately return NULL on error, but many consumers do not check for this, instead passing the return directly to str[n]cmp. Fix these cases.
67 * Fix these cases in pkgsrc as well.
68
69 ## Kernel projects 
70
71 ### One-liners
72 * Port the BSDL OSS code to DragonFly
73 * Complete Path MTU Discovery by adding a host route to remember the Path MTU and setting a timer to expire old host routes. See netinet/if_ether.c for an example of this mechanism as used by ARP. Periodically increase MTU of hosts that have had its MTU decreased.
74 * Implement [`sem_open()`](http://www.opengroup.org/onlinepubs/000095399/functions/sem_open.html), [`sem_close()`](http://www.opengroup.org/onlinepubs/000095399/functions/sem_close.html), and [`sem_unlink()`](http://www.opengroup.org/onlinepubs/000095399/functions/sem_unlink.html). (GCI:Code)
75 * Port or update drivers from other systems.
76 * Port Linux emulation to x86-64
77
78 ### Code to port/sync from FreeBSD
79 * PCI code (to take advantage of power saving features)
80 * Bring in support for UFS2, just the changes to extend the width of some fields from 32 bits to 64 bits.  (GCI:Code)
81 * hardware drivers. 
82 * ext2fs
83 * DTrace
84
85 ### Code to port/sync from OpenBSD
86 * Add support for the NoExecute bit as described in [http://www.openbsd.org/papers/auug04/index.html](http://www.openbsd.org/papers/auug04/index.html).
87 * After that, make user stacks and data heaps non-executable. (W^X)
88 * hardware drivers, specially wireless.
89
90 ### CPU scheduler
91 * A scheduler API supporting multiple scheduler implementations already exists
92 * Add a Solaris-like dispatcher framework that can handle more than one installed scheduling policy
93
94 ### I/O scheduler
95 * A pluggable kernel I/O scheduler already exists
96 * Implement additional disk scheduling policies
97
98 ### Implement boot cache
99 * Effectively a smart readahead.
100 * Store the pattern of incoming read requests of the boot disk.
101
102 ### Improve kernel boot speed
103 * Research source of delays in boot process, keyboard init, scsi?
104 * Better thread some hardware init, for example USB?
105 * Perhaps look to see how Linux can boot in one second, better pci scan code?
106 * "Some kernel work made it possible to do asynchronous initialization of some subsystems. For example, the modified kernel starts the Advanced Host Controller Interface (AHCI) initialization, to handle storage, at the same time as the Universal Host Controller Interface (UHCI), in order to handle USB" - http://lwn.net/Articles/299483/
107
108 ### Modify firmware framework 
109 * We currently use the firmware(9) FreeBSD also uses
110 * It would be more appropriate to avoid future problems with redistribution problems, etc, to adapt the wifi firmware stuff to use the firmware(9) we used to have before, which was able to load firmware files from userland (/etc/firmware).
111 * See "firmware discussion" thread on kernel@ mailing list, March-May 2010.
112 * Since it's not desired to just add another way of doing it, this project should include getting rid of loading firmwares as modules
113
114 ### Work relating to LWKT (LightWeightKernelThreading)
115 * Implement lazy IPI cross-processor lwkt message passing.
116 * Add timeout functionality to lwkt_waitmsg().
117
118 ### Filesystem extended attributes
119 * Generic VFS attributes layer
120 * Emulate attributes ala Darwin
121 * Allow filesystems to define their own attribute vop ops
122 * QUESTIONS: Attributes or subfiles? The consensus is that subfiles are better?
123
124 ### Capabilities
125 * Implement something resembling or inspired by POSIX.1e
126 * This implementation could possibly exist in userland and interlock with the kernel via a VFS Journal or HAMMER mirroring ioctl's.
127 * These should be capable of supporting NFSv4 capabilities.
128 * References: [1](http://leaf.dragonflybsd.org/mailarchive/kernel/2006-07/msg00012.html)
129
130 ### Hardware virtualization extensions
131 * Increase performance of virtual kernels
132 * Make use of hardware virtualization extensions, if supported, to manage vmspaces
133 * Implement a KVM-compatible virtualization device to support qemu
134 * Hardware IOMMU support is not a priority and if implemented must be strictly optional.
135
136 ### Remove zalloc
137 * zalloc is a deprecated kernel interface and all current consumers can be ported to objcache, with varying levels of difficulty.
138 * zlib, pv entries
139 * Once all consumers are ported, zalloc can be removed.
140
141 ### Convert kprintf-enabling sysctl's to KTR's
142 * Many sysctl's simply enable one or more kernel kprintf's
143 * This can be very easy, or can be very unwieldy
144 * Convert all of these cases to ktr's, while slightly less easy they are far easier to wield in all cases.
145
146 ### Tear out C/H/S disk reporting
147 * Cylinders/Heads/Sectors are an outdated concept and the system doesn't rely on them anymore.
148 * Verify the assumption that we don't rely on them in any way, shape or form.
149 * Tear the reporting out of the kernel/installer/etc.
150
151 ### Change vm_map lookup algorithm
152 * The vm_map lookups currently use a Red-Black tree, since 2005.
153 * It has been decided that using an array'ized bucket'ized hash table is probably a better approach.
154 * References: [1](http://kerneltrap.org/mailarchive/freebsd-current/2010/10/1/6260944) [2](http://leaf.dragonflybsd.org/mailarchive/kernel/2005-01/msg00122.html)
155
156 ### Trampoline Code Page instead of direct syscalls
157 * Map a read/execute trampoline page into every process, which has a syscall table, i.e. is used instead of "int" to enter the kernel. This way we can easily change the kernel enter method from "int" to e.g. "sysenter" without having to recompile userland applications, or even implement some syscalls in userspace.
158
159 ### Compressed in-memory swap device
160 * A device that uses physical memory as swap space, but compresses it.
161 * Do we support stacking of swap space? For example, one would have this compressed in-memory swap device with highest priority. Replaced objects will be put into the next priority swap device (e.g. a SSD), and so on.
162
163 ### mmap MAP_ALIGN
164 * Solaris's mmap support a flag, MAP_ALIGN, where the address to mmap acts as an alignment hint
165 * Our backing VM calls support an alignment parameter, but our public mmap does not
166 * This would allow nmalloc to allocate slabs (64k, 64k-aligned) without wastage
167
168 ### vnode dumps
169 * It may be beneficial to be able to have crash dumps written to an ordinary file in configurations where swap is not configured.
170
171 ### vnode swap
172 * Add a vnode-backed swap pager that respects a file size limit, to allow paging to a "swap file" on a filesystem.
173
174 ### Kernel allocator feature enhancements
175 * Enhance objcache in a manner that will allow the initialization to specify allocation functions which will allocate and free entire slabs of memory, not just single objects.
176 * Rework the kmalloc allocator to sit on top of objcache (there are various dependencies to making this work).
177 * Create or sort out a metric for vnode/other cache object cycling rate that can indicate realistic memory pressure.
178 * Clear out free objcache slabs under memory pressure.
179 * Add reclaim functionality to objcache, such that it may ask consumers to free objects back into it under memory pressure.
180
181 ### Tear out serializers
182 * Serializers could be _carefully_ replaced with MTX locks?
183
184 ### Tear out condvars
185 * Conditional vars -- condvar(9), could be replaced with other locking primitives and our tsleep/wakeup interlock.
186
187 ### Make karc4random in libkern per-cpu (or at least wrap its own token around it)
188 * Verify that it is possible and safe to do this, what care would need to be taken, especially with respect to the random seeding?
189 * Pull out locks around calls to karc4rand*
190
191 ### Improve kernel spinlock debug-ability
192 * Add a const char *descr  field to the spinlock structure.
193 * Adjust spin_init() and all use cases, SPINLOCK_INITIALIZER() could juse use macro string extensions (# head) to install the name there.
194 * Adjust error messages to print the spinlock desc field.
195 * This change will require a full world & kernel recompile.
196
197 ### Partially rewrite buffer cache
198 * Buffer cache buffers map VM pages from the filesystems VM-backed vnodes, the "buffer space" is the maximum amount of virtual space to allocate to these buffers.
199 * When the buffer_map KVA space gets fragmented it caused very expensive defrag operations, the buffer_map KVA was recently increased to double the actual buffer space to allow full space utilization in the face of fragmentation and reduce the frequency of defrag operations.
200 * Rewrite the buffer cache to have separate spaces or separate buffer pools for different sizes (16, 32, 64, 128, 256... up to max).
201 * The vm_map API is used to allocate kvm out of the buffer_map.  If the buffer's KVAs are preallocated then things can basically just be setup linearly at boot time.
202
203 ### Sync wireless infrastructure / drivers from FreeBSD
204 * Rui Paulo ported the wireless infrastructure and ath drivers to DragonFly from FreeBSD in recent history. A lot has changed in the intervening time, the infrastructure should be synchronized/updated to match the state-of-the-art in FreeBSD. At a minimum the drivers that currently work in DragonFly should be tested to ensure functionality and updates as well or improved.
205
206 ### Add informational hardware-related sysctl's
207 * MacOS X exports a bunch of cpu-specific sysctl's detailing sizes, layout, features, etc. Most/all of this could be detected by a userspace program, but exporting these makes the barrier of entry to cpu-conditional code lower.
208 * Research which of these sysctl's is the most useful and add them, using the same node names as OSX.
209 1. hw.vectorunit = 1
210 1. hw.busfrequency = 100000000
211 1. hw.cpufrequency = 3062000000
212 1. hw.cachelinesize = 64
213 1. hw.l1icachesize = 32768
214 1. hw.l1dcachesize = 32768
215 1. hw.l2settings = 1
216 1. hw.l2cachesize = 262144
217 1. hw.l3settings = 1
218 1. hw.l3cachesize = 6291456
219 1. hw.tbfrequency = 1000000000
220 1. hw.activecpu: 2
221 1. hw.physicalcpu: 2
222 1. hw.physicalcpu_max: 2
223 1. hw.logicalcpu: 2
224 1. hw.logicalcpu_max: 2
225 1. hw.cputype: 7
226 1. hw.cpusubtype: 4
227 1. hw.cpu64bit_capable: 1
228 1. hw.cpufamily: 1418770316
229 1. hw.cacheconfig: 2 1 1 1 0 0 0 0 0 0
230 1. hw.cachesize: 2147483648 32768 262144 6291456 0 0 0 0 0 0
231 1. hw.busfrequency: 100000000
232 1. hw.busfrequency_min: 100000000
233 1. hw.busfrequency_max: 100000000
234 1. hw.cpufrequency: 3062000000
235 1. hw.cpufrequency_min: 3062000000
236 1. hw.cpufrequency_max: 3062000000
237 1. hw.cachelinesize: 64
238 1. hw.l1icachesize: 32768
239 1. hw.l1dcachesize: 32768
240 1. hw.l2cachesize: 262144
241 1. hw.l3cachesize: 6291456
242 1. hw.tbfrequency: 1000000000
243 1. hw.packages: 2
244 1. hw.optional.floatingpoint: 1
245 1. hw.optional.mmx: 1
246 1. hw.optional.sse: 1
247 1. hw.optional.sse2: 1
248 1. hw.optional.sse3: 1
249 1. hw.optional.supplementalsse3: 1
250 1. hw.optional.sse4_1: 1
251 1. hw.optional.sse4_2: 1
252 1. hw.optional.x86_64: 1
253 1. hw.optional.aes: 1
254 1. hw.optional.avx1_0: 1
255 1. hw.optional.rdrand: 0
256 1. hw.optional.f16c: 0
257 1. hw.optional.enfstrg: 0
258 1. machdep.cpu.max_basic: 13
259 1. machdep.cpu.max_ext: 2147483656
260 1. machdep.cpu.vendor: GenuineIntel
261 1. machdep.cpu.brand_string: Intel(R) Core(TM) i5-3470 CPU @ 3.20GHz
262 1. machdep.cpu.family: 6
263 1. machdep.cpu.model: 42
264 1. machdep.cpu.extmodel: 2
265 1. machdep.cpu.extfamily: 0
266 1. machdep.cpu.stepping: 7
267 1. machdep.cpu.feature_bits: 262929407 2660770315
268 1. machdep.cpu.extfeature_bits: 672139520 1
269 1. machdep.cpu.signature: 132775
270 1. machdep.cpu.brand: 0
271 1. machdep.cpu.features: FPU VME DE PSE TSC MSR PAE MCE CX8 APIC SEP MTRR PGE MCA CMOV PAT PSE36 CLFSH DS MMX FXSR SSE SSE2 SS SSE3 PCLMULQDQ MON SSSE3 CX16 SSE4.1 SSE4.2 POPCNT AES VMM XSAVE OSXSAVE AVX1.0
272 1. machdep.cpu.extfeatures: SYSCALL XD EM64T LAHF RDTSCP TSCI
273 1. machdep.cpu.cores_per_package: 1
274 1. machdep.cpu.microcode_version: 16
275 1. machdep.cpu.processor_flag: 0
276 1. machdep.cpu.mwait.linesize_min: 4096
277 1. machdep.cpu.mwait.linesize_max: 4096
278 1. machdep.cpu.mwait.extensions: 3
279 1. machdep.cpu.mwait.sub_Cstates: 4384
280 1. machdep.cpu.xsave.extended_state: 7 832 832 0
281 1. machdep.cpu.arch_perf.version: 1
282 1. machdep.cpu.arch_perf.number: 8
283 1. machdep.cpu.arch_perf.width: 48
284 1. machdep.cpu.arch_perf.events_number: 7
285 1. machdep.cpu.arch_perf.events: 127
286 1. machdep.cpu.arch_perf.fixed_number: 0
287 1. machdep.cpu.arch_perf.fixed_width: 0
288 1. machdep.cpu.cache.linesize: 64
289 1. machdep.cpu.cache.L2_associativity: 8
290 1. machdep.cpu.cache.size: 256
291 1. machdep.cpu.tlb.inst.small: 128
292 1. machdep.cpu.tlb.data.small: 64
293 1. machdep.cpu.tlb.data.large: 32
294 1. machdep.cpu.tlb.shared: 512
295 1. machdep.cpu.address_bits.physical: 40
296 1. machdep.cpu.address_bits.virtual: 48
297 1. machdep.cpu.core_count: 1
298 1. machdep.cpu.thread_count: 1
299
300 ## Live images enhancement
301
302 The live images could be made easier to use by not assuming a QWERTY keyboard layout.
303
304 Not beeing able to choose a localized keyboard layout before having to type 'installer' or 'root' may be a deal breaker for some users.
305 A simple menu replacing login(1) and displaying the following three choices could be a good solution:
306
307 1. Set keyboard layout
308 2. Launch the installer
309 3. Login as root
310
311 For more theoretical projects and project concepts see [[ResearchProjects|/docs/developer/ResearchProjectsPage]]