35c21a2df86fb6316952dea71281559229767ee1
[ikiwiki.git] / release48temp / index.mdwn
1 # DragonFly BSD 4.8
2
3 * Version 4.8.0 released XX March 2017
4
5 DragonFly version 4.8 brings EFI boot support in the installer, 
6
7
8 The details of all commits between the 4.6 and 4.8 branches are available in the associated commit messages for [4.8RC](http://lists.dragonflybsd.org/pipermail/commits/2017-March/625576.html),
9 and [4.8.0](TBD).
10  
11 ## Big-ticket items
12
13 ### Improved graphics support
14
15 The i915 driver has been updated to match the version found with the Linux 4.6 kernel.  (insert note here about newer supported CPUs if any)  
16
17 ### Improved kernel performance
18
19 Kernel performance was already good but the 4.8 release makes it even better, going the next step in improving SMP performance by further localizing cache lines and reducing or removing cache ping-pongong on globals.  For bulk builds on many-cores or multi-socket systems we have around a 5% improvement, and certain subsystems such as namecache lookups and exec()s see massive focused improvements.  For example, concurrent exec rate of distinct (non-shared) binaries now tops 92,000 exec()s/sec.
20
21 ### Support for mobile and high-performance PCIe SSDs
22
23 This kernel release includes support for eMMC storage as the boot device.  We also sport a brand new fully SMP-friendly, high-performance NVME SSD driver (PCIe SSD storage).
24
25 ### EFI support
26
27 The installer can now create an EFI or Legacy installation.  Numerous adjustments have been made to userland utilities and the kernel to support EFI as a mainstream boot environment.  The /boot filesystem may now be placed either in its own GPT slice or in a DragonFly disklabel inside a GPT slice.
28
29 DragonFly, by default, creates a GPT slice for all of DragonFly and places a DragonFly disklabel inside it with all the standard DFly partitions, such that the disk names are roughly the same as they would be in a Legacy system.  Generally speaking our preference is to encapsulate DragonFlyBSD this way and not try to install its mounted filesystems in the GPT slice table itself.
30
31 ## Details
32
33 ### Checksums
34
35     MD5 (dfly-x86_64-4.8.0_REL.img) = 
36     MD5 (dfly-x86_64-4.8.0_REL.iso) = 
37     MD5 (dfly-x86_64-4.8.0_REL.img.bz2) = 
38     MD5 (dfly-x86_64-4.8.0_REL.iso.bz2) = 
39
40 ### Upgrading
41
42 If you have an existing 4.6.x system and are running a generic kernel, the normal upgrade process will work.  Change your local /usr/src to 4.8:
43
44     cd /usr/src
45     git fetch origin
46     git branch DragonFly_RELEASE_4_8 origin/DragonFly_RELEASE_4_8
47     git checkout DragonFly_RELEASE_4_8
48     git pull
49
50 And then rebuild: (in /usr/src )
51
52     make buildworld
53     make buildkernel
54     make installkernel
55     make installworld
56     make upgrade
57
58 Don't forget to upgrade your existing packages.  4.8 packages have
59 already been built and are immediately available.
60
61     pkg upgrade
62
63 ## All changes since DragonFly 4.6
64
65 ### Kernel
66
67 * Refactor buffer cache code to remove dynamic KVA reservations.  Instead, all KVA is reserved at boot time. Saves us from unnecessary IPIs and allows significant simplification of the buffer cache code.
68
69 * Add vfs.repurpose_enable (under test, disabled by default).  This feature can be enabled to significantly reduce the IPI and VM management load on a machine which is doing huge amounts of file I/O, for example from a NVMe SSD, by bypassing normal VM page recycling mechanism.  When enabled, the feature only triggers under high I/O loads.  It works by repurposing the VM pages underlying a buffer in-place (when possible) so as not to have to kremove/kenter the pages in the buffer's KVA.  Normal VM page recycling (which would otherwise be overwhelmed by the I/O load) is bypassed as well.
70
71 * Change how the IPIQ is processed, in particular create an independent Xinterrupt vector mechanism for page invalidations that ignore (will operate) even if a critical section is held.  Implement machdep.optimized_invltlb (disabled by default, under test) which avoids sending tlb invalidation IPIs to idle cpus.
72
73 * Fix numerous races that could occur under extreme loads.  Most use cases would never trigger these but our build boxes did occasionally.  For example, there was a two instruction race where the cpu bit for a pmap would be cleared (for two instructions) and cause a TLB IPI occuring at the same time on another cpu for the same pmap to not realize that cpu was using the pmap.  The fix is to disable the CR3 reload optimization for the LWP->LWP (same proc) switch case.
74
75 * Fix a HAMMER bug which could result in a DATA CRC error being improperly reported.
76
77 * Fix a double-write triggered by the way HAMMER uses cluster_write().  This significantly improves HAMMER's write performance.
78
79 * Numerous other HAMMER cleanups and fixes also went in.
80
81 * Fix a hard lock that could occur in getpbuf*() due to a misinterpretation of the return value of an atomic op.
82
83 * Fix a stacking interrupt that occur in a 10-instruction window, potentially (but not found in the wild) running the kernel stack out.
84
85 * Cut pmap related IPIs in half for certain buffer-cache operations by not bothering to invalidate the TLB, and on the flip-side always invalidating the TLB when entering a new pte even if the prior contents was invalid.  This improves performance and also makes debugging easier by removing a problematic optimization.
86
87 * Fix a number of difficult-to-trigger SMP races, in particular one related to doing simultaneous umount's of different mount points which the bulk build could trigger.  Also fix a mountctl vs umount race.
88
89 * Reduce the number of atomic ops in the switch path.
90
91 * Fix a namecache race/panic which could occur under extreme loads coupled with a lot of mount/umount activity.
92
93 * Restrict %rip sampling to root.
94
95 * Fix a getpid() issue in vfork() when threaded.  In particular, concurrent vfork()s in a threaded program could cause the wrong PID to be returned by getpid() in the child prior to the exec.
96
97 * Fix a rare tsleep/callout race when the callout timmer triggers before the tsleep() is completely done setting up.
98
99 * Cleanup namecache stall messages on the console.  In particular, report the proper elapsed time and the td_comm of the thread involved.
100
101 * Further reduce memory testing and early-boot zeroing to improve boot times on systems with large amounts of ram.
102
103 * Remove the idle page-zeroing code entirely.  Zeroing a page on a modern cpu on-demand is better for many reasons, and may actually be faster when combined with the consumer accessing data in the page, due to cache effects.  Remove PG_ZERO, because it is no longer needed.  Removing PG_ZERO also makes the kernel more debuggable by reducing the contamination caused by bugs.
104
105 * Refactor and finish implementing CPU localization for kernel memory allocations.  Combine with NUMA awareness.  This works for cpu-localized or short-living kernel data structures.  The two are combined together in our PQ_L2_SIZE abstraction that used to be the VM page coloring code.  This code now also handles CPU localization and NUMA awareness.
106
107 * Fix many vkernel issues and significantly improve vkernel performance.
108
109 * Update kern.proc.pathname, a sysctl used by programs to find the path of the running program.  This sysctl was originally implemented before we stored sufficient data to return a full, proper path.
110
111 * Sync ACPICA from Intel (this is a regular occurence).
112
113 * Fix the memcpy() assembly ABI.  The assembly was not returning the original (dst) argument.  Doesn't fix any known issues but closes a hole when GCC sometimes decides to call memcpy while generating code.
114
115 * Many commits to clean up -O2 warnings and errors.  The kernel is now compiled -O2 by default now.
116
117 * Add a workaround for an improper yield in the ACPI path (aka buggy ACPI code).
118
119 * Fix a STOP/CONT race that could be triggered by a pending signal at just the wrong time.
120
121 * Threaded coredump fixes and fix a lockup related to same when multiple threads of the same process seg-fault at the same time.
122
123 * Fix a CAM/VM deadlock that could occur due to a bug in uiomove_nofault().  This could cause an 'indefinite wait buffer' during heavy paging/swapping.
124
125 * Add code to detect and deal with lost IPIs.  This is primarily for vkernels where some virtual hosts can lose IPIs.  Real CPUs do not lose IPIs.
126
127 * Various fixes to clock_gettime().
128
129 * Remove more vestiges of the MPLOCK.  All critical paths have long since divested from this lock, but there are still a few non-critical places left that use it.
130
131 * Rework the low-memory process killing code and fix a number of races that could prevent the feature from working.
132
133 * Fix a system lockup with VMM, refactor the VMX code.
134
135 * Fix a deadlock when numvnodes reaches maxvnodes, which can occur under heavy loads.  Also fix a minor kernel memory leak when 'df' or filesystem sync races a umount.  Also reduce the maxvnodes calculation modestly.  For example, a machine with 8GB of ram will now set maxvnodes to 478483 instead of 598103.
136
137 * Fix a rare panic which can be triggered by vm_object_page_remove() when user_yield() is improperly called while holding a spinlock, and then decides to deschedule.
138
139 * Reduce the size of some dynamically allocated kernel structures.  In particular, excessively-sized inode hash table allocations are now smaller.  Primarily affects UFS (which DragonFlyBSD doesn't use much).
140
141 * Add workaround for AMD erratum 793.
142
143 * Fix a deadlock which can occur in stacked cluster_*() I/O calls.
144
145 * Fix a bug where recursive module loading could deadlock.
146
147 * Fix a silly bug in the NFS sillyrename code (server side NFS) which could cause the NFS server to never remove the silly-renamed file.
148
149 * Do a better job accomodating high-ncpu + low-memory configurations.
150
151 * Refactor shared spinlocks to reduce the amount of spinning which can occur when multiple cpus acquire a shared spinlock at the same time.
152
153 * Overhaul namecache operations to reduce SMP contention even further.  This improves simultaneous non-conflicting single-component performance at least 25x on systems with many cores, and significantly reduces vnode and mount structure ref and unref operations.
154
155 * Overhaul numerous other kernel structures to improve cache locality and reduce cache line bouncing.
156
157 * Fix a bug in SMBFS's file rename code.
158
159 * Implement RLIMIT_RSS, a per-process RSS limiter which will force localized paging on a per-process basis.  This feature can be used to prevent one process from turning the rest of the machine into a hard case.
160
161 * Increase maximum supported swap space.  The maximum supported swap is now limited primarily by ram and will be in the tens of terrabytes (if you have enough ram for the supporting management structures).  Also increase the kernel's KVM from 128G to 511G.
162
163 * Implement dynamic pmap deletion (disabled by default).  This directs the pmap code to delete intermediate page table pages and PDs from the pmap on the fly.  It can be useful if memory is at a premium, but note that it will slow execution of programs which allocate and deallocate memory at a high rate.
164
165 * Refactor how user 'nice' levels work, making the selected nice values more significant than they used to be.
166
167 * Add a high performance native NVME driver to DragonFly, written by Matt.  This driver will use MSI-X vectors and all available queues supported by the device, per-cpu localization with no locking or minimal locking (no SMP conflicts in most cases), and is capable of insane IOPS and throughput.
168
169 ### Graphics
170
171 * Stabilizes broadwell and skylake, bring us up to the Linux 4.6 equivalent DRM.
172
173 * Implement the Linux i2c API to make porting easier.
174
175 * Fix a few old bugs, including a lock order reversal, which could stall-out video playback (and the rest of X).
176
177 * Fix a kernel drm thread priority mistake that allowed user processes to have a higher priority than the drm helper thread.  This fixes most temporary video stalls reported on browsers.  That is, video will run a lot more smoothly in the face of other unrelated things running in the system.
178
179 * Handle EFI framebuffer passing into DRM, improve syscons VT switching and fix a related deadlock.  Also have the kernel try to switch back to the console VT from X when a panic occurs.
180
181 ### Networking
182
183 * Many improvements across the board.
184
185 * iwm - Fixes an issue caused by inverted logic.  Numerous other improvements that significantly improve performance.
186
187 * wlan - Support for asynchronous bg scan and other features added.
188
189 ### Other drivers
190
191 * nvme - Added to default kernel build, plus fixes and performance improvements.
192
193 * mmcsd - Significant eMMC support added to DragonFly.
194
195 * ahci - Some compatibility adjustments and more quirks added to support broken chipsets, in particular port multipliers.  Also implement FBS (FIS-Based-Switching) when supported by the chipset.
196
197 * Trackpoint and Elantech support added.
198
199 ### Userland
200
201 * systat enhanced to collapse multiple interrupts belonging to the same driver, as there are often too many to list now.
202
203 * systat -vm 1 significantly enhanced and revamped to report more useful information and to unpack fields so they don't run into each other.  And add 'nvme' to the block device match.  Also adjust the extended vmstats display and change how ozfod and nzfod is reported.
204
205 * 'vmstat 1' output refactored.  All the fields were running into each other due to the high performance of a modern machine verses what existed 30 years ago.
206
207 * Change mount/mountd signalling to reduce unnecessary mountlist scans and commands from mount_null and mount_tmpfs operations.  Only really matters under heavy concurrent use of mount/umount, but the bulk build actually creates that situation.
208
209 * Fix numerous fork/exec*() leaks that libc can trigger due to not using O_CLOEXEC in an atomic fashion.  Add various O_CLOEXEC features to functions like popen() and mk*stemp*() (add mkostemp() and mkostemps()).  Fix a file descriptor leak in popen() when running in a threaded environment.
210
211 * Be nicer to pthreads in vfork() by giving the new sub-process's lwp the same TID as the one that called vfork().  This allows pthread support functions to execute in the child during the vfork without imploding pthreads.
212
213 * Lots of compatibility fixes to headers to improve dports bulk builds.
214
215 * Several OpenSSL imports for security fixes.
216
217 * Resync OpenSSH to make it easier to keep it uptodate.
218
219 * Separate out kernel C flags by having the kernel build use KCFLAGS instead of CFLAGS.
220
221 * Remove numerous old ISA drivers from the tree entirely.  As DragonFlyBSD is now 64-bit only, we can begin to remove old drivers that do not exist on 64-bit platforms.
222
223 * Introduce WORLD_CFLAGS and WORLD_CCOPTLEVEL, defaulting to -O.  This makes it easier to compile your world -O2 or whatever (e.g. WORLD_CCOPTLEVEL=2).  However, we discourage use of 3 or higher.  Valid values are 0, 1, 2, 3, s, g, and 'fast'.
224
225 * Adjust STATUS formatting for ps to make it more readable and to remove ancient flags that are no longer applicable and just create clutter.
226
227 * Fix malloc() alignment for small allocations.  The minimum alignment is now 16 for allocations in the 16-128 byte range instead of 8.  Note that power-of-2 allocations have always been naturally aligned, but some programs use multiples of (e.g.) 16, like '48', and assume 16-byte alignment.
228
229 * Someone refactored a bunch of fortune stuff and added new fortunes.
230
231 * powerd - Add temperature-based management to powerd with a new -H lotemp:hightemp option.  This feature is extremely useful on laptops with poor cooling and whos BIOSes intentionally throttle at too-high a temperature.  Powerd now also detects power state changes (which can change the list of available frequencies) and properly transitions the service when a power state change occurs.
232
233 * Lots of libthread_xu / pthreads fixes and adjustments to improve dports compatibility.
234
235 * Add copy-on-write features to the vkernel.  For example, allows multiple vkernels to use a single disk image by having each one COW modifications internally to ram.
236
237 * /usr/src/secure rewired, conflicts removed from libmd, libcrypt.
238
239 ### Various tools have been upgraded in the base system:
240
241 * Compiler updated to GCC 5.4.1.
242
243 * We now have a gold linker with LTO.
244
245 * binutils 2.25
246
247 * less 481.
248
249 * OpenSSL / LibRESSL completely revamped.  Base now uses libressl.
250
251 * Many timezone updates.
252
253 ### Other improvements
254
255 * dports stats
256
257 ### Hammer2 Status
258
259 Development continues but no word yet on a first release.
260
261 ### Clang status
262
263 A starting framework has been added for using clang as the alternate base compiler in DragonFly, to replace gcc 4.7.  It's not yet complete.  Clang can of course be added as a package.
264
265 ### 64-bit status
266
267 * Note that DragonFly is only 64-bit, and will not run on 32-bit hardware.