hammer2.8/pthread_attr_setaffinity_np.3: Fix mdoc issues.
[dragonfly.git] / sbin / hammer2 / hammer2.8
1 .\" Copyright (c) 2015 The DragonFly Project.  All rights reserved.
2 .\"
3 .\" This code is derived from software contributed to The DragonFly Project
4 .\" by Matthew Dillon <dillon@backplane.com>
5 .\"
6 .\" Redistribution and use in source and binary forms, with or without
7 .\" modification, are permitted provided that the following conditions
8 .\" are met:
9 .\"
10 .\" 1. Redistributions of source code must retain the above copyright
11 .\"    notice, this list of conditions and the following disclaimer.
12 .\" 2. Redistributions in binary form must reproduce the above copyright
13 .\"    notice, this list of conditions and the following disclaimer in
14 .\"    the documentation and/or other materials provided with the
15 .\"    distribution.
16 .\" 3. Neither the name of The DragonFly Project nor the names of its
17 .\"    contributors may be used to endorse or promote products derived
18 .\"    from this software without specific, prior written permission.
19 .\"
20 .\" THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
21 .\" ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
22 .\" LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
23 .\" FOR A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE
24 .\" COPYRIGHT HOLDERS OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
25 .\" INCIDENTAL, SPECIAL, EXEMPLARY OR CONSEQUENTIAL DAMAGES (INCLUDING,
26 .\" BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
27 .\" LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED
28 .\" AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
29 .\" OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
30 .\" OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
31 .\" SUCH DAMAGE.
32 .\"
33 .Dd March 26, 2015
34 .Dt HAMMER2 8
35 .Os
36 .Sh NAME
37 .Nm hammer2
38 .Nd hammer2 file system utility
39 .Sh SYNOPSIS
40 .Nm
41 .Fl h
42 .Nm
43 .Op Fl s Ar path
44 .Op Fl t Ar type
45 .Op Fl u Ar uuid
46 .Ar command
47 .Op Ar argument ...
48 .Sh DESCRIPTION
49 The
50 .Nm
51 utility provides miscellaneous support functions for a
52 HAMMER2 file system.
53 .Pp
54 The options are as follows:
55 .Bl -tag -width indent
56 .It Fl s Ar path
57 Specify the path to a mounted HAMMER2 filesystem.
58 At least one PFS on a HAMMER2 filesystem must be mounted for the system
59 to act on all PFSs managed by it.
60 Every HAMMER2 filesystem typically has a PFS called "LOCAL" for this purpose.
61 .It Fl t Ar type
62 Specify the type when creating, upgrading, or downgrading a PFS.
63 Supported types are MASTER, SLAVE, SOFT_MASTER, SOFT_SLAVE, CACHE, and DUMMY.
64 If not specified the pfs-create directive will default to MASTER if no
65 uuid is specified, and SLAVE if a uuid is specified.
66 .It Fl u Ar uuid
67 Specify the cluster uuid when creating a PFS.  If not specified, a unique,
68 random uuid will be generated.
69 Note that every PFS also has a unique pfs_id which is always generated
70 and cannot be overridden with an option.
71 The { pfs_clid, pfs_fsid } tuple uniquely identifies a component of a cluster.
72 .El
73 .Pp
74 .Nm
75 directives are as shown below.
76 Note that most directives require you to either be CD'd into a hammer2
77 filesystem, specify a path to a mounted hammer2 filesystem via the
78 .Fl s
79 option, or specify a path after the directive.
80 It depends on the directive.
81 All hammer2 filesystem have a PFS called "LOCAL" which is typically mounted
82 locally on the host in order to be able to issue commands for other PFSs
83 on the filesystem.
84 The mount also enables PFS configuration scanning for that filesystem.
85 .Bl -tag -width indent
86 .\" ==== connect ====
87 .It Cm connect Ar target
88 Add a cluster link entry to the volume header.
89 The volume header can support up to 255 link entries.
90 This feature is not currently used.
91 .\" ==== destroy ====
92 .It Cm destroy Ar path
93 Destroy the specified directory entry in a hammer2 filesystem.  This bypasses
94 all normal checks and will unconditionally destroy the directory entry.
95 The underlying inode is not checked and, if it does exist, its nlinks count
96 is not decremented.
97 This directive should only be used to destroy a corrupted directory entry
98 which no longer has a working inode.
99 .Pp
100 Note that this command may desynchronize the system namecache for the
101 specified entry.  If this happens, you may have to unmount and remount the
102 filesystem.
103 .\" ==== disconnect ====
104 .It Cm disconnect Ar target
105 Delete a cluster link entry from the volume header.
106 This feature is not currently used.
107 .\" ==== info ====
108 .It Cm info Op devpath
109 Access and print the status and super-root entries for all HAMMER2
110 partitions found in /dev/serno or the specified device path(s).
111 The partitions do not have to be mounted.
112 Note that only mounted partitions will be under active management.
113 This is accomplished by mounting at least one PFS within the partition.
114 Typically at least the @LOCAL PFS is mounted.
115 .\" ==== mountall ====
116 .It Cm mountall Op devpath
117 This directive mounts the @LOCAL PFS on all HAMMER2 partitions found
118 in /dev/serno, or the specified device path(s).
119 The partitions are mounted as /var/hammer2/LOCAL.<id>.
120 Mounts are executed in the background and this command will wait a
121 limited amount of time for the mounts to complete before returning.
122 .\" ==== status ====
123 .It Cm status Ar path...
124 Dump a list of all cluster link entries configured in the volume header.
125 .\" ==== hash ====
126 .It Cm hash Ar filename...
127 Compute and print the directory hash for any number of filenames.
128 .\" ==== pfs-list ====
129 .It Cm pfs-list Op path...
130 List all local PFSs available on a mounted HAMMER2 filesystem, their type,
131 and their current status.
132 You must mount at least one PFS in order to be able to access the whole list.
133 .\" ==== pfs-clid ====
134 .It Cm pfs-clid Ar label
135 Print the cluster id for a PFS specified by name.
136 .\" ==== pfs-fsid ====
137 .It Cm pfs-fsid Ar label
138 Print the unique filesystem id for a PFS specified by name.
139 .\" ==== pfs-create ====
140 .It Cm pfs-create Ar label
141 Create a local PFS on a mounted HAMMER2 filesystem.
142 If no uuid is specified the pfs-type defaults to MASTER.
143 If a uuid is specified via the
144 .Fl u
145 option the pfs-type defaults to SLAVE.
146 Other types can be specified with the
147 .Fl t
148 option.
149 .Pp
150 If you wish to add a MASTER to an existing cluster, you must first add it as
151 a SLAVE and then upgrade it to MASTER to properly synchronize it.
152 .Pp
153 The DUMMY pfs-type is used to tie network-accessible clusters into the local
154 machine when no local storage is desired.
155 This type should be used on minimal H2 partitions or entirely in ram for
156 netboot-centric systems to provide a tie-in point for the mount command,
157 or on more complex systems where you need to also access network-centric
158 clusters.
159 .Pp
160 The CACHE or SLAVE pfs-type is typically used when the main store is on
161 the network but local storage is desired to improve performance.
162 SLAVE is also used when a backup is desired.
163 .Pp
164 Generally speaking, you can mount any PFS element of a cluster in order to
165 access the cluster via the full cluster protocol.
166 There are two exceptions.
167 If you mount a SOFT_SLAVE or a SOFT_MASTER then soft quorum semantics are
168 employed... the soft slave or soft master's current state will always be used
169 and the quorum protocol will not be used.  The soft PFS will still be
170 synchronized to masters in the background when available.
171 Also, you can use
172 .Sq mount -o local
173 to mount ONLY a local HAMMER2 PFS and
174 not run any network or quorum protocols for the mount.
175 All such mounts except for a SOFT_MASTER mount will be read-only.
176 Other than that, you will be mounting the whole cluster when you mount any
177 PFS within the cluster.
178 .Pp
179 DUMMY - Create a PFS skeleton intended to be the mount point for a
180 more complex cluster, probably one that is entirely network based.
181 No data will be synchronized to this PFS so it is suitable for use
182 in a network boot image or memory filesystem.
183 This allows you to create placeholders for mount points on your local
184 disk, SSD, or memory disk.
185 .Pp
186 CACHE - Create a PFS for caching portions of the cluster piecemeal.
187 This is similar to a SLAVE but does not synchronize the entire contents of
188 the cluster to the PFS.
189 Elements found in the CACHE PFS which are validated against the cluster
190 will be read, presumably a faster access than having to go to the cluster.
191 Only local CACHEs will be updated.
192 Network-accessible CACHE PFSs might be read but will not be written to.
193 If you have a large hard-drive-based cluster you can set up localized
194 SSD CACHE PFSs to improve performance.
195 .Pp
196 SLAVE - Create a PFS which maintains synchronization with and provides a
197 read-only copy of the cluster.
198 HAMMER2 will prioritize local SLAVEs for data retrieval after validating
199 their transaction id against the cluster.
200 The difference between a CACHE and a SLAVE is that the SLAVE is synchronized
201 to a full copy of the cluster and thus can serve as a backup or be staged
202 for use as a MASTER later on.
203 .Pp
204 SOFT_SLAVE - Create a PFS which maintains synchronization with and provides
205 a read-only copy of the cluster.
206 This is one of the special mount cases.  A SOFT_SLAVE will synchronize with
207 the cluster when the cluster is available, but can still be accessed when
208 the cluster is not available.
209 .Pp
210 MASTER - Create a PFS which will hold a master copy of the cluster.
211 If you create several MASTER PFSs with the same cluster id you are
212 effectively creating a multi-master cluster and causing a quorum and
213 cache coherency protocol to be used to validate operations.
214 The total number of masters is stored in each PFSs making up the cluster.
215 Filesystem operations will stall for normal mounts if a quorum cannot be
216 obtained to validate the operation.
217 MASTER nodes which go offline and return later will synchronize in the
218 background.
219 Note that when adding a MASTER to an existing cluster you must add the
220 new PFS as a SLAVE and then upgrade it to a MASTER.
221 .Pp
222 SOFT_MASTER - Create a PFS which maintains synchronization with and provides
223 a read-write copy of the cluster.
224 This is one of the special mount cases.  A SOFT_MASTER will synchronize with
225 the cluster when the cluster is available, but can still be read AND written
226 to even when the cluster is not available.
227 Modifications made to a SOFT_MASTER will be automatically flushed to the
228 cluster when it becomes accessible again, and vise-versa.
229 Manual intervention may be required if a conflict occurs during
230 synchronization.
231 .\" ==== pfs-delete ====
232 .It Cm pfs-delete Ar label
233 Delete a local PFS on a mounted HAMMER2 filesystem.
234 Deleting a PFS of type MASTER requires first downgrading it to a SLAVE (XXX).
235 .\" ==== snapshot ====
236 .It Cm snapshot Ar path Op label
237 Create a snapshot of a directory.
238 This can only be used on a local PFS, and is only really useful if the PFS
239 contains a complete copy of what you desire to snapshot so that typically
240 means a local MASTER, SOFT_MASTER, SLAVE, or SOFT_SLAVE must be present.
241 Snapshots are created simply by flushing a PFS mount to disk and then copying
242 the directory inode to the PFS.
243 The topology is snapshotted without having to be copied or scanned.
244 Snapshots are effectively separate from the cluster they came from
245 and can be used as a starting point for a new cluster.
246 So unless you build a new cluster from the snapshot, it will stay local
247 to the machine it was made on.
248 .\" ==== service ====
249 .It Cm service
250 Start the
251 .Nm
252 service daemon.
253 This daemon is also automatically started when you run
254 .Xr mount_hammer2 8 .
255 The hammer2 service daemon handles incoming TCP connections and maintains
256 outgoing TCP connections.  It will interconnect available services on the
257 machine (e.g. hammer2 mounts and xdisks) to the network.
258 .\" ==== stat ====
259 .It Cm stat Op path...
260 Print the inode statistics, compression, and other meta-data associated
261 with a list of paths.
262 .\" ==== leaf ====
263 .It Cm leaf
264 XXX
265 .\" ==== shell ====
266 .It Cm shell
267 Start a debug shell to the local hammer2 service daemon via the DMSG protocol.
268 .\" ==== debugspan ====
269 .It Cm debugspan
270 (do not use)
271 .\" ==== rsainit ====
272 .It Cm rsainit
273 Create the
274 .Pa /etc/hammer2
275 directory and initialize a public/private keypair in that directory for
276 use by the network cluster protocols.
277 .\" ==== show ====
278 .It Cm show Ar devpath
279 Dump the radix tree for the HAMMER2 filesystem by scanning a
280 block device directly.  No mount is required.
281 .\" ==== freemap ====
282 Dump the freemap tree for the HAMMER2 filesystem by scanning a
283 block device directly.  No mount is required.
284 .It Cm freemap Ar devpath
285 .\" ==== setcomp ====
286 .It Cm setcomp Ar mode[:level] Op path...
287 Set the compression mode as specified for any newly created elements at or
288 under the path if not overridden by deeper elements.
289 Available modes are none, autozero, lz4, or zlib.
290 When zlib is used the compression level can be set.
291 The default will be 6 which is the best trade-off between performance and
292 time.
293 .Pp
294 newfs_hammer2 will set the default compression to lz4 which prioritizes
295 speed over performance.
296 Also note that HAMMER2 contains a heuristic and will not attempt to
297 compress every block if it detects a sufficient amount of uncompressable
298 data.
299 .Pp
300 Hammer2 compression is only effective when it can reduce the size of dataset
301 (typically a 64KB block) by one or more powers of 2.  A 64K block which
302 only compresses to 40K will not yield any storage improvement.
303 .Pp
304 Generally speaking you do not want to set the compression mode to
305 .Sq none ,
306 as this will cause blocks of all-zeros to be written as all-zero blocks,
307 instead of holes.  The
308 .Sq autozero
309 compression mode detects blocks of all-zeros
310 and writes them as holes.  However, HAMMER2 will rewrite data in-place if
311 the compression mode is set to
312 .Sq none
313 and the check code is set to
314 .Sq  disabled .
315 Formal snapshots will still snapshot such files.  However,
316 de-duplication will no longer function on the data blocks.
317 .\" ==== setcheck ====
318 .It Cm setcheck Ar check Op path...
319 Set the check code as specified for any newly created elements at or under
320 the path if not overridden by deeper elements.
321 Available codes are default, disabled, crc32, xxhash64, or sha192.
322 .\" ==== clrcheck ====
323 .It Cm clrcheck Op path...
324 Clear the check code override for the specified paths.
325 Overrides may still be present in deeper elements.
326 .\" ==== setcrc32 ====
327 .It Cm setcrc32 Op path...
328 Set the check code to the ISCSI 32-bit CRC for any newly created elements
329 at or under the path if not overridden by deeper elements.
330 .\" ==== setxxhash64 ====
331 .It Cm setxxhash64 Op path...
332 Set the check code to XXHASH64, a fast 64-bit hash
333 .\" ==== setsha192 ====
334 .It Cm setsha192 Op path...
335 Set the check code to SHA192 for any newly created elements at or under
336 the path if not overridden by deeper elements.
337 .\" ==== bulkfree ====
338 .It Cm bulkfree Op path...
339 Run a bulkfree pass on a HAMMER2 mount.
340 You can specify any PFS for the mount, the bulkfree pass is run on the
341 entire partition.
342 Note that it takes two passes to actually free space.
343 .El
344 .Sh SYSCTLS
345 .Bl -tag -width indent
346 .It Va vfs.hammer2.dedup_enable (default on)
347 Enables live de-duplication.  Any recently read data that is on-media
348 (already synchronized to media) is tested against pending writes for
349 compatibility.  If a match is found, the write will reference the
350 existing on-media data instead of writing new data.
351 .It Va vfs.hammer2.always_compress (default off)
352 This disables the H2 compression heuristic and forces H2 to always
353 try to compress data blocks, even if they look uncompressable.
354 Enabling this option reduces performance but has higher de-duplication
355 repeatability.
356 .It Va vfs.hammer2.cluster_data_read (default 4)
357 .It Va vfs.hammer2.cluster_meta_read (default 1)
358 Set the amount of read-ahead clustering to perform on data and meta-data
359 blocks.
360 .It Va vfs.hammer2.cluster_write (default 4)
361 Set the amount of write-behind clustering to perform in buffers.  Each
362 buffer represents 64KB.  The default is 4 and higher values typically do
363 not improve performance.  A value of 0 disables clustered writes.
364 This variable applies to the underlying media device, not to logical
365 file writes, so it should not interfere with temporary file optimization.
366 Generally speaking you want this enabled to generate smoothly pipelined
367 writes to the media.
368 .It Va vfs.hammer2.bulkfree_tps (default 5000)
369 Set bulkfree's maximum scan rate.  This is primarily intended to limit
370 I/O utilization on SSDs and cpu utilization when the meta-data is mostly
371 cached in memory.
372 .El
373 .Sh SETTING UP /etc/hammer2
374 The
375 .Sq rsainit
376 directive will create the
377 .Pa /etc/hammer2
378 directory with appropriate permissions and also generate a public key
379 pair in this directory for the machine.  These files will be
380 .Pa rsa.pub
381 and
382 .Pa rsa.prv
383 and needless to say, the private key shouldn't leave the host.
384 .Pp
385 The service daemon will also scan the
386 .Pa /etc/hammer2/autoconn
387 file which contains a list of hosts which it will automatically maintain
388 connections to to form your cluster.
389 The service daemon will automatically reconnect on any failure and will
390 also monitor the file for changes.
391 .Pp
392 When the service daemon receives a connection it expects to find a
393 public key for that connection in a file in
394 .Pa /etc/hammer2/remote/
395 called
396 .Pa <IPADDR>.pub .
397 You normally copy the
398 .Pa rsa.pub
399 key from the host in question to this file.
400 The IP address must match exactly or the connection will not be allowed.
401 .Pp
402 If you want to use an unencrypted connection you can create empty,
403 dummy files in the remote directory in the form
404 .Pa <IPADDR>.none .
405 We do not recommend using unencrypted connections.
406 .Sh CLUSTER SERVICES
407 Currently there are two services which use the cluster network infrastructure,
408 HAMMER2 mounts and XDISK.
409 Any HAMMER2 mount will make all PFSs for that filesystem available to the
410 cluster.
411 And if the XDISK kernel module is loaded, the hammer2 service daemon will make
412 your machine's block devices available to the cluster (you must load the
413 xdisk.ko kernel module before starting the hammer2 service).
414 They will show up as
415 .Pa /dev/xa*
416 and
417 .Pa /dev/serno/*
418 devices on the remote machines making up the cluster.
419 Remote block devices are just what they appear to be... direct access to a
420 block device on a remote machine.  If the link goes down remote accesses
421 will stall until it comes back up again, then automatically requeue any
422 pending I/O and resume as if nothing happened.
423 However, if the server hosting the physical disks crashes or is rebooted,
424 any remote opens to its devices will see a permanent I/O failure requiring a
425 close and open sequence to re-establish.
426 The latter is necessary because the server's drives might not have committed
427 the data before the crash, but had already acknowledged the transfer.
428 .Pp
429 Data commits work exactly the same as they do for real block devices.
430 The originater must issue a BUF_CMD_FLUSH.
431 .Sh ADDING A NEW MASTER TO A CLUSTER
432 When you
433 .Xr newfs_hammer2 8
434 a HAMMER2 filesystem or use the
435 .Sq pfs-create
436 directive on one already mounted
437 to create a new PFS, with no special options, you wind up with a PFS
438 typed as a MASTER and a unique cluster uuid, but because there is only one
439 PFS for that cluster (for each PFS you create via pfs-create), it will
440 act just like a normal filesystem would act and does not require any special
441 protocols to operate.
442 .Pp
443 If you use the
444 .Sq pfs-create
445 directive along with the
446 .Fl u
447 option to specify a cluster uuid that already exists in the cluster,
448 you are adding a PFS to an existing cluster and this can trigger a whole
449 series of events in the background.
450 When you specify the
451 .Fl u
452 option in a
453 .Sq pfs-create ,
454 .Nm
455 will by default create a SLAVE PFS.
456 In fact, this is what must be created first even if you want to add a new
457 MASTER to your cluster.
458 .Pp
459 The most common action a system admin will want to take is to upgrade or
460 downgrade a PFS.
461 A new MASTER can be added to the cluster by upgrading an existing SLAVE
462 to MASTER.
463 A MASTER can be removed from the cluster by downgrading it to a SLAVE.
464 Upgrades and downgrades will put nodes in the cluster in a transition state
465 until the operation is complete.
466 For downgrades the transition state is fleeting unless one or more other
467 masters has not acknowledged the change.
468 For upgrades a background synchronization process must complete before the
469 transition can be said to be complete, and the node remains (really) a SLAVE
470 until that transition is complete.
471 .Sh USE CASES FOR A SOFT_MASTER
472 The SOFT_MASTER PFS type is a special type which must be specifically
473 mounted by a machine.
474 It is a R/W mount which does not use the quorum protocol and is not
475 cache coherent with the cluster, but which synchronizes from the cluster
476 and allows modifying operations which will synchronize to the cluster.
477 The most common case is to use a SOFT_MASTER PFS in a laptop allowing you
478 to work on your laptop when you are on the road and not connected to
479 your main servers, and for the laptop to synchronize when a connection is
480 available.
481 .Sh USE CASES FOR A SOFT_SLAVE
482 A SOFT_SLAVE PFS type is a special type which must be specifically mounted
483 by a machine.
484 It is a RO mount which does not use the quorum protocol and is not
485 cache coherent with the cluster.  It will receive synchronization from
486 the cluster when network connectivity is available but will not stall if
487 network connectivity is lost.
488 .Sh FSYNC FLUSH MODES
489 TODO.
490 .Sh RESTORING FROM A SNAPSHOT BACKUP
491 TODO.
492 .Sh PERFORMANCE TUNING
493 Because HAMMER2 implements compression, decompression, and deup natively,
494 it always double-buffers file data.  This means that the file data is
495 cached via the device vnode (in compressed / dedupped-form) and the same
496 data is also cached by the file vnode (in decompressed / non-dedupped form).
497 .Pp
498 While HAMMER2 will try to age the logical file buffers on its, some
499 additional performance tuning may be necessary for optimal operation
500 whether swapcache is used or not.  Our recommendation is to reduce the
501 number of vnodes (and thus also the logical buffer cache behind the
502 vnodes) that the system caches via the
503 .Va kern.maxvnodes
504 sysctl.
505 .Pp
506 Too-large a value will result in excessive double-caching and can cause
507 unnecessary read disk I/O.
508 We recommend a number between 25000 and 250000 vnodes, depending on your
509 use case.
510 Keep in mind that even though the vnode cache is smaller, this will make
511 room for a great deal more device-level buffer caching which can encompasses
512 far more data and meta-data than the vnode-level caching.
513 .Sh ENVIRONMENT
514 TODO.
515 .Sh FILES
516 .Bl -tag -width ".It Pa <fs>/abc/defghi/<name>" -compact
517 .It Pa /etc/hammer2/
518 .It Pa /etc/hammer2/rsa.pub
519 .It Pa /etc/hammer2/rsa.prv
520 .It Pa /etc/hammer2/autoconn
521 .It Pa /etc/hammer2/remote/<IP>.pub
522 .It Pa /etc/hammer2/remote/<IP>.none
523 .El
524 .Sh EXIT STATUS
525 .Ex -std
526 .Sh SEE ALSO
527 .Xr mount_hammer2 8 ,
528 .Xr mount_null 8 ,
529 .Xr newfs_hammer2 8 ,
530 .Xr swapcache 8 ,
531 .Xr sysctl 8
532 .Sh HISTORY
533 The
534 .Nm
535 utility first appeared in
536 .Dx 4.1 .
537 .Sh AUTHORS
538 .An Matthew Dillon Aq Mt dillon@backplane.com