em/emx: Add support for I219 LM15~19 and I219 V15~19
[dragonfly.git] / sbin / hammer2 / hammer2.8
1 .\" Copyright (c) 2015-2019 The DragonFly Project.  All rights reserved.
2 .\"
3 .\" This code is derived from software contributed to The DragonFly Project
4 .\" by Matthew Dillon <dillon@backplane.com>
5 .\"
6 .\" Redistribution and use in source and binary forms, with or without
7 .\" modification, are permitted provided that the following conditions
8 .\" are met:
9 .\"
10 .\" 1. Redistributions of source code must retain the above copyright
11 .\"    notice, this list of conditions and the following disclaimer.
12 .\" 2. Redistributions in binary form must reproduce the above copyright
13 .\"    notice, this list of conditions and the following disclaimer in
14 .\"    the documentation and/or other materials provided with the
15 .\"    distribution.
16 .\" 3. Neither the name of The DragonFly Project nor the names of its
17 .\"    contributors may be used to endorse or promote products derived
18 .\"    from this software without specific, prior written permission.
19 .\"
20 .\" THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
21 .\" ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
22 .\" LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
23 .\" FOR A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE
24 .\" COPYRIGHT HOLDERS OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
25 .\" INCIDENTAL, SPECIAL, EXEMPLARY OR CONSEQUENTIAL DAMAGES (INCLUDING,
26 .\" BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
27 .\" LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED
28 .\" AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
29 .\" OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
30 .\" OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
31 .\" SUCH DAMAGE.
32 .\"
33 .Dd November 29, 2020
34 .Dt HAMMER2 8
35 .Os
36 .Sh NAME
37 .Nm hammer2
38 .Nd hammer2 file system utility
39 .Sh SYNOPSIS
40 .Nm
41 .Fl h
42 .Nm
43 .Op Fl s Ar path
44 .Op Fl t Ar type
45 .Op Fl u Ar uuid
46 .Op Fl m Ar mem
47 .Ar command
48 .Op Ar argument ...
49 .Sh DESCRIPTION
50 The
51 .Nm
52 utility provides miscellaneous support functions for a
53 HAMMER2 file system.
54 .Pp
55 The options are as follows:
56 .Bl -tag -width indent
57 .It Fl s Ar path
58 Specify the path to a mounted HAMMER2 filesystem.
59 At least one PFS on a HAMMER2 filesystem must be mounted for the system
60 to act on all PFSs managed by it.
61 Every HAMMER2 filesystem typically has a PFS called "LOCAL" for this purpose.
62 .It Fl t Ar type
63 Specify the type when creating, upgrading, or downgrading a PFS.
64 Supported types are MASTER, SLAVE, SOFT_MASTER, SOFT_SLAVE, CACHE, and DUMMY.
65 If not specified the pfs-create directive will default to MASTER if no
66 UUID is specified, and SLAVE if a UUID is specified.
67 .It Fl u Ar uuid
68 Specify the cluster UUID when creating a PFS.
69 If not specified, a unique, random UUID will be generated.
70 Note that every PFS also has a unique pfs_id which is always generated
71 and cannot be overridden with an option.
72 The { pfs_clid, pfs_fsid } tuple uniquely identifies a component of a cluster.
73 .It Fl m Ar mem
74 Specify how much tracking memory to use for certain directives.
75 At the moment, this option is only applicable to the
76 .Cm bulkfree
77 directive, allowing it to operate in fewer passes when given more memory.
78 A nominal value for a 4TB drive with a ton of stuff on it would be around
79 a gigabyte '-m 1g'.
80 .El
81 .Pp
82 .Nm
83 directives are as shown below.
84 Note that most directives require you to either be CD'd into a hammer2
85 filesystem, specify a path to a mounted hammer2 filesystem via the
86 .Fl s
87 option, or specify a path after the directive.
88 It depends on the directive.
89 All hammer2 filesystem have a PFS called "LOCAL" which is typically mounted
90 locally on the host in order to be able to issue commands for other PFSs
91 on the filesystem.
92 The mount also enables PFS configuration scanning for that filesystem.
93 .Bl -tag -width indent
94 .\" ==== cleanup ====
95 .It Cm cleanup Op path
96 Perform manual cleanup passes on paths or all mounted partitions.
97 .\" ==== connect ====
98 .It Cm connect Ar target
99 Add a cluster link entry to the volume header.
100 The volume header can support up to 255 link entries.
101 This feature is not currently used.
102 .\" ==== destroy ====
103 .It Cm destroy Ar path...
104 Destroy the specified directory entry in a hammer2 filesystem.
105 This bypasses
106 all normal checks and will unconditionally destroy the directory entry.
107 The underlying inode is not checked and, if it does exist, its nlinks count
108 is not decremented.
109 This directive should only be used to destroy a corrupted directory entry
110 which no longer has a working inode.
111 .Pp
112 Note that this command may desynchronize the system namecache for the
113 specified entry.
114 If this happens, you may have to unmount and remount the filesystem.
115 .\" ==== destroy-inum ====
116 .It Cm destroy-inum Ar path...
117 Destroy the specified inode in a hammer2 filesystem.
118 .\" ==== disconnect ====
119 .It Cm disconnect Ar target
120 Delete a cluster link entry from the volume header.
121 This feature is not currently used.
122 .\" ==== emergency-mode-enable ===
123 .It Cm emergency-mode-enable Ar target
124 Flag emergency operations mode in the filesystem.
125 This mode may be used
126 as a last resort to delete files and directories from a full filesystem.
127 Inode creation, file writes, and certain meta-data cleanups are disallowed
128 while emergency mode is active.
129 File and directory removal and mode/attr setting is still allowed.
130 This mode is extremely dangerous and should only be used as a last resort.
131 .Pp
132 This mode allows the filesystem to modify blocks in-place when it is unable
133 to allocate a copy.
134 Thus it is possible to chflags and remove files and
135 directories even when the filesystem is completely full.
136 However, there is a price.
137 This mode of operation WILL LIKELY CORRUPT ANY SNAPSHOTS related
138 to this filesystem.
139 The filesystem will report this condition if it encounters
140 it but if you are forced to use this mode to fix a filesystem full condition
141 your snapshots can get a bit dicey.
142 It is usually safest to delete any related snapshots when using this mode.
143 .Pp
144 You can detect whether related snapshots have been corrupted by running
145 a bulkfree pass and checking the console output for reported CRC errors.
146 If no errors are reported, your snapshots are fine.
147 If errors are reported
148 you should delete related snapshots until bulkfree reports no further errors.
149 .Pp
150 The emergency mode will also make meta-data updates unsafe due to the lack of
151 copy-on-write, causing potential harm if the system unexpectedly panics or
152 loses power.
153 GREAT CARE MUST BE TAKEN WHILE THIS MODE IS ACTIVE.
154 .Bl -enum
155 .It
156 Determine that you are unable to recover space with normal file and directory
157 removal commands due to
158 .Er ENOSPC
159 errors being returned by 'rm', or through the
160 removal of snapshots (if any).  The 'bulkfree' directive must be issued to
161 scan the filesystem and free up the actual space, then check with 'df'.
162 Continue if you still have insufficient space and are unable to remove items
163 normally.
164 .It
165 If you need any related snapshots, this is a good time to copy them elsewhere.
166 .It
167 Idle or kill any processes trying to use the filesystem.
168 .It
169 Issue the emergency-mode-enable directive on the filesystem.
170 Once enabled, run 'sync' to update any dirty inodes which may still
171 be dirty due to not being able to flush.
172 Please remember that this
173 directive is a LAST RESORT, is dangerous, and will likely corrupt any
174 other snapshots you have based on the filesystem you are removing files
175 from.
176 .It
177 Remove file trees as necessary with 'rm -rf' to free space, being cognizant
178 of any warnings issued by the kernel on the console (via 'dmesg') while
179 doing so.
180 .It
181 Issue the 'bulkfree' directive to actually free the space and check that
182 sufficient space has been freed with 'df'.
183 .It
184 If bulkfree reports CHECK errors, or if you have snapshots and insufficient
185 space has been freed, you will need to delete snapshots.
186 Re-run bulkfree and delete snapshots until no errors are reported.
187 .It
188 Issue the emergency-mode-disable directive when done.
189 It might also be a
190 good idea to reboot after using this mode, but theoretically you should not
191 have to.
192 .It
193 Restore services using the filesystem.
194 .El
195 .\" ==== emergency-mode-disable ===
196 .It Cm emergency-mode-disable Ar target
197 Turn off the emergency operations mode on a filesystem, restoring normal
198 operation.
199 .\" ==== growfs ====
200 .It Cm growfs Op fspath...
201 After resizing the disk partition you can issue this command on a
202 mounted hammer2 filesystem to grow into the new space in the partition.
203 This command is run on a live hammer2 filesystem.
204 .\" ==== info ====
205 .It Cm info Op devpath...
206 Access and print the status and super-root entries for all HAMMER2
207 partitions found in /dev/serno or the specified device path(s).
208 The partitions do not have to be mounted.
209 Note that only mounted partitions will be under active management.
210 This is accomplished by mounting at least one PFS within the partition.
211 Typically at least the @LOCAL PFS is mounted.
212 .\" ==== mountall ====
213 .It Cm mountall Op devpath...
214 This directive mounts the @LOCAL PFS on all HAMMER2 partitions found
215 in /dev/serno, or the specified device path(s).
216 The partitions are mounted as /var/hammer2/LOCAL.<id>.
217 Mounts are executed in the background and this command will wait a
218 limited amount of time for the mounts to complete before returning.
219 .\" ==== status ====
220 .It Cm status Op path...
221 Dump a list of all cluster link entries configured in the volume header.
222 .\" ==== hash ====
223 .It Cm hash Op filename...
224 Compute and print the directory hash for any number of filenames.
225 .\" ==== dhash ====
226 .It Cm dhash Op filename...
227 Compute and print the data hash for long directory entry for any number of filenames.
228 .\" ==== pfs-list ====
229 .It Cm pfs-list Op path...
230 List all PFSs associated with all mounted hammer2 storage devices.
231 The list may be restricted to a particular filesystem using
232 .Fl s Ar mount .
233 .Pp
234 Note that hammer2 PFSs associated with storage devices which have not been
235 mounted in any fashion will not be listed.  At least one hammer2 label must
236 be mounted for the PFSs on that device to be visible.
237 .\" ==== pfs-clid ====
238 .It Cm pfs-clid Ar label
239 Print the cluster id for a PFS specified by name.
240 .\" ==== pfs-fsid ====
241 .It Cm pfs-fsid Ar label
242 Print the unique filesystem id for a PFS specified by name.
243 .\" ==== pfs-create ====
244 .It Cm pfs-create Ar label
245 Create a local PFS on the mounted HAMMER2 filesystem represented
246 by the current directory, or specified via
247 .Fl s Ar mount .
248 If no UUID is specified the pfs-type defaults to MASTER.
249 If a UUID is specified via the
250 .Fl u
251 option the pfs-type defaults to SLAVE.
252 Other types can be specified with the
253 .Fl t
254 option.
255 .Pp
256 If you wish to add a MASTER to an existing cluster, you must first add it as
257 a SLAVE and then upgrade it to MASTER to properly synchronize it.
258 .Pp
259 The DUMMY pfs-type is used to tie network-accessible clusters into the local
260 machine when no local storage is desired.
261 This type should be used on minimal H2 partitions or entirely in ram for
262 netboot-centric systems to provide a tie-in point for the mount command,
263 or on more complex systems where you need to also access network-centric
264 clusters.
265 .Pp
266 The CACHE or SLAVE pfs-type is typically used when the main store is on
267 the network but local storage is desired to improve performance.
268 SLAVE is also used when a backup is desired.
269 .Pp
270 Generally speaking, you can mount any PFS element of a cluster in order to
271 access the cluster via the full cluster protocol.
272 There are two exceptions.
273 If you mount a SOFT_SLAVE or a SOFT_MASTER then soft quorum semantics are
274 employed... the soft slave or soft master's current state will always be used
275 and the quorum protocol will not be used.
276 The soft PFS will still be
277 synchronized to masters in the background when available.
278 Also, you can use
279 .Sq mount -o local
280 to mount ONLY a local HAMMER2 PFS and
281 not run any network or quorum protocols for the mount.
282 All such mounts except for a SOFT_MASTER mount will be read-only.
283 Other than that, you will be mounting the whole cluster when you mount any
284 PFS within the cluster.
285 .Pp
286 DUMMY - Create a PFS skeleton intended to be the mount point for a
287 more complex cluster, probably one that is entirely network based.
288 No data will be synchronized to this PFS so it is suitable for use
289 in a network boot image or memory filesystem.
290 This allows you to create placeholders for mount points on your local
291 disk, SSD, or memory disk.
292 .Pp
293 CACHE - Create a PFS for caching portions of the cluster piecemeal.
294 This is similar to a SLAVE but does not synchronize the entire contents of
295 the cluster to the PFS.
296 Elements found in the CACHE PFS which are validated against the cluster
297 will be read, presumably a faster access than having to go to the cluster.
298 Only local CACHEs will be updated.
299 Network-accessible CACHE PFSs might be read but will not be written to.
300 If you have a large hard-drive-based cluster you can set up localized
301 SSD CACHE PFSs to improve performance.
302 .Pp
303 SLAVE - Create a PFS which maintains synchronization with and provides a
304 read-only copy of the cluster.
305 HAMMER2 will prioritize local SLAVEs for data retrieval after validating
306 their transaction id against the cluster.
307 The difference between a CACHE and a SLAVE is that the SLAVE is synchronized
308 to a full copy of the cluster and thus can serve as a backup or be staged
309 for use as a MASTER later on.
310 .Pp
311 SOFT_SLAVE - Create a PFS which maintains synchronization with and provides
312 a read-only copy of the cluster.
313 This is one of the special mount cases.
314 A SOFT_SLAVE will synchronize with
315 the cluster when the cluster is available, but can still be accessed when
316 the cluster is not available.
317 .Pp
318 MASTER - Create a PFS which will hold a master copy of the cluster.
319 If you create several MASTER PFSs with the same cluster id you are
320 effectively creating a multi-master cluster and causing a quorum and
321 cache coherency protocol to be used to validate operations.
322 The total number of masters is stored in each PFSs making up the cluster.
323 Filesystem operations will stall for normal mounts if a quorum cannot be
324 obtained to validate the operation.
325 MASTER nodes which go offline and return later will synchronize in the
326 background.
327 Note that when adding a MASTER to an existing cluster you must add the
328 new PFS as a SLAVE and then upgrade it to a MASTER.
329 .Pp
330 SOFT_MASTER - Create a PFS which maintains synchronization with and provides
331 a read-write copy of the cluster.
332 This is one of the special mount cases.
333 A SOFT_MASTER will synchronize with
334 the cluster when the cluster is available, but can still be read AND written
335 to even when the cluster is not available.
336 Modifications made to a SOFT_MASTER will be automatically flushed to the
337 cluster when it becomes accessible again, and vise-versa.
338 Manual intervention may be required if a conflict occurs during
339 synchronization.
340 .\" ==== pfs-delete ====
341 .It Cm pfs-delete Op label...
342 Destroy a PFS by name.  All hammer2 mount points will be checked, however
343 this directive will refuse to delete a PFS whos name is duplicated on
344 multiple mount points.  A specific mount point may be specified to restrict
345 the deletion via the
346 .Fl s Ar mount
347 option.
348 .\" ==== snapshot ====
349 .It Cm snapshot Ar path Op label
350 Create a snapshot of a directory.
351 The snapshot will be created on the same hammer2 storage device as the
352 directory.
353 This can only be used on a local PFS, and is only really useful if the PFS
354 contains a complete copy of what you desire to snapshot so that typically
355 means a local MASTER, SOFT_MASTER, SLAVE, or SOFT_SLAVE must be present.
356 Snapshots are created simply by flushing a PFS mount to disk and then copying
357 the directory inode to the PFS.
358 The topology is snapshotted without having to be copied or scanned and
359 take no additional space.
360 However, bulkfree scans may take longer.
361 Snapshots are effectively separate from the cluster they came from
362 and can be used as a starting point for a new cluster.
363 So unless you build a new cluster from the snapshot, it will stay local
364 to the machine it was made on.
365 .Pp
366 Snapshots can be maintained automatically with
367 .Xr periodic 8 .
368 See
369 .Xr periodic.conf 5
370 for details of enabling and configuring the functionality.
371 .\" ==== snapshot-debug ====
372 .It Cm snapshot-debug Ar path Op label
373 Snapshot without filesystem sync.
374 .\" ==== service ====
375 .It Cm service
376 Start the
377 .Nm
378 service daemon.
379 This daemon is also automatically started when you run
380 .Xr mount_hammer2 8 .
381 The hammer2 service daemon handles incoming TCP connections and maintains
382 outgoing TCP connections.
383 It will interconnect available services on the
384 machine (e.g. hammer2 mounts and xdisks) to the network.
385 .\" ==== stat ====
386 .It Cm stat Op path...
387 Print the inode statistics, compression, and other meta-data associated
388 with a list of paths.
389 .\" ==== leaf ====
390 .It Cm leaf
391 XXX
392 .\" ==== shell ====
393 .It Cm shell Op host
394 Start a debug shell to the local hammer2 service daemon via the DMSG protocol.
395 .\" ==== debugspan ====
396 .It Cm debugspan Ar target
397 (do not use)
398 .\" ==== rsainit ====
399 .It Cm rsainit Op path
400 Create the
401 .Pa /etc/hammer2
402 directory and initialize a public/private keypair in that directory for
403 use by the network cluster protocols.
404 .\" ==== show ====
405 .It Cm show Ar devpath
406 Dump the radix tree for the HAMMER2 filesystem by scanning a
407 block device directly.
408 No mount is required.
409 .\" ==== freemap ====
410 .It Cm freemap Ar devpath
411 Dump the freemap tree for the HAMMER2 filesystem by scanning a
412 block device directly.
413 No mount is required.
414 .\" ==== volhdr ====
415 .It Cm volhdr Ar devpath
416 Dump the volume header for the HAMMER2 filesystem by scanning a
417 block device directly.
418 No mount is required.
419 .\" ==== volume-list ====
420 .It Cm volume-list Op path...
421 List all volumes associated with all mounted hammer2 storage devices.
422 The list may be restricted to a particular filesystem using
423 .Fl s Ar mount .
424 .Pp
425 Note that hammer2 volumes associated with storage devices which have not been
426 mounted in any fashion will not be listed.  At least one hammer2 label must
427 be mounted for the volumes on that device to be visible.
428 .\" ==== setcomp ====
429 .It Cm setcomp Ar mode[:level] Ar path...
430 Set the compression mode as specified for any newly created elements at or
431 under the path if not overridden by deeper elements.
432 Available modes are none, autozero, lz4, or zlib.
433 When zlib is used the compression level can be set.
434 The default will be 6 which is the best trade-off between performance and
435 time.
436 .Pp
437 newfs_hammer2 will set the default compression to lz4 which prioritizes
438 speed over performance.
439 Also note that HAMMER2 contains a heuristic and will not attempt to
440 compress every block if it detects a sufficient amount of uncompressable
441 data.
442 .Pp
443 Hammer2 compression is only effective when it can reduce the size of dataset
444 (typically a 64KB block) by one or more powers of 2.  A 64K block which
445 only compresses to 40K will not yield any storage improvement.
446 .Pp
447 Generally speaking you do not want to set the compression mode to
448 .Sq none ,
449 as this will cause blocks of all-zeros to be written as all-zero blocks,
450 instead of holes.
451 The
452 .Sq autozero
453 compression mode detects blocks of all-zeros
454 and writes them as holes.
455 .\" ==== setcheck ====
456 .It Cm setcheck Ar check Ar path...
457 Set the check code as specified for any newly created elements at or under
458 the path if not overridden by deeper elements.
459 Available codes are default, disabled, crc32, xxhash64, or sha192.
460 .Pp
461 Normally HAMMER2 does not overwrite data blocks on the media in order
462 to ensure snapshot integrity.  Replacement data blocks will be reallocated.
463 However, if the compression mode is set to
464 .Sq none
465 and the check code is set to
466 .Sq disabled
467 HAMMER2 will overwrite data on the media in-place.
468 In this mode of operation,
469 snapshots will not be able to snapshot the data against later changes
470 made to the file, and de-duplication will no longer function on any
471 data related to the file.
472 However, you can still recover the most recent data from previously
473 taken snapshots if you accidentally remove the file.
474 .\" ==== clrcheck ====
475 .It Cm clrcheck Op path...
476 Clear the check code override for the specified paths.
477 Overrides may still be present in deeper elements.
478 .\" ==== setcrc32 ====
479 .It Cm setcrc32 Op path...
480 Set the check code to the ISCSI 32-bit CRC for any newly created elements
481 at or under the path if not overridden by deeper elements.
482 .\" ==== setxxhash64 ====
483 .It Cm setxxhash64 Op path...
484 Set the check code to XXHASH64, a fast 64-bit hash
485 .\" ==== setsha192 ====
486 .It Cm setsha192 Op path...
487 Set the check code to SHA192 for any newly created elements at or under
488 the path if not overridden by deeper elements.
489 .\" ==== bulkfree ====
490 .It Cm bulkfree Ar path
491 Run a bulkfree pass on a HAMMER2 mount.
492 You can specify any PFS for the mount, the bulkfree pass is run on the
493 entire partition.
494 Note that it takes two passes to actually free space.
495 By default this directive will use up to 1/16 physical memory to track
496 the freemap.
497 The amount of memory used may be overridden with the
498 .Op Fl m Ar mem
499 option.
500 .\" ==== printinode ====
501 .It Cm printinode Ar path
502 Dump inode.
503 .\" ==== dumpchain ====
504 .It Cm dumpchain Op path Op chnflags
505 Dump in-memory chain topology.
506 .El
507 .Sh SYSCTLS
508 .Bl -tag -width indent
509 .It Va vfs.hammer2.dedup_enable (default on)
510 Enables live de-duplication.
511 Any recently read data that is on-media
512 (already synchronized to media) is tested against pending writes for
513 compatibility.
514 If a match is found, the write will reference the
515 existing on-media data instead of writing new data.
516 .It Va vfs.hammer2.always_compress (default off)
517 This disables the H2 compression heuristic and forces H2 to always
518 try to compress data blocks, even if they look uncompressable.
519 Enabling this option reduces performance but has higher de-duplication
520 repeatability.
521 .It Va vfs.hammer2.cluster_data_read (default 4)
522 .It Va vfs.hammer2.cluster_meta_read (default 1)
523 Set the amount of read-ahead clustering to perform on data and meta-data
524 blocks.
525 .It Va vfs.hammer2.cluster_write (default 0)
526 Set the amount of write-behind clustering to perform in buffers.
527 Each buffer represents 64KB.
528 The default is 4 and higher values typically do not improve performance.
529 A value of 0 disables clustered writes.
530 This variable applies to the underlying media device, not to logical
531 file writes, so it should not interfere with temporary file optimization.
532 Generally speaking you want this enabled to generate smoothly pipelined
533 writes to the media.
534 .It Va vfs.hammer2.bulkfree_tps (default 5000)
535 Set bulkfree's maximum scan rate.
536 This is primarily intended to limit
537 I/O utilization on SSDs and CPU utilization when the meta-data is mostly
538 cached in memory.
539 .El
540 .Sh SETTING UP /etc/hammer2
541 The
542 .Sq rsainit
543 directive will create the
544 .Pa /etc/hammer2
545 directory with appropriate permissions and also generate a public key
546 pair in this directory for the machine.
547 These files will be
548 .Pa rsa.pub
549 and
550 .Pa rsa.prv
551 and needless to say, the private key shouldn't leave the host.
552 .Pp
553 The service daemon will also scan the
554 .Pa /etc/hammer2/autoconn
555 file which contains a list of hosts which it will automatically maintain
556 connections to to form your cluster.
557 The service daemon will automatically reconnect on any failure and will
558 also monitor the file for changes.
559 .Pp
560 When the service daemon receives a connection it expects to find a
561 public key for that connection in a file in
562 .Pa /etc/hammer2/remote/
563 called
564 .Pa <IPADDR>.pub .
565 You normally copy the
566 .Pa rsa.pub
567 key from the host in question to this file.
568 The IP address must match exactly or the connection will not be allowed.
569 .Pp
570 If you want to use an unencrypted connection you can create empty,
571 dummy files in the remote directory in the form
572 .Pa <IPADDR>.none .
573 We do not recommend using unencrypted connections.
574 .Sh CLUSTER SERVICES
575 Currently there are two services which use the cluster network infrastructure,
576 HAMMER2 mounts and XDISK.
577 Any HAMMER2 mount will make all PFSs for that filesystem available to the
578 cluster.
579 And if the XDISK kernel module is loaded, the hammer2 service daemon will make
580 your machine's block devices available to the cluster (you must load the
581 xdisk.ko kernel module before starting the hammer2 service).
582 They will show up as
583 .Pa /dev/xa*
584 and
585 .Pa /dev/serno/*
586 devices on the remote machines making up the cluster.
587 Remote block devices are just what they appear to be... direct access to a
588 block device on a remote machine.
589 If the link goes down remote accesses
590 will stall until it comes back up again, then automatically requeue any
591 pending I/O and resume as if nothing happened.
592 However, if the server hosting the physical disks crashes or is rebooted,
593 any remote opens to its devices will see a permanent I/O failure requiring a
594 close and open sequence to re-establish.
595 The latter is necessary because the server's drives might not have committed
596 the data before the crash, but had already acknowledged the transfer.
597 .Pp
598 Data commits work exactly the same as they do for real block devices.
599 The originater must issue a BUF_CMD_FLUSH.
600 .Sh ADDING A NEW MASTER TO A CLUSTER
601 When you
602 .Xr newfs_hammer2 8
603 a HAMMER2 filesystem or use the
604 .Sq pfs-create
605 directive on one already mounted
606 to create a new PFS, with no special options, you wind up with a PFS
607 typed as a MASTER and a unique cluster UUID, but because there is only one
608 PFS for that cluster (for each PFS you create via pfs-create), it will
609 act just like a normal filesystem would act and does not require any special
610 protocols to operate.
611 .Pp
612 If you use the
613 .Sq pfs-create
614 directive along with the
615 .Fl u
616 option to specify a cluster UUID that already exists in the cluster,
617 you are adding a PFS to an existing cluster and this can trigger a whole
618 series of events in the background.
619 When you specify the
620 .Fl u
621 option in a
622 .Sq pfs-create ,
623 .Nm
624 will by default create a SLAVE PFS.
625 In fact, this is what must be created first even if you want to add a new
626 MASTER to your cluster.
627 .Pp
628 The most common action a system admin will want to take is to upgrade or
629 downgrade a PFS.
630 A new MASTER can be added to the cluster by upgrading an existing SLAVE
631 to MASTER.
632 A MASTER can be removed from the cluster by downgrading it to a SLAVE.
633 Upgrades and downgrades will put nodes in the cluster in a transition state
634 until the operation is complete.
635 For downgrades the transition state is fleeting unless one or more other
636 masters has not acknowledged the change.
637 For upgrades a background synchronization process must complete before the
638 transition can be said to be complete, and the node remains (really) a SLAVE
639 until that transition is complete.
640 .Sh USE CASES FOR A SOFT_MASTER
641 The SOFT_MASTER PFS type is a special type which must be specifically
642 mounted by a machine.
643 It is a R/W mount which does not use the quorum protocol and is not
644 cache coherent with the cluster, but which synchronizes from the cluster
645 and allows modifying operations which will synchronize to the cluster.
646 The most common case is to use a SOFT_MASTER PFS in a laptop allowing you
647 to work on your laptop when you are on the road and not connected to
648 your main servers, and for the laptop to synchronize when a connection is
649 available.
650 .Sh USE CASES FOR A SOFT_SLAVE
651 A SOFT_SLAVE PFS type is a special type which must be specifically mounted
652 by a machine.
653 It is a RO mount which does not use the quorum protocol and is not
654 cache coherent with the cluster.
655 It will receive synchronization from
656 the cluster when network connectivity is available but will not stall if
657 network connectivity is lost.
658 .Sh FSYNC FLUSH MODES
659 TODO.
660 .Sh RESTORING FROM A SNAPSHOT BACKUP
661 TODO.
662 .Sh PERFORMANCE TUNING
663 Because HAMMER2 implements compression, decompression, and dedup natively,
664 it always double-buffers file data.
665 This means that the file data is
666 cached via the device vnode (in compressed / dedupped-form) and the same
667 data is also cached by the file vnode (in decompressed / non-dedupped form).
668 .Pp
669 While HAMMER2 will try to age the logical file buffers on its, some
670 additional performance tuning may be necessary for optimal operation
671 whether swapcache is used or not.
672 Our recommendation is to reduce the
673 number of vnodes (and thus also the logical buffer cache behind the
674 vnodes) that the system caches via the
675 .Va kern.maxvnodes
676 sysctl.
677 .Pp
678 Too-large a value will result in excessive double-caching and can cause
679 unnecessary read disk I/O.
680 We recommend a number between 25000 and 250000 vnodes, depending on your
681 use case.
682 Keep in mind that even though the vnode cache is smaller, this will make
683 room for a great deal more device-level buffer caching which can encompasses
684 far more data and meta-data than the vnode-level caching.
685 .Sh ENVIRONMENT
686 TODO.
687 .Sh FILES
688 .Bl -tag -width ".It Pa <fs>/abc/defghi/<name>" -compact
689 .It Pa /etc/hammer2/
690 .It Pa /etc/hammer2/rsa.pub
691 .It Pa /etc/hammer2/rsa.prv
692 .It Pa /etc/hammer2/autoconn
693 .It Pa /etc/hammer2/remote/<IP>.pub
694 .It Pa /etc/hammer2/remote/<IP>.none
695 .El
696 .Sh EXIT STATUS
697 .Ex -std
698 .Sh SEE ALSO
699 .Xr periodic.conf 5 ,
700 .Xr mount_hammer2 8 ,
701 .Xr mount_null 8 ,
702 .Xr newfs_hammer2 8 ,
703 .Xr swapcache 8 ,
704 .Xr sysctl 8
705 .Sh HISTORY
706 The
707 .Nm
708 utility first appeared in
709 .Dx 4.1 .
710 .Sh AUTHORS
711 .An Matthew Dillon Aq Mt dillon@backplane.com