dragonfly.git
12 years agorp(4): Fix indent.
Sascha Wildner [Sat, 31 Mar 2012 02:44:50 +0000 (04:44 +0200)]
rp(4): Fix indent.

12 years agopcn(4): Add missing braces.
Sascha Wildner [Sat, 31 Mar 2012 02:10:59 +0000 (04:10 +0200)]
pcn(4): Add missing braces.

12 years agolgue(4): Add missing braces and fix indentation.
Sascha Wildner [Sat, 31 Mar 2012 01:46:53 +0000 (03:46 +0200)]
lgue(4): Add missing braces and fix indentation.

It was returning too early in some cases.

While here, add an error message.

12 years agokernel/netgraph7: Fix whitespace.
Sascha Wildner [Sat, 31 Mar 2012 01:30:32 +0000 (03:30 +0200)]
kernel/netgraph7: Fix whitespace.

12 years agokernel: Indent a debugging kprintf.
Sascha Wildner [Sat, 31 Mar 2012 01:30:07 +0000 (03:30 +0200)]
kernel: Indent a debugging kprintf.

12 years agohptiop(4): Add missing braces.
Sascha Wildner [Sat, 31 Mar 2012 01:26:52 +0000 (03:26 +0200)]
hptiop(4): Add missing braces.

12 years agokernel: Adjust some casts.
Sascha Wildner [Sat, 31 Mar 2012 01:20:34 +0000 (03:20 +0200)]
kernel: Adjust some casts.

12 years agoKernel - Completely remove DFLTPHYS
François Tigeot [Thu, 22 Mar 2012 18:17:48 +0000 (19:17 +0100)]
Kernel - Completely remove DFLTPHYS

* There is no need to have two different macros define the maximum
  allowed IO size for low-level operations; replace DFLTPHYS by
  MAXPHYS in the entire kernel.

* Old drivers typically used DFLTPHYS without a second thought,
  assuming it would always be the same value; they may have hard
  limitations and break if bigger I/O sizes are suddenly used.
  Be sure to explicitely limit their maximum allowed I/O size to
  64KB and keep them working.

12 years agortld: allocate obj->vertab only once
John Marino [Fri, 30 Mar 2012 18:07:35 +0000 (20:07 +0200)]
rtld: allocate obj->vertab only once

Verbatim from FreeBSD SVN 233546 (27 MAR 2012)

Prevent rtld_verify_object_versions() from being called several times for
the same object. This can happen when object is a dependency of the
dlopen()ed dso. When called several times, we waste time due to unneeded
processing, and memory, because obj->vertab is allocated anew on each
iteration.

12 years agoVFS accounting: do not count write operations for removed files
Francois Tigeot [Fri, 30 Mar 2012 08:52:07 +0000 (10:52 +0200)]
VFS accounting: do not count write operations for removed files

* vnode operations can and do happen out-of-order in some circumstances
  (multi-job builds with make for example)

* check if the vnode has at least one associated link to be sure it
  still corresponds to an existing file

* do not count the write operation if this is not the case

12 years agomfiutil(8): Fix some 'unused variable' warnings and raise WARNS to 6.
Sascha Wildner [Fri, 30 Mar 2012 16:38:54 +0000 (18:38 +0200)]
mfiutil(8): Fix some 'unused variable' warnings and raise WARNS to 6.

12 years agorwhod(8): Prevent clobbering the neighboring field by a wrong cast.
Sascha Wildner [Fri, 30 Mar 2012 16:36:50 +0000 (18:36 +0200)]
rwhod(8): Prevent clobbering the neighboring field by a wrong cast.

The time stamps in the rwhod(8) network datagram and, based on that,
/var/rwho/whod.* spool files are typed as 32bit int and cannot accept
a 64bit time_t.

The old code clobbered the first bytes of the adjacent "hostname"
field, yielding empty hostnames in local rwho(1) and ruptime(1) output.
(Outgoing datagrams to other hosts were not affected.)

Re-code to let the compiler do the proper coercion (well, until 2038).

Submitted-by: Martin Neitzel
Dragonfly-bug: <https://bugs.dragonflybsd.org/issues/2339>

12 years agoVFS accounting: small speed optimization
Francois Tigeot [Wed, 28 Mar 2012 11:52:36 +0000 (13:52 +0200)]
VFS accounting: small speed optimization

* Some operations may end up using the accounting macro with an
  effective zero bytes space usage difference

* Avoid calling the whole mess and its associated mount-point spinlock
  in that case.

12 years agokernel -- ffs: Do not dereference NULL inodes in ffs_sync_scan1.
Venkatesh Srinivas [Fri, 30 Mar 2012 06:33:08 +0000 (23:33 -0700)]
kernel -- ffs: Do not dereference NULL inodes in ffs_sync_scan1.

ffs_sync_scan1 is a fast callback from vmntvnodescan; it is not called
with vnodes locked. It is possible for an ffs_reclaim to have reclaimed
the vnode in question, NULL-ing out ip, without having removed the vnode
from the per-mount list. If we see a NULL inode, return failure from the
fast callback.

12 years agokern.cp_time - Add convenience defines
Samuel J. Greear [Fri, 30 Mar 2012 03:27:09 +0000 (21:27 -0600)]
kern.cp_time - Add convenience defines

* Add convenience defines for indexes of the array returned by the kern.cp_time
  sysctl.

* This sync's us with FreeBSD and should un-break and couple of pkgsrc
  packages.

12 years agomfi(4): Update to LSI's version 4.23 of the driver.
Sascha Wildner [Thu, 29 Mar 2012 18:05:12 +0000 (20:05 +0200)]
mfi(4): Update to LSI's version 4.23 of the driver.

Brings in support for newer SAS2208 (aka Thunderbolt) based
controllers. It was tested with an Intel RS25DB080.

A few other things have been fixed too. Most x86_64/i386 specific
parts have been merged, MSI is now setup in mfi_pci.c properly.

Taken-from: FreeBSD (from their projects/ repository)

12 years agopuffs_framebuf.3: Fix typo
Sascha Wildner [Thu, 29 Mar 2012 14:13:56 +0000 (16:13 +0200)]
puffs_framebuf.3: Fix typo

12 years agopuffs_ops.3: Fix typo.
Sascha Wildner [Thu, 29 Mar 2012 13:25:12 +0000 (15:25 +0200)]
puffs_ops.3: Fix typo.

12 years agokernel -- ffs: Replace softupdates critical section locks with lockmgr.
Venkatesh Srinivas [Wed, 28 Mar 2012 18:09:15 +0000 (11:09 -0700)]
kernel -- ffs: Replace softupdates critical section locks  with lockmgr.

ffs softupdates was using a combination of critical sections and the mplock
to construct its acquire_lock/free_lock/interlocked_sleep primitives.

The softupdates I/O completion callback had a few points where it could block,
causing it to lose the mplock and any critical sections it held. When it did
so, front-end softupdates code would try to grab the lock but panic on seeing
the I/O completion callback in progress. This was not a problem in older
systems, as splx() would prevent the I/O callback from starting while
softdep code was executing.

This patch converts to using hard locks (lockmgr), which are held even while
a thread is blocked.

getdirtybuf(), locking a dirty buffer via BUF_LOCK, was changed to not
deadlock against the I/O completion path; specifically it drops the softdep
lock when its non-blocking attempt to lock a dirty buffer fails. One caller
of getdirtybuf() also required changes to retry locking buffers.

Closes-bug: 2291
Partially-from: FreeBSD r140709
Reported-by: tuxillo, marino, Rumko, vsrinivas
Discussed-with: dillon

12 years agoVFS accounting: use vq_vptomp() in kern_ftruncate()
Francois Tigeot [Wed, 28 Mar 2012 11:22:56 +0000 (13:22 +0200)]
VFS accounting: use vq_vptomp() in kern_ftruncate()

* Getting the needed struct mp* from curthread is not a good idea,
  the chain of dependencies is complex and may cause problems.

* Use vq_vptomp() to get it from the vnode we're using instead.

12 years agonetstat: Print SACK related statistics
Sepherosa Ziehau [Wed, 28 Mar 2012 03:23:36 +0000 (11:23 +0800)]
netstat: Print SACK related statistics

While I'm here, indent syncookie statistics into syncache statistics block.

12 years agotcp/sack: Add more statistics
Sepherosa Ziehau [Tue, 27 Mar 2012 01:54:55 +0000 (09:54 +0800)]
tcp/sack: Add more statistics

12 years agokernel - Revert 0d52e78c527ec7ba3ac62d40d9fa588c964d4c55
Matthew Dillon [Wed, 28 Mar 2012 02:11:22 +0000 (19:11 -0700)]
kernel - Revert 0d52e78c527ec7ba3ac62d40d9fa588c964d4c55

* Revert allowance of spinlocks when doing a lockmgr LK_RELEASE operation.
  Spinlocks must not be allowed for release operations due to the possibility
  of a livelock in the IPI code if wakeup() is called.

12 years agokernel - Fix improper BUF_UNLOCK() with spinlock held
Matthew Dillon [Wed, 28 Mar 2012 02:10:14 +0000 (19:10 -0700)]
kernel - Fix improper BUF_UNLOCK() with spinlock held

* Fix improper BUF_UNLOCK()s in the buf daemon threads.  Use a
  marker and rearrange the code to release the spinlock before
  executing BUF_UNLOCK().

12 years agokernel -- DEBUG_LOCKS: Do not panic if releasing a lockmgr lock w/ spinlocks held.
Venkatesh Srinivas [Tue, 27 Mar 2012 14:55:17 +0000 (07:55 -0700)]
kernel -- DEBUG_LOCKS: Do not panic if releasing a lockmgr lock w/ spinlocks held.

12 years agomountlist_exists(): use a TAILQ_FOREACH macro again
Francois Tigeot [Mon, 26 Mar 2012 17:58:30 +0000 (19:58 +0200)]
mountlist_exists(): use a TAILQ_FOREACH macro again

Removing a few lines of code in the process.

12 years agokernel: msdosfs -- Use -1 rather than 32-bit 0xffffffff in mount().
Venkatesh Srinivas [Mon, 26 Mar 2012 15:59:02 +0000 (08:59 -0700)]
kernel: msdosfs -- Use -1 rather than 32-bit 0xffffffff in mount().

Corrects bug mounting 8GB msdosfs filesystem on x86-64.

Submitted-by: G. Isenmann
12 years agotcp: Properly update tcps_rttcantdetect
Sepherosa Ziehau [Mon, 26 Mar 2012 05:39:10 +0000 (13:39 +0800)]
tcp: Properly update tcps_rttcantdetect

- Fix the logic which detects that RTT based spurious retransmition
  detection does not work.
- Add missing tcps_rttcantdetect updating in header prediction code

12 years agonetstat: Print the statistics that Eifel works but RTT based spurious rexmt not
Sepherosa Ziehau [Mon, 26 Mar 2012 05:37:46 +0000 (13:37 +0800)]
netstat: Print the statistics that Eifel works but RTT based spurious rexmt not

12 years agotcp/sack: Prevent invalid SACK option from being processed
Sepherosa Ziehau [Mon, 26 Mar 2012 03:36:53 +0000 (11:36 +0800)]
tcp/sack: Prevent invalid SACK option from being processed

If the received SACK blocks contain one invalid SACK block,
discard the whole SACK blocks.

12 years agoacpi_hp(4): Fix acquisition of acpi's softc.
Sascha Wildner [Sun, 25 Mar 2012 12:34:03 +0000 (14:34 +0200)]
acpi_hp(4): Fix acquisition of acpi's softc.

Now that acpi_hp is acpi_wmi's child, the softc must be taken from
its grandparent (acpi).

This fixes a crash in the setup of the sysctl tree.

Reported-by: tuxillo
12 years agortld: Sync memory allocation with FreeBSD
John Marino [Sun, 25 Mar 2012 10:49:17 +0000 (12:49 +0200)]
rtld: Sync memory allocation with FreeBSD

Taken from:
FreeBSD SVN 233306 (22 March 2012)
FreeBSD SVN 233307 (22 March 2012)
FreeBSD SVN 233357 (22 March 2012)

Remove unused CalTech #ifdef fragments.

Use xmalloc() instead of malloc() in the places where malloc() calls
are assumed to not fail. Make the xcalloc() calling conventions follow
the calloc(3) calling conventions and replace unchecked calls to calloc()
with calls to xcalloc(). Remove redundand declarations from xmalloc.c,
which are already present in rtld.h.

Implement xstrdup() using strlen()/xmalloc()/memcpy() already presented
in rtld, instead of pulling in libc strdup().

12 years agortld: Fix ELF filter implementation
John Marino [Sun, 25 Mar 2012 10:28:13 +0000 (12:28 +0200)]
rtld: Fix ELF filter implementation

Vertatim from FreeBSD SVN 233231 (20 March 2012):

Do not relocate twice an object which happens to be needed by loaded
binary (or dso) and some filtee opened due to symbol resolution when
relocating need objects.  Record the state of the relocation
processing in Obj_Entry and short-circuit relocate_objects() if
current object already processed.

Do not call constructors for filtees loaded during the early
relocation processing before image is initialized enough to run
user-provided code.  Filtees are loaded using dlopen_object(), which
normally performs relocation and initialization.  If filtee is
lazy-loaded during the relocation of dso needed by the main object,
dlopen_object() runs too earlier, when most runtime services are not
yet ready.

Postpone the constructors call to the time when main binary and
depended libraries constructors are run, passing the new flag
RTLD_LO_EARLY to dlopen_object().  Symbol lookups callers inform
symlook_* functions about early stage of initialization with
SYMLOOK_EARLY.  Pass flags through all functions participating in
object relocation.

Use the opportunity and fix flags argument to find_symdef() in
arch-specific reloc.c to use proper name SYMLOOK_IN_PLT instead of
true, which happen to have the same numeric value.

12 years agoVFS accounting: use an explicit TAILQ_FIRST/TAILQ_NEXT loop in mountlist_exists()
Francois Tigeot [Sun, 25 Mar 2012 10:38:51 +0000 (12:38 +0200)]
VFS accounting: use an explicit TAILQ_FIRST/TAILQ_NEXT loop in mountlist_exists()

The previous TAILQ_FOREACH loop body was never executed

12 years agoVFS accounting: do not set vp->v_pfsmp for non-nullfs mounts
Francois Tigeot [Sun, 25 Mar 2012 08:27:07 +0000 (10:27 +0200)]
VFS accounting: do not set vp->v_pfsmp for non-nullfs mounts

* the test in _cache_setvp() was wrong and was initializing a pfs-specific
  accounting variable in vnodes for all filesystem types, possibly causing
  unnecessary work for each filesystem write operation.

12 years agodefaults: remove /usr/lib/gcc* from ldconfig search path
John Marino [Sat, 24 Mar 2012 08:55:38 +0000 (09:55 +0100)]
defaults: remove /usr/lib/gcc* from ldconfig search path

It is not necessary for ldconfig to add /usr/lib/gcc44 and /usr/lib/gcc41
directories to the default library search path.  Every binary built with
gcc41 and gcc44 embeds these paths into the DT_RPATH dynamic tag which
tells the runtime linker to look their first.  In effect, this means these
paths are potentially searched multiple times: once due to the rpath and
again due to the ldconfig hints file.  Let's do away will the redundant,
always-fails check here.

Another reason is that the gcc libraries have different versions of the
same libraries.  Surely the gcc41 version isn't preferred over the gcc44
version, but it gets searched first.  Again, let rpath take care of this
for gcc.

To update the rc.conf defaults, "make upgrade" after building world is
required.

12 years agogcc41: remove /usr/lib from rpath
John Marino [Sat, 24 Mar 2012 08:14:15 +0000 (09:14 +0100)]
gcc41: remove /usr/lib from rpath

The gcc41 specs were unconditionally adding /usr/lib to the rpath, making
it impossible to use the -z nodefaultlibs linker flag.  RTLD will look in
/usr/lib by default as the last priority of the library search path as
long as the object wasn't built with -z nodefaultlibs.

Also the __DragonFly__ macro was bumped from 1 to 3.  It's supposed to
reflect the major version of DragonFly.

12 years agogcc44: remove /usr/lib from rpath
John Marino [Sat, 24 Mar 2012 08:08:48 +0000 (09:08 +0100)]
gcc44: remove /usr/lib from rpath

The gcc44 specs were unconditionally adding /usr/lib to the rpath, making
it impossible to use the -z nodefaultlibs linker flag.  RTLD will look in
/usr/lib by default as the last priority of the library search path as
long as the object wasn't built with -z nodefaultlibs.

12 years agortld: Implement DT_RUNPATH and -z nodefaultlib
John Marino [Sat, 24 Mar 2012 05:40:50 +0000 (06:40 +0100)]
rtld: Implement DT_RUNPATH and -z nodefaultlib

DT_RUNPATH is incorrectly being considered as an alias of DT_RPATH.  The
purpose of DT_RUNPATH is to have two different types of rpath: one that
can be overridden by the environment variable LD_LIBRARY_PATH and one that
can't.  With the currently implementation, LD_LIBRARY_PATH will always
trump any embedded rpath or runpath tags.

Current path search order by rtld:
==================================
LD_LIBRARY_PATH
DT_RPATH / DT_RUNPATH (always the same)
ldconfig hints file (default: /var/run/ld-elf.so.hints)
/usr/lib

New path search order by rtld:
==============================
DT_RPATH of the calling object if no DT_RUNPATH
DT_RPATH of the main binary if no DT_RUNPATH and binary isn't calling obj
LD_LIBRARY_PATH
DT_RUNPATH
ldconfig hints file
/usr/lib

The new path search matches how the linux runtime loader works.  The other
major added feature is support for linker flag "-z nodefaultlib".  When
this flag is passed to the linker, rtld will skip all references to the
standard library search path ("/usr/lib" in this case but it could handle
more color delimited paths) except in DT_RPATH and DT_RUNPATH.

New path search order by rtld with -z nodefaultlib flag set:
============================================================
DT_RPATH of the calling object if no DT_RUNPATH
DT_RPATH of the main binary if no DT_RUNPATH and binary isn't calling obj
LD_LIBRARY_PATH
DT_RUNPATH
ldconfig hints file (skips all references to /usr/lib)

Currently gcc41 and gcc44 are embedding /usr/lib directly in every
DT_RPATH tag of every binary and shared library it creates.  This is
both unnecessary due to rtld default search path order and it also
defaults the purpose of -z nodefaultlib, so this behavior must be
changed before the flag works.  This will be done in a separate commit.

12 years agoELF: Update header, sync with binutils 2.22
John Marino [Tue, 20 Mar 2012 18:40:41 +0000 (19:40 +0100)]
ELF: Update header, sync with binutils 2.22

12 years agoVFS accounting: fix an issue with unlink operations
Francois Tigeot [Sat, 24 Mar 2012 12:40:27 +0000 (13:40 +0100)]
VFS accounting: fix an issue with unlink operations

* Space counters were previously decreased for every unlink(2)
  on regular files.

* They are only updated for the last link now

12 years agovquota(8): Only count files with more than 2 hard links once
Francois Tigeot [Sat, 24 Mar 2012 13:43:47 +0000 (14:43 +0100)]
vquota(8): Only count files with more than 2 hard links once

True, false, what's the difference ?

12 years agolibc - Do not allow a stuck syslogd to screw up the entire system
Matthew Dillon [Sat, 24 Mar 2012 00:33:51 +0000 (17:33 -0700)]
libc - Do not allow a stuck syslogd to screw up the entire system

* If syslogd gets stuck the socket buffer will still full forever.
  Only try writing a limited number of times before giving up.

12 years agokernel - Add workaround for errata #721 on AMD cpus (found by Matt Dillon)
Matthew Dillon [Fri, 23 Mar 2012 22:49:54 +0000 (15:49 -0700)]
kernel - Add workaround for errata #721 on AMD cpus (found by Matt Dillon)

* Official reference for errata 721:

    http://support.amd.com/us/Processor_TechDocs/41322_10h_Rev_Gd.pdf

* This is the cpu bug found by Matthew Dillon, present on all K10 cores
  (so far).  AMD has indicated that the bug is not present on Bulldozer
  cpus.

* The MSR workaround is now reported and programmed during kernel boot.

* No discernable difference in performance was detected running GCC
  with and without the MSR adjustment.

* Verified to have fixed our test case w/GCC.  It no longer seg-faults.

12 years agorpc.yppasswdd(8): Fix some warnings and raise WARNS to 5.
Sascha Wildner [Fri, 23 Mar 2012 21:06:37 +0000 (22:06 +0100)]
rpc.yppasswdd(8): Fix some warnings and raise WARNS to 5.

12 years agokernel - Improve NFS server error responses when an inode goes away
Matthew Dillon [Fri, 23 Mar 2012 20:38:29 +0000 (13:38 -0700)]
kernel - Improve NFS server error responses when an inode goes away

* When an inode goes away and FHTOVP fails return ESTALE instead of
  what the VFS returned.

* Greatly improves the re-acquisition of files on NFS clients which have
  been ripped out by the server or other clients.

12 years agokernel - Fix improper unlock/relock sequence in HAMMER
Matthew Dillon [Fri, 23 Mar 2012 20:36:27 +0000 (13:36 -0700)]
kernel - Fix improper unlock/relock sequence in HAMMER

* VOP_FSYNC() can be called during a vnode inactivation or reclaim.
  In this case the vnode lock absolutely cannot be released or it
  can create a window of opportunity for another thread that results
  in a panic.

* Fixes a NFS server crash when multiple clients are trying to
  delete/create/write the same file at the same time.

12 years agokernel - Fix bug in SILI, remove debugging in AHCI
Matthew Dillon [Fri, 23 Mar 2012 16:06:57 +0000 (09:06 -0700)]
kernel - Fix bug in SILI, remove debugging in AHCI

* Fix the same unlock/lock sequence bug in the SILI driver that was
  fixed in the AHCI driver.

* Remove a flag that was being added to the service set in AHCI for
  debugging purposes.

12 years agokernel - Fix another AHCI bug
Matthew Dillon [Fri, 23 Mar 2012 08:47:48 +0000 (01:47 -0700)]
kernel - Fix another AHCI bug

* Remove the unlock/lock sequences around the xpt_done() calls.  These
  temporary unlocks create a gap which can allow another interrupt to
  squeeze in and interfere with the interrupt thread that is already
  running, resulting in corruption.

  This bug occurs under very heavy loads, and typically required multiple
  concurrent ops to a SSD to trigger.

* Add additional assertions to catch issues and reorder one of the
  chiploads.

* This is a bit non-optimal, be on the lookout for deadlocks in case it
  turns out that holding the lock is a bad idea.

12 years agotcp/sack: Add comment about the implemented TCP/SACK related RFCs
Sepherosa Ziehau [Fri, 23 Mar 2012 06:48:26 +0000 (14:48 +0800)]
tcp/sack: Add comment about the implemented TCP/SACK related RFCs

12 years agokernel - Fix mount refs interactions and umount races
Matthew Dillon [Fri, 23 Mar 2012 04:37:25 +0000 (21:37 -0700)]
kernel - Fix mount refs interactions and umount races

* It is possible for a umount to race other operations on active mount
  point, causing one or the other to deadlock.

* vfs_busy()/vfs_unbusy() now incr/decr mp->mnt_refs.

* cache_findmount() now increments mp->mnt_refs, and add a new API
  function cache_dropmount() which decrements it.

12 years agokernel - Fix three AHCI bugs
Matthew Dillon [Fri, 23 Mar 2012 04:31:31 +0000 (21:31 -0700)]
kernel - Fix three AHCI bugs

* This fixes spurious timeouts which occur on SMP boxes with faster devices
  (such as SSDs or more recent hard drives)

* The global interrupt status register appears to be latched on some parts
  rather than wire-or.  Clearing it after signaling the port threads or
  processing the interrupt can cause interrupts to be lost.

* In cases where it is actually wire-or we may get a double-interrupt,
  but stability is more important here.

* Fix the port signaling code.  The mask was being cleared with the
  port interlock released.  It has to be cleared when the interlock is
  held.

* Reorder the per-port interrupt status register clearing code in two
  places to execute before processing the operation rather than after,
  which may fix another source of lost interrupts.

12 years agokernel - Cluster fixes + Enable clustering for HAMMER1
Matthew Dillon [Thu, 22 Mar 2012 23:45:55 +0000 (16:45 -0700)]
kernel - Cluster fixes + Enable clustering for HAMMER1

* Add cluster_awrite(), which replaces vfs_bio_awrite() and has the same
  basic semantics as bawrite().

* Remove vfs_bio_awrite(), which had an odd API that required the buffer
  to be locked but not removed from its queues.

* Make cluster operations work on disk device buffers as well as on
  regular files.

* Add a blkflags argument to getcacheblk(), allowing GETBLK_NOWAIT to
  be passed to it.

* Enhance cluster_wbuild() to support cluster_awrite() by having it take
  an optional bp to incorporate into the cluster.  The caller disposes of
  the bp by calling bawrite() if the cluster_wbuild() code could not use it.

* Certain adjustments to cluster_write() and related code in checking against
  the file EOF to not break when variable block sizes are used.

* Fix a bug in calls made to buf_checkwrite().  The caller is required to
  initiate the I/O if the function returns good (0).  HAMMER1 uses this
  save side effects and blows up if the I/O is then not initiated.

* Enable clustering in HAMMER1 for both data and meta-data.

12 years agokernel/kobj: Put the default kobj_method inside the kobjop_desc struct.
Sascha Wildner [Thu, 22 Mar 2012 18:35:13 +0000 (19:35 +0100)]
kernel/kobj: Put the default kobj_method inside the kobjop_desc struct.

Also, make kobj_methods constant. See FreeBSD's r227343 and r227384 for
more information.

This change reduces the size of a LINT64 kernel by 18KB and our source
by 7 lines!

Taken-from: FreeBSD

12 years agoVFS accounting: handle file truncation on open(2)
Francois Tigeot [Thu, 22 Mar 2012 16:51:47 +0000 (17:51 +0100)]
VFS accounting: handle file truncation on open(2)

* Files succesfully opened with O_TRUNC are truncated to zero length.
  This case was not previously handled, leading to a growing drift
  between VFS counters and reality.

* Fix a buildworld issue caused by the last VFS accounting commit

12 years agopstat.8: The fstat manpage is in section 1.
Sascha Wildner [Thu, 22 Mar 2012 15:50:05 +0000 (16:50 +0100)]
pstat.8: The fstat manpage is in section 1.

12 years agoVFS accounting: isolate the code to find the real mp
François Tigeot [Thu, 22 Mar 2012 12:48:33 +0000 (13:48 +0100)]
VFS accounting: isolate the code to find the real mp

* It was not specific to vop_write()

* Put it in a standalone vq_vptomp() function so that it may be easily
  used in other places

12 years agokernel - Add argument to nvtruncbuf()
Matthew Dillon [Tue, 20 Mar 2012 22:10:02 +0000 (15:10 -0700)]
kernel - Add argument to nvtruncbuf()

* Add a 'trivial' arg to nvtruncbuf() that works similarly to
  nvextendbuf().

  This will allow hammer2 to tell nvtruncbuf() not to mess with the
  buffer that overlaps EOF, so hammer2 can mess with it atomically.

12 years agompt(4): Fix an issue that caused the driver to attach to mfi(4) cards.
Sascha Wildner [Tue, 20 Mar 2012 20:19:25 +0000 (21:19 +0100)]
mpt(4): Fix an issue that caused the driver to attach to mfi(4) cards.

FreeBSD's commit message (r232411) explains it:

Fix a problem that was causing the mpt(4) driver to attach to MegaRAID
cards that should be handled by the mfi(4) driver.

The root of the problem is that the mpt(4) driver was masking off the
bottom bit of the PCI device ID when deciding which cards to attach to.

It appears that a number of the mpt(4) Fibre Channel cards had a LAN
variant whose PCI device ID was just one bit off from the FC card's device
ID.  The FC cards were even and the LAN cards were odd.

The problem was that this pattern wasn't carried over on the SAS and
parallel SCSI mpt(4) cards.  Luckily the SAS and parallel SCSI PCI device
IDs were either even numbers, or they would get masked to a supported
adjacent PCI device ID, and everything worked well.

Now LSI is using some of the odd-numbered PCI device IDs between the 3Gb
SAS device IDs for their new MegaRAID cards.  This is causing the mpt(4)
driver to attach to the RAID cards instead of the mfi(4) driver.

The solution is to stop masking off the bottom bit of the device ID, and
explicitly list the PCI device IDs of all supported cards.

This change should be a no-op for mpt(4) hardware.  The only intended
functional change is that for the 929X, the is_fc variable gets set.  It
wasn't being set previously, but needs to be because the 929X is a Fibre
Channel card.

12 years agoaesni(4): Move some unused variables into the #if 0'd parts.
Sascha Wildner [Tue, 20 Mar 2012 15:32:45 +0000 (16:32 +0100)]
aesni(4): Move some unused variables into the #if 0'd parts.

12 years agondis(4): Use the device_t for getting the softc.
Sascha Wildner [Tue, 20 Mar 2012 12:25:43 +0000 (13:25 +0100)]
ndis(4): Use the device_t for getting the softc.

12 years agokernel - Fix buffer cache deadlock due to multiple buffer cache sizes
Matthew Dillon [Tue, 20 Mar 2012 04:14:13 +0000 (21:14 -0700)]
kernel - Fix buffer cache deadlock due to multiple buffer cache sizes

* The buffer daemon was triggering off of dirtybufspace[hw], comparing
  it against bufspace.  However, bufspace is an aggregation of the
  total buffer kva reserved, not the dirty count based on b_bufsize.

* Add dirtykvasize to track the dirty space in terms of the kva reservation
  and change the buffer daemons to use that instead.

* systat and other displays still use the bufsize, which is a more
  accurate indicator for human consumption.

12 years agokernel - Fix clustered read bug (2)
Matthew Dillon [Tue, 20 Mar 2012 00:52:48 +0000 (17:52 -0700)]
kernel - Fix clustered read bug (2)

* Fix an edge case that can cause hammer1 to panic.  The read-ahead
  must not go past the filesize limit.  HAMMER1 uses this to
  implement two different logical buffer sizes for regular files.

12 years agokernel - Fix clustered read bug
Matthew Dillon [Tue, 20 Mar 2012 00:11:09 +0000 (17:11 -0700)]
kernel - Fix clustered read bug

* cluster_read() was improperly reducing the 'maxra' variable when
  handling the read-ahead mark, creating a degenerate situation which
  would cause only the first few burst reads from a file to cluster,
  and the remainder to read-ahead but not cluster.

12 years agodma.8: Avoid a dead link in the online manual pages.
Sascha Wildner [Mon, 19 Mar 2012 21:08:36 +0000 (22:08 +0100)]
dma.8: Avoid a dead link in the online manual pages.

For the purposes of the manpage, referring to sendmail(8) (where a
manual page is available) alone is enough.

Reported-by: Loganaden Velvindron
12 years agokernel: Remove two unneeded inclusions of <sys/cdefs.h>.
Sascha Wildner [Mon, 19 Mar 2012 19:31:13 +0000 (20:31 +0100)]
kernel: Remove two unneeded inclusions of <sys/cdefs.h>.

12 years agotcp/md5sig: White space and indentation cleanup
Sepherosa Ziehau [Mon, 19 Mar 2012 06:33:45 +0000 (14:33 +0800)]
tcp/md5sig: White space and indentation cleanup

12 years agokernel/acpi: Add a missing file to the module.
Sascha Wildner [Sun, 18 Mar 2012 22:30:50 +0000 (23:30 +0100)]
kernel/acpi: Add a missing file to the module.

Reported-by: tuxillo
12 years ago<sys/gmon.h>: Add prototypes for moncontrol() and monstartup().
Sascha Wildner [Sun, 18 Mar 2012 12:31:33 +0000 (13:31 +0100)]
<sys/gmon.h>: Add prototypes for moncontrol() and monstartup().

12 years ago<uuid.h>: Add four missing prototypes.
Sascha Wildner [Sun, 18 Mar 2012 11:25:26 +0000 (12:25 +0100)]
<uuid.h>: Add four missing prototypes.

For uuid_enc_le(), uuid_dec_le(), uuid_enc_be() and uuid_dec_be().

While here, do a little whitespace cleanup.

Taken-from: FreeBSD

12 years ago<sys/socket.h>: Add missing prototype for sockatmark().
Sascha Wildner [Sun, 18 Mar 2012 12:29:24 +0000 (13:29 +0100)]
<sys/socket.h>: Add missing prototype for sockatmark().

12 years agoopieinfo(1): Raise WARNS to 1.
Sascha Wildner [Sun, 18 Mar 2012 09:50:47 +0000 (10:50 +0100)]
opieinfo(1): Raise WARNS to 1.

12 years agortld: fixing bad patch
John Marino [Sun, 18 Mar 2012 02:30:43 +0000 (03:30 +0100)]
rtld: fixing bad patch

This code should have been part of the last rtld commit, but apparently
the wrong patch was committed.

12 years agocrtstuff: Stop calling _init/_fini methods on dyn binaries
John Marino [Sat, 17 Mar 2012 19:05:10 +0000 (20:05 +0100)]
crtstuff: Stop calling _init/_fini methods on dyn binaries

The runtime linker has already been modified to add the ability to call
_init and _fini methods on the main executable.  Previously it would
only do this for shared libraries.

A new ELF note with value 0x20 is added to signify that the crt code
no longer calls these methods so that rtld will know that it needs
to do it.  The name of the note section has been changed from
.note.ABI-tag to .note.tag.  There was an option to put the two notes
each in their own section, or put both notes in the same section.  The
latter was selected.  Since the second note is not an ABI-tag, the
section was simply renamed.  This doesn't cause any issues.

Taken from: FreeBSD SVN 232832 (2012-03-11)

12 years agortld: Add main object initialization and finalization
John Marino [Sat, 17 Mar 2012 18:52:17 +0000 (19:52 +0100)]
rtld: Add main object initialization and finalization

Since DragonFly's inception, crt1 has called _init and _fini functions of
the binary rather than leaving this task to the runtime linker.  Likely
this was done in order to use the same crt code for both statically and
dynamically linked binaries.

When FreeBSD imported DragonFly's preinit, init, and fini array handling
code, they moved the _init and _fini calls to rtld.  In order for rtld to
maintain compatiblity with binaries created with crt code that call these
functions, rtld looks for an ELF note that indicates the binary was built
with a crt that does not call _init and _fini.

This commit imports this capability as well as synchronizes some of the
changes FreeBSD made to the DragonFly code.  Many of the differences
weren't necessary, but some represented improvements.  In any case, it
benefits both operating systems to minimize the differences between the
runtime linkers in order to continue to collaborate and share new
features.

Taken from: FreeBSD SVN 232831 (2012-03-11)

One key difference between the DragonFly and FreeBSD implementations is
that FreeBSD will not properly execute a binary that requires
initialization and/or finalization if the PT_NOTE program header is
intentionally omitted using a custom linker script and the PHDRS
directive.  In the same case, DragonFly will look to see if the main
binary contains a gnu hash dynamic tag.  If it does, it assumes the binary
was built with the new crt, which is a very good assumption.  Since gnu
hash was inserted by default into binaries only a week ago, there's only
a window of few days where this isn't true, and PT_NOTE-free binaries are
very rare.

12 years agocrtstuff: refactor
John Marino [Sat, 17 Mar 2012 15:37:14 +0000 (16:37 +0100)]
crtstuff: refactor

Add common/initfini.c file to provide common prototypes and functions
to all DragonFly arches, particularly focusing on the various types
of initialization and finalization.

12 years agocrtstuff: Move ELF note definitions to dedicated header
John Marino [Sat, 17 Mar 2012 11:15:04 +0000 (12:15 +0100)]
crtstuff: Move ELF note definitions to dedicated header

Currently only note.ABI-tag is defined in crt files for the purpose
of identifying the operating system and version that created the binary.
Soon a new type of note will be created to indicate whether crt is
responsible for calling the _init function or not.  Creating a separate
header avoids duplicate note definitions.

12 years agocrtstuff: Move 6 identical sed patterns to variable
John Marino [Sat, 17 Mar 2012 10:45:02 +0000 (11:45 +0100)]
crtstuff: Move 6 identical sed patterns to variable

This note.ABI-tag pattern will be changed in an upcoming commit.
Taken from: FreeBSD SVN 232832 (2012-03-11)

12 years agortld: Don't use toupper function in rtld_printf.c
John Marino [Sat, 17 Mar 2012 10:23:45 +0000 (11:23 +0100)]
rtld: Don't use toupper function in rtld_printf.c

The libc function toupper may not function correctly due to TLS use when
LD_DEBUG is in effect.  Rather than determine this for sure, just use the
FreeBSD approach of eliminating ctype.h macro.

Taken from: FreeBSD SVN 232729 (2012-03-09)

12 years agocrtstuff: Remove unused crtbegin/crtend support files
John Marino [Sat, 17 Mar 2012 14:46:52 +0000 (15:46 +0100)]
crtstuff: Remove unused crtbegin/crtend support files

These files were imported:
commit 9b1e249481830caa2004c437ecda34c48b92798d (joerg, 2004-06-14)

The files stop being useful here:
commit fd8b66cd017f88e1baffc6426ca74ea7f57dbadd (corecode, 2007-01-15)

12 years agokernel/acpi: Bring in acpi_wmi(4) from FreeBSD, which acpi_hp(4) needs.
Sascha Wildner [Sat, 17 Mar 2012 16:53:51 +0000 (17:53 +0100)]
kernel/acpi: Bring in acpi_wmi(4) from FreeBSD, which acpi_hp(4) needs.

Also, hook acpi_hp(4) back into the build.

Some fixes to acpi_hp(4) were brought in, too.

It is all untested, unfortunately. The hope is, that someone with a
HP laptop might check it out.

12 years agokernel: Add sbuf_done() (taken from FreeBSD).
Sascha Wildner [Sat, 17 Mar 2012 16:24:04 +0000 (17:24 +0100)]
kernel: Add sbuf_done() (taken from FreeBSD).

12 years agokernel: Really fix DEV_SUPPORT for sys/dev/virtual.
Sascha Wildner [Sat, 17 Mar 2012 16:00:46 +0000 (17:00 +0100)]
kernel: Really fix DEV_SUPPORT for sys/dev/virtual.

Reported-by: aggelos
12 years agovkernel: Fix DEV_SUPPORT.
Sascha Wildner [Sat, 17 Mar 2012 15:26:43 +0000 (16:26 +0100)]
vkernel: Fix DEV_SUPPORT.

12 years agodev/virtual/vkernel Makefiles: Remove bogus .PATHs.
Sascha Wildner [Sat, 17 Mar 2012 14:44:17 +0000 (15:44 +0100)]
dev/virtual/vkernel Makefiles: Remove bogus .PATHs.

12 years agovkernel: Move things from dev/virtual to dev/virtual/vkernel.
Sascha Wildner [Sat, 17 Mar 2012 14:24:53 +0000 (15:24 +0100)]
vkernel: Move things from dev/virtual to dev/virtual/vkernel.

This is so we can later put any other "virtual" device drivers in their
own subdirectories in dev/virtual.

12 years agokernel/{a,b}list: Remove some unused variables in the debug code.
Sascha Wildner [Sat, 17 Mar 2012 11:08:27 +0000 (12:08 +0100)]
kernel/{a,b}list: Remove some unused variables in the debug code.

12 years agokernel/gre: Remove unused variables.
Sascha Wildner [Sat, 17 Mar 2012 11:03:49 +0000 (12:03 +0100)]
kernel/gre: Remove unused variables.

12 years agokernel/hammer: Remove an unused variable.
Sascha Wildner [Sat, 17 Mar 2012 10:37:51 +0000 (11:37 +0100)]
kernel/hammer: Remove an unused variable.

12 years agoalc(4): Ifdef out an unused variable and assignment.
Sascha Wildner [Sat, 17 Mar 2012 10:27:03 +0000 (11:27 +0100)]
alc(4): Ifdef out an unused variable and assignment.

12 years agokernel/sili: Actually print the generation.
Sascha Wildner [Sat, 17 Mar 2012 10:04:59 +0000 (11:04 +0100)]
kernel/sili: Actually print the generation.

12 years agortld: Shrink by eliminating stdio
John Marino [Fri, 16 Mar 2012 19:46:52 +0000 (20:46 +0100)]
rtld: Shrink by eliminating stdio

Eliminate stdio for parsing libmap.conf, and instead parse it from direct
mapping.  Also stop using strerror(3) in rtld which sucks in msgcat and
stdio.  Instead directly access sys_errlist array of error messages with
private rtld_strerror() function.

Results on x86_64 (includes debug symbols):

> size /usr/libexec/ld-elf.so.2*
   text    data     bss     dec     hex filename
  95294    1560    7680  104534   19856 /usr/libexec/ld-elf.so.2
 108830    3128   18216  130174   1fc7e /usr/libexec/ld-elf.so.2.old

> ls -al /usr/libexec/ld-elf.so.2*
-r-xr-xr-x  1 root  wheel  305763 Mar 16 20:33 /usr/libexec/ld-elf.so.2
-r-xr-xr-x  1 root  wheel  370392 Mar 14 00:02 /usr/libexec/ld-elf.so.2.old

Taken from:
FreeBSD SVN 232862 (2012-03-12)
FreeBSD SVN 232974 (2012-03-14)

12 years agotcp: Remove the workaround for the old servers in the retransmit timeout
Sepherosa Ziehau [Fri, 16 Mar 2012 10:53:10 +0000 (18:53 +0800)]
tcp: Remove the workaround for the old servers in the retransmit timeout

These old timers don't understand timestamp and window scale options;
they really should be retired.

12 years agotcp: Lowering initial RTO according to RFC 6298
Sepherosa Ziehau [Fri, 16 Mar 2012 10:23:47 +0000 (18:23 +0800)]
tcp: Lowering initial RTO according to RFC 6298

The SYN retransmit backoff is roughly according to the tcp_syn_backoff[]
as following:
                                      15s
tcp_syn_backoff[]     rexmt: 3 3 3 3 3 | 6 12 24 (ended at 57s)
tcp_syn_backoff_low[] rexmt: 1 2 4 4 4 | 8 16 16 (ended at 55s)

It is on by default and could be turned off by using sysctl
net.inet.tcp.low_rtobase

12 years agotcp: More RFC 3390 conforming
Sepherosa Ziehau [Fri, 16 Mar 2012 08:51:58 +0000 (16:51 +0800)]
tcp: More RFC 3390 conforming

If SYN or SYN|ACK was lost, the IW should be set to one MSS

This affects initial snd_cwnd and snd_cwnd after a long idle period

12 years agotcp_input: Factor out tcp_established()
Sepherosa Ziehau [Fri, 16 Mar 2012 07:43:19 +0000 (15:43 +0800)]
tcp_input: Factor out tcp_established()

12 years agotcp/syncache: Simplify syncache_add() interface
Sepherosa Ziehau [Fri, 16 Mar 2012 06:56:20 +0000 (14:56 +0800)]
tcp/syncache: Simplify syncache_add() interface

Since the passed in 'sop' are always NULL upon returning, we do not need
to pass in "struct socket **"; just pass in the listen socket, i.e.
struct socket *.

Nuke the code follows the syncache_add(), which acts upon non-NULL 'sop'
returns from syncache_add().  These codes are actually never executed.

12 years agojoin.1: Remove useless .Bk/.Ek
Sascha Wildner [Fri, 16 Mar 2012 04:06:37 +0000 (05:06 +0100)]
join.1: Remove useless .Bk/.Ek

12 years agofstat(1): Little fix in a cast.
Sascha Wildner [Fri, 16 Mar 2012 02:16:13 +0000 (03:16 +0100)]
fstat(1): Little fix in a cast.

12 years agoLINT/LINT64 configs: Reduce differences.
Sascha Wildner [Fri, 16 Mar 2012 02:11:54 +0000 (03:11 +0100)]
LINT/LINT64 configs: Reduce differences.