iw_cxgb4: add fast-path for small REG_MR operations
authorSteve Wise <swise@opengridcomputing.com>
Fri, 16 Sep 2016 14:54:52 +0000 (07:54 -0700)
committerDoug Ledford <dledford@redhat.com>
Fri, 7 Oct 2016 20:54:40 +0000 (16:54 -0400)
commit49b53a93a64ab0aaec10851b004297a3ac885433
tree6f252df36ba90d7baccddfbae6bb57d1ea6a4937
parent086de575c14239f77ea0dbf2370738a105c753ea
iw_cxgb4: add fast-path for small REG_MR operations

When processing a REG_MR work request, if fw supports the
FW_RI_NSMR_TPTE_WR work request, and if the page list for this
registration is <= 2 pages, and the current state of the mr is INVALID,
then use FW_RI_NSMR_TPTE_WR to pass down a fully populated TPTE for FW
to write.  This avoids FW having to do an async read of the TPTE blocking
the SQ until the read completes.

To know if the current MR state is INVALID or not, iw_cxgb4 must track the
state of each fastreg MR.  The c4iw_mr struct state is updated as REG_MR
and LOCAL_INV WRs are posted and completed, when a reg_mr is destroyed,
and when RECV completions are processed that include a local invalidation.

This optimization increases small IO IOPS for both iSER and NVMF.

Signed-off-by: Steve Wise <swise@opengridcomputing.com>
Signed-off-by: Doug Ledford <dledford@redhat.com>
drivers/infiniband/hw/cxgb4/cq.c
drivers/infiniband/hw/cxgb4/mem.c
drivers/infiniband/hw/cxgb4/qp.c
drivers/infiniband/hw/cxgb4/t4.h
drivers/infiniband/hw/cxgb4/t4fw_ri_api.h
drivers/net/ethernet/chelsio/cxgb4/t4fw_api.h