diff mbox series

[RESEND,09/13] net/hns3: optimize SVE xmit performance

Message ID	20220905085939.22236-10-liudongdong3@huawei.com (mailing list archive)
State	Accepted, archived
Delegated to:	Andrew Rybchenko
Headers	From: Dongdong Liu <liudongdong3@huawei.com> To: <dev@dpdk.org>, <andrew.rybchenko@oktetlabs.ru>, <ferruh.yigit@xilinx.com>, <thomas@monjalon.net>, <liudongdong3@huawei.com>, <lihuisong@huawei.com>, <haijie1@huawei.com> CC: <stable@dpdk.org>, <fengchengwen@huawei.com>, <yisen.zhuang@huawei.com>, <humin29@huawei.com> Subject: [PATCH RESEND 09/13] net/hns3: optimize SVE xmit performance Date: Mon, 5 Sep 2022 16:59:35 +0800 Message-ID: <20220905085939.22236-10-liudongdong3@huawei.com> In-Reply-To: <20220905085939.22236-1-liudongdong3@huawei.com> References: <20220905085939.22236-1-liudongdong3@huawei.com> MIME-Version: 1.0 Content-Transfer-Encoding: 8bit Content-Type: text/plain Precedence: list Errors-To: dev-bounces@dpdk.org
Series	some bugfixes and clean code for hns3 \| [RESEND,00/13] some bugfixes and clean code for hns3 [RESEND,01/13] net/hns3: rename hns3 dump file [RESEND,02/13] net/hns3: fix code check warning [RESEND,03/13] net/hns3: adjust code for dump file [RESEND,04/13] net/hns3: add dump of VF vlan filter modify capability [RESEND,05/13] net/hns3: fix fail to receive PTP packet [RESEND,06/13] net/hns3: fix segment fault when using SVE xmit [RESEND,07/13] net/hns3: fix next-to-use overflow when using SVE xmit [RESEND,08/13] net/hns3: fix next-to-use overflow when using simple xmit [RESEND,09/13] net/hns3: optimize SVE xmit performance [RESEND,10/13] net/hns3: fix segment fault when secondary process access FW [RESEND,11/13] net/hns3: delete rte unused tag [RESEND,12/13] net/hns3: fix uncleared hardware MAC statistics [RESEND,13/13] net/hns3: revert optimize Tx performance

Checks

Context	Check	Description
ci/checkpatch	success	coding style OK

Commit Message

Dongdong Liu Sept. 5, 2022, 8:59 a.m. UTC

  From: Chengwen Feng <fengchengwen@huawei.com>

This patch optimize SVE xmit algorithm performance, will get about 1%+
performance gain under 64B macfwd.

Cc: stable@dpdk.org
Signed-off-by: Chengwen Feng <fengchengwen@huawei.com>
---
 drivers/net/hns3/hns3_rxtx_vec_sve.c | 19 ++++++++++---------
 1 file changed, 10 insertions(+), 9 deletions(-)

diff mbox series

Patch

diff --git a/drivers/net/hns3/hns3_rxtx_vec_sve.c b/drivers/net/hns3/hns3_rxtx_vec_sve.c
index f09a81dbd5..6f23ba674d 100644
--- a/drivers/net/hns3/hns3_rxtx_vec_sve.c
+++ b/drivers/net/hns3/hns3_rxtx_vec_sve.c
@@ -389,10 +389,12 @@  hns3_tx_fill_hw_ring_sve(struct hns3_tx_queue *txq,
 				   HNS3_UINT32_BIT;
 	svuint64_t base_addr, buf_iova, data_off, data_len, addr;
 	svuint64_t offsets = svindex_u64(0, BD_SIZE);
-	uint32_t i = 0;
-	svbool_t pg = svwhilelt_b64_u32(i, nb_pkts);
+	uint32_t cnt = svcntd();
+	svbool_t pg;
+	uint32_t i;
 
-	do {
+	for (i = 0; i < nb_pkts; /* i is updated in the inner loop */) {
+		pg = svwhilelt_b64_u32(i, nb_pkts);
 		base_addr = svld1_u64(pg, (uint64_t *)pkts);
 		/* calc mbuf's field buf_iova address */
 		buf_iova = svadd_n_u64_z(pg, base_addr,
@@ -439,12 +441,11 @@  hns3_tx_fill_hw_ring_sve(struct hns3_tx_queue *txq,
 			(svaddv_u64(pg, data_len) >> HNS3_UINT16_BIT);
 
 		/* update index for next loop */
-		i += svcntd();
-		pkts += svcntd();
-		txdp += svcntd();
-		tx_entry += svcntd();
-		pg = svwhilelt_b64_u32(i, nb_pkts);
-	} while (svptest_any(svptrue_b64(), pg));
+		i += cnt;
+		pkts += cnt;
+		txdp += cnt;
+		tx_entry += cnt;
+	}
 }
 
 static uint16_t