diff mbox

[dpdk-dev] net/mlx5: remove excessive data prefetch

Message ID	20180312170545.16165-1-yskoh@mellanox.com (mailing list archive)
State	Accepted, archived
Delegated to:	Shahaf Shuler
Headers	From: Yongseok Koh <yskoh@mellanox.com> To: adrien.mazarguil@6wind.com, nelio.laranjeiro@6wind.com Cc: dev@dpdk.org, Yongseok Koh <yskoh@mellanox.com> Date: Mon, 12 Mar 2018 10:05:45 -0700 Message-Id: <20180312170545.16165-1-yskoh@mellanox.com> MIME-Version: 1.0 Content-Type: text/plain Received-SPF: None (protection.outlook.com: mellanox.com does not designate permitted sender hosts) X-Microsoft-Exchange-Diagnostics: =?us-ascii?Q?1; VI1PR0501MB2045; 23:NmrJxxXsDH57oFQdJ3n4Klmhyk88TnfXJcpjQMo?= mDJKalR/v6VOmx71audzu6Qmw0pnThT1tmN/S8Xry4PH+mBa9VMaAhaVJwBoak3goFHQj45Q6OaxVMi5gWRKfMmFIB0VgsA6OP0zw6HlP6eQFeIHpC/vrwDRC9dlkg0eIZFj0qBCWxXJ/sV04o9vZ40PqKgwxS6srKX8srP0eU2g958Hy45MLy44/CCgkXuu0cdhyisFAEEm1vOVfKmYzcnbFxAcH74LhUtA0JJnbws2c1NIs3HUoVuUKQevbC1kmC+EnxI+1AV/CVnDz5kuWfrZxcxnZM8osczBA2JaL7J904ZOIyNw7bf/yeQU/kBcmIJcj8MCBibJ96HHdzC720h2Cc258h8SiDjGB0Vn+tSIsGn48EB4ecfNWbkK1mVV6rEP/OiQsUF/YXZe51wT3S6DnWga+lIuWAorbtWNRLtouSxoVifLioq/Qj/rXdKJdKT6cTxgFNGE8enz3hVuXkJMJbi0OoGZL+iQpLRRRG170lJ7bBRBdHPZAsWbI3yPKWiHgJ6I3704hI+upBXJug+6ORgODNmlEHKjzZMmfrN/dzK2xuIccjF1o3C7gggaj3YkQtRn6ZoDJ/b4AEmWjwkxY4b9VfqVgyjtBlcGIa6Ueho39OmSuUpSS8wmjJ3cDIFg9QKxtuI5w1H7pWgphmPtbXUOkhfD+wThToR41QJsd/E8K2WT8hZtkC4zWsEBHE8xMzBwrOYDuaUaZQxpmJqrw7564BNQ/kwtWRNe4b0YncplWlzWDsi0tSaWkG6Pyi9rdTO3azmoIDou7x8N9k3P7Z6RaiwjgBQpwzfe00InANrglCeNHVlCyNT1osGBBgxPc2jpew/nvnDG7NHMuhHUJHYrFk7K1zVxxmclprF6gahO5oucFeNbjPyxsNqYazkmKPLoUiFk8Yqn7LqFbzzADHBKBLq4ihAASckUEgwTHSSVFlIsyoD7PEGZUucS1EMitChtVPonrvVBPpns1yKvo//76RGnLjexShtzGHyORNUqkwQ4PKbKdRMgyAFrtFvxhaIIaGwb9q1j9vly6zdHPeGqV9I5pBESBmuCKKlBvbd9x1PTfACoUGKleRrFtxMg= X-Microsoft-Antispam-Message-Info: 3xQTdpVhKxk2xTT1sw44kvB23c0DIbRt4hXRVLlrN7VLiwyHB0U/AFq310OEMfgALXWaAu4YA89pI1r4qYf1XfFKiez/BDx7OFAqYXTyxeBthUYpwUtClV8aEbuEpgEnlV+e3qX1R856RFmwKwnCeyxF/Xk8O/CAC2cGsHL/u7XrGNR1PC9xPvJxv6NTsM42 X-Microsoft-Exchange-Diagnostics: 1; VI1PR0501MB2045; 6:WdN+U/zBv9bo8MHuaFBd+uP/iv+GJTND1ZRGIM/LAKyvCq4zBjkrgwzMdAZ3TxVtMXuu9XfkJCCaHJ9RhoHhZyC1U+zFEgw/oH12Gzr4WanqRw39efirJJ8CTK9ufqGz3T/qYJT+1gRajFZrefbIAhZotwTBE1op9NkAsy2tIruxxGC3Y0qT2J2koVm1b84+YsUu5FEIAiIy1mWrewZxLtCdlrGtFQkl1O/QUOjYl07WC4AHDEtPtzKNt7iwRENjJ9D1cDzgrLI/yF02q08TyW2GnIlOCSH0lUoxagTAtmpKT1LX2IBi7kA9TvRmtK9A0WignNMtr9vovDE50Y148xoPOh7IpNoKrZuWmBhDBX8=; 5:IFI7wYtMbUQiM4BBUm4dKLyHlXVVEZewVQE2Ae/xQAQ+cFmPIU4m1y4ygXUiKMc9KU4vOVa2OYkvo0B1OqsLNX2QjSZ/LzAQRgQjCIOaGG4+A/Yv+CWvcd02/V01ZtiyQr1c4l05IHDARK7ExVf3WcAxDF2MUutmUROfpGf2Wlc=; 24:9nzRMNP58j9bbfP6oHenbN6OWJJwUh23AAvQNp5PejkSnXH5bVZvQy/eINIVsxg+beiFVcx0eObX0ldyxGGrH9nCyzN46WdoW17YuZl8O1E=; 7:cKFI/PiL6eIuY8FWs6sW2SfNRpXiYiVIZvWICR2hvP8/mDOvduLJMxKb/dZEFOloO2UGCrd1/VETn1UNuJSg2hf4+Q0VupsnV/mIE6IstF/Y9WNBzQvPFuvItzpVr667ain2XCpwB0Y0f6Lw73syCk6FIdZyXfJYlsTJsfzaLW7D3L/1JJR0I454UKtGdZA9kmY9pMIiLFlao/k5nuCjJLoli86WwC/mtn4NcXcJfPLz/R7R/j16k4z23MBnAbkz SpamDiagnosticOutput: 1:99 SpamDiagnosticMetadata: NSPM Subject: [dpdk-dev] [PATCH] net/mlx5: remove excessive data prefetch Precedence: list Errors-To: dev-bounces@dpdk.org Sender: "dev" <dev-bounces@dpdk.org>

Checks

Context	Check	Description
ci/checkpatch	success	coding style OK
ci/Intel-compilation	success	Compilation OK

Commit Message

Yongseok Koh March 12, 2018, 5:05 p.m. UTC

  In Enhanced Multi-Packet Send (eMPW), entire packet data is prefetched to
LLC if it isn't inlined. Even though this helps reducing jitter when HW
fetches data by DMA, this can thresh the LLC with evicting precious data.
And if the size of queue is large and there are many queues, this might not
be effective. Also, if application runs on a remote node from the PCIe
link, it may not be helpful and can even cause bad results.

Signed-off-by: Yongseok Koh <yskoh@mellanox.com>
---
 drivers/net/mlx5/mlx5_rxtx.c | 8 ++------
 1 file changed, 2 insertions(+), 6 deletions(-)

Comments

Adrien Mazarguil March 13, 2018, 12:44 p.m. UTC | #1

On Mon, Mar 12, 2018 at 10:05:45AM -0700, Yongseok Koh wrote:
> In Enhanced Multi-Packet Send (eMPW), entire packet data is prefetched to
> LLC if it isn't inlined. Even though this helps reducing jitter when HW
> fetches data by DMA, this can thresh the LLC with evicting precious data.
> And if the size of queue is large and there are many queues, this might not
> be effective. Also, if application runs on a remote node from the PCIe
> link, it may not be helpful and can even cause bad results.
> 
> Signed-off-by: Yongseok Koh <yskoh@mellanox.com>

Acked-by: Adrien Mazarguil <adrien.mazarguil@6wind.com>

Shahaf Shuler April 3, 2018, 4:58 a.m. UTC | #2

Tuesday, March 13, 2018 2:45 PM, Adrien Mazarguil:
> Subject: Re: [dpdk-dev] [PATCH] net/mlx5: remove excessive data prefetch
> 
> On Mon, Mar 12, 2018 at 10:05:45AM -0700, Yongseok Koh wrote:
> > In Enhanced Multi-Packet Send (eMPW), entire packet data is prefetched
> > to LLC if it isn't inlined. Even though this helps reducing jitter
> > when HW fetches data by DMA, this can thresh the LLC with evicting
> precious data.
> > And if the size of queue is large and there are many queues, this
> > might not be effective. Also, if application runs on a remote node
> > from the PCIe link, it may not be helpful and can even cause bad results.
> >
> > Signed-off-by: Yongseok Koh <yskoh@mellanox.com>
> 
> Acked-by: Adrien Mazarguil <adrien.mazarguil@6wind.com>

Applied to next-net-mlx, thanks. 

> 
> --
> Adrien Mazarguil
> 6WIND

diff mbox

Patch

diff --git a/drivers/net/mlx5/mlx5_rxtx.c b/drivers/net/mlx5/mlx5_rxtx.c
index 049f7e6c1..c2060b734 100644
--- a/drivers/net/mlx5/mlx5_rxtx.c
+++ b/drivers/net/mlx5/mlx5_rxtx.c
@@ -1320,7 +1320,6 @@  txq_burst_empw(struct mlx5_txq_data *txq, struct rte_mbuf **pkts,
 	do {
 		struct rte_mbuf *buf = *(pkts++);
 		uintptr_t addr;
-		unsigned int n;
 		unsigned int do_inline = 0; /* Whether inline is possible. */
 		uint32_t length;
 		uint8_t cs_flags;
@@ -1440,11 +1439,8 @@  txq_burst_empw(struct mlx5_txq_data *txq, struct rte_mbuf **pkts,
 					((uintptr_t)mpw.data.raw +
 					 inl_pad);
 			(*txq->elts)[elts_head++ & elts_m] = buf;
-			addr = rte_pktmbuf_mtod(buf, uintptr_t);
-			for (n = 0; n * RTE_CACHE_LINE_SIZE < length; n++)
-				rte_prefetch2((void *)(addr +
-						n * RTE_CACHE_LINE_SIZE));
-			addr = rte_cpu_to_be_64(addr);
+			addr = rte_cpu_to_be_64(rte_pktmbuf_mtod(buf,
+								 uintptr_t));
 			*dseg = (rte_v128u32_t) {
 				rte_cpu_to_be_32(length),
 				mlx5_tx_mb2mr(txq, buf),