1 files changed, 0 insertions, 219 deletions
diff --git a/meta-v1000/recipes-kernel/linux/linux-yocto-4.14.71/1460-drm-amdgpu-Make-hqd_load-work-in-kernel-thread.patch b/meta-v1000/recipes-kernel/linux/linux-yocto-4.14.71/1460-drm-amdgpu-Make-hqd_load-work-in-kernel-thread.patch
deleted file mode 100644
index 9455ffd3..00000000
--- a/meta-v1000/recipes-kernel/linux/linux-yocto-4.14.71/1460-drm-amdgpu-Make-hqd_load-work-in-kernel-thread.patch
+++ /dev/null
@@ -1,219 +0,0 @@
-From 7e65ec1aac3303ea408cf2088a4a28f9f49159f8 Mon Sep 17 00:00:00 2001
-From: Felix Kuehling <Felix.Kuehling@amd.com>
-Date: Fri, 24 Jun 2016 15:15:09 -0400
-Subject: [PATCH 1460/4131] drm/amdgpu: Make hqd_load work in kernel thread
-
-Reading the WPTR from user memory doesn't work in a kernel thread,
-such as a work queue. This is the case when a queue is restored after
-eviction of userptr memory. Instead let the GPU read the updated WPTR
-from memory itself.
-
-Feature: KFD-237
-
-Change-Id: Ib167bbe89f6131ae27080bf8b08742a44d02cb40
-Signed-off-by: Felix Kuehling <Felix.Kuehling@amd.com>
-
- Conflicts:
-	drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gfx_v7.c
-	drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gfx_v8.c
----
- drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gfx_v7.c | 56 +++++++++++++++--------
- drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gfx_v8.c | 46 +++++++++++++++----
- 2 files changed, 75 insertions(+), 27 deletions(-)
-
-diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gfx_v7.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gfx_v7.c
-index 67b9e56..cec4d67 100644
---- a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gfx_v7.c
-+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gfx_v7.c
-@@ -38,6 +38,7 @@
- #include "gmc/gmc_7_1_sh_mask.h"
- #include "cik_structs.h"
- 
-+#define CIK_QUEUES_PER_PIPE_MEC	(8)
- 
- #define AMDKFD_SKIP_UNCOMPILED_CODE 1
- 
-@@ -244,6 +245,16 @@ static void acquire_queue(struct kgd_dev *kgd, uint32_t pipe_id,
- 	lock_srbm(kgd, mec, pipe, queue_id, 0);
- }
- 
-+static uint32_t get_queue_mask(uint32_t pipe_id, uint32_t queue_id)
-+{
-+	/* assumes that pipe0 is used by graphics and that the correct
-+	 * MEC is selected by acquire_queue already
-+	 */
-+	unsigned bit = ((pipe_id+1) * CIK_QUEUES_PER_PIPE_MEC + queue_id) & 31;
-+
-+	return ((uint32_t)1) << bit;
-+}
-+
- static void release_queue(struct kgd_dev *kgd)
- {
- 	unlock_srbm(kgd);
-@@ -345,12 +356,9 @@ static int kgd_hqd_load(struct kgd_dev *kgd, void *mqd, uint32_t pipe_id,
- {
- 	struct amdgpu_device *adev = get_amdgpu_device(kgd);
- 	struct cik_mqd *m;
--	uint32_t wptr_shadow = 0, is_wptr_shadow_valid = 0;
- 
- 	m = get_mqd(mqd);
- 
--        if (wptr != NULL)
--                is_wptr_shadow_valid = !get_user(wptr_shadow, wptr);
- 
- 	acquire_queue(kgd, pipe_id, queue_id);
- 
-@@ -361,6 +369,33 @@ static int kgd_hqd_load(struct kgd_dev *kgd, void *mqd, uint32_t pipe_id,
-         WREG32(mmCP_HQD_PQ_BASE, m->cp_hqd_pq_base_lo);
-         WREG32(mmCP_HQD_PQ_BASE_HI, m->cp_hqd_pq_base_hi);
-         WREG32(mmCP_HQD_PQ_CONTROL, m->cp_hqd_pq_control);
-+        WREG32(mmCP_HQD_VMID, m->cp_hqd_vmid);
-+
-+        WREG32(mmCP_HQD_PQ_RPTR_REPORT_ADDR, m->cp_hqd_pq_rptr_report_addr_lo);
-+        WREG32(mmCP_HQD_PQ_RPTR_REPORT_ADDR_HI, m->cp_hqd_pq_rptr_report_addr_hi);
-+        WREG32(mmCP_HQD_PQ_RPTR, m->cp_hqd_pq_rptr);
-+
-+        WREG32(mmCP_HQD_PQ_DOORBELL_CONTROL, m->cp_hqd_pq_doorbell_control);
-+
-+        if (wptr) {
-+                /* Don't read wptr with get_user because the user
-+                 * context may not be accessible (if this function
-+                 * runs in a work queue). Instead trigger a one-shot
-+                 * polling read from memory in the CP. This assumes
-+                 * that wptr is GPU-accessible in the queue's VMID via
-+                 * ATC or SVM. WPTR==RPTR before starting the poll so
-+                 * the CP starts fetching new commands from the right
-+                 * place.
-+                 */
-+                WREG32(mmCP_HQD_PQ_WPTR, m->cp_hqd_pq_rptr);
-+                WREG32(mmCP_HQD_PQ_WPTR_POLL_ADDR, (uint32_t)(uint64_t)wptr);
-+                WREG32(mmCP_HQD_PQ_WPTR_POLL_ADDR_HI,
-+                       (uint32_t)((uint64_t)wptr >> 32));
-+                WREG32(mmCP_PQ_WPTR_POLL_CNTL1,
-+                      get_queue_mask(pipe_id, queue_id));
-+        } else
-+                WREG32(mmCP_HQD_PQ_WPTR, 0);
-+
- 
-         WREG32(mmCP_HQD_IB_CONTROL, m->cp_hqd_ib_control);
-         WREG32(mmCP_HQD_IB_BASE_ADDR, m->cp_hqd_ib_base_addr_lo);
-@@ -377,19 +412,6 @@ static int kgd_hqd_load(struct kgd_dev *kgd, void *mqd, uint32_t pipe_id,
-         WREG32(mmCP_HQD_ATOMIC1_PREOP_LO, m->cp_hqd_atomic1_preop_lo);
-         WREG32(mmCP_HQD_ATOMIC1_PREOP_HI, m->cp_hqd_atomic1_preop_hi);
- 
--        WREG32(mmCP_HQD_PQ_RPTR_REPORT_ADDR, m->cp_hqd_pq_rptr_report_addr_lo);
--        WREG32(mmCP_HQD_PQ_RPTR_REPORT_ADDR_HI,
--                        m->cp_hqd_pq_rptr_report_addr_hi);
--
--        WREG32(mmCP_HQD_PQ_RPTR, m->cp_hqd_pq_rptr);
--
--        WREG32(mmCP_HQD_PQ_WPTR_POLL_ADDR, m->cp_hqd_pq_wptr_poll_addr_lo);
--        WREG32(mmCP_HQD_PQ_WPTR_POLL_ADDR_HI, m->cp_hqd_pq_wptr_poll_addr_hi);
--
--        WREG32(mmCP_HQD_PQ_DOORBELL_CONTROL, m->cp_hqd_pq_doorbell_control);
--
--        WREG32(mmCP_HQD_VMID, m->cp_hqd_vmid);
--
-         WREG32(mmCP_HQD_QUANTUM, m->cp_hqd_quantum);
- 
-         WREG32(mmCP_HQD_PIPE_PRIORITY, m->cp_hqd_pipe_priority);
-@@ -397,8 +419,6 @@ static int kgd_hqd_load(struct kgd_dev *kgd, void *mqd, uint32_t pipe_id,
- 
-         WREG32(mmCP_HQD_IQ_RPTR, m->cp_hqd_iq_rptr);
- 
--	WREG32(mmCP_HQD_PQ_WPTR, (is_wptr_shadow_valid ? wptr_shadow : 0));
--
-         WREG32(mmCP_HQD_ACTIVE, m->cp_hqd_active);
- 	release_queue(kgd);
- 
-diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gfx_v8.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gfx_v8.c
-index e2c3457..473b924 100644
---- a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gfx_v8.c
-+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd_gfx_v8.c
-@@ -39,6 +39,8 @@
- #include "vi_structs.h"
- #include "vid.h"
- 
-+#define VI_QUEUES_PER_PIPE_MEC	(8)
-+
- enum hqd_dequeue_request_type {
- 	NO_ACTION = 0,
- 	DRAIN_PIPE,
-@@ -237,6 +239,16 @@ static void acquire_queue(struct kgd_dev *kgd, uint32_t pipe_id,
- 	lock_srbm(kgd, mec, pipe, queue_id, 0);
- }
- 
-+static uint32_t get_queue_mask(uint32_t pipe_id, uint32_t queue_id)
-+{
-+	/* assumes that pipe0 is used by graphics and that the correct
-+	 * MEC is selected by acquire_queue already
-+	 */
-+	unsigned bit = ((pipe_id+1) * VI_QUEUES_PER_PIPE_MEC + queue_id) & 31;
-+
-+	return ((uint32_t)1) << bit;
-+}
-+
- static void release_queue(struct kgd_dev *kgd)
- {
- 	unlock_srbm(kgd);
-@@ -339,13 +351,9 @@ static int kgd_hqd_load(struct kgd_dev *kgd, void *mqd, uint32_t pipe_id,
- {
- 	struct amdgpu_device *adev = get_amdgpu_device(kgd);
- 	struct vi_mqd *m;
--	uint32_t wptr_shadow = 0, is_wptr_shadow_valid = 0;
- 
- 	m = get_mqd(mqd);
- 
--	if (wptr != NULL)
--		is_wptr_shadow_valid = !get_user(wptr_shadow, wptr);
--
- 	acquire_queue(kgd, pipe_id, queue_id);
- 
- 	WREG32(mmCP_MQD_CONTROL, m->cp_mqd_control);
-@@ -353,18 +361,38 @@ static int kgd_hqd_load(struct kgd_dev *kgd, void *mqd, uint32_t pipe_id,
- 	WREG32(mmCP_MQD_BASE_ADDR_HI, m->cp_mqd_base_addr_hi);
- 
- 	WREG32(mmCP_HQD_VMID, m->cp_hqd_vmid);
--	WREG32(mmCP_HQD_PERSISTENT_STATE, m->cp_hqd_persistent_state);
--	WREG32(mmCP_HQD_PIPE_PRIORITY, m->cp_hqd_pipe_priority);
--	WREG32(mmCP_HQD_QUEUE_PRIORITY, m->cp_hqd_queue_priority);
--	WREG32(mmCP_HQD_QUANTUM, m->cp_hqd_quantum);
- 	WREG32(mmCP_HQD_PQ_BASE, m->cp_hqd_pq_base_lo);
- 	WREG32(mmCP_HQD_PQ_BASE_HI, m->cp_hqd_pq_base_hi);
- 	WREG32(mmCP_HQD_PQ_RPTR_REPORT_ADDR, m->cp_hqd_pq_rptr_report_addr_lo);
- 	WREG32(mmCP_HQD_PQ_RPTR_REPORT_ADDR_HI,
- 			m->cp_hqd_pq_rptr_report_addr_hi);
--	WREG32(mmCP_HQD_PQ_WPTR, (is_wptr_shadow_valid ? wptr_shadow : 0));
- 	WREG32(mmCP_HQD_PQ_CONTROL, m->cp_hqd_pq_control);
- 	WREG32(mmCP_HQD_PQ_DOORBELL_CONTROL, m->cp_hqd_pq_doorbell_control);
-+	WREG32(mmCP_HQD_PQ_RPTR, m->cp_hqd_pq_rptr);
-+
-+	if (wptr) {
-+		/* Don't read wptr with get_user because the user
-+		 * context may not be accessible (if this function
-+		 * runs in a work queue). Instead trigger a one-shot
-+		 * polling read from memory in the CP. This assumes
-+		 * that wptr is GPU-accessible in the queue's VMID via
-+		 * ATC or SVM. WPTR==RPTR before starting the poll so
-+		 * the CP starts fetching new commands from the right
-+		 * place.
-+		 */
-+		WREG32(mmCP_HQD_PQ_WPTR, m->cp_hqd_pq_rptr);
-+		WREG32(mmCP_HQD_PQ_WPTR_POLL_ADDR, (uint32_t)(uint64_t)wptr);
-+		WREG32(mmCP_HQD_PQ_WPTR_POLL_ADDR_HI,
-+		       (uint32_t)((uint64_t)wptr >> 32));
-+		WREG32(mmCP_PQ_WPTR_POLL_CNTL1,
-+		       get_queue_mask(pipe_id, queue_id));
-+	} else
-+		WREG32(mmCP_HQD_PQ_WPTR, 0);
-+
-+	WREG32(mmCP_HQD_PERSISTENT_STATE, m->cp_hqd_persistent_state);
-+	WREG32(mmCP_HQD_PIPE_PRIORITY, m->cp_hqd_pipe_priority);
-+	WREG32(mmCP_HQD_QUEUE_PRIORITY, m->cp_hqd_queue_priority);
-+	WREG32(mmCP_HQD_QUANTUM, m->cp_hqd_quantum);
- 
- 	WREG32(mmCP_HQD_EOP_BASE_ADDR, m->cp_hqd_eop_base_addr_lo);
- 	WREG32(mmCP_HQD_EOP_BASE_ADDR_HI, m->cp_hqd_eop_base_addr_hi);
--- 
-2.7.4
-