KVM: arm/arm64: vgic-its: Introduce multiple LPI translation caches (def3bcbd) · Commits · EulixOS / Software / Kernel

arch/arm64/kvm/vgic/vgic-init.c

+7 −1

Original line number	Diff line number	Diff line
		@@ -52,9 +52,15 @@
		void kvm_vgic_early_init(struct kvm *kvm)
		{
		struct vgic_dist *dist = &kvm->arch.vgic;
		raw_spinlock_t *lpi_lock;
		int i;

		INIT_LIST_HEAD(&dist->lpi_list_head);
		INIT_LIST_HEAD(&dist->lpi_translation_cache);
		for (i = 0; i < LPI_TRANS_CACHES_NUM; i++) {
		lpi_lock = &dist->lpi_translation_cache[i].lpi_cache_lock;
		INIT_LIST_HEAD(&dist->lpi_translation_cache[i].lpi_cache);
		raw_spin_lock_init(lpi_lock);
		}
		raw_spin_lock_init(&dist->lpi_list_lock);
		}

arch/arm64/kvm/vgic/vgic-its.c

+128 −83

Original line number	Diff line number	Diff line
		@@ -545,13 +545,21 @@ static unsigned long vgic_mmio_read_its_idregs(struct kvm *kvm,
		return 0;
		}

		/* Default is 16 cached LPIs per vcpu */
		#define LPI_DEFAULT_PCPU_CACHE_SIZE 16

		static struct vgic_irq __vgic_its_check_cache(struct vgic_dist dist,
		phys_addr_t db,
		u32 devid, u32 eventid)
		u32 devid, u32 eventid,
		int cacheid)
		{
		struct vgic_translation_cache_entry *cte;
		struct vgic_irq *irq = NULL;
		struct list_head *cache_head;
		int pos = 0;

		list_for_each_entry(cte, &dist->lpi_translation_cache, entry) {
		cache_head = &dist->lpi_translation_cache[cacheid].lpi_cache;
		list_for_each_entry(cte, cache_head, entry) {
		/*
		* If we hit a NULL entry, there is nothing after this
		* point.
		@@ -559,21 +567,25 @@ static struct vgic_irq __vgic_its_check_cache(struct vgic_dist dist,
		if (!cte->irq)
		break;

		if (cte->db != db \|\| cte->devid != devid \|\|
		cte->eventid != eventid)
		continue;
		pos++;

		if (cte->devid == devid &&
		cte->eventid == eventid &&
		cte->db == db) {
		/*
		* Move this entry to the head, as it is the most
		* recently used.
		* Move this entry to the head if the entry at the
		* position behind the LPI_DEFAULT_PCPU_CACHE_SIZE * 2
		* of the LRU list, as it is the most recently used.
		*/
		if (!list_is_first(&cte->entry, &dist->lpi_translation_cache))
		list_move(&cte->entry, &dist->lpi_translation_cache);
		if (pos > LPI_DEFAULT_PCPU_CACHE_SIZE * 2)
		list_move(&cte->entry, cache_head);

		return cte->irq;
		irq = cte->irq;
		break;
		}
		}

		return NULL;
		return irq;
		}

		static struct vgic_irq vgic_its_check_cache(struct kvm kvm, phys_addr_t db,
		@@ -581,11 +593,15 @@ static struct vgic_irq vgic_its_check_cache(struct kvm kvm, phys_addr_t db,
		{
		struct vgic_dist *dist = &kvm->arch.vgic;
		struct vgic_irq *irq;
		unsigned long flags;
		int cpu;
		int cacheid;

		raw_spin_lock_irqsave(&dist->lpi_list_lock, flags);
		irq = __vgic_its_check_cache(dist, db, devid, eventid);
		raw_spin_unlock_irqrestore(&dist->lpi_list_lock, flags);
		cpu = smp_processor_id();
		cacheid = cpu % LPI_TRANS_CACHES_NUM;

		raw_spin_lock(&dist->lpi_translation_cache[cacheid].lpi_cache_lock);
		irq = __vgic_its_check_cache(dist, db, devid, eventid, cacheid);
		raw_spin_unlock(&dist->lpi_translation_cache[cacheid].lpi_cache_lock);

		return irq;
		}
		@@ -598,15 +614,22 @@ static void vgic_its_cache_translation(struct kvm kvm, struct vgic_its its,
		struct vgic_translation_cache_entry *cte;
		unsigned long flags;
		phys_addr_t db;
		raw_spinlock_t *lpi_lock;
		struct list_head *cache_head;
		int cacheid;

		/* Do not cache a directly injected interrupt */
		if (irq->hw)
		return;

		raw_spin_lock_irqsave(&dist->lpi_list_lock, flags);

		if (unlikely(list_empty(&dist->lpi_translation_cache)))
		goto out;
		for (cacheid = 0; cacheid < LPI_TRANS_CACHES_NUM; cacheid++) {
		lpi_lock = &dist->lpi_translation_cache[cacheid].lpi_cache_lock;
		cache_head = &dist->lpi_translation_cache[cacheid].lpi_cache;
		raw_spin_lock_irqsave(lpi_lock, flags);
		if (unlikely(list_empty(cache_head))) {
		raw_spin_unlock_irqrestore(lpi_lock, flags);
		break;
		}

		/*
		* We could have raced with another CPU caching the same
		@@ -614,21 +637,24 @@ static void vgic_its_cache_translation(struct kvm kvm, struct vgic_its its,
		* already
		*/
		db = its->vgic_its_base + GITS_TRANSLATER;
		if (__vgic_its_check_cache(dist, db, devid, eventid))
		goto out;
		if (__vgic_its_check_cache(dist, db, devid, eventid, cacheid)) {
		raw_spin_unlock_irqrestore(lpi_lock, flags);
		continue;
		}

		/* Always reuse the last entry (LRU policy) */
		cte = list_last_entry(&dist->lpi_translation_cache,
		typeof(*cte), entry);
		cte = list_last_entry(cache_head, typeof(*cte), entry);

		/*
		* Caching the translation implies having an extra reference
		* to the interrupt, so drop the potential reference on what
		* was in the cache, and increment it on the new interrupt.
		*/
		if (cte->irq)
		if (cte->irq) {
		raw_spin_lock(&dist->lpi_list_lock);
		__vgic_put_lpi_locked(kvm, cte->irq);

		raw_spin_unlock(&dist->lpi_list_lock);
		}
		vgic_get_irq_kref(irq);

		cte->db = db;
		@@ -637,10 +663,9 @@ static void vgic_its_cache_translation(struct kvm kvm, struct vgic_its its,
		cte->irq = irq;

		/* Move the new translation to the head of the list */
		list_move(&cte->entry, &dist->lpi_translation_cache);

		out:
		raw_spin_unlock_irqrestore(&dist->lpi_list_lock, flags);
		list_move(&cte->entry, cache_head);
		raw_spin_unlock_irqrestore(lpi_lock, flags);
		}
		}

		void vgic_its_invalidate_cache(struct kvm *kvm)
		@@ -648,10 +673,15 @@ void vgic_its_invalidate_cache(struct kvm *kvm)
		struct vgic_dist *dist = &kvm->arch.vgic;
		struct vgic_translation_cache_entry *cte;
		unsigned long flags;
		raw_spinlock_t *lpi_lock;
		struct list_head *cache_head;
		int i;

		raw_spin_lock_irqsave(&dist->lpi_list_lock, flags);

		list_for_each_entry(cte, &dist->lpi_translation_cache, entry) {
		for (i = 0; i < LPI_TRANS_CACHES_NUM; i++) {
		lpi_lock = &dist->lpi_translation_cache[i].lpi_cache_lock;
		cache_head = &dist->lpi_translation_cache[i].lpi_cache;
		raw_spin_lock_irqsave(lpi_lock, flags);
		list_for_each_entry(cte, cache_head, entry) {
		/*
		* If we hit a NULL entry, there is nothing after this
		* point.
		@@ -659,11 +689,13 @@ void vgic_its_invalidate_cache(struct kvm *kvm)
		if (!cte->irq)
		break;

		raw_spin_lock(&dist->lpi_list_lock);
		__vgic_put_lpi_locked(kvm, cte->irq);
		raw_spin_unlock(&dist->lpi_list_lock);
		cte->irq = NULL;
		}

		raw_spin_unlock_irqrestore(&dist->lpi_list_lock, flags);
		raw_spin_unlock_irqrestore(lpi_lock, flags);
		}
		}

		int vgic_its_resolve_lpi(struct kvm kvm, struct vgic_its its,
		@@ -1829,20 +1861,24 @@ static int vgic_register_its_iodev(struct kvm kvm, struct vgic_its its,
		return ret;
		}

		/* Default is 16 cached LPIs per vcpu */
		#define LPI_DEFAULT_PCPU_CACHE_SIZE 16

		void vgic_lpi_translation_cache_init(struct kvm *kvm)
		{
		struct vgic_dist *dist = &kvm->arch.vgic;
		unsigned int sz;
		struct list_head *cache_head;
		int i;
		int cacheid;

		if (!list_empty(&dist->lpi_translation_cache))
		for (cacheid = 0; cacheid < LPI_TRANS_CACHES_NUM; cacheid++) {
		cache_head = &dist->lpi_translation_cache[cacheid].lpi_cache;
		if (!list_empty(cache_head))
		return;
		}

		sz = atomic_read(&kvm->online_vcpus) * LPI_DEFAULT_PCPU_CACHE_SIZE;

		for (cacheid = 0; cacheid < LPI_TRANS_CACHES_NUM; cacheid++) {
		cache_head = &dist->lpi_translation_cache[cacheid].lpi_cache;
		for (i = 0; i < sz; i++) {
		struct vgic_translation_cache_entry *cte;

		@@ -1850,9 +1886,9 @@ void vgic_lpi_translation_cache_init(struct kvm *kvm)
		cte = kzalloc(sizeof(*cte), GFP_KERNEL);
		if (WARN_ON(!cte))
		break;

		INIT_LIST_HEAD(&cte->entry);
		list_add(&cte->entry, &dist->lpi_translation_cache);
		list_add(&cte->entry, cache_head);
		}
		}
		}

		@@ -1860,14 +1896,23 @@ void vgic_lpi_translation_cache_destroy(struct kvm *kvm)
		{
		struct vgic_dist *dist = &kvm->arch.vgic;
		struct vgic_translation_cache_entry cte, tmp;
		unsigned long flags;
		raw_spinlock_t *lpi_lock;
		struct list_head *cache_head;
		int cacheid;

		vgic_its_invalidate_cache(kvm);

		list_for_each_entry_safe(cte, tmp,
		&dist->lpi_translation_cache, entry) {
		for (cacheid = 0; cacheid < LPI_TRANS_CACHES_NUM; cacheid++) {
		lpi_lock = &dist->lpi_translation_cache[cacheid].lpi_cache_lock;
		cache_head = &dist->lpi_translation_cache[cacheid].lpi_cache;
		raw_spin_lock_irqsave(lpi_lock, flags);
		list_for_each_entry_safe(cte, tmp, cache_head, entry) {
		list_del(&cte->entry);
		kfree(cte);
		}
		raw_spin_unlock_irqrestore(lpi_lock, flags);
		}
		}

		#define INITIAL_BASER_VALUE \

include/kvm/arm_vgic.h

+11 −2

Original line number	Diff line number	Diff line
		@@ -33,6 +33,9 @@
		#define irq_is_spi(irq) ((irq) >= VGIC_NR_PRIVATE_IRQS && \
		(irq) <= VGIC_MAX_SPI)

		/The number of lpi translation cache lists/
		#define LPI_TRANS_CACHES_NUM 8

		enum vgic_type {
		VGIC_V2, /* Good ol' GICv2 */
		VGIC_V3, /* New fancy GICv3 */
		@@ -163,6 +166,12 @@ struct vgic_io_device {
		struct kvm_io_device dev;
		};

		struct its_trans_cache {
		/* LPI translation cache */
		struct list_head lpi_cache;
		raw_spinlock_t lpi_cache_lock;
		};

		struct vgic_its {
		/* The base address of the ITS control register frame */
		gpa_t vgic_its_base;
		@@ -253,8 +262,8 @@ struct vgic_dist {
		struct list_head lpi_list_head;
		int lpi_list_count;

		/* LPI translation cache */
		struct list_head lpi_translation_cache;
		/* LPI translation cache array*/
		struct its_trans_cache lpi_translation_cache[LPI_TRANS_CACHES_NUM];

		/* used by vgic-debug */
		struct vgic_state_iter *iter;