memcg: charge before adding to swapcache on swapin (0add0c77) · Commits · EulixOS / Software / Kernel

include/linux/memcontrol.h

+13 −0

Original line number	Diff line number	Diff line
		@@ -609,6 +609,9 @@ static inline bool mem_cgroup_below_min(struct mem_cgroup *memcg)
		}

		int mem_cgroup_charge(struct page page, struct mm_struct mm, gfp_t gfp_mask);
		int mem_cgroup_swapin_charge_page(struct page page, struct mm_struct mm,
		gfp_t gfp, swp_entry_t entry);
		void mem_cgroup_swapin_uncharge_swap(swp_entry_t entry);

		void mem_cgroup_uncharge(struct page *page);
		void mem_cgroup_uncharge_list(struct list_head *page_list);
		@@ -1112,6 +1115,16 @@ static inline int mem_cgroup_charge(struct page page, struct mm_struct mm,
		return 0;
		}

		static inline int mem_cgroup_swapin_charge_page(struct page *page,
		struct mm_struct *mm, gfp_t gfp, swp_entry_t entry)
		{
		return 0;
		}

		static inline void mem_cgroup_swapin_uncharge_swap(swp_entry_t entry)
		{
		}

		static inline void mem_cgroup_uncharge(struct page *page)
		{
		}

mm/memcontrol.c

+74 −43

Original line number	Diff line number	Diff line
		@@ -6644,6 +6644,27 @@ void mem_cgroup_calculate_protection(struct mem_cgroup *root,
		atomic_long_read(&parent->memory.children_low_usage)));
		}

		static int __mem_cgroup_charge(struct page page, struct mem_cgroup memcg,
		gfp_t gfp)
		{
		unsigned int nr_pages = thp_nr_pages(page);
		int ret;

		ret = try_charge(memcg, gfp, nr_pages);
		if (ret)
		goto out;

		css_get(&memcg->css);
		commit_charge(page, memcg);

		local_irq_disable();
		mem_cgroup_charge_statistics(memcg, page, nr_pages);
		memcg_check_events(memcg, page);
		local_irq_enable();
		out:
		return ret;
		}

		/**
		* mem_cgroup_charge - charge a newly allocated page to a cgroup
		* @page: page to charge
		@@ -6653,55 +6674,71 @@ void mem_cgroup_calculate_protection(struct mem_cgroup *root,
		* Try to charge @page to the memcg that @mm belongs to, reclaiming
		* pages according to @gfp_mask if necessary.
		*
		* Do not use this for pages allocated for swapin.
		*
		* Returns 0 on success. Otherwise, an error code is returned.
		*/
		int mem_cgroup_charge(struct page page, struct mm_struct mm, gfp_t gfp_mask)
		{
		unsigned int nr_pages = thp_nr_pages(page);
		struct mem_cgroup *memcg = NULL;
		int ret = 0;
		struct mem_cgroup *memcg;
		int ret;

		if (mem_cgroup_disabled())
		goto out;
		return 0;

		if (PageSwapCache(page)) {
		swp_entry_t ent = { .val = page_private(page), };
		unsigned short id;
		memcg = get_mem_cgroup_from_mm(mm);
		ret = __mem_cgroup_charge(page, memcg, gfp_mask);
		css_put(&memcg->css);

		/*
		* Every swap fault against a single page tries to charge the
		* page, bail as early as possible. shmem_unuse() encounters
		* already charged pages, too. page and memcg binding is
		* protected by the page lock, which serializes swap cache
		* removal, which in turn serializes uncharging.
		return ret;
		}

		/**
		* mem_cgroup_swapin_charge_page - charge a newly allocated page for swapin
		* @page: page to charge
		* @mm: mm context of the victim
		* @gfp: reclaim mode
		* @entry: swap entry for which the page is allocated
		*
		* This function charges a page allocated for swapin. Please call this before
		* adding the page to the swapcache.
		*
		* Returns 0 on success. Otherwise, an error code is returned.
		*/
		VM_BUG_ON_PAGE(!PageLocked(page), page);
		if (page_memcg(compound_head(page)))
		goto out;
		int mem_cgroup_swapin_charge_page(struct page page, struct mm_struct mm,
		gfp_t gfp, swp_entry_t entry)
		{
		struct mem_cgroup *memcg;
		unsigned short id;
		int ret;

		id = lookup_swap_cgroup_id(ent);
		if (mem_cgroup_disabled())
		return 0;

		id = lookup_swap_cgroup_id(entry);
		rcu_read_lock();
		memcg = mem_cgroup_from_id(id);
		if (memcg && !css_tryget_online(&memcg->css))
		memcg = NULL;
		rcu_read_unlock();
		}

		if (!memcg)
		if (!memcg \|\| !css_tryget_online(&memcg->css))
		memcg = get_mem_cgroup_from_mm(mm);
		rcu_read_unlock();

		ret = try_charge(memcg, gfp_mask, nr_pages);
		if (ret)
		goto out_put;

		css_get(&memcg->css);
		commit_charge(page, memcg);
		ret = __mem_cgroup_charge(page, memcg, gfp);

		local_irq_disable();
		mem_cgroup_charge_statistics(memcg, page, nr_pages);
		memcg_check_events(memcg, page);
		local_irq_enable();
		css_put(&memcg->css);
		return ret;
		}

		/*
		* mem_cgroup_swapin_uncharge_swap - uncharge swap slot
		* @entry: swap entry for which the page is charged
		*
		* Call this function after successfully adding the charged page to swapcache.
		*
		* Note: This function assumes the page for which swap slot is being uncharged
		* is order 0 page.
		*/
		void mem_cgroup_swapin_uncharge_swap(swp_entry_t entry)
		{
		/*
		* Cgroup1's unified memory+swap counter has been charged with the
		* new swapcache page, finish the transfer by uncharging the swap
		@@ -6714,20 +6751,14 @@ int mem_cgroup_charge(struct page page, struct mm_struct mm, gfp_t gfp_mask)
		* correspond 1:1 to page and swap slot lifetimes: we charge the
		* page to memory here, and uncharge swap when the slot is freed.
		*/
		if (do_memsw_account() && PageSwapCache(page)) {
		swp_entry_t entry = { .val = page_private(page) };
		if (!mem_cgroup_disabled() && do_memsw_account()) {
		/*
		* The swap entry might not get freed for a long time,
		* let's not wait for it. The page already received a
		* memory+swap charge, drop the swap entry duplicate.
		*/
		mem_cgroup_uncharge_swap(entry, nr_pages);
		mem_cgroup_uncharge_swap(entry, 1);
		}

		out_put:
		css_put(&memcg->css);
		out:
		return ret;
		}

		struct uncharge_gather {

mm/memory.c

+7 −9

Original line number	Diff line number	Diff line
		@@ -3309,28 +3309,26 @@ vm_fault_t do_swap_page(struct vm_fault *vmf)
		page = alloc_page_vma(GFP_HIGHUSER_MOVABLE, vma,
		vmf->address);
		if (page) {
		int err;

		__SetPageLocked(page);
		__SetPageSwapBacked(page);
		set_page_private(page, entry.val);

		/* Tell memcg to use swap ownership records */
		SetPageSwapCache(page);
		err = mem_cgroup_charge(page, vma->vm_mm,
		GFP_KERNEL);
		ClearPageSwapCache(page);
		if (err) {
		if (mem_cgroup_swapin_charge_page(page,
		vma->vm_mm, GFP_KERNEL, entry)) {
		ret = VM_FAULT_OOM;
		goto out_page;
		}
		mem_cgroup_swapin_uncharge_swap(entry);

		shadow = get_shadow_from_swap_cache(entry);
		if (shadow)
		workingset_refault(page, shadow);

		lru_cache_add(page);

		/* To provide entry to swap_readpage() */
		set_page_private(page, entry.val);
		swap_readpage(page, true);
		set_page_private(page, 0);
		}
		} else {
		page = swapin_readahead(entry, GFP_HIGHUSER_MOVABLE,

mm/swap_state.c

+6 −7

Original line number	Diff line number	Diff line
		@@ -497,16 +497,14 @@ struct page *__read_swap_cache_async(swp_entry_t entry, gfp_t gfp_mask,
		__SetPageLocked(page);
		__SetPageSwapBacked(page);

		/* May fail (-ENOMEM) if XArray node allocation failed. */
		if (add_to_swap_cache(page, entry, gfp_mask & GFP_RECLAIM_MASK, &shadow)) {
		put_swap_page(page, entry);
		if (mem_cgroup_swapin_charge_page(page, NULL, gfp_mask, entry))
		goto fail_unlock;
		}

		if (mem_cgroup_charge(page, NULL, gfp_mask)) {
		delete_from_swap_cache(page);
		/* May fail (-ENOMEM) if XArray node allocation failed. */
		if (add_to_swap_cache(page, entry, gfp_mask & GFP_RECLAIM_MASK, &shadow))
		goto fail_unlock;
		}

		mem_cgroup_swapin_uncharge_swap(entry);

		if (shadow)
		workingset_refault(page, shadow);
		@@ -517,6 +515,7 @@ struct page *__read_swap_cache_async(swp_entry_t entry, gfp_t gfp_mask,
		return page;

		fail_unlock:
		put_swap_page(page, entry);
		unlock_page(page);
		put_page(page);
		return NULL;