net/page_pool/types.h

190207Srpaulo/* SPDX-License-Identifier: GPL-2.0 */
75115Sfenner
75115Sfenner#ifndef _NET_PAGE_POOL_TYPES_H
75115Sfenner#define _NET_PAGE_POOL_TYPES_H
75115Sfenner
75115Sfenner#include <linux/dma-direction.h>
75115Sfenner#include <linux/ptr_ring.h>
75115Sfenner#include <linux/types.h>
75115Sfenner
75115Sfenner#define PP_FLAG_DMA_MAP		BIT(0) /* Should page_pool do the DMA
75115Sfenner					* map/unmap
75115Sfenner					*/
75115Sfenner#define PP_FLAG_DMA_SYNC_DEV	BIT(1) /* If set all pages that the driver gets
75115Sfenner					* from page_pool will be
75115Sfenner					* DMA-synced-for-device according to
75115Sfenner					* the length provided by the device
75115Sfenner					* driver.
75115Sfenner					* Please note DMA-sync-for-CPU is still
75115Sfenner					* device driver responsibility
75115Sfenner					*/
75115Sfenner#define PP_FLAG_SYSTEM_POOL	BIT(2) /* Global system page_pool */
75115Sfenner#define PP_FLAG_ALL		(PP_FLAG_DMA_MAP | PP_FLAG_DMA_SYNC_DEV | \
75115Sfenner				 PP_FLAG_SYSTEM_POOL)
75115Sfenner
75115Sfenner/*
75115Sfenner * Fast allocation side cache array/stack
75115Sfenner *
75115Sfenner * The cache size and refill watermark is related to the network
75115Sfenner * use-case.  The NAPI budget is 64 packets.  After a NAPI poll the RX
75115Sfenner * ring is usually refilled and the max consumed elements will be 64,
75115Sfenner * thus a natural max size of objects needed in the cache.
75115Sfenner *
75115Sfenner * Keeping room for more objects, is due to XDP_DROP use-case.  As
75115Sfenner * XDP_DROP allows the opportunity to recycle objects directly into
75115Sfenner * this array, as it shares the same softirq/NAPI protection.  If
75115Sfenner * cache is already full (or partly full) then the XDP_DROP recycles
75115Sfenner * would have to take a slower code path.
75115Sfenner */
75115Sfenner#define PP_ALLOC_CACHE_SIZE	128
75115Sfenner#define PP_ALLOC_CACHE_REFILL	64
75115Sfennerstruct pp_alloc_cache {
75115Sfenner	u32 count;
75115Sfenner	struct page *cache[PP_ALLOC_CACHE_SIZE];
75115Sfenner};
75115Sfenner
75115Sfenner/**
75115Sfenner * struct page_pool_params - page pool parameters
75115Sfenner * @flags:	PP_FLAG_DMA_MAP, PP_FLAG_DMA_SYNC_DEV
75115Sfenner * @order:	2^order pages on allocation
75115Sfenner * @pool_size:	size of the ptr_ring
75115Sfenner * @nid:	NUMA node id to allocate from pages from
75115Sfenner * @dev:	device, for DMA pre-mapping purposes
75115Sfenner * @netdev:	netdev this pool will serve (leave as NULL if none or multiple)
75115Sfenner * @napi:	NAPI which is the sole consumer of pages, otherwise NULL
75115Sfenner * @dma_dir:	DMA mapping direction
75115Sfenner * @max_len:	max DMA sync memory size for PP_FLAG_DMA_SYNC_DEV
75115Sfenner * @offset:	DMA sync address offset for PP_FLAG_DMA_SYNC_DEV
75115Sfenner */
75115Sfennerstruct page_pool_params {
75115Sfenner	struct_group_tagged(page_pool_params_fast, fast,
75115Sfenner		unsigned int	flags;
75115Sfenner		unsigned int	order;
75115Sfenner		unsigned int	pool_size;
75115Sfenner		int		nid;
75115Sfenner		struct device	*dev;
75115Sfenner		struct napi_struct *napi;
75115Sfenner		enum dma_data_direction dma_dir;
75115Sfenner		unsigned int	max_len;
75115Sfenner		unsigned int	offset;
75115Sfenner	);
75115Sfenner	struct_group_tagged(page_pool_params_slow, slow,
75115Sfenner		struct net_device *netdev;
75115Sfenner/* private: used by test code only */
75115Sfenner		void (*init_callback)(struct page *page, void *arg);
75115Sfenner		void *init_arg;
75115Sfenner	);
75115Sfenner};
75115Sfenner
75115Sfenner#ifdef CONFIG_PAGE_POOL_STATS
75115Sfenner/**
75115Sfenner * struct page_pool_alloc_stats - allocation statistics
75115Sfenner * @fast:	successful fast path allocations
75115Sfenner * @slow:	slow path order-0 allocations
75115Sfenner * @slow_high_order: slow path high order allocations
75115Sfenner * @empty:	ptr ring is empty, so a slow path allocation was forced
75115Sfenner * @refill:	an allocation which triggered a refill of the cache
75115Sfenner * @waive:	pages obtained from the ptr ring that cannot be added to
75115Sfenner *		the cache due to a NUMA mismatch
75115Sfenner */
75115Sfennerstruct page_pool_alloc_stats {
75115Sfenner	u64 fast;
75115Sfenner	u64 slow;
75115Sfenner	u64 slow_high_order;
75115Sfenner	u64 empty;
75115Sfenner	u64 refill;
75115Sfenner	u64 waive;
75115Sfenner};
75115Sfenner
75115Sfenner/**
75115Sfenner * struct page_pool_recycle_stats - recycling (freeing) statistics
75115Sfenner * @cached:	recycling placed page in the page pool cache
75115Sfenner * @cache_full:	page pool cache was full
75115Sfenner * @ring:	page placed into the ptr ring
75115Sfenner * @ring_full:	page released from page pool because the ptr ring was full
172683Smlaier * @released_refcnt:	page released (and not recycled) because refcnt > 1
75115Sfenner */
75115Sfennerstruct page_pool_recycle_stats {
75115Sfenner	u64 cached;
75115Sfenner	u64 cache_full;
146773Ssam	u64 ring;
75115Sfenner	u64 ring_full;
75115Sfenner	u64 released_refcnt;
75115Sfenner};
75115Sfenner
75115Sfenner/**
75115Sfenner * struct page_pool_stats - combined page pool use statistics
75115Sfenner * @alloc_stats:	see struct page_pool_alloc_stats
75115Sfenner * @recycle_stats:	see struct page_pool_recycle_stats
75115Sfenner *
75115Sfenner * Wrapper struct for combining page pool stats with different storage
75115Sfenner * requirements.
75115Sfenner */
75115Sfennerstruct page_pool_stats {
75115Sfenner	struct page_pool_alloc_stats alloc_stats;
75115Sfenner	struct page_pool_recycle_stats recycle_stats;
75115Sfenner};
75115Sfenner#endif
75115Sfenner
75115Sfennerstruct page_pool {
75115Sfenner	struct page_pool_params_fast p;
75115Sfenner
75115Sfenner	int cpuid;
75115Sfenner	bool has_init_callback;
75115Sfenner
75115Sfenner	long frag_users;
75115Sfenner	struct page *frag_page;
75115Sfenner	unsigned int frag_offset;
75115Sfenner	u32 pages_state_hold_cnt;
75115Sfenner
75115Sfenner	struct delayed_work release_dw;
75115Sfenner	void (*disconnect)(void *pool);
75115Sfenner	unsigned long defer_start;
75115Sfenner	unsigned long defer_warn;
75115Sfenner
75115Sfenner#ifdef CONFIG_PAGE_POOL_STATS
75115Sfenner	/* these stats are incremented while in softirq context */
75115Sfenner	struct page_pool_alloc_stats alloc_stats;
75115Sfenner#endif
75115Sfenner	u32 xdp_mem_id;
75115Sfenner
75115Sfenner	/*
75115Sfenner	 * Data structure for allocation side
75115Sfenner	 *
75115Sfenner	 * Drivers allocation side usually already perform some kind
75115Sfenner	 * of resource protection.  Piggyback on this protection, and
75115Sfenner	 * require driver to protect allocation side.
75115Sfenner	 *
75115Sfenner	 * For NIC drivers this means, allocate a page_pool per
75115Sfenner	 * RX-queue. As the RX-queue is already protected by
75115Sfenner	 * Softirq/BH scheduling and napi_schedule. NAPI schedule
75115Sfenner	 * guarantee that a single napi_struct will only be scheduled
127668Sbms	 * on a single CPU (see napi_schedule).
127668Sbms	 */
127668Sbms	struct pp_alloc_cache alloc ____cacheline_aligned_in_smp;

	/* Data structure for storing recycled pages.
	 *
	 * Returning/freeing pages is more complicated synchronization
	 * wise, because free's can happen on remote CPUs, with no
	 * association with allocation resource.
	 *
	 * Use ptr_ring, as it separates consumer and producer
	 * efficiently, it a way that doesn't bounce cache-lines.
	 *
	 * TODO: Implement bulk return pages into this structure.
	 */
	struct ptr_ring ring;

#ifdef CONFIG_PAGE_POOL_STATS
	/* recycle stats are per-cpu to avoid locking */
	struct page_pool_recycle_stats __percpu *recycle_stats;
#endif
	atomic_t pages_state_release_cnt;

	/* A page_pool is strictly tied to a single RX-queue being
	 * protected by NAPI, due to above pp_alloc_cache. This
	 * refcnt serves purpose is to simplify drivers error handling.
	 */
	refcount_t user_cnt;

	u64 destroy_cnt;

	/* Slow/Control-path information follows */
	struct page_pool_params_slow slow;
	/* User-facing fields, protected by page_pools_lock */
	struct {
		struct hlist_node list;
		u64 detach_time;
		u32 napi_id;
		u32 id;
	} user;
};

struct page *page_pool_alloc_pages(struct page_pool *pool, gfp_t gfp);
struct page *page_pool_alloc_frag(struct page_pool *pool, unsigned int *offset,
				  unsigned int size, gfp_t gfp);
struct page_pool *page_pool_create(const struct page_pool_params *params);
struct page_pool *page_pool_create_percpu(const struct page_pool_params *params,
					  int cpuid);

struct xdp_mem_info;

#ifdef CONFIG_PAGE_POOL
void page_pool_destroy(struct page_pool *pool);
void page_pool_use_xdp_mem(struct page_pool *pool, void (*disconnect)(void *),
			   struct xdp_mem_info *mem);
void page_pool_put_page_bulk(struct page_pool *pool, void **data,
			     int count);
#else
static inline void page_pool_destroy(struct page_pool *pool)
{
}

static inline void page_pool_use_xdp_mem(struct page_pool *pool,
					 void (*disconnect)(void *),
					 struct xdp_mem_info *mem)
{
}

static inline void page_pool_put_page_bulk(struct page_pool *pool, void **data,
					   int count)
{
}
#endif

void page_pool_put_unrefed_page(struct page_pool *pool, struct page *page,
				unsigned int dma_sync_size,
				bool allow_direct);

static inline bool is_page_pool_compiled_in(void)
{
#ifdef CONFIG_PAGE_POOL
	return true;
#else
	return false;
#endif
}

/* Caller must provide appropriate safe context, e.g. NAPI. */
void page_pool_update_nid(struct page_pool *pool, int new_nid);

#endif /* _NET_PAGE_POOL_H */