Day21 atomic, memory barrier


昨天讲完了最後一天的记忆体管理方法,了解了如何管理匿名分页 anonymous page,也知道了RMAP为何要存在,以及存在RMAP的好处。 只是前面讲的都是以单一行程的角度来看记忆体管理,当这些资料有非常多行程需要同时管理与同时使用呢? 如果有多个行程对某个资料同时存取,该如何保证资料的正确性呢? 这个时候就需要同步管理的机制,让行程可以依序拿到正确的资料。


Atomic Operation 若翻译为「原子操作」,同样会因汉语的语意而让我们理解受限,可改称为「最小操作」,即某个动作执行时,中间没有办法分割。


static int i = 0;

void thread_A(){

void thread_B(){

上述程序码的结果可能为1也可能为2,端看两个程序的执行顺序,理由是因为 i++ 的过程,可以拆解成三个,读取i -> i++ -> 存回i , 存在一种状况,如果两个thread 同时取得 i=0 的状态,则两个function的存回值都会是 i=1, 因此原子操作最基本的想法,就是把 "读取-> 修改 ->写入" 这个流程整合成一块,必须要三个步骤都完成,才能够让资料开放给其他人读取,这麽能保持资料的完整性。
在Linux kernel 内有 atomic_t 的结构维护最小操作


type def struct{
    int counter;

以下说说几种 Linux内提供的基本最小操作函数

1. 基本的最小操作函数


void ATOMIC_INIT(i)                  //定义某个变量为 atomic_t
void atomic_set(atomic_t *v, int i); //设置v值为i
int atomic_read(atomic_t *v);        //读取v得值

atomic_set() , atomic_read() 这两个函数可以利用 READ_ONCE()WRITE_ONCE() 达成。只是让我们看看 READ_ONCE() WRITE_ONCE()的注释

Prevent the compiler from merging or refetching reads or writes. The compiler is also forbidden from reordering successive instances of READ_ONCE and WRITE_ONCE, but only when the compiler is aware of some particular ordering. One way to make the compiler aware of ordering is to put the two invocations of READ_ONCE or WRITE_ONCE in different C statements.

可以发现,这样的最小操作函数只能应用在单核,因为 READ_ONCE() WRITE_ONCE() 这两个函数只能禁止编译器进行重排指令的动作,所以这边的指令在多核就会失去效果。

2. 没有返回值的最小操作

static inline void atomic_add(int i, atomic_t *v) 
static inline void atomic_sub(int i, atomic_t *v)
#define atomic_inc(v)			atomic_add(1, (v))
#define atomic_dec(v)			atomic_sub(1, (v))
atomic_{and, or, xor}(int i, atomic_t *v))

#define ATOMIC_OP(op, c_op)						\
static inline void atomic_##op(int i, atomic_t *v)			\
{									\
	int c, old;							\
	c = v->counter;							\
	while ((old = cmpxchg(&v->counter, c, c c_op i)) != c)		\
		c = old;						\


3. 有返回值的原子操作函数

inline function补充

The point of making a function inline is to hint to the compiler that it is worth making some form of extra effort to call the function faster than it would otherwise - generally by substituting the code of the function into its caller. As well as eliminating the need for a call and return sequence, it might allow the compiler to perform certain optimizations between the bodies of both functions.


4. 记忆体屏障 (memory barrier)

记忆体屏障(英语:Memory barrier),也称记忆体栅栏,记忆体栅障,屏障指令等,是一类同步屏障指令,它使得 CPU 或编译器在对记忆体进行操作的时候, 严格按照一定的顺序来执行, 也就是说在memory barrier 之前的指令和memory barrier之後的指令不会由於系统最佳化等原因而导致乱序。

以下是几个Linux kernel中的记忆体屏障函数

barrier()                       //编译优化屏障,阻止编译器为了性能优化而进行指令重排 
mb()                            //记忆体屏障,包含读跟写
rmb()                           //读记忆体屏障
wmb()                           //写记忆体屏障
smp_mb()                        //用於smp的记忆体屏障
smp_rmb()                       //用於SMP的读取记忆体屏障
smp_wmb()                       //用於SMP的写入记忆体屏障

/* The "volatile" is due to gcc bugs */
#define barrier() asm volatile("": : :"memory")
/*volatile: 告诉编译器 barrier()周围的指令不要优化


Token concatenation
The ## operator (known as the "Token Pasting Operator") concatenates two tokens into one token.


#define DECLARE_STRUCT_TYPE(name) typedef struct name##_s name##_t
DECLARE_STRUCT_TYPE(g_object); // Outputs: typedef struct g_object_s g_object_t;

并行程序设计: Atomics 操作

