内存屏障,先看这篇文章
发布日期:2021-06-30 18:43:41 浏览次数:2 分类:技术文章

本文共 2436 字,大约阅读时间需要 8 分钟。

刚看到这个词的时候,我以为是白内障,然后查了很多资料,才理解内存屏障是干嘛的,我就不像很多其他文章说得那么多了,我希望我说得简单一些,让大家看了我的文章都知道这个是怎么回事。

说到内存屏障,我们先从CPU性能优化说起

性能优化的方法一,缓存

CPU的速度很快,到底有多快?我们就用光速来比喻CPU的执行速度吧,反正就是执行读写很快,但是CPU速度很快,内存的速度很慢,怎么办?

这时候,高速缓存出现了「先不抬杠说寄存器哈」。比如有一个变量a ,CPU在很长一段时间内都需要使用它,如果把他放在内存里面的话,每次读写的速度都很慢,这样严重拖慢了CPU的执行速度。

所以就出现了 缓存

缓存也是分类的,缓存分成了三类,我简单说明下

缓存同步协议MESI如果在4个CPU在各自的L1 里面都有一个变量 i ,他们要把这个变量i写入到内存里面去,是以哪一个为准呢?

这个时候就需要缓存的同步协议,每个cpu对缓存里面的变量操作的时候,要通知其他CPU,让他们知道当前的状态。

CPU不仅需要发消息给其他CPU告诉他们状态,同时也要接收其他CPU发出来的状态。

这样做的最终目的,就是为了保证CPU对变量操作的一致性

CPU性能优化的方法二,运行时指令重排

指令重排是个有意思的事情,如果把CPU当成是一个人的话,他也是有自己的意识的,存在意识的东西,就会存在自己做事情的方法,比如,我今天要去打篮球,还要去帮妈妈打酱油,我是先打篮球还是先打酱油,因为个人的意识不同,做事情的先后顺序也存在差异。

为什么出现指令重排?如果有一个CPU,我们假设是CPU0吧,它在写缓存的的某个区块的时候,发现这个缓存位置刚好被CPU1正常操作,那他怎么办?有两种方法,一种是等待CPU1执行结束后自己再执行,还有一种方法就是先去干其他的事情,很明显,CPU为了提高自己的性能,它会选择第二种方法,就是先去干其他的事情,干其他的事情,就出现上面描述的情况,指令重排了。

所以我们会有一个疑问?代码是按照程序员的想法去执行的呢?还是按照CPU的想法去执行的呢?回答当然是需要按照程序员的意识去执行的。

所以要求,指令重排遵循as-if-serial语义这个是什么意思呢?就是说指令重排的结果不能影响程序员预期的结果,比如上面的代码,重排后就会出现问题,那么CPU就不能对指令进行重排。

注意,上面所说的as-if-serial语义针对的是单核CPU来说

但是如果是下面的代码

a = 100;b = c;

上面两条语句不存在依赖关系,它们可以进行指令重排,因为重排后不会影响最后的执行结果。

高速缓存和指令重排序(reordings)存在的问题

缓存机制和指令重排都是为了CPU运算的性能优化。会出现两个问题。1、缓存和内存的数据并不是时实同步的,同一个内存地址,不同的CPU看到的内存值是不一样的。因为CPU运行速度很快,假设,CPU0 读 地址 0x2345 的时候值为 1,这个时候,CPU1向 0x2345写入了 2,CPU2再读这个内存 0x2345 的值的时候,发现它变成2了。所以就有问题了

出现的问题是同一个时间点上,不同的CPU看到的同一个内存地址数据不一样

2、我们指令重排说的as-if-serial语义只是针对单个CPU,那多个CPU呢?会出现什么问题

看下面的例子:

看上面图片

CPU0 要执行两条指令,CPU1也要执行两条指令,但是如果他们执行的先后顺序不同,那么x和y的结果也将存在差异。

第一种情况如下图执行顺序会导致 x = 0 , y = 1。

第二种情况如下图执行顺序会导致 x =1,y = 0。第三种情况如下图执行顺序会导致 x = 1,y=1。

结果跟程序员的预期不符合 出现的问题是,多个CPU,也就是我们经常所说的SMP系统下,会出现结果和预期不一致的问题

最后说内存屏障(Memory Barrier)

内存屏障就是用来解决上面两个问题的。这个是CPU厂商来搞定的。

  • 写内存屏障(Store Memory Barrier) 写内存屏障的意思就是在写内存的后面加入指令 Store Barrier ,如果CPU有读的也有写的,加了这条指令,就保证先执行写入而不去做指令重排,这种显示调用可以让其他线程看到。其他线程会等这个执行结束后再去操作,既然是等待,那也是降低性能的,好吧,降低性能也是没有办法的事情了。

就拿上面的 图片来说明A = 1 B = 1 这两个是写操作,我们加上写内存屏障,即使其他CPU有读的指令,我们需要等待这个写完成后,再进行读操作。

  • 读内存屏障 (Load Memory Barrier) 在读指令之前插入Load Barrier,可以让高速缓存中的数据失效,强制从内存加载最新的数据,让CPU缓存和主内存保持一致,避免了缓存导致的一致性问题。

void executedOnCpu0() {    value = 10;    /*在更新数据之前必须将所有存储缓存(store buffer)中的指令执行完毕。*/    storeMemoryBarrier();    finished = true;}void executedOnCpu1() {    while(!finished);    /*在读取之前将所有失效队列中关于该数据的指令执行完毕。*/    loadMemoryBarrier();    assert value == 10;}

总结

CPU为了性能,发明了缓存和指令重排,但是又因为缓存和指令重排出现了新的问题,因为新的问题出现,聪明的人类又发明了内存屏障,之所谓,兵来将挡水来土掩就是这个道理。

文章是整理了自己看到资料的很多见解,后续会发新的文章进一步讲解,当然了,或者也会不发,我就是一只漂亮的鸽子,我鸽呀鸽呀鸽,祝大家周末愉快。


扫码或长按关注

回复「 篮球的大肚子」进入技术群聊

转载地址:https://linus.blog.csdn.net/article/details/103650323 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:自定义协议的这些典型例子你会了吗?
下一篇:我和Git的第一次

发表评论

最新留言

关注你微信了!
[***.104.42.241]2024年04月05日 04时49分28秒