分支预测(Branch Prediction) -

googi

浏览: 172744 次
性别:
来自: 珠海

最近访客更多访客>>

san_yun

chenguangyao

Master-Gao

DP15980213848

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

分支预测(Branch Prediction)

博客分类：

JAVA综合

在写代码的时候，有时会遇到在循环遍历一个数组时，如果代码块里有做if判断的操作时，我们有个优化的经验，就是先将数组先排序，然后再进行遍历比较操作时，效率会有比较大的提升。

一个简单的测试：

import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
import java.util.Random;

public class Test3 {
  public static final void main( String argc[] ) throws Exception {
    //生成十万个随机数
    List<Integer> randomNumbers = new ArrayList<Integer>();
    Random rnd = new Random();
    for(int i=0; i <= 100000; i++){
      randomNumbers.add(rnd.nextInt(10));
    }
    //未将randomNumbers排序，将randomNumbers大于五万的数放入results1
    List<Integer> results1 = new ArrayList<Integer>();
    long start = System.nanoTime();
    for(int i=0; i <= 100000; i++){
      Integer a = randomNumbers.get(i);
      if(a > 50000){
        results1.add(a);
      }
    }
    long end = System.nanoTime();
    System.out.println(end - start);
    //将randomNumbers排序，将randomNumbers大于五万的数放入results1
    Collections.sort(randomNumbers);
    List<Integer> results2 = new ArrayList<Integer>();
    long start1 = System.nanoTime();
    for(int i=0; i <= 100000; i++){
      Integer a = randomNumbers.get(i);
      if(a > 50000){
        results2.add(a);
      }
    }
    long end1 = System.nanoTime();
    System.out.println(end1 - start1);
  }
}

运行结果：
1138865
762985

那为什么排好序的代码在判断的时候效率会更高呢？原因在于本文的主题：分支预测。

简单来说，就是在做if语句判断时，结果要么是A,要么是B,如果在判断前有个预判，执行A或者B,可以预先做些操作，然后通过判断来确认判断的正确性，如果预判的准确率较高，那么效率提升地就高，而预判一般地基础是之前做地判断结果，所以排序后地判断，能保证这个预判地连续性和正确性，提升了效率。

具体来说，这其实是个CPU level的操作，一般的，指令流水线中的第一条指令已进入到译码阶段，而第二条指令已进入到提取阶段(准备进入译码器)，如果发现第一条指令是分支指令(如跳转到某个地址)，则指令预取队列中下一条及下下条等指令预取无效。这时(确切地说，等到第一条指令执行期间形成了分支的目标地址)，需从目标地址中现取指令，并交付执行，同时应立即清除指令预取队列，再将目标地址后面的指令预取过来填到队列中。这表明，一遇到分支指令，整个指令流水线就被打乱一次，稍后才能恢复到正常。显然，这影响了机器的运行速度。为此，在Pentium处理器中使用了分支目标缓冲器(Branch Target Buffer，BTB)来预测分支指令。
BTB实际是一个能存若干(通常为256或512)条目的地址存储部件。当一条分支指令导致程序分支时，BTB就记下这条指令的目标地址，并用这条信息预测这一指令再次引起分支时的路径，预先从该处预取。下面看一下BTB在循环程序中应用。循环程序在程序设计中使用得十分普遍。在指令级目标程序中构成循环程序需要用转移指令(条件转移指令或无条件转移指令)。看下例：
MOV CX．100
LOOP： ……
……
DEC CX
JNZ LOOP
……
在第一次执行到JNZ指令时，预测的转移地址是存在BTB中的前面一条JNZ指令的目标地址，不是LOOP，这一次预测是错误的。但执行后目标地址 LOOP便存入到BTB中。等到下一次执行到JNZ指令，就按BTB中的内容来预测，转移到LOOP，这是正确的。如此，一直到cx的值变为0之前，也都是对的。当再循环一次CX的值变为0时，JNZ指令因条件不成立而不实行转移，而预测仍是LOOP，预取仍按该预测进行，这是第二次预取错误。可见，该例中100次循环，有98次预测，确切地说，有98次预测指导下的预取是正确的。同理，对于1000次循环，就会有998次的预取是正确的。即循环次数越多，BTB带来的效益就越高。

参考：http://blog.sina.com.cn/s/blog_6c673e570100zfmo.html

分享到：

写在2013年的第一天 | 逆商 & 灵商

2012-12-24 15:36
浏览 3369
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

分支预测(Branch Prediction)

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

分支预测(Branch Prediction)

评论

发表评论

相关推荐

Guava学习2

Guava学习1

Spring MVC学习

JUC AQS

货币组合问题的实现

笔记-再读深入浅出设计模式

CLH锁学习

java语言的线程安全级别

Java多线程发展简史(转)

读《分布式java应用:基础与实践》

Java 并发和NIO的学习计划

同步与异步 阻塞与非阻塞型I/O(转)

Java 线程/内存模型的缺陷和增强(转)

读《你的灯亮着吗》

excel大数据量处理小结（excel07）

最近访客更多访客>>

同步与异步阻塞与非阻塞型I/O(转)