什么是伪随机数？

植鞣革2023-02-09 37

分类: 电脑/网络

解析:

大家可能很多次讨论过随机数在计算机中怎样产生的问题，在这篇文章中，我会对这个问题进行更深入的探讨，阐述我对这个问题的理解。

首先需要声明的是，计算机不会产生绝对随机的随机数，计算机只能产生“伪随机数”。其实绝对随机的随机数只是一种理想的随机数，即使计算机怎样发展，它也不会产生一串绝对随机的随机数。计算机只能生成相对的随机数，即伪随机数。

伪随机数并不是假随机数，这里的“伪”是有规律的意思，就是计算机产生的伪随机数既是随机的又是有规律的。怎样理解呢？产生的伪随机数有时遵守一定的规律，有时不遵守任何规律；伪随机数有一部分遵守一定的规律；另一部分不遵守任何规律。比如“世上没有两片形状完全相同的树叶”，这正是点到了事物的特性，即随机性，但是每种树的叶子都有近似的形状，这正是事物的共性，即规律性。从这个角度讲，你大概就会接受这样的事实了：计算机只能产生伪随机数而不能产生绝对随机的随机数。

那么计算机中随机数是怎样产生的呢？有人可能会说，随机数是由“随机种子”产生的。没错，随机种子是用来产生随机数的一个数，在计算机中，这样的一个“随机种子”是一个无符号整形数。那么随机种子是从哪里获得的呢？

下面看这样一个C程序：

rand01.c

#include

static unsigned int RAND_SEED

unsigned int random(void)

{

RAND_SEED=(RAND_SEED*123+59)%65536

return(RAND_SEED)

}

void random_start(void)

{

int temp[2]

movedata(0x0040,0x006c,FP_SEG(temp),FP_OFF(temp),4)

RAND_SEED=temp[0]

}

main()

{

unsigned int i,n

random_start()

for(i=0i<10i++)

printf("%u\t",random())

printf("\n")

}

这个程序（rand01.c）完整地阐述了随机数产生的过程：

首先，主程序调用random_start()方法，random_start()方法中的这一句我很感兴趣：

movedata(0x0040,0x006c,FP_SEG(temp),FP_OFF(temp),4)

这个函数用来移动内存数据，其中FP_SEG（far pointer to segment）是取temp数组段地址的函数，FP_OFF（far pointer to offset）是取temp数组相对地址的函数，movedata函数的作用是把位于0040:006CH存储单元中的双字放到数组temp的声明的两个存储单元中。这样可以通过temp数组把0040:006CH处的一个16位的数送给RAND_SEED。

random用来根据随机种子RAND_SEED的值计算得出随机数，其中这一句：

RAND_SEED=(RAND_SEED*123+59)%65536

是用来计算随机数的方法，随机数的计算方法在不同的计算机中是不同的，即使在相同的计算机中安装的不同的操作系统中也是不同的。我在linux和windows下分别试过，相同的随机种子在这两种操作系统中生成的随机数是不同的，这说明它们的计算方法不同。

现在，我们明白随机种子是从哪儿获得的，而且知道随机数是怎样通过随机种子计算出来的了。那么，随机种子为什么要在内存的0040:006CH处取？0040:006CH处存放的是什么？

学过《计算机组成原理与接口技术》这门课的人可能会记得在编制ROM BIOS时钟中断服务程序时会用到Intel 8253定时/计数器，它与Intel 8259中断芯片的通信使得中断服务程序得以运转，主板每秒产生的18.2次中断正是处理器根据定时/记数器值控制中断芯片产生的。在我们计算机的主机板上都会有这样一个定时/记数器用来计算当前系统时间，每过一个时钟信号周期都会使记数器加一，而这个记数器的值存放在哪儿呢？没错，就在内存的0040:006CH处，其实这一段内存空间是这样定义的：

TIMER_LOW DW ? ；地址为 0040:006CH

TIMER_HIGH DW ? ；地址为 0040:006EH

TIMER_OFT DB ? ；地址为 0040:0070H

时钟中断服务程序中，每当TIMER_LOW转满时，此时，记数器也会转满，记数器的值归零，即TIMER_LOW处的16位二进制归零，而TIMER_HIGH加一。rand01.c中的

movedata(0x0040,0x006c,FP_SEG(temp),FP_OFF(temp),4)

正是把TIMER_LOW和TIMER_HIGH两个16位二进制数放进temp数组，再送往RAND_SEED，从而获得了“随机种子”。

现在，可以确定的一点是，随机种子来自系统时钟，确切地说，是来自计算机主板上的定时/计数器在内存中的记数值。这样，我们总结一下前面的分析，并讨论一下这些结论在程序中的应用：

1.随机数是由随机种子根据一定的计算方法计算出来的数值。所以，只要计算方法一定，随机种子一定，那么产生的随机数就不会变。

看下面这个C++程序：

rand02.cpp

#include

using namespace std

int main()

{

unsigned int seed=5

srand(seed)

unsigned int r=rand()

cout<编辑者注：可能代码有缺

}

在相同的平台环境下，编译生成exe后，每次运行它，显示的随机数都是一样的。这是因为在相同的编译平台环境下，由随机种子生成随机数的计算方法都是一样的，再加上随机种子一样，所以产生的随机数就是一样的。

2.只要用户或第三方不设置随机种子，那么在默认情况下随机种子来自系统时钟（即定时/计数器的值）

看下面这个C++程序：

rand03.cpp

#include

using namespace std

int main()

{

srand((unsigned)time(NULL))

unsigned int r=rand()

cout<return 0

}

这里用户和其他程序没有设定随机种子，则使用系统定时/计数器的值做为随机种子，所以，在相同的平台环境下，编译生成exe后，每次运行它，显示的随机数会是伪随机数，即每次运行显示的结果会有不同。

3.建议：如果想在一个程序中生成随机数序列，需要至多在生成随机数之前设置一次随机种子。

看下面这个用来生成一个随机字符串的C++程序：

rand04.cpp

#include

using namespace std

int main()

{

int rNum,m=20

char *ch=new char[m]

for ( int i = 0i 大家看到了，随机种子会随着for循环在程序中设置多次

srand((unsigned)time(NULL))

rNum=1+(int)((rand()/(double)RAND_MAX)*36)求随机值

switch (rNum){

case 1: ch[i]='a'

break

case 2: ch[i]='b'

break

case 3: ch[i]='c'

break

case 4: ch[i]='d'

break

case 5: ch[i]='e'

break

case 6: ch[i]='f'

break

case 7: ch[i]='g'

break

case 8: ch[i]='h'

break

case 9: ch[i]='i'

break

case 10: ch[i]='j'

break

case 11: ch[i]='k'

break

case 12: ch[i]='l'

break

case 13: ch[i]='m'

break

case 14: ch[i]='n'

break

case 15: ch[i]='o'

break

case 16: ch[i]='p'

break

case 17: ch[i]='q'

break

case 18: ch[i]='r'

break

case 19: ch[i]='s'

break

case 20: ch[i]='t'

break

case 21: ch[i]='u'

break

case 22: ch[i]='v'

break

case 23: ch[i]='w'

break

case 24: ch[i]='x'

break

case 25: ch[i]='y'

break

case 26: ch[i]='z'

break

case 27:ch[i]='0'

break

case 28:ch[i]='1'

break

case 29:ch[i]='2'

break

case 30:ch[i]='3'

break

case 31:ch[i]='4'

break

case 32:ch[i]='5'

break

case 33:ch[i]='6'

break

case 34:ch[i]='7'

break

case 35:ch[i]='8'

break

case 36:ch[i]='9'

break

}end of switch

cout<}end of for loop

cout<return 0

}

而运行结果显示的随机字符串的每一个字符都是一样的，也就是说生成的字符序列不随机，所以我们需要把srand((unsigned)time(NULL))从for循环中移出放在for语句前面，这样可以生成随机的字符序列，而且每次运行生成的字符序列会不同（呵呵，也有可能相同，不过出现这种情况的几率太小了）。

如果你把srand((unsigned)time(NULL))改成srand(2)这样虽然在一次运行中产生的字符序列是随机的，但是每次运行时产生的随机字符序列串是相同的。把srand这一句从程序中去掉也是这样。

此外，你可能会遇到这种情况，在使用timer控件编制程序的时候会发现用相同的时间间隔生成的一组随机数会显得有规律，而由用户按键mand事件产生的一组随机数却显得比较随机，为什么？根据我们上面的分析，你可以很快想出答案。这是因为timer是由计算机时钟记数器精确控制时间间隔的控件，时间间隔相同，记数器前后的值之差相同，这样时钟取值就是呈线性规律的，所以随机种子是呈线性规律的，生成的随机数也是有规律的。而用户按键事件产生随机数确实更呈现随机性，因为事件是由人按键引起的，而人不能保证严格的按键时间间隔，即使严格地去做，也不可能完全精确做到，只要时间间隔相差一微秒，记数器前后的值之差就不相同了，随机种子的变化就失去了线性规律，那么生成的随机数就更没有规律了，所以这样生成的一组随机数更随机。这让我想到了各种晚会的抽奖程序，如果用人来按键产生幸运观众的话，那就会很好的实现随机性原则，结果就会更公正。

最后，我总结两个要点：

1.计算机的伪随机数是由随机种子根据一定的计算方法计算出来的数值。所以，只要计算方法一定，随机种子一定，那么产生的随机数就是固定的。

2.只要用户或第三方不设置随机种子，那么在默认情况下随机种子来自系统时钟。

伪随机数是用确定性的算法计算出来自[0.1]均匀分布的随机数序列。并不真正的随机，但具有类似于随机数的统计特征，如均匀性、独立性等。在计算伪随机数时，若使用的初值不变，那么伪随机数的数序也不变。伪随机数可以用计算机大量生成，在模拟研究中为了提高模拟效率，一般采用伪随机数代替真正的随机数。模拟中使用的一般是循环周期极长并能通过随机数检验的伪随机数，以保证计算结果的随机性。

伪随机数生成方法

1、直接法，根据分布函数的物理意义生成。缺点是仅适用于某些具有特殊分布的随机数，如二项式分布、泊松分布。

2、逆转法，假设U服从[0.1]区间上的均匀分布，令X=F-1(U)，则X的累计分布函数(CDF)为F。该方法原理简单、编程方便、适用性广。

3、接受拒绝法，假设希望生成的随机数的概率密度函数为f，则首先找到一个PDF为g的随机数发生器与常数c，使得f(x)≤cg(x)，然后根据接收拒绝算法求解。由于算法平均运算c次才能得到一个希望生成的随机数，因此c的取值必须尽可能小。显然，该算法的缺点是较难确定g与c。

因此，伪随机数生成器一般采用逆转法，其基础是均匀分布，均匀分布PRNG的优劣决定了整个随机数体系的优劣。

真伪随机其实分别指的是几率和概率

很久以前流传着这样一则笑话：一个身患重病的人决定去动手术。在手术之前，他问医生：“这起手术的成功率是多少？”医生回答他：“只有1%。”他很惊慌，但是医生说：“没事的，在你之前我已经治死过99个人了。”

这是一则嘲笑那些不懂“概率”的人的笑话，却讲出了“真随机”和“伪随机”之间的区别。

1.随机性：完全紊乱；

2.不可预测性：从现有号码，无法推断下一个数字；

3.不可重复性：随机数之间没有重复。

真随机数是伴随物理实验，例如：掷硬币、掷骰子、电子元件噪声、核裂变等，其结果符合三个特点。

伪随机数是通过某种算法，获取随机值，不是真的很随机。

伪随机数分为强伪随机数和弱伪随机数。

1.强伪随机数：接近真实随机数，令人满意的特性。随机性与不可预测性，不可预知的。

2.弱伪随机数：满足随机性，可预测的。

在游戏当中我们一直提到的“真随机”和“伪随机”，到底是什么意思？

我们通常说的真随机又名“纯随机”（True Random Distribution），就是我们平常一直说的那种、一般意义上的“随机”。

在真随机中，每一个事件都是相互独立、服从真随机分布的，不受其他事件的发生而改变。比方说某款游戏为了吸引用户，拥有这么一个随机抽卡系统：每次抽卡时，都有1%的几率抽出SSR卡片，这个概率服从真随机分布。

回到我们最开始说的那个“治死99个”的笑话：我们一眼就能看出这个笑话的不合理性。但在抽卡游戏中，我们的大脑瞬间失去理智。有相当一部分玩家认为：我连抽100次，总能抽到这张卡吧！

实际上，连抽100次却抽不出1%的SSR卡的几率是为(1-0.01)^100=36.6%，甚至还稍稍超过了1/3。将连抽数字上升至300，也仍有4.9%的几率。

换句话说，假设有10000个玩家连抽100次，就有约3660个玩家抽不出这张SSR；10000个玩家连抽300次，也仍有约490个玩家抽不出这张SSR——这对玩家的游戏体验来说可以说是毁灭性的打击。

设计者们提出了“伪随机”的概念：在不确定性的随机事件当中，通过一系列算法使随机事件均匀分布在多次事件当中，尽可能减少或消除极端情况的发生，以提高玩家的游戏体验。

制造“伪随机”的方法有很多，

N表示当前攻击的次数，P(N)表示当前攻击的暴击率，C为概率增量。如果我们这次攻击产生了暴击，则需要将 N 重置为 1，如果这次攻击没有产生暴击，则 N + 1。

为了便于理解，这里直接给出一个具体例子：

设我们当前玩家角色暴击率还是0.5，那么对于 PRD算法，此时的 C = 0.3

可以看到，使用 PRD 算法，对于攻击是否会暴击这一问题，仍然是存在着随机性即玩家的运气因素的，但即使是运气最差的玩家，仍然也会在第四次攻击时产生暴击，因此PRD算法可以在保存随机性的同时，减少玩家运气因素对游戏结果的影响。

真随机： 有一天，小明在的班级上举办了一次抽奖活动。这个班级有40个学生，所以为了公平起见，保证每个学生都有1/40的几率中奖，老师准备了40个相同的纸盒，每个纸盒中都有40张纸条，有1张纸条是中奖纸条。这样一来，每个学生都有1/40的几率中奖，但每个学生是否中奖并不受其他学生的影响。在极端情况下，这个班上可能40个学生都能中奖。这就是真随机。

伪随机： 小明班上举办了抽奖活动。为了公平起见，老师准备了1个纸盒，纸盒中有40张纸条，只有1张纸条是中奖纸条。这样一来，每个学生都有1/40的几率中奖——但是显而易见，这个班上有且仅有一名学生能够中奖。一名学生在中奖后，余下的所有学生中奖几率都会减少至0。这就是伪随机。

转载请注明原文地址:https://juke.outofmemory.cn/read/2928730.html

00 生成海报

什么是伪随机数？

随机数

种子

记数器

随机性

程序

万有引力定律是什么？

死得其所的意思是什么