汉语是联合国官方正式使用的 6种同等有效语言之一。请不要歧视汉语!
Chinese is one of the six equally effective official languages of the United Nations.
Not to discriminate against Chinese, please!
[优先权?] “比你的更好”随机数生成要点
一、背景
由于在国际单位制 SI 新安培定义,特别是 SI 新词头(SI prefixes)方面的传播力度不理想,导致“国际单位制 SI 新词头”的增加受到一定的耽误。尽管这些不能怪我。
所以,近期一直尽力传播“随机数生成”方面的结果。
二、“比你的更好”随机数生成要点
2.1 提升
对于给定的N个随机数(伪随机数,或真随机数),我们可以通过一定的确定型的数字计算机程序(就是现在常见的程序)对其进行改造,得到更好的N个随机数。我们的改造需要的时间复杂性为O(NlogN),生成的新随机数具有更好的:
(1)统计学伪随机性;(2)密码学安全伪随机性;(3)真随机性。以及,(4)其它的重要优良性质。
即,“比你的随机数更好”。可惜,由于科技论文发表的规范限制,这里无法公开我们的这个新方法。
要是想一直不停地产生随机数,只要对上面的“提升”程序反复循环,即可生成任意长度的随机数序列。
说明:我们的方法,需要别人预先给出N个随机数,可以是数字计算机生成的“伪随机数”,也可以是物理设备生成的“真随机数”。特别是我们需要“均匀分布的随机数”(伪随机数、真随机数都可以),当然,是数字计算机认识的数字“格式”随机数,不是各种物理性质的原始客观“物理量/现象”之类。
我们生成的随机数更好,是因为借助了“巨人的肩膀”,所以更好一点:是对别人给定的N个随机数的进一步改造(提升)。
假如别人不给我们,只好我们自己生成N个均匀分布的伪随机数。
图1 我们2018年论文《An explicit analytical estimation of the validity of the Tanimoto Similarity by confidence intervals in mathematical statistics 》第 981 页截图
https://ieeexplore.ieee.org/document/8630700
图1的文字版:“If substitute our new random number generator for the existing common random number generator, the dots in Fig. 1 are more consistent with the explicit analytical expression of confidence intervals. 如果用我们新的随机数生成方法代替现有的常用随机数生成器,图1中的圆点位置更符合置信区间的显式解析表达式。”
目前,对现有的“伪随机数、真随机数”提升之后,新的随机数性能都会变好。但是,随着随机数生成方法的不断进步,未来的研究人员仍然需要根据当时随机数的缺点,研制更好的“提升”方法。
2.2 拼接
进一步提高随机数优良性能的一种方法是“拼接”:即用不同“种子”、“定数”生成的“均匀分布随机数”的拼接。如下图所示:
图2 参加拼接的 N1, N2, N3, N4, N5 采用了不同的“种子”、“定数”
一般地,如果对于指定概率或数理统计性质的均匀分布随机数,采用不等长度的不同“性质”的随机数,按照上图将它们“拼接”成一个均匀分布随机数序列,则可以极大地提高密码学安全伪随机性。即,给定随机样本的一部分和随机算法,不能有效的演算出随机样本的剩余部分。
参加“拼接”的随机数,可以是不同“方法”生成的随机数(真随机数、伪随机数都可以)。当然要求它们具有“相同的概率性质”或“相同的数理统计学性质”。
假如只采用一种“伪随机数”生成方法,则建议对不等“长度”的各个随机数片段 N1, N2, N3, N4, N5 ,各自选用不同的“种子”、“定数”等来生成。
如果在“种子”、“定数”、“长度”选择上引入“大整数的分解”(即把整数分解成素数的乘积),或其它NP完全问题(NP-complete problems),则可以显著地增加“破译”的难度。
三、说明
3.1 提升
即“比你的更好”,是我多年之前发现的。与2016年的“Eshan Chattopadhyay, David Zuckerman. Explicit two-source extractors and resilient functions”没有任何关系。该文2019年正式刊出,但是,在 2016-05-17 就有了公开的报道:
“We show that if you have two low-quality random sources—lower quality sources are much easier to come by—two sources that are independent and have no correlations between them, you can combine them in a way to produce a high-quality random number,” Zuckerman said. “People have been trying to do this for quite some time. Previous methods required the low-quality sources to be not that low, but more moderately high quality.
“We improved it dramatically,” Zuckerman said.
【机器翻译】 Zuckerman说:“我们表明,如果你有两个低质量的随机源,那么两个独立的、相互之间没有相关性的源更容易获得低质量的源,你可以将它们组合在一起,产生高质量的随机数。”。“人们已经尝试这样做很长一段时间了。以前的方法要求低质量的来源不是那么低,而是中等质量的高质量。
Zuckerman说:“我们极大地改进了它。”
我的方法,只使用一个随机数序列。
3.2 拼接
受到了2016年的“Eshan Chattopadhyay, David Zuckerman. Explicit two-source extractors and resilient functions”的启发。尽管我不知道他们的研究结果是否严密,但是在我的仿真/知识范围里,至少大多数情况下还是正确的。
拼接,可以是对现有方法生成的随机数的拼接;也可以对我们“提升”后的随机数拼接。对于具有相同概率性质(数理统计学性质)的“不同来源随机数”的“不等长”拼接,将极大地增加“破译”的难度。
拼接,具有渐近“完善保密”中“一次一密”的潜力。
一般地,活用“保密通信”里各种方法,都会进一步改进随机数的性质。
3.3 可测试的样本:3个
先提供3个“[0,1] 区间上的均匀分布随机数”样本,供您检验。
这些随机数只做了一次“提升”,没有进一步“拼接”。
[1] 2021-01-30,100个均匀分布随机 100 uniformly distributed random numbers
https://blog.sciencenet.cn/blog-107667-1269737.html
[2] 2023-04-05,278个均匀分布随机数Uniformly distributed random numbers with a sample size 278
https://blog.sciencenet.cn/blog-107667-1383082.html
[3] 2023-04-07,1000个均匀分布随机 1000 uniformly distributed random numbers
https://blog.sciencenet.cn/blog-107667-1383337.html
一点初步的个人经验:样本数量(样本容量, sample size)越小,随机数的优劣性质越容易得到表现。
3.4 投稿
我没有向“学术期刊”等投稿,主要是一直没有精力和时间。
近年来,持续性地严重过劳,实在没有精力,没有时间。近几个月来更是“长新冠”:要多傻,有多傻。身心俱疲。
2016-06-17 20:17 曾经向某网站投稿,目前还在“处理中”:
图3 2016-06-17 20:17 曾经向某网站投稿的记录
因为看到了与《Michael Mimoso, 2016-05-17, Academics make theoretical breakthrough in random number generation》有关的报道。所以,受到鼓舞,赶紧整理了一个帖子。
现在为什么写博文?因为有《科学网》编辑部把关啊!肯定不会犯错误!!辛苦的是《科学网》编辑部的老师们!真的感谢!!
并且,《科学网》博文48小时之后就不能修改,具有了保护“优先权”的功能。通过博文,还可以广泛听取老师们的批评,有利于进一步完善我们的工作。感谢您的指正!!
3.5 科学创新,社会的责任
“我爱我的老师,但我更爱真理。”
“追求科学需要特殊的勇敢。”
在人类文明的进步中,我们每一个人,注定都是后人脚下的铺路石。
我是促进人类文明进步铺路石?还是阻碍进步的绊脚石?
参考资料:
[1] 2022-12-23,随机数生成/random number generation/尚轶伦,中国大百科全书,第三版网络版[ED/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=296338&Type=bkzyb&SubID=81652
[2] Random variable. Encyclopedia of Mathematics. [ED/OL]
https://encyclopediaofmath.org/wiki/Random_variable
[3] Random and pseudo-random numbers. Encyclopedia of Mathematics. [ED/OL]
https://encyclopediaofmath.org/wiki/Random_and_pseudo-random_numbers
[4] Generating random variables. Encyclopedia of Mathematics. [ED/OL]
https://encyclopediaofmath.org/wiki/Generating_random_variables
[5] Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables (Partially Mathcad-enabled) [ED/OL]
https://app.knovel.com/kn/resources/kpHMFFGMT1/toc
[6] Eshan Chattopadhyay, David Zuckerman. Explicit two-source extractors and resilient functions [J]. Annals of Mathematics, 2019, 189(3): 653-705.
doi: 10.4007/annals.2019.189.3.1
https://dl.acm.org/doi/10.1145/2897518.2897528
[7] Michael Mimoso, 2016-05-17, Academics make theoretical breakthrough in random number generation. [ED/OL]
https://threatpost.com/academics-make-theoretical-breakthrough-in-random-number-generation/118150/
The technical details are described in the academics’ paper “Explicit Two-Source Extractors and Resilient Functions.” The academics’ introduction of resilient functions into their new algorithm built on numerous previous works to arrive at landmark moment in theoretical computer science. Already, one other leading designer of randomness extractors, Xin Li, has built on their work to create sequences of many more random numbers.
[8] 杨正瓴,2023-04-05,[讨论,擂台] 比真随机数更好的伪随机数(以[0,1] 区间上的均匀分布随机数为例) [ED/OL]
https://blog.sciencenet.cn/blog-107667-1383089.html
[9] YANG, Zheng-Ling. 2021. “Uniformly Distributed Random Numbers with a Sample Size 278.” OSF Preprints. February 2. doi:10.31219/osf.io/pgrdk. [ED/OL]
[10] 杨正瓴,2021-01-30,100个均匀分布随机数 100 uniformly distributed random numbers [ED/OL]
https://blog.sciencenet.cn/blog-107667-1269737.html
[11] 杨正瓴,2023-04-07,1000个均匀分布随机数 Uniformly distributed random numbers with a sample size 1000 [ED/OL]
https://blog.sciencenet.cn/blog-107667-1383337.html
[12] 2022-01-20,RSA密码签名/RSA code signing/冯荣全,中国大百科全书,第三版网络版[ED/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=34357&Type=bkzyb&SubID=81365
整数的乘积运算是非常简单的,但是大整数的分解(即把整数分解成素数的乘积)则是非常困难的。
[13] 2022-01-20,保密通信/secret communication/刘永峻,中国大百科全书,第三版网络版[ED/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=110252&Type=bkzyb&SubID=99594
[14] 2022-01-20,完善保密/perfect secrecy/徐秋亮,中国大百科全书,第三版网络版[ED/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=34328&Type=bkzyb&SubID=81359
[15] 2023-03-29,一次一密/one-time pad/林东岱,中国大百科全书,第三版网络版[ED/OL]
https://www.zgbk.com/ecph/words?SiteID=1&ID=39265&Type=bkzyb&SubID=81359
一次一密虽然理论上是完善保密的,但实际上并不实用。尽管一次一密不实用,但是利用序列随机性加密信息流的思想则被继承下来,广泛应用于流密码序列密码中。
[16] 王鸣阳. 科学创新,社会的责任:读《居里夫人文选》有感[J]. 科普研究,2010,(2): 82-85.
http://qikan.cqvip.com/Qikan/Article/Detail?id=33866424
https://www.nssd.cn/html/1/156/159/index.html?lngId=33866424&from=Qikan_Article_Detail
哪位老师有“王鸣阳”老师的大照片?感谢!
相关链接:
[1] 2023-04-07,1000个均匀分布随机数 Uniformly distributed random numbers with a sample size 1000
https://blog.sciencenet.cn/blog-107667-1383337.html
[2] 2023-04-05,[讨论,擂台] 比真随机数更好的伪随机数(以[0,1] 区间上的均匀分布随机数为例)
https://blog.sciencenet.cn/blog-107667-1383089.html
[3] 2021-01-30,100个均匀分布随机数 100 uniformly distributed random numbers
http://blog.sciencenet.cn/blog-107667-1269737.html
[4] 2023-01-12,[阅读笔记] “证明了一个数学大问题”之后的 8 类走向(结果)
https://blog.sciencenet.cn/blog-107667-1371682.html
[5] 2023-03-01,[打听] 四色定理计算机“证明”的“诗、电话簿”原文
https://blog.sciencenet.cn/blog-107667-1378486.html
[6] 2022-10-19,[想不明白] 几十页、上百页长的数学证明,真的可靠吗?(阿诺德、Chaitin)
https://blog.sciencenet.cn/blog-107667-1360078.html
[7] 2023-03-31,[小资料,擂台] 随机数,伪随机数,真随机数
https://blog.sciencenet.cn/blog-107667-1382520.html
[8] 2021-01-30,[再擂台] 最好的100个均匀分布随机数 The best 100 uniformly distributed random numbers
https://blog.sciencenet.cn/blog-107667-1269740.html
[9] 2021-01-30,100个均匀分布随机数 100 uniformly distributed random numbers
http://blog.sciencenet.cn/blog-107667-1269737.html
[10] 2021-05-10,“最好的均匀分布随机数”的一些说明
https://blog.sciencenet.cn/blog-107667-1285904.html
[11] An explicit analytical estimation of the validity of the Tanimoto similarity by confidence intervals in mathematical statistics [C]. Proceedings of the 2018 13th World Congress on Intelligent Control and Automation: 979-984. (EI).
https://ieeexplore.ieee.org/document/8630700/
[12] 2019-07-16,会议论文公式纠错:Tanimoto similarity 谷本系数的置信区间
http://wap.sciencenet.cn/blog-107667-1189819.html
[13] 2020-10-04,[优先权?] 中国人首先提出 SI 基本单位“安培”新定义?
https://blog.sciencenet.cn/blog-107667-1253168.html
[14] 2020-10-03,[严肃内容] 2019年 SI 的新“安培定义”:我当初一些考虑
https://blog.sciencenet.cn/blog-107667-1253079.html
[15] 2020-10-02,[严肃内容] 2019年 SI 的新“安培定义”,是对我2012年第二方案的细化
https://blog.sciencenet.cn/blog-107667-1252951.html
[16] 2019-09-11,[建议] 关于2018年安培新定义的修改或补充建议
https://blog.sciencenet.cn/blog-107667-1197586.html
[17] 2019-08-21,国际单位制 SI 的安培 2019 年新定义
https://blog.sciencenet.cn/blog-107667-1194625.html
[18] 2016-9-6,一年了,没有人理俺(安培定义的物理实验检验)
https://blog.sciencenet.cn/blog-107667-1001173.html
[19] 2014-10-12,三个想法(安培定义、引力磁、电荷-能量关系)
https://blog.sciencenet.cn/blog-107667-835087.html
[20] 2013-10-14,“修改安培定义”的一些新思考
https://blog.sciencenet.cn/blog-107667-732934.html
[21] 2012-04-13,[请教] SI基本单位中安培定义的两种可能缺陷
https://blog.sciencenet.cn/blog-107667-558804.html
[22] [转载] 2012-04-12,科学智慧火花,《SI基本单位中安培定义的两种可能缺陷》
https://blog.sciencenet.cn/blog-107667-1253075.html
[23] 2023-03-04,往日(18):SI “词头 prefixes”与科技话语权
https://blog.sciencenet.cn/blog-107667-1378891.html
[24] 2022-11-24,[建议] Let my 2012 new prefixes be used, please! 请使用我2012年建议的新词头!
https://blog.sciencenet.cn/blog-107667-1365158.html
[25] 2022-11-22,[插播,往日] 国际单位制 SI 新增 4 个“词头”(vs 中国人 10 年前的建议)
https://blog.sciencenet.cn/blog-107667-1364818.html
[26] 2020-10-05,[严肃内容] 2012-04-13,《增加SI prefixes的建议》,可能属于“0到1”原创
https://blog.sciencenet.cn/blog-107667-1253270.html
[27] 2020-03-05,扩展 SI prefixes 的建议(Suggest to extend the SI prefixes)
http://blog.sciencenet.cn/blog-107667-1221975.html
[28] 2018-04-03,增加 SI prefixes 的建议 (Suggestion to add the SI prefixes)”再回首
http://blog.sciencenet.cn/blog-107667-1107140.html
[29] 2012-04-19,增加 SI prefixes 的建议 (Suggestion to add the SI prefixes)
http://blog.sciencenet.cn/blog-107667-561082.html
[30] 2023-03-08,[傻现状] “长新冠”症状一直存在,持续患病中
https://blog.sciencenet.cn/blog-107667-1379445.html
[31] 2023-04-03,新冠引起的指甲变形(资料图片)
https://blog.sciencenet.cn/blog-107667-1382831.html
[32] 2022-07-26,[汇报] 近十多年的时间、精力状态(欠佳)
https://blog.sciencenet.cn/blog-107667-1348843.html
[33] 2022-09-19,[???] 热血沸腾之后,更是“耗尽/耗干”后的无奈(关联资料“集成电路”,诺伊斯 Robert Norton Noyce)
https://wap.sciencenet.cn/blog-107667-1356020.html
感谢您的指教!
感谢您指正以上任何错误!
感谢您提供更多的相关资料!
转载本文请联系原作者获取授权,同时请注明本文来自杨正瓴科学网博客。
链接地址:https://wap.sciencenet.cn/blog-107667-1383480.html?mobile=1
收藏