Статистически тестове на случайни генератори

Научен доклад | 21 юни 2022

Един от най-важните компоненти в света на криптографията, статистическите симулации и модели са т. нар. генератори на случайни числа. Това са софтуерни алгоритми или хардуерни устройства, произвеждащи поток от непредсказуеми, случайни битове. Проверката на качеството на изходните данни е от изключителна важност за приложимостта и надеждността на съответния генератор [5]. За тази цел са създадени множество алгоритми и методи, т. нар. батерии от статистически тестове, чието използване е безалтернативно и абсолютно задължително, особено когато става дума за разработката на нов вид генератор, независимо дали е софтуерен псевдослучаен генератор (Pseudorandom Number Generator, PRNG) или физическо устройство за генериране на истински случайни числа (True Random Number Generator, TRNG). В този материал ще представим статистическите тестове и самите процедури за проверка работата на нашия квантов USB хардуерен генератор GTR-01. Използвали сме следните тестови батерии: Diehard, TestU01 и NIST STS. Във всички проведени процедури, GTR-01 работи винаги в режим по подразбиране, т.е. с побитово XOR на двата хардуерни канала.

Diehard

Тестовете са разработени от George Marsaglia през 80-те години на миналия век. През 1995 г. той публикува CD-ROM, съдържащ файлове със случайни числа, компилирани изпълними файлове съставляващи самите Diehard тестове, както и файлове с документация и указания за използване [3]. Общо батерията се състои от 18 статистически теста. Макар и леко поостарели, тези алгоритми са се превърнали в класика и са вдъхновили множество усъвършенствания.

Поради липсата на изходен сорс код, сме използвали C# обвивка на оригиналните изпълними файлове (компилирани на FORTRAN за MS-DOS), които се извикват от .NET конзолно приложение. За всяко стартиране на батерията, първоначално се генерират 80,000,000 случайни бита (10,000,000 байта) под формата на бинарен файл, който се подава като аргумент към оригиналните .exe файлове. Върху получените 234 p-стойности се прилагат Chi-Square и Kolmogorov-Smirnov тестове за равномерност и на базата на тяхната оценка се прави окончателен извод за изхода от теста. Във всички свои тестове Diehard използва ниво на съгласие α = 0.01. GTR-01 минава успешно всички тестове! Времето за изпълнение на цялата батерия е около 15 s на персонален компютър с Windows 10, Intel Pentium CPU G4600@3.60GHz, 8GB RAM (DDR4 2400MHz).

Diehard конзолен прозорец. — Конзолен прозорец с резултати от Diehard.

Важно е да отбележим, че Diehard използва приближени апроксимации на статистическите разпределения в алгоритмите си. При последователното прилагане на батерията към множество отделни бинарни файлове (примерно 50, 100 или повече) и оценка на получените p-стойности в съвкупност, се наблюдава силно отклонение от равномерното разпределение. Ето защо, тестовете са подходящи само за единична оценка така, както са били предложени оригинално от самия автор.

TestU01

Тестовете са разработени от Pierre L’Ecuyer и са представени през 2007 г. [1][2]. Разпределени са в няколко статистически батерии: SmallCrush (10 теста), Crush (96 теста) и BigCrush (106 теста). В добавка, тестовете включват и PseudoDIEHARD (съдържаща повечето от оригиналните тестове на Diehard), Alphabit (специално разработена за проверка на хардуерни случайни генератори), Rabbit, както и FIPS-140-2 (разработена по стандарт на NIST). Важен факт е, че тестовете използват ниво на съгласие α = 0.001. TestU01 е написана на ANSI C за UNIX операцианни системи и затова сорс кода беше преработен за MS Windows и компилиран с Visual C++ Express Edition 2008. Първоначално е генериран бинарен файл с 8,000,000,000 случайни бита (1,000,000,000 байта) и последователно са стартирани SmallCrush, PseudoDIEHARD, FIPS-140-2, Rabbit и Alphabit. Общото време за изпълнение е около 40 мин. Описаната процедура се повтаря многократно, като GTR-01 преминава успешно всички тестове! Фигурата по-долу показва резултат от PseudoDIEHARD.

Отделно от горните батерии, Crush е запусната самостоятелно, като отново се засича общото време за изпълнение на всичките 96 теста. За разлика от предишния случай, където се генерира един и същи бинарен файл, който се използва последователно при отделните батерии, то тук, за всеки тест от Crush, програмата автоматично генерира нова последователност от случайни битове. В резултат, времето за изпълнение нараства многократно. Едно запускане на батерията отнема приблизително 8 денонощия! Като краен резултат, можем да направим следното заключение:

GTR-01 преминава успешно всички тестове на TestU01 Crush battery!

Следващите фигури показват резултатите за някои от тестовете в Crush.

TestU01 конзолен прозорец с резултати от Crush - снимка 1. — Екран с резултат от TestU01 и Crush. Вижда се, че точното време за изпълнение е 8 денонощия (не са показани), 5 часа и 17 минути.

TestU01 конзолен прозорец с резултати от Crush - снимка 2. — Екран с резултат от TestU01 и Crush (Autocorrelation тест).

TestU01 конзолен прозорец с резултати от Crush - снимка 3. — Екран с резултат от TestU01 и Crush (Hamming Weight тест).

TestU01 конзолен прозорец с резултати от Crush - снимка 4. — Екран с резултат от TestU01 и Crush (Gap тест).

TestU01 конзолен прозорец с резултати от Crush - снимка 5. — Екран с резултат от TestU01 и Crush (Multinomial Over тест).

NIST статистически тестове

Тестовете са публикувани от National Institute of Standards and Technology [6]. Към момента, батерията включва 15 статистически теста. Кодът е свободен, което позволява някои малки модификации и експериментиране с тестовете. Алгоритмите се използват практически като стандарт за проверка надеждността на всички съвременни генератори на случайни числа, било то псевдослучайни генератори или хардуерни такива. Оригиналният сорс код (написан на C) за цялата статистическа батерия беше пренаписан на C# за .NET и тестван, за да се осигури пълно съответствие между двата варианта. Въз основа на този код, сме конструирали обща процедура, включваща всички тестове, като някои са в различни разновидности, в зависимост от входните им аргументи. Процедурата приема 1, 10, 100 или 1000 броя двоични последователности от случайни битове, като дължината им може да варира от 1,000,000 до 10,000,000 бита. Включени са следните тестове:

Frequency Monobit.
Frequency Block (n/80).
Runs.
Longest Run of Ones.
Binary Matrix Rank (7x7).
Binary Matrix Rank (8x8).
Binary Matrix Rank (15x15).
Binary Matrix Rank (16x16).
Binary Matrix Rank (31x31).
Binary Matrix Rank (32x32).
Binary Matrix Rank (63x63).
Binary Matrix Rank (64x64).
Discrete Fourier Transform (Spectral).
Non-overlapping Template Matching (9).
Overlapping Template Matching (9)
Universal
Linear Complexity (1000).
Serial (2).
Serial (8).
Serial (14).
Approximate Entropy (2).
Approximate Entropy (8).
Approximate Entropy (14).
Cumulative Sums (forward).
Cumulative Sums (backward).
Random Excursions.
Random Excursions Variant.

Non-overlapping Template Matching съдържа 148 независими теста, Serial – 2, Random Excursions – 8 и Random Excursions Variant – 18. Общо тестовете са 201. Random Excursions и Random Excursions Variant правят вътрешна проверка за приложимост, която ако не е изпълнена, алгоритъмът връща нулеви стойности и резултатите от тези тестове се игнорират. Ако това се случи, общия брой тестове става 175. Оценката за успешност на даден тест се получава след проверка на p-стойността спрямо приетото ниво на съгласие α. Ако p-стойноста ≥ α теста се смята за сполучлив. Тестовете се провеждат за α = 0.001, 0.005, 0.01, 0.05, 0.1. Всички 201 теста се разглеждат като статистически независими [6].

Последния факт ни дава право да конструираме обща оценка за успешността на цялата тестова процедура в съвкупност. Разглеждаме всеки тест от батерията като независим случаен опит на Бернули (Bernoulli trial) с два възможни изхода: успех с вероятност p = 1 – α и неуспех с вероятност α [9]. При провеждане на n на брой независими опита (теста), броят успешни изхода е случайна величина с биномно разпределение (Binomial distribution), От функцията на разпределение (Cumulative distribution function, CDF) пресмятаме кумулативната вероятност за даден интервал от брой успешни опита, всеки с вероятност за успех p от общо n направени опита [9]. Така определяме минималния брой C сполучливи опита, необходим, за да считаме тестовата процедура за успешна. Използваме следното уравнение:

P{X ≤ C | n, p} = ∑_{k = 0}^⌊C⌋(_kⁿ)p^k(1 - p)^{n - k} = α

Примерно, нека n = 201, α = 0.01, p = 0.99, откъдето получаваме C = 194 т.е. ако броя сполучливи теста е равен или по-голям от 195, приемаме цялата процедура за успешна, при даденото ниво на съгласие α. Ако изключим резултатите от Random Excursions и Random Excursions Variant, тогава n = 175 и C = 169. Подобен подход е описан в [8].

Когато тестваните случайни последователности са повече от една, т.е. 10, 100 или 1000, се прави и допълнителна оценка за равномерността в разпределението на p-стойностите. Използвани са три независими теста.

Proportion. Пресмятане по горната формула на обща оценка за цялата съвкупност от тествани битови последователности при n = 10, 100 или 1000 и ниво на съгласие α. Общата оценка от направените 201 теста се разглежда отново като независим опит на Бернули с p и α и по същия начин се определя числото C за различните стйности на n.
Chi-Squire. При тази оценка използваме горните стойности за α, за разлика от предложеното в [6] ниво на съгласие 0.0001.
Kolmogorov-Smirnov. При пресмятането на статистиката е използвана процедурата описана в [7], която е подобрен вариант на алгоритъма показан в [4].

Проведени са множество повторения на тестовете за бинарни последователности с различни дължини и за серии от по 10, 100 и 1000 броя последователности. Можем да направим следното заключение:

GTR-01 преминава успешно всички тестови процедури в NIST STS!

Следващата фигура показва типичен резултат от проведен тест на генератора.

GTR-01 – квантов хардуерен генератор на случайни числа. — Екран с резултати от NIST STS тестове.

NIST STS е вградена в StudioGTR – специално разработен .NET софтуер с графичен интерфейс за работа с GTR-01. Програмата позволява използването на тестовете с различни стойности за нивото на съгласие α. Повече информация можете да намерите на страницата с описание на StudioGTR.

Важно е да отбележим следното. Разглеждайки работата на генераторите за случайни числа, не трябва да забравяме, че работим със случайни събития, които се описват в термините на вероятностни разпределения и нищо не е абсолютно точно. Така например, понякога, може да се случва резултатът от изпитването, за всички тестове в дадена батерия, да е сполучлив на сто процента. Чудесно! Понякога може някоя от p-стойностите да е по-малка от зададеното ниво на съгласие и теста формално да е неуспешен. В света на вероятностните събития това е съвсем нормално. Но трябва да внимаваме. Ако стопроцентовият успешен резултат се повтаря постоянно, а вероятността за това при наистина добър случаен генератор е нищожна, би било ясна индикация за проблем в методологията или в самите тестове. Важно е да помним, че работим със случайни величини. При всички случаи, достоверна оценка за качеството на даден генератор може да бъде получена само след провеждането на множество тествания и внимателно анализиране на резултатите.

Заключение

Описаните процедури и статистически тестове ясно демонстрират превъзходното качество на генерираните бинарни данни от GTR-01. Нещо повече, разработената от нас методология с вградена софтуерна поддръжка, позволява бързото и лесно калибриране и тестване на всяка една бройка от устройството. Това може да се прави не само в етапа на производство, а и периодически, в процеса на реалната работа на генератора, с цел гарантиране качеството на получаваните данни.

Литература