Translate this page:
Please select your language to translate the article


You can just close the window to don't translate
Library
Your profile

Back to contents

Cybernetics and programming
Reference:

Improving the precision of steganalysis in the DWT sphere by using the interrelation between the spheres of one-dimensional and two-dimensional developments.

Prokhozhev Nikolai Nikolaevich

PhD in Technical Science

Associate Professor, St. Petersburg National Research University of Information Technologies, Mechanics and Optics

197101, Russia, g. Saint Petersburg, ul. Kronverskii, 49, of. 474

19791109@list.ru
Other publications by this author
 

 
Sivachev Aleksei Vyacheslavovich

graduate student, Department of Design and Security of Computer Systems, St. Petersburg National Research University of Information Technologies, Mechanics and Optics

197101, Russia, Saint Petersburg, Kronverskii prospekt, 49, of. 474

sivachev239@mail.ru
Other publications by this author
 

 
Mikhailichenko Ol'ga Viktorovna

Senior Lecturer, Department of Design and Security of Computer Systems, St. Petersburg National Research University of Information Technologies, Mechanics and Optics

197101, Russia, Sankt-Peterburg, Kronverkskii prospekt, d.49

19791109@list.ru
Other publications by this author
 

 
Bashmakov Daniil Andreevich

graduate student, Department of Design and Security of Computer Systems, St. Petersburg National Research University of Information Technologies, Mechanics and Optics

197101, Russia, Saint Petersburg, ul. Kronverskii, 49, of. 474

basme@list.ru
Other publications by this author
 

 

DOI:

10.7256/2306-4196.2017.2.22412

Received:

24-03-2017


Published:

28-05-2017


Abstract: The article contains the studies, which are aimed at improving the precision of steganalysis in the sphere of digital image DWT. The authors analyze the causes of inaccuracy of the modern stegoanalysis methods based upon the support vectors, then they offer the directions for improving the teaching quality. In order to improve the quality of teaching support vectors machine the authors study the interrelation between the spheres of one-dimensional and two-dimensional DWT and the influence of the changes in the coefficients of the high frequency spheres of the two-dimensional DWT upon the coefficient spheres of the one-dimensional DWT.  The steganographic influence involves the change in the value of the lower meaning bit coefficients of the DWT. Considering the study results the authors develop an original method, guaranteeing greater precision in the sphere of finding incorporated information in the high frequency areas of the two-dimensional DWT image.  In order to prove the precision of the original method, the authors compare it with some modern steganalysis methods. Experimental results of a comparative study prove that the original method provides for greater precision (generally 10-15% higher than other evaluated methods) when detecting the fact of steganographic influence in high frequency areas of HL and LH of the two-dimensional DWT. The original method also provides for the same precision in the high frequency HH area, as do other modern methods evaluated in this article.


Keywords:

steganography, binary classification, passive attack, machine learning , efficiency of steganalysis, steganogram, data hiding, support vector machine , steganalysis, DVT


В настоящее время широко представлены стеганографическое методы и алгоритмы, осуществляющие встраивание информации в область дискретного вейвлет преобразования (ДВП) изображения, что связано с использованием ДВП в формате сжатия изображений JPEG 2000. В зависимости от метода встраивания информации в изображение могут использоваться различные области коэффициентов ДВП (LL, LH, HL и HH). Области коэффициентов ДВП могут использоваться либо по отдельности, либо совместно друг с другом [1].

Для пассивного противодействия стеганографическим каналам разработано большое количество методов стеганоанализа, эффективно обнаруживающих факт встраивания информации в цифровое изображение [2]. Хорошие результаты по точности детектирования стеганографического воздействия в ДВП области дают методы на основе машинного обучения, в частности на основе машин опорных векторов. На точность стеганоанализа таких методов большое влияние оказывает область (области) встраивания, используемая конкретным стеганографическим методом. Результаты исследований показывают, что:

– при встраивании информации в низкочастотную область ДВП изображения обеспечивается высокая точность обнаружения стеганографического воздействия;

– при встраивании в высокочастотные области ДВП изображения современные методы стеганоанализа дают значительную погрешность обнаружения стеганографического воздействия [3].

Например, согласно экспериментальным данным, представленным авторами метода [4], максимальная эффективность, которой добились авторы для высокочастотных плоскостей HL и LH, составила 80% верно классифицированных изображений при 20% полезной нагрузки, что оставляет значительную пропускную способность стеганоканала даже при пассивном противодействии, реализованном на базе такого метода. Таким образом, исследования направленные на повышение эффективности обнаружения факта встраивания в частотную область изображений являются актуальными.

Исследование предметной области

Рассматриваемые в настоящей работе методы стеганоанализа на основе машинного обучения в качестве параметров для опорных векторов используют результаты одно- или многоуровневого двумерного ДВП изображения [4, 5, 6]. В машине опорных векторов используются статистические моменты, рассчитанные для разных областей двумерного вейвлет-разложения. В дополнение к значениям моментов применяется широкий спектр других параметров изображения. Основным направлением совершенствования таких методов стеганоанализа является увеличение размерности пространства опорных векторов, т.е. количества используемых параметров изображения. Данные параметры могут принадлежать как к пространственной, так и к частотной области изображения.

Результаты исследования значений статистических моментов для двух высокочастотных областей (HL, LH) коэффициентов ДВП оригинальных изображений и изображений, в отношении которых было применено стеганографическое воздействие (стеганоизображений), представлены на рисунке 1.1, 1.2. В качестве стеганографического воздействия на изображение использовалось изменение значений младших значащих бит коэффициентов ДВП.

Рисунок 1.1 Гистограмма значений первого статистического момента, полученного для HL области оригинальных (синий) и стеганоизображений (оранжевый)

Рисунок 1.2 Гистограмма значений первого статистического момента, полученного для LH области оригинальных (синий) и стеганоизображений (оранжевый)

Основная проблема, возникающая при обучении машины опорных векторов, связана со значительной областью пересечения множеств значений для оригинального изображения и стеганоизображения, см. рисунки 1.1, 1.2.

В целях повышения качества машинного обучения авторы методов стеганоанализа в опорные векторы добавляют дополнительные характеристики изображений. Эти характеристики могут принадлежать как к пространственной области изображения (например, значения яркости пикселей), так и к частотной (например, значения коэффициентов ДКП). При этом совершенно игнорируется область одномерного ДВП изображения.

При одномерном ДВП изображения получаются две области коэффициентов: низкочастотная (L) и высокочастотная (H). Исследования, проведенные авторами статьи показали, что значения коэффициентов, получаемых при одномерном ДВП, имеют корреляцию с низкочастотными коэффициентами, получаемыми при двумерном ДВП (см. рисунки 2.1, 2.2).

Рисунок 2.1. График зависимости первого статистического момента HL областей от первого статистического момента массива разностей L области

Рисунок 2.2 График зависимости первого статистического момента LH областей от первого статистического момента массива разностей L области

При этом стеганографическое встраивание с использованием двумерного ДВП не оказывает существенного влияния на параметры областей, получаемых при одномерном ДВП изображения. На рисунке 3 приведен график значения первого статистического момента массива разности L области для оригинальных и стеганоизображений (каждая точка графика обозначает одно изображение: координата по оси Х – значение параметра в оригинальном изображении, по оси Y – значение параметра в стеганоизображении). Данный график представляет собой прямую линию, означающую, что стеганографическое встраивание не оказывает влияния на значение первого статистического момента массива разностей L области.

Рисунок 3. График зависимости значений первого статистического момента L области оригинальных изображений (ось Х) и стеганоизображений (ось Y)

Следовательно, используя значение корреляции величин статистических моментов двумерного и одномерного ДВП в качестве параметров опорных векторов можно повысить качество машинного обучения и точность методов стеганоанализа на его основе.

Таким образом, для повышения качества машинного обучения в дополнение к статистическим моментам, полученным для областей коэффициентов двумерного вейвлет-преобразования (LL, HL, LH, HH) и используемых в методах [4, 5, 6], предлагается использовать параметры, получаемые на основе коэффициентов одномерного ДВП изображения.

Описание предлагаемого метода

Формируя первую часть параметров для машины опорных векторов необходимо выполнить двумерное ДВП изображения получив в результате четыре области вейвлет-коэффициентов LL, LH, HL и HH. Для каждой из полученных областей вейвлет-коэффициентов считаются 1, 2, 3 и 4 статистические моменты, аналогично методам [4, 5, 6].

При формировании второй части параметров, которые предлагается использовать для оценки и учета погрешности первой части параметров, выполняется одномерное ДВП для набора горизонтальных строк пикселей, составляющих изображение. В результате получаются две области коэффициентов: низкочастотная () и высокочастотная (). Аналогичное преобразование выполняется также для набора вертикальных столбцов пикселей, составляющих изображение, получая области и соответственно. Для каждой из полученных низкочастотных областей коэффициентов и считается по два массива разностей по следующим формулам:

где – коэффициенты советующей области ( или ).

Из каждой области и получается по два массива разностей: массив разностей по горизонтали и массив разностей по вертикали. В результате получается четыре различных массива разностей. Для каждого полученного массива разностей считаются значения 1, 2, 3 и 4 статистических моментов.

Для классификации изображения на вход машине опорных векторов подается вектор, включающий:

- 1, 2, 3 и 4 статистических моментов, полученных для каждой из областей, получаемых при двумерном ДВП (LL, HL, LH и HH), которые предлагают использовать авторы в методах [4, 5, 6];

- 1, 2, 3 и 4 статистических моментов, полученных для вертикальных и горизонтальных массивов разностей полученных из областей и , полученных при одномерном ДВП.

Сравнительная оценка точности предлагаемого метода стеганоанализа

Методика проведения экспериментов

На основе имеющегося массива цифровых изображений формируется множество оригинальных изображений, а также несколько множеств стеганоизображений, различающихся областью (HL, LH, HH) встраивания и значением полезной нагрузки. Стеганографическое воздействие на изображение моделируется путем модификации значений младших значащих бит коэффициентов в выбранной области одноуровневого двумерного ДВП изображения. В качестве ДВП использовалось вейвлет-преобразование Хаара.

Оригинальные изображения и стеганоизображения разбиваются на две выборки: обучающую выборку и тестовую выборку. Сначала используемый конкретным методом стеганоанализа метод машинного обучения обучается с использованием обучающей выборки, после чего точность обученного классификатора проверяется с использованием тестовой выборки. Полученные результаты сохраняются для дальнейшей обработки и сравнения различных методов стеганоанализа.

Эффективность метода стеганоанализа определяется корректностью классификации изображений: оригинальное изображение или стеганоизображение. Для идеального метода стеганоанализа 100% изображений, содержащих встроенную информацию, должны быть классифицированы как стеганоизображение, а 100% изображений, не содержащих встроенную информацию, должны быть классифицированы как оригинальные изображения.

Условия проведения экспериментов

Из современных методов стеганоанализа на основе машинного обучения для исследования были выбраны методы, широко известные и наиболее часто цитируемые:

- метод, предложенный GireeshKumar и другими [4];

- метод, предложенный HanyFarid [5];

- метод, предложенный ChangxinLiu [6].

Для проведения экспериментов была выбрана коллекция изображений BOWS2 – 10000 изображений, разрешением 512х512.

Для формирования обучающей выборки из коллекции BOWS2 использовалось 20% изображений. Остальные 80% изображений коллекции использовались в качестве тестовой выборки.

Экспериментальные результаты

Для оценки точности предлагаемого метода были проведены эксперименты по классификации множества изображений, содержащего оригинальные изображения и стеганоизображения, имеющие 20% полезной нагрузки (payload) в одной из областей ДВП изображения (LL, HL, LH, HH).

Результаты классификации тестового массива изображений представлены на рисунках 4.1-4.3. в виде графиков значений TN (истинно отрицательные), TP (истинно положительных), FP (ложноположительных), FN (ложноотрицательных), наглядно показывающих количество истинно отрицательных, истинно положительных, ложноположительных и ложноотрицательных результатов классификации изображений (от общего объема множества в процентах).

Рисунок 4.1. График соотношения TN, TP, FP, FN при встраивании в LH область

Рисунок 4.2. График соотношения TN, TP, FP, FN при встраивании в HL область

Рисунок 4.3. График соотношения TN, TP, FP, FN при встраивании в HH область

Выводы

Графики, представленные на рисунках 4.1-4.3, показывают, что предложенный метод дает высокую точность обнаружения факта встраивания в области LH и HL.

Для области HL увеличение точности составляет немногим больше 10%: предлагаемый метод дает 92,33% (46,815% – истинно отрицательные изображения, 45,515% – истинно положительные изображения) корректно классифицированных изображений против 79,99% (42,19% – истинно отрицательные, 38,80% – истинно положительные) у метода [4], оказавшегося на втором месте по точности.

Для области LH увеличение точности составило более чем на 20%: 89,97% корректно классифицированных изображений (46,46% – истинно отрицательные, 43,51% – истинно положительные) у предложенного метода против 59,755% у метода [4] (23,38% – истинно отрицательные, 36,375% – истинно положительные).

Для области LL результаты, показанные предлагаемым методом, аналогичны результатам других алгоритмов [4, 5, 6].

При использовании 20 % полезной нагрузки в НН области предложенный метод не дает преимуществ в стеганоанализе, поскольку точность детектирования для данной области и так достаточно высокая (98-99%).

Заключение

Высокая точность предлагаемого метода объясняется тем, что увеличение размерности опорных векторов дополнительными параметрами дает возможность учесть величину погрешности значений статистических моментов, используемых в методах [4, 5, 6].

Неопределенности, связанные со значениями величин первых статистических моментов (пересекающие области на гистограммах) для оригинальных и стеганоизображений, могут быть скорректированы значениями 1, 2, 3 и 4 статистических моментов низкочастотных областей одномерного ДВП. Использование дополнительных параметров при обучении и практическом применении машин опорных векторов дает существенное уменьшение погрешности при детектировании факта стеганографического воздействия на области LH и HL.

Использование взаимосвязи между областями двумерного и одномерного ДВП позволяет существенно повысить точность обнаружения факта стеганографического воздействия в HL и LH областях. Точность предложенного метода на основе машин опорных векторов составляет более 90 % верно классифицированных изображений, что на 10-15% лучше существующих методов.

Для дальнейшего повышения точности методов стеганоанализа необходимо вести поиск параметров для опорных векторов, которые имеют минимальные размеры области неопределенности величин при стеганографическом воздействии на различные области ДВП и позволяют эффективно разделить множества стегано- и оригинальных изображений.

References
1. Konakhovich G.F. Otsenka effektivnosti metodov steganograficheskogo vstraivaniya informatsii v spektral'nuyu oblast' izobrazhenii [Tekst], Avtomatizirovannye sistemy upravleniya i pribory – 2014.-№168 – S. 59-63.
2. AroojNissar, A. H. MirClassification of steganalysis techniques: A study [Tekst], Digital Signal Processing, Volume 20 Issue 6, December, 2010Pages 1758-1770.
3. Prokhozhev N., Mikhailichenko O., Sivachev A., Bashmakov D., Korobeynikov A.G. Passive Steganalysis Evaluation: Reliabilities of Modern Quantitative Steganalysis Algorithms [Tekst], Advances in Intelligent Systems and Computing. 2016. Vol. 451. pp. 89-94.
4. Gireesh Kumar T., Jithin R., Deepa D. Shankar Feature Based Steganalysis Using Wavelet Decomposition and Magnitude Statistics [Tekst], Advances in Computer Engineering (ACE), 2010, pp. 298-300.
5. Farid, Hany Detecting Steganographic Messages in Digital Images [Tekst], Technical Report TR2001-412, Dartmouth College, Computer Science Department, 2001.
6. Changxin Liu, Chunjuan Ouyang, Ming Guo, Huijuan ChenImage Steganalysis Based on Spatial Domain and DWT Domain Features [Tekst], Proceedings of the 2010 Second International Conference on Networks Security, Wireless Communications and Trusted Computing-Volume 01, pp. 329-331.