Статистический анализ

При анализе случайно шероховатых поверхностей нередко требуется статистический подход для определения некоторого набора описывающих эту поверхность величин. В Gwyddion реализовано несколько различных подходов как это можно сделать. В этом разделе мы опишем различные статистические инструменты и модули, представленные в Gwyddion, а также представим основные формулы, которые использовались для разработки лежащих в их основе алгоритмов.

Данные сканирующей зондовой микроскопии обычно представляются как двумерное поле данных размера N×M где N и M – число строк и столбцов поля данных, соответственно. Настоящая площадь этого поля обозначается как Lx×Ly, где Lx и Ly – размеры вдоль соответствующих осей. Интервал дискретизации (расстояние между двумя соседними точками в скане) обозначается Δ. Мы предполагаем, что интервал дискретизации одинаков как в x, так и в y-направлении и что высота поверхности в заданной точке (xy) может быть описана случайной функцией ξ(xy) с заданными статистическими свойствами.

Следует заметить, что данные АСМ обычно собираются как линейные сканы вдоль оси x, которые объединяются вместе, чтобы сформировать двумерное изображение. Следовательно, скорость сканирования в направлении x значительно больше, чем скорость сканирования вдоль оси y. В результате, статистические свойства данных АСМ обычно собираются вдоль профилей, параллельных оси x, поскольку на них меньше влияет низкочастотный шум и температурный дрейф образца.

Инструмент статистические величины

Статистические величины включают в себя основные свойства распределения значений высоты, включая его дисперсию, коэффициент асимметрии и эксцесс. Следующие величины доступны в меню инструмента Статистические величины программы Gwyddion:

  • Среднее значение, минимум, максимум, срединное значение.
  • Среднеквадратичное значение неровностей высоты: это значение вычисляется из дисперсии данных.
  • Значение среднеквадратичного отклонения зерён которое будет отличаться от обычного среднеквадратичного только при использовании маски. Среднее значение при этом определяется отдельно для каждого зерна (непрерывной части маски или инвертированной маски, в зависимости от типа маскирования) и дисперсия затем вычисляется относительно этих средних для зёрен значений.
  • Ra значение неровностей высоты: эта величина аналогична среднеквадратичному значению с единственной разницей в экспоненте (степени) в сумме отклонений данных. Поскольку для среднеквадратичного эта экспонента равна q = 2, значение Ra рассчитывается с экспонентой q = 1 и модулем значений данных (нулевым средним).
  • Коэффициент асимметрии распределения высот: вычисляется из третьего центрального момента значений данных.
  • Эксцесс распределения высот: вычисляется из четвёртого центрального момента значений данных.
  • Площадь проекции и площадь поверхности: подсчитывается простой триангуляцией.
  • Средний уклон граней в области: вычисляется усреднением нормализованных векторов направления граней.
  • Вариация, которая рассчитывается как интеграл модуля локального градиента.
  • Оценка дифференциальной энтропии распределения значений, рассчитанной из гистограммы как объясняется в описании Функция энтропии. Показывается в естественных единицах информации (натах, nats).

Подсказка

По умолчанию инструмент «Статистические величины» показывает значения для всего изображения. Если вам нужно исследовать определённую область внутри изображения, просто щёлкните мышью и обведите её прямоугольником. Окно инструмента обновится с новыми значениями основанными на новой области. Если вы снова хотите просмотреть статистику для всего изображения, щёлкните один раз на окне данных и инструмент сбросится в исходное состояние.

Точнее, среднеквадратичное отклонение (σ), коэффициент асимметрии (γ1), и эксцесс (γ2) вычисляются из центральных моментов i-того порядка μi в соответствии со следующими формулами:

Площадь поверхности оценивается следующим методом. Пусть zi для i = 1, 2, 3, 4 обозначает значения в четырёх соседних точках (центрах пикселей), а hx и hy - размеры пикселей вдоль соответствующих осей. Если дополнительная точка помещается в центр прямоугольника который соответствует общему углу четырёх пикселей (используя среднее значение четырёх пикселей), образуются четыре треугольника и площадь поверхности может быть приближенно оценена суммированием их площадей. Это приводит к следующим формулам для площади одного треугольника (верхняя) и площади поверхности для одного пикселя (нижняя):

Теперь этот метод хорошо определён для внутренних точек области. Каждое значение участвует в восьми треугольниках, по два с каждым из четырёх соседних значений. Половина из этих треугольников лежит внутри одного пикселя, другая половина в другом пикселе. Подсчётом площади, лежащей внутри каждого пикселя, общая площадь определяется также для зерён и областей под маской. Осталось определить её для граничных пикселей всего поля данных. Мы это делаем виртуально расширяя поле данных копией граничного ряда пикселей с каждой стороны для расчёта площади поверхности, таким образом делая все интересующие нас пиксели внутренними.

Схема триангуляции при рассчёте площади поверхности (слева). Применение схемы триангуляции (справа) к области под маской из трёх пикселей, т.е. зерну. Малые круги обозначают вершины в центрах пикселей zi, тонкие пунктирные линии обозначают границы пикселей, толстыми линиями показано разбиение на треугольники. Оценка площади поверхности равна области под маской (серой) на этой схеме.

Инструмент статистические функции

Одномерные статистические функции доступны при использовании инструмента Статистические функции. В окне инструмента можно выбрать, какую функцию нужно рассчитать, используя выпадающий список слева, озаглавленный Тип вывода. Предпросмотр графика будет обновляться автоматически. Можно выбрать направление, в котором будут рассчитываться функции (горизонтальное или вертикальное), но, как уже говорилось выше, мы рекомендуем использовать направление быстрой оси сканирования. Также можно выбрать, какой из методов интерполяции использовать. После того, как выбор закончен, можно нажать кнопку Применить чтобы закрыть окно инструмента и вывести новое окно графика, которое содержит данные статистики.

Подсказка

Подобно инструменту Статистические величины, этот инструмент оценивает по умолчанию всё изображение, но при желании можно выбрать область, на которой будет проводиться анализ.

Функции распределения высоты и углов

Простейшими статистическими функциями являются функции распределения высот и наклонов. Они могут быть рассчитаны как неинтегральные (т.е. плотности) и как интегральные. Эти функции рассчитываются как нормированные гистограммы значений высоты или наклона (полученного как производные в выбранном направлении – горизонтальном или вертикальном). Другими словами, величина по абсциссе в «распределении углов» – тангенс угла, а не сам угол.

Нормировка плотностей ρ(p) (где p – соответствующая величина, высота или наклон) такова, что

Очевидно, что масштаб значений при этом не зависит от числа точек данных и числа выборок в гистограмме. Интегральные распределения – интегралы плотностей и они принимают значения из интервала [0, 1].

Величины первого порядка против величин второго порядка

Величины распределений высот и углов относятся к статистическим величинам первого порядка, описывающих только статистические свойства отдельных точек. Однако, для полного описания свойств поверхности необходимо изучать функции более высоких порядков. Обычно применяются статистические величины второго порядка, описывающие взаимные соотношения пар точек на поверхности. К этим функциям относятся функция автокорреляции, функция корреляции высота-высота и функция спектральной плотности мощности. Далее следует описание каждой из них:

Функция автокорреляции

Функция автокорреляции задаётся как

где z1 и z2 – значения высоты в точках (x1, y1), (x2, y2); при этом τx =  x1 −  x2 и τy =  y1 −  y2. Функция w(z1, z2, τx, τy) обозначает двумерную плотность вероятности случайной функции ξ(xy), соответствующей точкам (x1, y1), (x2, y2) и расстоянию между этими точками τ.

Из дискретных данных АСМ можно извлечь эту функцию в виде

где m = τxx, n = τyy. Следовательно, эта функция может быть рассчитана для дискретного набора значений τx и τy, разделённых интервалами дискретизации Δx и Δy, соответственно. Двумерная функция автокорреляции может быть посчитана с помощью меню Обработка данныхСтатистикаДвумерная автокорреляция. Следует отметить, что в отличие от одномерного случая, здесь предполагается что соответствующее выравнивание уже производилось и уровень нуля установлен правильно. Функция Двумерной автокорреляции сама по себе не производит выравнивания. Это даёт пользователю больше возможностей и полезно в ряде случаев. Тем не менее, если вы более заинтересованы в получении максимального контраста на АКФ, чем в определении заданных количественных значений, то лучше использовать функцию Обнулить среднее значение перед вызовом данной функции.

Для измерений АСМ мы обычно рассчитываем одномерную функцию автокорреляции основанную на профилях вдоль оси быстрого сканирования. Следовательно, она может рассчитываться из дискретных данных АСМ как

Одномерная функция автокорреляции нередко считается имеющей форму гауссовой, т.е. заданной следующим соотношением:

где σ обозначает среднеквадратичное отклонение высот и T обозначает длину автокорреляции.

Для экспоненциальной функции автокорреляции у нас получается следующее соотношение

Функция автокорреляции, полученная для модели гауссовой случайной шероховатой поверхности (т.е. с гауссовой функцией автокорреляции) с σ ≈ 20 nm и T ≈ 300 nm.

Мы можем также ввести радиально усреднённую функцию автокорреляции Gr(τ), т.е. усреднённую вдоль заданного углом направления двумерную функцию автокорреляции, которая, естественно, содержит ту же самую информацию, что и одномерная функция автокорреляции для изотропных поверхностей:

Примечание

Для оптических измерений (т.е. спектроскопической рефлектометрии, эллипсометрии) гауссова функция автокорреляции обычно ожидается достаточно хорошо совпадающей со свойствами поверхности. Однако, некоторые статьи связанные с ростом поверхности и оксидированием обычно предполагают, что экспоненциальная форма ближе к реальности.

Функция корреляции высота-высота

Различие между функцией корреляции высота-высота и функцией автокорреляции очень мало. Как и в случае с функцией автокорреляции, мы суммируем произведение двух различных значений. Для функции автокорреляции эти значения представляют различные расстояния между точками. Для функции корреляции высота-высота мы вместо этого используем степень разности между точками.

Для измерений АСМ мы обычно рассчитываем одномерную функцию корреляции высота-высота, основанную только на профилях вдоль быстрой оси сканирования. Следовательно, она может быть рассчитана из дискретных значений данных АСМ как

где m = τxx. Таким образом, функция может быть рассчитана на дискретном наборе значений τx разделённом интервалом дискретизации Δx.

Одномерная функция корреляции высота-высота нередко считается имеющей форму гауссовой, т.е. заданной следующим соотношением:

где σ обозначает среднеквадратичное отклонение высот и T обозначает длину автокорреляции.

Для экспоненциальной функции корреляции высота-высота у нас получается следующее соотношение

На следующем рисунке функция корреляции высота-высота построена для модели гауссовой поверхности. Она аппроксимирована формулой, приведённой выше. Результирующие значения σ и T полученные аппроксимацией функцией корреляции высота-высота практически те же, что и для функции автокорреляции.

Функция корреляции высота-высота полученная для модели гауссовой случайно шероховатой поверхности с σ ≈ 20 nm и T ≈ 300 nm.

Функция спектральной плотности мощности

Двумерная функция спектральной плотности мощности может быть записана в терминах преобразования Фурье от функции автокорреляции

Подобно функции автокорреляции, мы также обычно рассчитываем одномерную функцию спектральной плотности мощности, которая задана уравнением

Эта функция может быть расчитана с помощью быстрого преобразования Фурье следующим образом:

где Pj(Kx) – коэффициент Фурье для j-той строки, т.е.

Если мы выберем гауссову функцию автокорреляции, соответствующее гауссово соотношение для функции спектральной плотности мощности будет следующим:

Для поверхности с экспоненциальной функцией автокорреляции мы имеем

На следующем рисунке построены результирующая функция спектральной плотности мощности и её аппроксимация для той же самой поверхности, что использовалась для функции автокорреляции и функции корреляции высота-высота. Можно видеть, что функция может быть снова аппроксимирована гауссовой функцией спектральной плотности мощности. Результирующие значения σ и T практически те же самые, что и для аппроксимации функции автокорреляции и функции корреляции высота-высота.

Функция спектральной плотности мощности полученная для данных, смоделированных с гауссовой функцией автокорреляции.

Мы можем также ввести радиальную функцию спектральной плотности мощности Wr(K), т.е. интегрированную вдоль заданного углом направления двумерную функцию автокорреляции, которая, естественно, содержит ту же самую информацию, что и одномерная функция спектральной плотности мощности для изотропных шероховатых поверхностей:

Для поверхности с гауссовой функцией автокорреляции эта функция может быть выражена как

для поверхностей с экспоненциальной как

Подсказка

В Gwyddion можно аппроксимировать все представленные здесь статистические функции их гауссовыми и экспоненциальными формами. Чтобы это сделать, сначала нажмите Применить в окне инструмента Статистические функции. При этом будет создано новое окно графика. При выбранном этом окне, нажмите на ГрафикАппроксимировать график.

Функционалы Минковского

Функционалы Минковского используются для описания глобальных геометрических характеристик структур. Двумерный дискретный вариант объема V, поверхности S и связности (характеристики Эйлера – Пуанкаре) χ рассчитываются в соответствии со следующими формулами:

Здесь N обозначает общее число пикселей, Nwhite обозначает число «белых» пикселей, пикселей выше порога. Пиксели, которые ниже порога, называются «чёрными». Символ Nbound обозначает число границ между чёрными и белыми пикселями. И, наконец, Cwhite и Cblack обозначают число непрерывных наборов белых и чёрных пикселей, соответственно.

Для изображений с непрерывным набором значений функционалы параметризованы по значению порога высоты ϑ, который отделяет белые пиксели от чёрных, т.е. они могут рассматриваться как функции этого параметра. И эти функции V(ϑ), S(ϑ) и χ(ϑ) строятся.

Распределение диапазонов

Распределение диапазонов это график роста диапазона значений от пространственного расстояния. Это всегда неубывающая функция.

Для каждого пикселя изображения и каждого расстояния по горизонтали можно рассчитать минимальное и максимальное из значений, которые лежат не далее заданного расстояния от выбранного пикселя. Локальный диапазон это разность между максимумом и минимумом (и в двумерном случае может быть показано используя функцию презентации Ранга). Усреднение локальных диапазонов для всех пикселей изображения даёт кривую распределения диапазонов

График функции относительной площади

График функции относительной площади показывает отношение площади развитой поверхности и площади проекции за вычетом единицы как функцию от масштаба, на котором рассчитывается площадь поверхности. Из за вычета единицы, которой равно отношение для полностью плоской поверхности, величина называется «избыточной» площадью.

Подобно функциям корреляции, избыточная площадь может быть определена как направленная величина. Однако, функция, показанная в иструменте, предполагает изотропную поверхность, горизонтальное или вертикальное направление, которые можно выбрать, задают только основное направление, используемое в расчёте.

Статистические функции под маской

Большая часть статистических функций поддерживает использование масок. Другими словами, они могут быть рассчитаны для областей изображения произвольной формы. Для некоторых из них, таких как распределение высот или углов, не требуется дополнительных пояснений: в расчёте используются только пиксели изображения под (или не под) маской. Однако, смысл функции менее ясен для функций корреляции и спектральных плотностей.

Мы покажем его для автокорреляционной функции (простейший случай). Полное описание можно найти в литературе [1]. Формула для дискретной автокорреляционной функции может быть переписана как

где Ωm это набор пикселей изображения внутри области для которой пиксель m столбцов правее также лежит внутри области. если мы рассчитываем функцию автокорреляции для прямоугольной области, например для всего изображения, ничего не меняется. Однако, данная формула достоверно задаёт функцию для областей любой формы. Осталось только понять, как можно эффективно проводить такой расчёт.

Для этого мы определяем ck,l как маску нужных пикселей, которая равна 1 для пикселей, которые мы хотим включить и 0 для пикселей, которые мы исключаем из расчёта. Из этого следует что

Далее, если данные изображения перед расчётом умножить на ck,l то сумму автокорреляционной функции для неправильной области можно заменить на обычную сумму автокорреляционной функции по всему изображению. И то, и другое можно эффективно рассчитывать с помощью быстрого преобразования Фурье.

Важно отметить, что количество информации, доступной в данных об автокорреляционной функции для заданной m зависит от Ωm. В отличие от прямоугольных изображений, она не должна монотонно убывать с увеличением m и может меняться произвольным образом. Там могут быть даже вырезы, т.е. горизонтальные интервалы m для которых область не содержит пар пикселей с нужным расстоянием между ними. Если это происходит, то Gwyddion заменяет отсутствующие значения используя линейную интерполяцию.

Инструмент статистики строк/столбцов

Инструмент Статистики по строкам/столбцам рассчитывает численные характеристики каждой строки или столбца и строит их как функции его/её положения. Это делает его в некоторой степени дополнительным к инструменту Статистические функции. Доступные величины включают в себя:

  • Среднее значение, минимум, максимум, срединное значение.
  • Среднеквадратичное значение неровностей высоты: это значение вычисляется из дисперсии данных Rq..
  • Коэффициент асимметрии и эксцесс распределения высот.
  • Длина линии поверхности. Эта величина оценивается как общая длина прямых сегментов, соединяющих значения данных в строке (столбце).
  • Общий уклон, т.е. тангенс средней линии, аппроксимирующей строку (столбец).
  • Тангенс β0. Это характеристика крутизны локальных уклонов, близко связанная с поведением функций автокорреляции и корреляции высота-высота в нуле. Для дискретных значений она вычисляется следующим образом:
  • Стандартные параметры шероховатости Ra, Rz, Rt.

В дополнение к графику, показывающему значения для индивидуальных строк/столбцов, среднее значение и среднеквадратичное отклонение выбранной величины рассчитывается из набора отдельных значений для строк/столбцов. Следует подчеркнуть, что стандартное отклонение выбранной величины представляет собой разброс значений для отдельных строк/столбцов и не может рассматриваться как ошибка аналогичной двумерной величины.

Статистики двумерных наклонов

Несколько функций в меню Обработка данныхСтатистика оперируют статистикой двухмерных наклонов (производных).

Распределение наклонов рассчитывает простое двухмерное распределение производных, то есть горизонтальные и вертикальные координаты результирующего поля данных это, соответственно, горизонтальные и вертикальные производные. Наклоны могут быть посчитаны как центральные производные (односторонние на границах изображения) или, если включена опция Использовать аппроксимацию локальной плоскостью, аппроксимацией локальной плоскостью окрестности каждой точки и использованием её градиента.

Распределение наклонов также может строить суммарные графики, представляющие одномерные распределения величин, относящихся к локальным уклонам и углам наклона граней задаваемым следующими уравнениями:

Доступны три различных графика:

  • Наклон (θ), распределение угла наклона ϑ относительно горизонтальной плоскости. Естественно, что представление наклона в виде угла требует чтобы значения и пространственные координаты были одними физическими величинами.
  • Наклон (градиент) напоминает график ϑ за исключением того, что строится распределение производной v вместо угла.
  • Наклон (φ) показывает интеграл v2 для каждого направления φ в горизонтальной плоскости. Это означает, что данная величина не просто распределение φ , поскольку области с большими уклонами вносят больший вклад, чем плоские области.

Функция Распределение углов - инструмент визуализации, который не рассчитывает распределение в строгом смысле. Для каждой производной v строится круг точек, удовлетворяющих уравнению

Число точек на круге задаётся параметром Число шагов.

Измерения решетки

Обработка данныхСтатистикаИзмерить решетку

Параметры правильных двумерных структур могут быть получены анализом данных, преобразованных в форму, которая учитывает их периодичность. Функции автокорреляции и плотности спектра мощности особенно хорошо подходят для этого, поскольку при анализе периодических структур на них присутствуют пики, соответствующие базисным векторам решеток Браве.

Пики на двумерной функции автокорреляции соответствуют векторам решетки в нормальном линейном пространстве (а также им же, умноженным в целое число раз и их линейным комбинациям). Пики на двумерной функции плотности спектра мощности соответствуют векторам обратной решетки. Матрицы, образованные векторами решетки в линейном пространстве и пространстве частот (Фурье-пространстве) являются транспонированными версиями обратных матриц друг друга. С соответствующим преобразованием любая из них может применяться для измерения периодической решетки.

Функция программы Gwyddion Измерить решетку может использовать либо функцию автокорреляции, либо ФСПМ для измерения. Поскольку правильные решетки с большими значениями периодов соответствуют далеко расположенным пикам на изображении функции автокорреляции, но близкорасположенным на ФСПМ, в этом случае лучше использовать автокорреляционную функцию для получения лучшего разрешения. Наоборот, изображение ФСПМ лучше подходит для измерения малых периодов решетки. В диалоговом окне можно свободно переключаться между линейным и Фурье-пространством и выбранная решетка по необходимости преобразуется вместе с пространством.

Если линии сканирования содержат много высокочастотного шума, горизонтальная автокорреляционная функция (средняя строка на изображении АКФ) также может оказаться достаточно шумной. В этом случае лучше интерполировать её по окружающим строкам используя опцию Интерполировать горизонтальную АКФ.

При нажатии на кнопку Оценить будет сделана попытка подобрать параметры решетки автоматически. Если полученные в результате вектора вас не устраивают, их можно выбрать на изображении вручную. Выбор можно делать либо способом, похожим на Афинное искажение (соответствует выбору Показать решетку как Решетку), либо будут показываться и настраиваться только два вектора (Вектора). Независимо от представления, когда вы приблизительно выберете положения пиков, нажатие на кнопку Уточнить подстроит вектора таким образом, чтобы они максимально точно соответствовали пикам. Кнопка Сброс может использоваться чтобы восстановить вектора во вменяемое исходное состояние.

Вектора решетки всегда показываются как вектора в линейном пространстве в виде компонент, длин и направлений. Угол, показанный как φ является углом между двумя векторами.

Анализ граней

Обработка данныхСтатистикаАнализ граней

Анализ граней позволяет в интерактивном режиме изучать ориентацию граней, которые встречаются в данных и выделять грани определённой ориентации на изображении. Левое окно просмотра показывает данные с предпросмотром помеченных граней. Правое меньшее окно, ниже именуемое просмотром граней, показывает двумерное распределение наклонов.

Центр грани всегда будет соответствовать нулевому наклону (горизонтальные грани), наклон в направлении x увеличивается в направлении левой и правой границы и наклон в направлении y увеличивается в направлении верхней и нижней границе. Точное представление координатной системы достаточно сложно и оно адаптируется к диапазону наклонов в конкретных отображаемых данных.

Площадь поверхности грани управляет размером (радиусом) плоскости, локально аппроксимированной в каждой токе для определения локального уклона. Специальное значение 0 соответствует случаю, когда аппроксимация плоскостью не проводится, локальный уклон определяется исходя из симметричных x и y производных в каждой точке. Выбор размера окружения критически важен для получения значимого результата: он должен быть меньше, чем те особенности, которые интересуют чтобы избежать сглаживания, в то же время он должен быть достаточно большим чтобы подавить шум, который присутствует в изображении.

Иллюстрация влияния размера аппроксимирующей плоскости на распределение в скане расслоённого алмазоподобного покрытия со значительным тонким шумом. Можно заметить, что распределение полностью скрыто шумом при малых размерах плоскости. Размеры окружения: (a) 0, (b) 2, (c) 4, (d) 7. Шкалы углов и псевдоцвета растянуты на весь диапазон для каждого изображения, т.е. они различны для разных изображений.

Как окно просмотра граней, так и окно данных позволяют выбрать точку мышью и прочитать соответствующее значение наклона нормали к грани ϑ и направление φ под заголовком Normal. Когда вы выбираете точку в окне просмотра данных, окно просмотра граней обновляется чтобы показать наклон в этой точке.

Кнопка найти максимум устанавливает выбор в окне распределения уклонов в точку максимума (там, где оно было изначально).

Кнопка Пометить обновляет маску областей с уклоном, подобным выбранному. Более точно, областей с уклоном укладывающихся в допуск от выбранного наклона. Окно просмотра граней после этого показывает набор граней, соответствующих отмеченным точкам (следует заметить, что набор отмеченных граней может не быть похожим в окне просмотра граней, но это лишь вследствие выбранной проекции). Средний наклон всех точек в выбранном диапазоне наклонов показывается под заголовком Средняя нормаль.

Энтропия

Обработка данныхСтатистикаЭнтропия

Инструмент Статистические величины может показывать оценку дифференциальной энтропии распределения значений. Эта функция может в дополнение рассчитывать дифференциальную энтропию распределения уклонов и также помогает увидеть, как она рассчитывается.

Дифференциальная энтропия Шеннона для функции плотности вероятности может быть выражена как

где X — область определения переменной x. Например, для распределения высоты x представляет высоту поверхности и X будет всей действительной осью. Для распределения углов x это двухкомпонентный вектор, состоящий из производных по осям и X, соответственно, будет плоскостью.

Существует большое количество более или менее сложных методов оценки энтропии. Gwyddion использует относительно простой метод, основанный на гистограмме, в котором приведённая выше формула аппроксимируется с помощью

где pi и wi — оценки плотности вероятности, т.е. нормализованное значение гистограммы и ширина i-той корзины гистограммы.

Естественно, оцениваемое значение энтропии зависит от выбора ширины корзины, за исключением равномерного распределения, где оценка от этого не зависит. Из этого следует, что для разумных распределений подходящей шириной корзины будет такая, при которой оценка энтропии не меняется при небольшом изменении ширины. Это и будет критерием выбора подходящей ширины корзины.

На практике это означает, что энтропия оценивается для большого диапазона ширины корзины (обычно много порядков величины), получая масштабную кривую, показываемую в виде графика в правой части диалогового окна. Энтропия после этого оценивается путём определения точки перегиба на кривой. Если такой точки нет, что может быть, например, если распределение очень близко к сумме δ-функций, в качестве энтропии будет выведено очень большое отрицательное значение.

Энтропии показываются без единиц измерения, поскольку они являются логарифмическими величинами. Для численного сравнения с другими расчётами, следует отметить, что в Gwyddion они всегда считаются из величин в основных единицах измерения СИ (т.е., например, в метрах при нанометровой шкале) и используются натуральные логарифмы. Следовательно, величины будут в естественных единицах информации (натах, nats)

Абсолютное значение энтроии зависит от абсолютной ширины распределения. например, два гауссова распределения высот с различными значениями среднеквадратичного отклонения будут иметь различные энтроии. Это полезно, если мы хотим сравнивать абсолютную ровность структур в распределении высот. С другой стороны, может оказаться полезным сравнить их способом, независимым от общего масштаба. Для этого мы можем использовать тот факт, что гауссово распределение будет иметь максимальную энтроию из всех распределений с одинаковым значением среднеквадратичного отклонения. Разница между максимальной и оцениваемой энтропией показывается как дефицит энтропии. По определению, она всегда положительна (кроме небольших отрицательных погрешностей, возникающих за счёт метода расчёта).

Ссылки

[1] D. Nečas and P. Klapetek: One-dimensional autocorrelation and power spectrum density functions of irregular regions. Ultramicroscopy 124 (2013) 13-19.