Понятие функции распределения

Практически любая техническая наука основана на эмпирическом (опытном) знании, следовательно, получение данных о том или ином объекте исследования неизбежно сопровождается фактором случайности. Под фактором случайности мы подразумеваем заведомо неизвестную совокупность опытных данных, которую необходимо представить в аналитической форме.

Продолжая разговор об аналитическом описании механических систем, в частности дискретных систем, стоит отметить, что наиболее универсальной характеристикой случайной величины является функция распределения.

Функция распределения случайной величины (она же интегральная функция распределения вероятностей) – это вероятность того, что случайная величина (назовем ее ξ) примет значение меньшее, чем конкретное числовое значение X:

(1)

Для дискретной случайной величины функция распределения вычисляется для каждого значения как сумма вероятностей, соответствующих всем предшествующим значениям случайной величины.

Касательно дискретных систем в подразделе «Методы определения размеров частиц» упоминалось, что функции распределения используются для представления результатов дисперсионного анализа гранулированных материалов. В том же подразделе описывается принцип построения дифференциальных гистограмм и кривых распределения частиц по размерам, позволяющих производить статистический анализ гранулометрического состава сыпучих материалов. Ввиду того, что современные методы обработки эмпирических данных основываются на применении программно-вычислительных средств, далее мы будем рассматривать вопросы, касающиеся разработки алгоритмов компьютерного анализа эмпирических распределений.

Рассмотрим поэтапно процесс статистической обработки данных с применением алгоритмических методов на примере дисперсионного анализа гранулированного материала. Как уже отмечалось выше, результатом дисперсионного анализа является набор данных о размерах частиц и вероятности их присутствия в составе гранулированного материала. Получаемые данные носят дискретный характер, другими словами, измерения производятся с определенным шагом. В случае ситового анализа шагом дискретности измерений является апертура стандартных сит, например, 5,0; 2,5; 1,25; 0,63; 0,315; 0,25; 0,125; 0,063 мм. Это значит, что в процессе анализа фиксируются остатки пробы материала на указанных ситах, при этом промежуточные значения размеров зерен между двумя апертурами остаются неизвестными. Для построения интегральной кривой рассева полученных данных достаточно, а промежуточные значения распределения размеров определяются линейной интерполяцией (дискретные точки кривой соединяются прямыми отрезками). Рисунок 1 иллюстрирует кривую рассева гранулированного материала, построенную по данным ситового анализа.

Рисунок 1  Пример кривой рассева материала по данным ситового анализа

Таким образом, построив интегральную кривую рассева, мы приблизительно описываем зерновой состав материала с допущением, что каждая фракция гранулированного материала, заключенная между двумя апертурами, например 1,25-2,5 мм, описывается линейным распределением размеров частиц. Однако фактически распределение размеров зерен внутри одной фракции имеет разброс. Точность определения гранулометрического состава материала зависит от конкретного применяемого экспериментального метода дисперсионного анализа. Ситовой анализ в данном случае дает наиболее грубую оценку зернового состава материала, ввиду большого шага дискретности. Данный тип анализа применяется к грубодисперсным материалам, например, природным гранулированным материалам (щебень, песок). Для исследования тонкодисперсных материалов (порошков, пыли) применяются более точные методы дисперсионного анализа, например, лазерный дифракционный анализ. Данный метод анализа характеризуется малым шагом дискретности измерений, а в результате анализа получается больше выходных данных. Так, например, для пробы порошка цемента в результате лазерного анализа получают кривую распределения, включающую порядка 50-100 экспериментальных точек.

Когда речь идет о дифференциальном распределении частиц по размерам, а именно о получении дифференциальной функции распределения, возникает задача аппроксимации эмпирического распределения значений плавной кривой. Рисунок 2 наглядно демонстрирует результат построения дифференциальных гистограмм распределения частиц по размерам (в и г) для линейной (а) и сплайновой (б) аппроксимации интегральной кривой распределения. Масштаб оси ординат дифференциальной гистограммы в 4 раза больше масштаба оси ординат интегрального графика.

Рисунок 2  Пример построения дифференциальной гистограммы распределения частиц по размерам для двух случаев аппроксимации интегральной кривой

Как видно из представленного рисунка, сплайновая аппроксимация интегральной кривой распределения позволяет построить гистограмму дифференциального распределения, которая носит более закономерный характер, в отличие от первого способа аппроксимации данных. Далее остановимся на понятии «аппроксимация».

Аппроксимация (от лат. approximo – приближаюсь) – замена одних математических объектов другими, в том или ином смысле близкими к исходным. Аппроксимация позволяет исследовать числовые характеристики или качественные свойства объекта, сводя задачу к изучению более простых или удобных объектов (например, таких, характеристики которых легко вычисляются или свойства которых уже известны) [1].

Условно аппроксимацию можно разделить на два вида:

  1. строгая теория математической аппроксимации;
  2. физическая (техническая) аппроксимация.

Строгая теория математической аппроксимации включает в себя следующие методы аппроксимации [2]:

  1. полиномами (многочленами); 
  2. сплайнами;
  3. отрезками ряда Фурье;
  4. полиномами по ортогональным многочленам;
  5. собственными функциями краевых задач.

Библиографические ссылки:

[1]  Математика: Энциклопедия / под ред. Ю.В. Прохорова.— М.: Большая Российская энциклопедия, 2003.

[2]  Голубинский, А.Н. Методы аппроксимации экспериментальных данных и построения моделей / А.Н. Голубинский // Вестник Воронежского института МВД России. Выпуск №2. 2007. С.1-6.