1.Основные функции
В программе RegrStat используется аналитический метод наименьших квадратов для построения уравнения регрессии, т.е. определения коэффициентов полинома вида Y=A0+A1X+A2X2..., а также для вычисления среднего квадратического отклонения (СКО) полученной кривой. Оптимальная степень полинома может быть определена путем сравнения величин СКО для различных значений этой степени. Если при последовательном увеличении степени СКО далее не уменьшается или начинает возрастать, то оптимальная степень полинома, наиболее отвечающая экспериментальным данным, считается достигнутой. Визуально это может быть проконтролировано по виду графика кривой, который строится программой одновременно с расчетом для данной степени. См. также Примечания в конце этого текста.
Полученные данные могут быть сохранены в текстовом файле, а график - в формате GIF (или скопирован в буфер обмена для последующей вставки в графические редакторы). Программа RegrStat также позволяет рассчитать таблицу значений зависимой переменной (Y) с заданным шагом по независимой переменной (X) и значение Y для произвольного X.
2. Установка
Установки программа RegrStat не требует, достаточно скопировать исполняемый файл Regrstat.exe (а также этот файл справки) в любую папку. Программа работает под Windows 98/Me/2000/XP. Все установки запоминаются в ini-файле, который автоматически создается при первом запуске программы в текущей папке. Если хотите вернуть установки по умолчанию, просто удалите ini-файл перед запуском программы.
3. Интерфейс
Интерфейс программы RegrStat рассчитан так, чтобы обеспечить возможность управления полностью от клавиатуры (за исключением некоторых установок), или полностью мышью (за исключением полей ввода некоторых численных значений), без необходимости перестраиваться с одного на другое. Установлен определенный порядок переключения фокуса ввода между управляющими элементами по мере выполнения основных операций, а также с помощью клавиши Tab. Все пункты меню имеют клавиатурные комбинации, и большинство из них дублированы отдельными кнопками. Клавиатурные комбинации можно узнать при обращении к меню. Для лучшей ориентации на клавиатуру используется специально написанный упрощенный диалог открытия файла (может быть заменен на вызов обычного диалога Windows). Последняя открытая директория запоминается к следующему разу. В диалогах открытия может быть использован фильтр типов файлов. Закрытие любого диалога без внесения изменений осуществляется клавишей Esc.
4. Файлы с исходными данными
Файлы с исходными данными должны представлять собой обычные текстовые таблицы с двумя колонками чисел (в колонке слева указывается X, справа Y, каждая пара располагается в новой строке). В таблице могут располагаться произвольные текстовые строки (например, заголовок для колонок с надписями "X" и "Y"), которые игнорируются при чтении по условию наличия в них хотя бы одного символа, отличного от цифры, пробела, знака табуляции, точки, запятой, точки с запятой, и английских букв "e" или "E". Пустые строки, даже содержащие пробелы или знаки табуляции, также игнорируются. Между цифрами в колонках в качестве разделителя могут использоваться знаки пробела, табуляции или точки с запятой (но не запятой!) в произвольном количестве, пробелы и знаки табуляции могут располагаться также до и после них. Формат записи чисел должен соответствовать следующим договоренностям: десятичный разделитель - точка или запятая, знак экспоненты - "е" или "Е" (английское). Плюс перед числом может опускаться, минус ставится без пробела. Образцы написания вещественных чисел: "1.2345", "-1.2345", "1.2345e-3"(="0.0012345"), "1.2345e3"(="1234.5") и т.п. В выходных файлах десятичный разделитель - точка или запятая, в зависимости от формата исходных чисел. Максимальное количество экспериментальных точек - 1000, свыше этого значения все записи в исходном файле игнорируются.
6. Основной порядок работы
После запуска программы фокус ввода стоит на кнопке "Открыть файл с данными", поэтому просто нажмите Enter (или Ctrl-O, что соответствует обращению к пункту "Файл>Открыть"). В появившемся диалоге с помощью клавиш-стрелок выберите нужный файл и нажмите Enter. По умолчанию используется фильтр по расширениям файлов .dat и .txt (см. ниже пункт "Настройки открытия и сохранения файлов"). Если в текущей директории нужного файла нет, то нажатие Enter после выбора одной из вложенных директорий (при их наличии помечаются голубым цветом и большими буквами) позволяет перейти в нее, а после выбора значка ".." наверху списка - выйти в вышележащую. Выбор можно также производить двойным щелчком мыши. Для смены текущего диска нажмите Alt-F1 (или обратитесь к единственному пункту главного меню) и выберите имя диска из выпадающего списка (с клавиатуры это можно сделать клавишами-стрелками с последующим нажатием Enter). Внизу окна демонстрируются свойства выбранного файла (объем и время создания) или папки (только время), они служат только для справки и для управления не используются. Из диалога открытия можно выйти без выбора нажатием клавиши ESC. Изменение настроек (см. далее) позволяет использовать обычный диалог открытия Windows.
После успешного открытия файла в текстовом окне будет выведена таблица с исходными данными. Если в этих данных нет отрицательных и нулевых значений зависимой переменной (Y), то будет доступен пункт "Экспонента" (управляется только мышью). О расчете коэффициентов экспоненциальной зависимости см. далее.
Введите желаемую степень полинома (по умолчанию 1; вводимое число не может быть равно 0 или превышать число экспериментальных точек минус единица, при ошибочном вводе будет автоматически исправлено) и опять нажмите Enter. Будет произведен расчет и построен график. Масштабы по осям выбираются автоматически по специальному алгоритму так, чтобы обеспечить максимальное использование поля графика и "круглые" значения величин по осям графика.
При задании максимально возможной степени полинома (число экспериментальных точек минус единица) СКО не будет рассчитано, а кривая точно пройдет через все экспериментальные точки.
7. Расчет коэффициентов экспоненты
Под экспонентой понимается уравнение вида Y = AeBX. Если пункт "Экспонента" отмечен, то установка значений степени полинома будет недоступна. Не будет также производиться расчет значений СКО. Производить расчет коэффициентов экспоненты следует в случае, когда априорно известно, что экспериментальные данные описываются именно экспоненциальной зависимостью (процессы остывания физических тел, разряд конденсатора и т.п.). В случае, если желательно получить иную форму уравнения экспоненты (например, Y = AeB/X), следует привести исходные данные по Х в соответствие с желаемой формой уравнения (в приведенном примере следует заменить в столбце Х значения на 1/X).
8. Сохранение результатов
Расчет можно сохранить в текстовом файле (кнопка "Сохранить результаты в текстовом файле", клавиши Ctrl-S), которому будет автоматически присвоено имя открытого файла с расширением .RES. При сохранении дальнейших расчетов с теми же данными, результаты будут автоматически дописываться в уже созданный файл. По нажатию кнопки "Сохранить как GIF" (Ctrl-Alt-S) график псохраняется в формате CIF, имя файла формируется также из имени исходного файла с добавлением числа от 00 до 99 (при повторном сохранении число будет последовательно расти). Изменение настроек (см. далее) позволяет дополнительно выводить диалог сохранения файла для контроля (и, если надо, изменения) имени файла с сохраняемыми данными.
Нажатие клавиш Ctrl-Alt-C (или кнопки "Копировать в буфер" справа внизу) копирует график в буфер обмена. Все перечисленные операции дублированы пунктами меню.
9. Настройки открытия и сохранения файлов
Если в меню настроек открытия и сохранения (пункт "Файл>Настройки" или Ctrl-D) отмечен пункт "Открывать через обычный диалог Windows", то при следующем вызове открытия файла вместо текстового диалога появится обычный диалог Windows. Отметка пункта "Вызывать диалог при сохранении файлов" разрешает дополнительно выводить диалог сохранения файла для контроля (и, если надо, изменения) имени файла с сохраняемыми данными. Пункт "При открытии использовать фильтр" разрешает использование фильтра по типам файлов при вызове диалога открытия. Сам фильтр устанавливается в однострочном редакторе ниже (при запрещении использования фильтра редактор недоступен), и по умолчанию включает в себя два расширения файлов - .dat и .txt, все остальные файлы не будут показываться. Если пункт не отмечен, то в диалогах открытия будут показываться все файлы. Если вы хотите добавить к фильтру свои расширения имен или изменить существующие, то делать это следует строго по образцу имеющихся. Дописывать можно в начало и конец списка, перед следующим расширением должен быть знак ";" и затем пробел. Вместо имени файла перед точкой должна стоять звездочка "*". Проверки на корректность записи не производится, и при неверном оформлении фильтра он не заработает.
10. Установки масштаба графика
При желании вы можете выбрать свои величины масштаба по осям графика, в пределах максимального и минимального значений для Х и Y (они рассчитываются автоматически и приблизительно равны крайним значениям исходного массива данных). Ограничение на выход за пределы исходного массива связано с тем, что полиномиальная регрессия позволяет только аппроксимировать экспериментальные точки в заданных пределах, но не позволяет сделать заключение о ходе кривой за пределами заданного массива (т.е. осуществлять интерполяцию).
Установки масштаба производятся через нажатие кнопок группы "Масштаб" или выбором подпунктов меню "График" с соотвествующими наименованиями. Кнопка "Задать масштаб" (Ctrl-M) позволяет установить максимальное и минимальное значения по осям. Предпочтительно выбирать значения так, чтобы разность между ними делилась на 4 или 8 без остатка (тогда значения на осях графика будут выражаться круглыми числами). Нажатие клавиши Enter приводит к переходу в нижележащее окно ввода, а в конце переводит фокус ввода на кнопку "ОК" (т.е. если вы после открытия меню установок нажмете на Enter 5 раз подряд, то закроете диалог без изменений). Переход между полями ввода можно осуществлять также клавишей Tab.
Нажатие кнопки "Автоматически" (Alt-Backspace) приводит к восстановлению оптимальных величин масштаба, выбранных автоматически.
11. Настройки внешнего вида графика
Позволяет настроить величину, цвет и форму отображения экспериментальных точек на графике, толщину и цвет расчетной кривой. Можно также запретить отображение точек или кривой на графике, и задать обозначения осей координат (по умолчанию "X" и "Y"), при этом для Y не более 3, а для Х не более 2 символов. Меню настроек внешнего вида графика появится при обращении к пункту меню "График>Оформление графика" (Ctrl-G). Все сделанные установки, кроме обозначений осей координат, запоминаются, если отмечен пункт "Сохранять настройки".
12. Дополнительно
В пункте меню "Дополнительно" есть два подпункта: расчета таблицы значений Y с заданным шагом по X (Ctrl-T) и расчета значения Y для произвольного X (Ctrl-Y). Результаты расчетов будут выведены в текстовое поле и их можно добавить (Ctrl-S) в тот же текстовый файл, что и результаты расчетов полинома. При расчете таблицы вы можете задавать шаг непосредственно (в значениях Х) или указать число точек разбиения. Так как эти величины связаны между собой, то они автоматически рассчитываются при вводе, поэтому обращайте внимание на их значения перед нажатием кнопки "ОК". Следует иметь в виду, что при разбиении, например, на 10 интервалов число точек будет равно 11 - на единицу больше. Таким образом, если вы задали начальное значение Х=0, конечное X=10, и шаг разбиения по Х=1, то число точек автоматически рассчитается, как равное 11. При попытке изменить это значение на 10, у вас будет пересчитан шаг, который в этом случае станет равным 1,11. Если вы хотите в этом примере непременно установить величину шага =1 и число точек =10, то вам придется вернуться назад и откорректировать начальное/конечное значения (например, установить начальное, равное 1, а не 0).
Последовательный переход между полями ввода можно осуществлять клавишей Enter или Tab - так же, как для установок масштаба.
Примечание 1
При проведении экспериментов в целях минимизации ошибок аппроксимации следует придерживаться следующих правил. При необходимости получения некоей зависимости в заданном диапазоне, следует производить измерения равномерно по всему диапазону измерений, при этом как минимум по одному измерению должно выполняться вблизи крайних значений диапазона. Число точек измерений по диапазону - чем больше, тем лучше. Минимально необходимое число точек - на 1 больше степени полинома (для линейной зависимости - прямой линии Y=A0+A1X оно равно 2), но при этом ошибка (СКО) не может быть рассчитана, и для надежности следует увеличить число точек как минимум еще на одну, а лучше две-три (т.е. 4-5 для линейного уравнения, см. далее Примечание 2). Если априорно точно известно, что степень полинома равна 1 (например, в случае линейных датчиков это обязательно должна быть прямая), то можно ограничиться несколькими измерениями вблизи крайних значений, не затрагивая середину диапазона.
назад к тексту
Примечание 2
Значение среднего квадратическое отклонения (СКО) характеризует ошибку аппроксимации, куда входит как случайная ошибка измерений, так и ошибка, обусловденная неадеватностью модели (т.е. несоотвествием выбранной степени полинома настоящему виду зависимости). Значения СКО представляют абсолютную ошибку (т.е. в физических величинах размерности Y), при достаточно большом количестве измерений (не менее, чем на 8-10 точек превышающем степень полинома) соотвествующую уровню надежности 63% (т.е. в 63% случаев ошибка не превысит СКО). Для получения ошибки измерений с обычным для технических применений уровнем надежности 95% следует умножить величину СКО на 2 (для числа измерений, более, чем на 10 превышающим степень полинома) или на 2,5 (при числе измерений, первышающим степень полинома на 4-8). Подчеркнем, что при количестве измерений, меньших указанных значений (5 точек для линейного уравнения), уровень надежности резко падает и указанная методика оценки ошибки неприменима.
назад к тексту
Примечание 3
Для расчета многофакторной регрессии (полиномов более, чем от одного переменного) можно воспользоваться следующей методикой. Например, для двух переменных Х1 и Х2 получите экспериментальные зависимости Y от одной из них (Х1) при нескольких (не менее 3-4-х) фиксированных значениях второй (Х2). Потом рассчитайте коэффициенты полинома для каждой из этих серий измерений по Х1, получив в результате наборы значений каждого из коэффициентов (А0, А1 и т.д.) в зависимости от второй переменной Х2. Представив коэффициенты в каждом из наборов, как зависимую переменную, а Х2 - как независимую, вы сможете рассчитать полиномы, соотвествующие зависимости коэффициентов от второй переменной. Подставьте полученные формулы этих полиномов в качестве коэффициентов в первоначальную формулу зависимости от первой переменной Х1. При желании можно упростить вид результирующего полинома, раскрыв скобки. Аналогично можно поступить и при числе независимых переменных (факторов) большем, чем 2. Однако уже при числе факторов, равном 3, экспериментальная задача становится очень громоздкой (для 3 факторов при минимально необходимых для адекватной линейной аппроксимации 4-х фиксированных значениях каждой переменной Х1, X2 и X3 требуется 64 измерения, при 4 факторах - 256 измерений и т.п.), и в таких случаях лучше использовать специальные методы планирования эксперимента и специализированные программы для расчета.
наверх