Методы обработки экономической информации для нейросетевой идентификации сложных экономических систем
Подавляющее большинство средств нейросетевой идентификации накла-дывают существенные ограничения на входной диапазон значений и характер обрабатываемых данных. Независимо от того, в каком виде представлена исход-ная информация, ИНС способны обрабатывать информацию лишь числового ха-рактера. С другой стороны, функциональные ограничения многих видов фор-мальных нейронов требуют, чтобы в обучающей выборке область определения обучающих множеств находилась в пределах области определения возможных со-стояний выходов формальных нейронов. Так, для сигмоидальной функции акти-вации эта область находится в диапазоне от 0 до 1, а для функции гиперболиче-ского тангенса − от -1 до 1, что сразу накладывает соответствующие ограничения на значения величин выходных сигналов в обучающих выборках. Что касается предварительной обработки количественных входных сигналов ИНС, то для них также требуется модификация с целью увеличения оценки константы Липшица [187]. Данный этап является необходимым, поскольку максимизация этой оценки положительно влияет как на скорость обучения ИНС, так и на ее итоговую точ-ность. Поэтому соответствующая статистическая предобработка входной и вы-ходной информации в обучающих выборках является необходимой абсолютно во всех случаях.
Многие типы данных в информационно-аналитических системах СЭС но-сят не количественный, а качественный характер. Примерами таких данных могут быть результаты анкетирования клиентов или экспертов, исследования социоло-гического характера, информация о сезонности продаж и т. д. В таких случаях всегда требуется кодирование категорий переменных. Оно может быть как непо-средственным (особенно для булевого типа независимой или зависимой перемен-ной), так и более сложным, например, с привлечением аппарата нечеткой логики. В последнем случае нечеткая логика используется несколько нетрадиционным способом. А именно: для входных и выходных (независимых и зависимых) пере-менных ИНС выполняется процедура дефаззификации до выполнения обучения ИНС. Готовая ИНС в этом случае эксплуатируется с дефаззификацией входных переменных и соответствующей фаззификацией выходных. При этом возникает существенное число вопросов, наиболее значимыми среди которых являются за-дачи определения формы и размерности функций принадлежности. Как отмеча-лось выше, аппарат нечеткой логики в настоящее время активно используется и развивается. Поскольку в предлагаемом контексте вопросы его использования яв-ляются вспомогательными, то в рамках настоящей работы указанные они рас-смотрены не будут, методология использования этого математического аппарата применительно к задачам обработки экономической информации в СЭС приведе-на в [87, 113].
После идентификации СЭС полученная нейросетевая модель может быть использована как в задачах классификации и принятия решений, так и в задачах прогнозирования и управления СЭС. В последнем случае входная и выходная ин-формация носит динамический характер и, как правило, представлена в виде со-вокупности временных рядов. Прямое использование информации подобного ха-рактера непосредственно для обучения ИНС и ее применение в качестве динами-ческой модели СЭС затрудняется шумовыми и пиковыми компонентами сигналов в таких временных рядах. В этих случаях для получения адекватной нейросетевой модели СЭС в ходе предобработки исходных временных рядов требуется допол-нительная фильтрация данных. Ее целью является освобождение обучающего множества от названых шумовых и пиковых компонент. Следует заметить, что выполнение такой фильтрации является весьма нетривиальной задачей, поскольку временной ряд может носить экспоненциальный, трендовый, циклический или комплексный характер. В то же время поставленная задача полной формализации процедуры такой фильтрации требует разработки универсального метода, кото-рый был бы эффективен для временных рядов произвольного характера.
Другим аспектом необходимости фильтрации данных является невозмож-ность корректного обучения ИНС в случае противоречивости обучающей выбор-ки. Наличие в обучающей выборке противоречивых примеров приводит к стагна-ции всего процесса обучения ИНС. При этом ошибка обучения достигает некото-рого неснижаемого порога, а сама процедура обучения зацикливается. Также важ-ным фактором является то, что усложнение топологии числа слоев и нейронов ИНС не способно решить указанную проблему. Поэтому всегда крайне важно ис-ключать из обучающей выборки противоречивые примеры. Это может быть вы-полнено математическими методами (оценка константы Липшица, попарные сравнения и т. д.) или техническими средствами (индексация обучающей выборки в базах данных).