Ректификация — один из самых сложных типовых процессов для моделирования в нефтегазовой отрасли. Это связано с тем, что необходимо учитывать температуру, давление, компонентный состав, степень износа основного оборудования, а также внешние условия, от которых зависят режим работы колонны и технологические параметры выходящих материальных потоков. Учет указанных факторов требует больших вычислительных ресурсов для решения системы уравнений с использованием термодинамических моделей флюидов. Кроме того, некоторые из данных факторов физически нельзя задать при использовании специализированных химико-технологических симуляторов. Один из вариантов решения проблемы — суррогатное моделирование, которому посвящена статья.
Процесс суррогатного моделирования основан на машинном обучении. Оно помогает сократить время расчета различного рода объектов благодаря аппроксимации детальной и медленной моделей при помощи более простого алгоритма, обученного на основе имитационных данных.
Для реализации суррогатной модели процесса ректификации [1] необходимо:
В настоящей статье авторами представлена пошаговая методика создания суррогатной модели ректификационной колонны для газоконденсатной смеси. В целях генерации обучающих данных была построена технологическая модель (рис. 1) в среде UniSim Design, для расчета термодинамического равновесия использовалось уравнение состояния Пенга — Робинсона [2]. Алгоритм оптимизации гиперпараметров искусственной нейронной сети (ИНС) — Hyperband, функция активации – ELU (exponential linear unit), а оптимизатор по минимизации среднеквадратичной ошибки во время обучения — Adam (adaptive moment estimation). Для построения базовой модели был взят нестабильный газовый конденсат. В табл. 1 представлены его характеристики, а в табл. 2 — спецификации модели.
Рис. 1. Технологическая модель: MSTR-085 — входной поток (до дросселирования);
VLV-100 — дроссель; 1 — входной поток (после дросселирования); ESTR-07 —
энергетический поток конденсатора; T-100 — ректификационная колонна;
ESTR-08 — энергетический поток ребойлера; MSTR-089, MSTR-086 — выходные
потоки; COLUMN — логический блок для задания входных условий; DIST — логический
блок для вывода свойств дистиллята; CUBE — логический блок для вывода свойств
остатка
Таблица 1. Характеристики нестабильного газового конденсата
Таблица 2. Основные спецификации базовой модели
В ходе суррогатного моделирования строится подменная (или суррогатная) модель методами машинного обучения для достаточно точной аппроксимации полученных результатов (рис. 2). Впоследствии эта обученная статистическая модель может быть использована для замены исходной компьютерной симуляции при проведении анализа чувствительности, оптимизации или анализа рисков.
Рис. 2. Блок-схема использования суррогатных моделей
Обучающую и тестовую выборки получают путем расчета на исходной химико-технологической модели высокой точности. Собрав достаточное количество пар входов (входных параметров) и соответствующих им выходов для обучающего набора, можно построить статистическую модель на основе искуственных данных.
Рабочий процесс создания суррогатной модели выглядит так, как показано на рис. 3.
Рис. 3. Последовательность разработки суррогатной модели
После расширения выборки модель дообучается и корректируется в соответствии с новыми полученными данными.
При создании суррогатной модели требуется база расчетных данных. На первом этапе генерируются исходные параметры.
Для ректификационных колонн при суррогатном моделировании результаты лучше воспроизводятся при распределении исходных данных по латинским гиперкубам (LHS), чем при обычном равномерном [3]. Поэтому для генерации данных использовалось LHS-распределение с помощью Python-библиотеки surrogate modeling toolbox (SMT) [4]. Границы и переменные указаны в табл. 3.
Таблица 3. Границы генератора для каждого входящего параметра
После первичной генерации и фильтрации данные отправлялись в очередь на расчет. За время цифрового эксперимента в базу были записаны результаты расчета модели для 100 тыс. технологических режимов. На рис. 4 изображена схема генерации обучающей выборки.
Рис. 4. Схема генерации обучающей выборки (создания синтетической базы
данных)
Второй этап создания суррогатной модели — выбор архитектуры и обучение ИНС. В качестве входных параметров выступают компонентный состав, давление и температура входящего потока, а результирующих — компонентные составы дистиллята и остатка, а также энергии ребойлера и конденсатора.
В исследовании [5] Hyperband показал лучшую способность к подбору оптимальных гиперпараметров модели ИНС, чем метод байесовской оптимизации. На рис. 5 изображена подобранная архитектура ИНС.
Рис. 5. Архитектура искусственной нейронной сети
В роли функции активации для всех слоев ИНС, кроме последнего, использовалась ELU, как метрика качества обучения — среднеквадратичная ошибка (MSE). Исходный набор данных был разбит на обучающую и тестовую выборки в соотношении 9 : 1 и нормализован по каждому параметру на входе и по каждой целевой переменной на выходе1. В результате данные в обучающей и тестовой выборках стали безразмерными.
Поскольку данные получены синтетическим путем, могут встречаться значения, порядок которых ниже 10–6 (максимальная точность работы симулятора). Такие столбцы необходимо исключить из набора.
Была построена корреляционная матрица, по результатам анализа которой стало очевидно, что признаки не коррелируют. Это необходимое условие для качественного обучения модели [6]. Выбранный оптимизатор Adam минимизирует среднеквадратичную ошибку с начальным коэффициентом скорости обучения (learning rate), равным 10–4. На рис. 6 проиллюстрирован процесс обучения модели, характеризующий зависимость MSE от количества эпох. Из графика следует, что среднеквадратичная ошибка на обучающей выборке составляет 2,6614 · 10–5, а на тестовой — 2,6818 · 10–5.
Рис. 6. Среднеквадратичная ошибка
Для более удобного использования разработанной суррогатной модели ее необходимо интегрировать в промышленный химико-технологический симулятор. В исследовании использовалось ПО «Планета. ИнСим». В нем есть поддержка гибридных моделей с применением методов машинного обучения, поэтому суррогатную модель можно легко интегрировать стандартными инструментами.
На рис. 7 изображен пример интеграции суррогатной модели ректификационной колонны в химико-технологический симулятор «Планета. ИнСим».
Рис. 7. Суррогатная модель колонны в симуляторе «Планета.ИнСим»
В результате блок ректификационной колонны стал считаться в 1000 раз быстрее, а точность моделирования сохранилась на приемлемом уровне (более 99 % на тестовой выборке). С применением описанного метода появилась возможность интегрировать колонну из ПО UniSim без использования ее лицензии в симулятор «Планета. ИнСим».
По результатам применения суррогатного моделирования для ректификационной колонны стабилизации газового конденсата можно сделать вывод, что метод позволяет выполнять высокопроизводительные расчеты с большой степенью сходимости результатов, аппроксимируя данные с помощью ИНС.
Дополнительно была решена обратная задача по интегрированию разработанной в UniSim суррогатной модели в среду специализированного ПО «Планета. ИнСим», что позволяет использовать ее как типовой технологический объект без каких‑либо ограничений.
1. Kirk-Othmer encyclopedia of chemical technology. 5th ed. New York, NY, USA: John Wiley and Sons, 2004. Vol. 8. 852 p.
2. Peng D.Y., Robinson D.B. A new two-constant equation of state // Ind. Eng. Chem. Fundam. 1976. Vol. 15, No. 1. P. 59–64. DOI: 10.1021/i160057a011.
3. Bouhlel M.A., Hwang J.T., Bartoli N., et al. A Python surrogate modeling framework with derivatives // Advances in Engineering Software. 2019. Vol. 135. Article ID 102662. DOI: 10.1016/j.advengsoft.2019.03.005.
4. Kingma D.P., Ba J. Adam: A method for stochastic optimization // Proceedings of the 3rd International Conference for Learning Representations (ICLR 2015). URL: https://arxiv.org/abs/1412.6980. Дата публикации: 22.12.2014.
5. Forrester A.I.J., Sobester A., Keane A.J. Engineering design via surrogate modelling: A practical guide. Chichester, UK: John Wiley and Sons, 2008. 210 p.
6. Jiang P., Zhou Q., Shao X. Surrogate model-based engineering design and optimization. Singapore: Springer, 2020. 240 p. DOI: 10.1007/978-981-15- 0731-1
1 Данные следует нормализовать, если они имеют различные размерности или обучаемая модель чувствительна к параметрам, значения которых измерены в разных шкалах.
А.С. Никулин, IBS (Москва, Россия)
Д.А. Степнов, IBS
Д.С. Куркин, ФГАОУ ВО «Российский государственный университет нефти и газа (национальный исследовательский университет) имени И.М. Губкина» (Москва, Россия)