# Обзор библиотек для решения задач оптимизации

<img src="../../img/Optimization_memes.png">


Каждый из нас повседневно сталкивается с задачами оптимизации, часто не замечая этого. В магазине мы стремимся минимизировать затраты, не теряя в количестве и качестве необходимых нам продуктов. Организуя свой день, делаем его максимально продуктивным, стараясь успеть на все мероприятия. И так далее.
Обычно мы справляемся с этим интуитивно и самостоятельно. Но в бизнесе и в науке всё должно быть максимально точно. И здесь на помощь приходят алгоритмы оптимизации.
В этом тьюториале представлена задача оптимизации и ее решения с помощью 3-х алгоритмов с использованием библиотек python.
Итак, начнём.

Если говорить об определениях, то оптимизация – это целенаправленная деятельность, заключающаяся в получении наилучших результатов при соответствующих условиях. 
Количественная оценка оптимизируемого качества называется  критерием оптимальности  или  целевой функцией.

Условные  задачи оптимизации, или задачи с ограничениями, – это такие задачи, при формулировке которых на значения аргументов налагаются ограничения в виде равенств или неравенств.

<img src="../../img/Optimization_definition.png">


## Задача оптимального планирования

Задачи оптимизации часто возникают в экономике, при планировании производственных процессов и количественной оценке альтернатив, связанных с принятием управленческих решений. Постановка этих задач обычно основана на анализе и сопоставлении расходуемых ресурсов и полученного результата. Такой подход принято называть методом “затраты - эффективность”. Применение этого подхода приводит, как правило, к двум связанным между собой типам задач: либо максимизировать эффективность при ограниченных затратах, либо обеспечивать эффективность не ниже заданной при минимальных затратах.

Такую задачу также можно назвать задачей линейного программирования (LP).

### Рассмотрим пример такой задачи:

Задача взята [отсюда](http://matica.org.ua/primery/primery/zadachi-optimizatcii).

   Металлургическому заводу требуется уголь с содержанием фосфора не более 0,03% и с долей зольных примесей не более 3,25%. Завод закупает три сорта угля A, B, C с известным содержанием примесей. В какой пропорции нужно смешивать исходные продукты А, B, C  чтобы смесь удовлетворяла ограничениям на содержание примесей и имела минимальную цену? Содержание примесей и цена исходных продуктов приведены в таблице:

<img src="../../img/Optimization_task.png">


### Решение:

Для начала необходимо составить математическую модель задачи. Введем следующие обозначения: x1 – содержание угля A в смеси; x2 – содержание угля B в смеси; x3 – содержание угля C в смеси. 

Тогда ограничения примут вид:
- 0.06*x1 + 0.04*x2 + 0.02*x3 <= 0.03*(x1 + x2 + x3)
- 2.0*x1 + 4.0*x2 + 3.0*x3 <= 3.25*(x1 + x2 + x3)
- x1 + x2 + x3 = 1 

А целевая функция будет:
- f(x) = 30*x1 + 30*x2 + 45*x3 → min

Перенесём правую часть через равно и упростим выражения, где это возможно. Таким образом, получим математическую модель нашей задачи.

Целевая функция:
- f(x) = 30*x1 + 30*x2 + 45*x3 → min

Ограничения: 
- 0.03*x1 + 0.01*x2 - 0.01*x3 <= 0
- -1.25*x1 + 0.75*x2 - 0.25*x3 <= 0
- x1 + x2 + x3 = 1 

Математическая модель готова, пришло время приступать к алгоритмам оптимизации. Для этого я предлагаю рассмотреть 3 библиотеки Python:
* pulp,
* scipy.optimize,
* cvxopt.modeling. 

Для того, чтобы убедиться в верной работе алгоритма, сразу дам ответ на эту задачу.

### Ответ

Для получения 1т угля необходимо взять 1/12т (0.0833т) первого компонента, 1/3т (0.333т) второго, 7/12т (0.583т) третьего. При этом его цена будет минимальной и составит 155/4 руб (38.75 руб).

## Библиотека PuLP

Устанавливаем библиотеку:

In [None]:
!pip install pulp

PuLP – это бесплатное программное обеспечение с открытым исходным кодом, написанное на Python. Оно используется для описания задач оптимизации, как математических моделей. Также PuLP может вызвать любой из многочисленных внешних решателей LP (CBC, GLPK, CPLEX, Gurobi и т. д.) для решения этой модели, а затем использовать команды python для управления и отображения решения.

Для начала решения задачи оптимизации необходимо инициализировать переменную (например prob) с помощью функции LpProblem():
    - prob = LpProblem("The Problem", LpMinimize)
 
Она имеет два параметра, первый из которых произвольное имя этой проблемы (в виде строки), а второй параметр либо LpMinimize или LpMaximize в зависимости от типа задачи оптимизации (минимизация/максимизация), которую вы пытаетесь решить.

Переменные задачи создаются с помощью класса LpVariable:

    - x = LpVariable("example", 0, None, LpInteger)

Он имеет четыре параметра:
 - Первый – произвольное имя того, что представляет эта переменная;
 - Второй – нижняя граница этой переменной;
 - Третий – верхняя граница;
 - Четвертый – тип данных (дискретный или непрерывный). Значения четвертого параметра – LpContinuous или LpInteger, по умолчанию – LpContinuous. Если бы мы моделировали количество банок для производства, нам нужно было бы ввести LpInteger, так как это дискретные данные. 

Границы могут быть введены непосредственно как число, или None, чтобы не представлять никакой границы (т. е. положительная или отрицательная бесконечность), None стоит по умолчанию. 

Если первые несколько параметров введены, а остальные игнорируются, они принимают значения по умолчанию. Однако, если вы хотите указать третий параметр, но хотите, чтобы второй был значением по умолчанию, вам нужно будет специально установить второй параметр как значение по умолчанию. То есть, нельзя оставлять запись параметра пустой. 

Далее, объявленная переменная prob начинает сбор данных с помощью оператора +=. Сначала вводится целевая функция с важной запятой в конце инструкции и короткой строкой, объясняющей, что это за целевая функция. Пример:

    - prob += 0.013*x1 + 0.008*x2, "Total Cost of Ingredients per can"

Затем точно также вводятся ограничения. Например:
    - prob += x1 + x2 == 100, "PercentagesSum"
    - prob += 0.100*x1 + 0.200*x2 >= 8.0, "Requirement"

Строка в конце является необязательной.

Далее, решается задача оптимизации с помощью функции:
    - prob.solve()

Если задача решилась оптимально, то можно выводить значения найденных переменный в цикле. Для вывода на экран результата целевой функции нужно воспользоваться функцией value.

### Итак, вернёмся к задачe

Напомним уже найденную математическую модель:

Целевая функция:
- f(x) = 30*x1 + 30*x2 + 45*x3 → min

Ограничения: 
- 0.03*x1 + 0.01*x2 - 0.01*x3 <= 0
- -1.25*x1 + 0.75*x2 - 0.25*x3 <= 0
- x1 + x2 + x3 = 1 

Код с импользованием библиотеки PuLP:

In [None]:
import time

from pulp import *

start = time.time()

problem = pulp.LpProblem("0", pulp.LpMinimize)
x1 = pulp.LpVariable("x1", lowBound=0)
x2 = pulp.LpVariable("x2", lowBound=0)
x3 = pulp.LpVariable("x3", lowBound=0)

problem += 30 * x1 + 30 * x2 + 45 * x3, "Целевая функция"
problem += 0.03 * x1 + 0.01 * x2 - 0.01 * x3 <= 0, "1-е ограничение"
problem += -1.25 * x1 + 0.75 * x2 - 0.25 * x3 <= 0, "2-е ограничение"
problem += x1 + x2 + x3 == 1, "3-е ограничение"
problem.solve()

print("Результат:")
for variable in problem.variables():
    print(variable.name, "=", variable.varValue)
print("Цена:")
print(value(problem.objective))

stop = time.time()
print("Время:")
print(stop - start)

Ответ был: Для получения 1т угля необходимо взять 1/12т (0.0833т) первого компонента, 1/3т (0.333т) второго, 7/12т (0.583т) третьего. При этом его цена будет минимальной и составит 155/4 руб (38.75 руб)

Ответы сошлись! Успех!

## Библиотека SciPy

Устанавливаем библиотеку:

In [None]:
!pip install scipy

SciPy – это популярная библиотека для языка программирования Python, предназначенная
для выполнения научных и инженерных расчётов. Библиотека включает компоненты для решения
дифференциальных уравнений, интегрирования, обработки изображений, визуализации,
оптимизации и многих других задач. В частности, для решения задач линейного программирования
SciPy предлагает функцию linprog (входящую в компонент optimize).

In [None]:
scipy.optimize.linprog(
    c,
    A_ub=None,
    b_ub=None,
    A_eq=None,
    b_eq=None,
    bounds=None,
    method="simplex",
    callback=None,
    options={"disp": False, "bland": False, "tol": 1e-12, "maxiter": 1000},
)

Минимальное количество пораметров – один, только параметр с.

Описание параметров:
  - c – коэффициенты целевой функции;
  - A_ub – двумерный массив ndarray (или список списков) с коэффициентами ограничений – верхних границ («≤»);
  - b_ub – правая часть ограничений – верхних границ;
  - A_eq – двумерный массив ndarray (или список списков) с коэффициентами ограничений равенства;
  - b_eq – правая часть ограничений равенства;
  - bounds – ограничения на значения переменных. Этот параметр может принимать одну из трех форм:
       - None – все переменные неотрицательны;
       - (lb, ub) – если параметр представляет собой один кортеж, то все переменные должны принимать значения в диапазоне [lb; ub] включительно;
       - [(lb_0, ub_0), (lb_1, ub_1), …] – если параметр представляет собой список, то в этом списке должно быть столько элементов, сколько переменных, и i-тый элемент списка задает диапазон значений i-той переменной;
  - callback – функция обратного вызова, которая должна иметь сигнатуру callback(xk, kwargs), где xk – это вектор с текущим решением, а kwargs – ассоциативный массив, содержащий следующие ключи:
       - tableau – текущая симплекс-таблица;
       - nit – номер текущей итерации;
       - pivot – разрешающий элемент, который будет использован для следующей итерации;
       - phase – фаза алгоритма (функция реализует двухфазный симплекс-метод);
       - bv – структурированный массив, содержащий строковое представление каждой переменной и ее текущего значения;
        
Дополнителные опции, задаваемые через параметр options:
  - maxiter – лимит на количество итераций;
  - disp – если True, то выводить статус в стандартный поток вывода;
  - tol – порог, используемый при сравнении с нулем;
  - bland – если True, то использовать алгоритм Блэнда для выбора разрешающего элемента, позволяющее избежать возможного зацикливания симплекс-метода. В противном случае, выбирается элемент, который быстрее всего приведет к нахождению решения, однако, в редких случаях не исключается возможность зацикливания.

То есть, в пареметр A_ub мы записываем коэффиценты неравенства («≤»), в параметр A_eq коэффиценты равенства («=»). Для неравенства («≥») парметров нет, но это легко исправить, поменяв знаки коэффицентов и добавив их в пареметр A_ub.

Возвращаемым значением является объект scipy.optimize.OptimizeResult, содержащий следующие поля:
   - fun - значение целевой функции;
   - message – строка с описанием статуса;
   - nit – количество произведенных итераций;
   - slack – значения дополнительных переменных. Каждая переменная соответствует ограничению-неравенству. Нулевое значение переменной означает, что соответствующее ограничение активно.
   - status – статус решения:
       - 0 – поиск оптимального решения завершился успешно;
       - 1 – достигнут лимит на число итераций;
       - 2 – задача не имеет решений;
       - 3 – целевая функция не ограничена.
   - success – True, если функции удалось найти оптимальное решение;
   - x – массив значений переменных, доставляющих максимум целевой функции.

### Решаем нашу задачу:

Напомню математическую модель задачи.

Целевая функция:
- f(x) = 30*x1 + 30*x2 + 45*x3 → min

Ограничения: 
- 0.03*x1 + 0.01*x2 - 0.01*x3 <= 0
- -1.25*x1 + 0.75*x2 - 0.25*x3 <= 0
- x1 + x2 + x3 = 1 

Код:

In [None]:
import time

from scipy.optimize import linprog

start = time.time()

c = [30, 30, 45]  # Целевая функция
A_ub = [
    [0.03, 0.01, -0.01],
    [-1.25, 0.75, -0.25],
]  # Коэффициенты первых 2-х функций ограничения
b_ub = [0, 0]  # Результат первых 2-х функций ограничения
A_eq = [[1, 1, 1]]  # Коэффициенты 3-й функции ограничения
b_eq = [1]  # Результат 3-й функции ограничения

print(linprog(c, A_ub, b_ub, A_eq, b_eq))  # Оптимизация

stop = time.time()
print("Время :")
print(stop - start)

Сравним с ответом задачи: для получения 1т угля необходимо взять 1/12т (0.0833т) первого компонента, 1/3т (0.333т) второго, 7/12т (0.583т) третьего. При этом его цена будет минимальной и составит 155/4 руб (38.75 руб)

Решено верно!

## Библиотека CVXOPT

Устанавливаем:

In [None]:
!pip install cvxopt

Библиотека CVXOPT предназначена для решения более широкого класса задач – задач
выпуклого программирования. Соответственно, в ней используются более универсальные
алгоритмы, за счет чего время решения аналогичных задач может оказаться несколько больше, чем
у специализированных библиотек, реализующих разновидности симплекс-метода.

Переменные оптимизации представлены объектами, которые являются векторной величиной.
    - cvxopt.modeling.variable([size[, name]])
    
 - Первый аргумент – размерность вектора (положительное целое число со значением по умолчанию 1). 
 - Второй аргумент – строка с именем переменной. Имя является необязательным и имеет значение по умолчанию "". Оно используется только при отображении переменных (или объектов, зависящих от переменных, таких как функции или ограничения) с помощью инструкций print, при вызове встроенных функций repr или str или при записи линейных программ в файлы MPS.

Целевую функцию и ограничения можно определить с помощью перегруженных операций над переменными и другими функциями. Поддерживаются три типа функций: аффинные, выпуклые кусочно-линейные и вогнутые кусочно-линейные.

Задачи оптимизации строятся вызовом следующей функции.
    - cvxopt.modeling.op([objective[, constraints[, name]]])

 - Первый аргумент определяет целевую функцию, которая должна быть минимизирована. Это может быть аффинная или выпуклая кусочно-линейная функция с длиной 1, переменная с длиной 1 или скалярная константа (целое число, float или 1 на 1 плотная матрица). Значение по умолчанию – 0.0.

 - Второй аргумент – одно ограничение или список объектов ограничений. Значение по умолчанию – пустой список.

 - Третий аргумент – строка с именем задачи. Значением по умолчанию является пустая строка.
    


Задача оптимизации с выпуклой кусочно-линейной задачей и ограничениями может быть решена путем вызова метода solve. Эта функция преобразует задачу оптимизации в линейную программу в матричном виде, а затем решает ее.

    - solve([format[, solver]])

 - Первый аргумент является либо "плотным", либо "разреженным" и обозначает типы матриц. Значение по умолчанию – "плотный".
 - Второй аргумент – None, ' glpk 'или' mosek'. Выбирается один из трех доступных решателей LP: решатель по умолчанию, написанный на Python, решатель GLPK (если установлен) или решатель MOSEK LP (если установлен). Значение по умолчанию – None.

Решатель сообщает о результатах оптимизации, задавая атрибут self.status и путем изменения значений атрибутов переменных и множителей ограничений задачи.

- Если задача решается оптимально, то self.status = 'optimal'. Значения переменных в задаче устанавливаются в их вычисляемые решения, а значения множителей ограничений задачи – в вычисляемое оптимальное решение.
 - Если определено, что проблема невыполнима, то self.status = 'primal infeasible'. Значений переменных нет. Множителям ограничений присваивается значение первичной неосуществимости. С опцией 'glpk', solve не предоставляет значений неосуществимости.
 - Если определено, что проблема двойственна, то self.status установливается в 'dual infeasible'. Значений множителей ограничений нет. Переменным устанавливаются значения двойной неосуществимости. Опять же, с опцией 'glpk', solve не предоставляет значений неосуществимости.
 - Если проблема не была решена успешно, self.status = 'unknown'. Значения переменных и множители ограничений имеют значение None.

### Возвращаемся к задаче:

Исходная математическая модель:

Целевая функция:
- f(x) = 30*x1 + 30*x2 + 45*x3 → min

Ограничения: 
- 0.03*x1 + 0.01*x2 - 0.01*x3 <= 0
- -1.25*x1 + 0.75*x2 - 0.25*x3 <= 0
- x1 + x2 + x3 = 1 

Код с использованием библиотеки cvxopt:

In [None]:
import time

from cvxopt.modeling import op, variable

start = time.time()

x = variable(3, "x")
z = 30 * x[0] + 30 * x[1] + 45 * x[2]  # Целевая функция
mass1 = 0.03 * x[0] + 0.01 * x[1] - 0.01 * x[2] <= 0  # 1-е ограничение
mass2 = -1.25 * x[0] + 0.75 * x[1] - 0.25 * x[2] <= 0  # 2-е ограничение
mass3 = x[0] + x[1] + x[2] == 1  # 3-е ограничение
problem = op(z, [mass1, mass2, mass3])  # Построение задачи
problem.solve(solver="glpk")  # Оптимизация
problem.status

print("Цена:")
print(abs(problem.objective.value()[0]))
print("Результат:")
print(x.value)

stop = time.time()
print("Время :")
print(stop - start)

Ответ был: Для получения 1т угля необходимо взять 1/12т (0.0833т) первого компонента, 1/3т (0.333т) второго, 7/12т (0.583т) третьего. При этом его цена будет минимальной и составит 155/4 руб (38.75 руб)

Итак, алгоритм с использованием библиотеки CVXOPT также прекрасно справляется с задачей! Решено верно.

### Выводы

||Данный ответ|Библиотека PuLP|Библиотека SciPy|Библиотека CVXOPT|
|----|----|----|----|---|---|
|<b>y</b>|38.74|38.74999974|38.749999999999993|38.75|
|<b>x1</b>|0.0833|0.083333333|0.08333333|8.33e-02|
|<b>x2</b>|0.333|0.33333333|0.33333333|3.33e-01|
|<b>x3</b>|0.583|0.58333333|0.58333333|5.83e-01|
|<b>Время, сек</b>|-|0.0930559635162|0.00560903549194|0.00599002838135|

Как видно из таблицы, все библиотеки справились с задачей. Лучшей по времени оказалась библиотека SciPy. Но решение о применении той или иной библиотеки часто носит субъективный характер, поэтому целесообразно проводить их сравнительный анализ для области решаемых Вами задач.

## Заключение

Умение грамотно строить математическую модель ситуации и знание алгоритмов оптимизации может очень сильно пригодиться даже в бытовых вещах. Будь то планирование маршрута путешествий с наименьшими затратами и наибольшой пользой, или выбор в пользу той или иной работы. 
Стоит ещё упомянуть, что в своё время Б.А. Березовский занимался этим вопросом и даже написал не одну научную работу. Одну из самых известных Березовский написал с соавторами (с Ю. А. Барышниковым, В. И. Борзенко и Л. М. Кемпнером) "Многокритериальная оптимизация: математические аспекты".
Кто знает, может быть, умение оптимизировать всё, что оптимизируется, очень сильно пригодиться Вам в жизни!

### Ссылки:

- [Библиотека PuLP](https://pythonhosted.org/PuLP/)
- [Библиотека SciPy](https://docs.scipy.org/doc/scipy/reference/tutorial/optimize.html)
- [Библиотека CVXOPT](http://cvxopt.org/userguide/modeling.html)
    

Если Вы нашли ошибку, или у вас есть замечания, пожалуйста, напишите мне на почту – elizavetazikeeva@gmail.com.<br/>
Большое спасибо, что уделили своё время этому тьюториалу! :)