d9/df2/AugmentedLagrangianOptimizer_8cpp_source.html

// Mantid Repository : https://github.com/mantidproject/mantid

//

// Copyright &copy; 2018 ISIS Rutherford Appleton Laboratory UKRI,

//   NScD Oak Ridge National Laboratory, European Spallation Source,

//   Institut Laue - Langevin & CSNS, Institute of High Energy Physics, CAS

// SPDX - License - Identifier: GPL - 3.0 +

#include "MantidCurveFitting/AugmentedLagrangianOptimizer.h"

#include "MantidKernel/Exception.h"


#include <cmath>

#include <memory>


#include <gsl/gsl_multimin.h>


#include <algorithm>

#include <cassert>

#include <cmath>

#include <sstream>


namespace Mantid::CurveFitting {

using Kernel::DblMatrix;

using std::fabs;

using std::max;

using std::min;


namespace {

// Absolute tolerance on function value

double FTOL_ABS = 1e-10;

// Relative tolerance on function value

double FTOL_REL = 1e-10;

// Absolute tolerance on the X values

double XTOL_ABS = 1e-8;

// Relative toleranceon the X values

double XTOL_REL = 1e-8;

// Tolerance on constraint violation

double CONSTRAINT_TOL = 1e-08;

int MAX_SUBOPT_ITER = 100;


struct FunctionData {

  size_t n;                                                  // number of parameters

  const AugmentedLagrangianOptimizer::ObjFunction *userfunc; // user supplied function

  const DblMatrix *eqmatrix;                                 // equality constraints

  const std::vector<double> *lambda;                         // lagrange multiplier for equality

  const DblMatrix *ineqmatrix;                               // inequality constraints

  const std::vector<double> *mu;                             // lagrange multiplier for inequality

  double rho;                                                // scaling parameter

  gsl_vector *tmp;                                           // gsl vector of size n (used for numerical derivative calc

                                                             // to avoid constant reallocation)

};


double evaluateConstraint(const DblMatrix &cmatrix, const size_t index, const size_t /*unused*/, const double *x) {

  assert(index < cmatrix.numRows());

  const double *row = cmatrix[index];


  double res(0.0);

  for (size_t j = 0; j < cmatrix.numCols(); ++j) {

    res += row[j] * x[j];

  }

  return res;

}


int relstop(double vold, double vnew, double reltol, double abstol) {

  if (vold != vold)

    return 0; // nan

  return (fabs(vnew - vold) < abstol || fabs(vnew - vold) < reltol * (fabs(vnew) + fabs(vold)) * 0.5 ||

          (reltol > 0 && vnew == vold)); /* catch vnew == vold == 0 */

}


int relstopX(const std::vector<double> &xvOld, const std::vector<double> &xvNew, double reltol, double abstol) {

  for (size_t i = 0; i < xvOld.size(); ++i) {

    if (!relstop(xvOld[i], xvNew[i], reltol, abstol))

      return 0;

  }

  return 1;

}

int relstopX(const std::vector<double> &xvOld, const gsl_vector *xvNew, double reltol, double abstol) {

  for (size_t i = 0; i < xvOld.size(); ++i) {

    if (std::isnan(gsl_vector_get(xvNew, i)))

      return 1;

    if (!relstop(xvOld[i], gsl_vector_get(xvNew, i), reltol, abstol))

      return 0;

  }

  return 1;

}

} // namespace


//---------------------------------------------------------------------------------------------

// AugmentedLagrangianOptimizer

//---------------------------------------------------------------------------------------------


void AugmentedLagrangianOptimizer::minimize(std::vector<double> &xv) const {

  assert(numParameters() == xv.size());


  double ICM(HUGE_VAL), minf_penalty(HUGE_VAL), rho(0.0);

  double minf(HUGE_VAL), penalty(0.0);

  std::vector<double> xcur(xv), lambda(numEqualityConstraints(), 0), mu(numInequalityConstraints());

  int minfIsFeasible = 0;

  int auglagIters = 0;


  /* magic parameters from Birgin & Martinez */

  const double tau = 0.5, gam = 10;

  const double lam_min = -1e20, lam_max = 1e20, mu_max = 1e20;


  if (numEqualityConstraints() > 0 || numInequalityConstraints() > 0) {

    double con2 = 0;

    double fcur = m_userfunc(numParameters(), xcur.data());

    int feasible = 1;

    for (size_t i = 0; i < numEqualityConstraints(); ++i) {

      double hi = evaluateConstraint(m_eq, i, numParameters(), xcur.data());

      penalty += fabs(hi);

      feasible = (feasible && fabs(hi) <= CONSTRAINT_TOL);

      con2 += hi * hi;

    }

    for (size_t i = 0; i < numInequalityConstraints(); ++i) {

      double fci = evaluateConstraint(m_ineq, i, numParameters(), xcur.data());

      penalty += fci > 0 ? fci : 0;

      feasible = feasible && fci <= CONSTRAINT_TOL;

      if (fci > 0)

        con2 += fci * fci;

    }

    minf = fcur;

    minf_penalty = penalty;

    minfIsFeasible = feasible;

    rho = max(1e-6, min(10.0, 2.0 * fabs(minf) / con2));

  } else {

    rho = 1; /* doesn't matter */

  }


  do {

    double prevICM = ICM;


    unconstrainedOptimization(lambda, mu, rho, xcur);


    double fcur = m_userfunc(numParameters(), xcur.data());

    ICM = 0.0;

    penalty = 0.0;

    int feasible = 1;

    for (size_t i = 0; i < numEqualityConstraints(); ++i) {

      double hi = evaluateConstraint(m_eq, i, numParameters(), xcur.data());

      double newlam = lambda[i] + rho * hi;

      penalty += fabs(hi);

      feasible = feasible && (fabs(hi) <= CONSTRAINT_TOL);

      ICM = max(ICM, fabs(hi));

      lambda[i] = min(max(lam_min, newlam), lam_max);

    }

    for (size_t i = 0; i < numInequalityConstraints(); ++i) {

      double fci = evaluateConstraint(m_ineq, i, numParameters(), xcur.data());

      double newmu = mu[i] + rho * fci;

      penalty += fci > 0 ? fci : 0;

      feasible = feasible && fci <= CONSTRAINT_TOL;

      ICM = max(ICM, fabs(max(fci, -mu[i] / rho)));

      mu[i] = min(max(0.0, newmu), mu_max);

    }


    if (ICM > tau * prevICM) {

      rho *= gam;

    }

    ++auglagIters;


    if ((feasible && (!minfIsFeasible || penalty <= minf_penalty || fcur < minf)) ||

        (!minfIsFeasible && penalty <= minf_penalty)) {

      OptimizerResult ret = Success;

      if (feasible) {

        if (relstop(minf, fcur, FTOL_REL, FTOL_ABS))

          ret = FTolReached;

        else if (relstopX(xv, xcur, XTOL_REL, XTOL_ABS))

          ret = XTolReached;

      }

      minf = fcur;

      minf_penalty = penalty;

      minfIsFeasible = feasible;

      std::copy(xcur.begin(), xcur.end(), xv.begin());

      if (ret != Success)

        break;

    }

    if (ICM == 0.0) {

      break;

    }

  } while (auglagIters < m_maxIter);

}


//--------------------------------------------------------------------------------------------------------

// Private methods

//--------------------------------------------------------------------------------------------------------


namespace {

double costf(const gsl_vector *v, void *params) {

  auto *d = static_cast<FunctionData *>(params);


  double lagrangian = (*d->userfunc)(d->n, v->data);

  for (size_t i = 0; i < d->eqmatrix->numRows(); ++i) {

    double h = evaluateConstraint(*d->eqmatrix, i, d->n, v->data) + ((*d->lambda)[i] / d->rho);

    lagrangian += 0.5 * d->rho * h * h;

  }

  for (size_t i = 0; i < d->ineqmatrix->numRows(); ++i) {

    double fc = evaluateConstraint(*d->ineqmatrix, i, d->n, v->data) + ((*d->mu)[i] / d->rho);

    if (fc > 0.0)

      lagrangian += 0.5 * d->rho * fc * fc;

  }

  return lagrangian;

}


void costdf(const gsl_vector *v, void *params, gsl_vector *df) {

  auto *d = static_cast<FunctionData *>(params);

  double f0 = costf(v, params);

  gsl_vector *tmp = d->tmp;

  std::copy(v->data, v->data + d->n, tmp->data);


  const double epsilon(1e-08);

  for (size_t i = 0; i < d->n; ++i) {

    const double curx = gsl_vector_get(tmp, i);

    gsl_vector_set(tmp, i, curx + epsilon);

    gsl_vector_set(df, i, (costf(tmp, params) - f0) / epsilon);

    gsl_vector_set(tmp, i, curx);

  }

}


void costfdf(const gsl_vector *x, void *params, double *f, gsl_vector *df) {

  *f = costf(x, params);

  costdf(x, params, df);

}

} // namespace


void AugmentedLagrangianOptimizer::unconstrainedOptimization(const std::vector<double> &lambda,

                                                             const std::vector<double> &mu, const double rho,

                                                             std::vector<double> &xcur) const {

  // Data required to calculate function

  FunctionData d;

  d.n = numParameters();

  d.userfunc = &m_userfunc;

  d.eqmatrix = &m_eq;

  d.ineqmatrix = &m_ineq;

  d.lambda = &lambda;

  d.mu = &mu;

  d.rho = rho;


  gsl_vector *x = gsl_vector_alloc(d.n);

  std::copy(xcur.begin(), xcur.end(), x->data);

  gsl_vector *tmp = gsl_vector_alloc(d.n); // Used for numerical derivative calculation

  d.tmp = tmp;


  // Unconstrained const function

  gsl_multimin_function_fdf costFunc;

  costFunc.n = d.n;

  costFunc.f = costf;

  costFunc.df = costdf;

  costFunc.fdf = costfdf;

  costFunc.params = static_cast<void *>(&d);


  // Declare minimizer

  const gsl_multimin_fdfminimizer_type *T = gsl_multimin_fdfminimizer_conjugate_pr;

  gsl_multimin_fdfminimizer *s = gsl_multimin_fdfminimizer_alloc(T, costFunc.n);

  double tol = (xcur[0] > 1e-3 ? 1e-4 : 1e-3); // Adjust the tolerance for the scale of the first param

  gsl_multimin_fdfminimizer_set(s, &costFunc, x, 0.01, tol);


  int iter = 0;

  int status = 0;


  do {

    iter++;

    status = gsl_multimin_fdfminimizer_iterate(s);

    if (status)

      break;

    status = gsl_multimin_test_gradient(s->gradient, 1e-3);


    if (relstopX(xcur, s->x, XTOL_REL, XTOL_ABS))

      break; // If the X's don't change then assume we're done

    std::copy(s->x->data, s->x->data + d.n, xcur.begin());

  } while (status == GSL_CONTINUE && iter < MAX_SUBOPT_ITER);

  // Final parameter update

  std::copy(s->x->data, s->x->data + d.n, xcur.begin());


  gsl_multimin_fdfminimizer_free(s);

  gsl_vector_free(x);

  gsl_vector_free(tmp);

}


void AugmentedLagrangianOptimizer::checkConstraints(const DblMatrix &equality, const DblMatrix &inequality) {

  const size_t totalNumConstr = numEqualityConstraints() + numInequalityConstraints();

  if (totalNumConstr == 0)

    return;


  // Sanity checks on matrix sizes

  for (size_t i = 0; i < 2; ++i) {

    size_t ncols(0);

    std::string matrix;

    if (i == 0) {

      ncols = equality.numCols();

      matrix = "equality";

    } else {

      ncols = inequality.numCols();

      matrix = "inequality";

    }


    if (ncols > 0 && ncols != numParameters()) {

      std::ostringstream os;

      os << "AugmentedLagrangianOptimizer::initializeConstraints - Invalid " << matrix

         << " constraint matrix. Number of columns must match number "

            "of parameters. ncols="

         << ncols << ", nparams=" << numParameters();

      throw std::invalid_argument(os.str());

    }

  }

}


} // namespace Mantid::CurveFitting

ineqmatrix
const DblMatrix * ineqmatrix
Definition: AugmentedLagrangianOptimizer.cpp:46

lambda
const std::vector< double > * lambda
Definition: AugmentedLagrangianOptimizer.cpp:45

n
size_t n
Definition: AugmentedLagrangianOptimizer.cpp:42

rho
double rho
Definition: AugmentedLagrangianOptimizer.cpp:48

tmp
gsl_vector * tmp
Definition: AugmentedLagrangianOptimizer.cpp:49

eqmatrix
const DblMatrix * eqmatrix
Definition: AugmentedLagrangianOptimizer.cpp:44

userfunc
const AugmentedLagrangianOptimizer::ObjFunction * userfunc
Definition: AugmentedLagrangianOptimizer.cpp:43

AugmentedLagrangianOptimizer.h

ncols
size_t ncols
Definition: ComptonScatteringCountRate.cpp:97

Exception.h

index
std::map< DeltaEMode::Type, std::string > index
Definition: DeltaEMode.cpp:19

fabs
#define fabs(x)
Definition: Matrix.cpp:22

Mantid::CurveFitting::AugmentedLagrangianOptimizer::m_eq
Kernel::DblMatrix m_eq
Defines the equality constraints.
Definition: AugmentedLagrangianOptimizer.h:135

Mantid::CurveFitting::AugmentedLagrangianOptimizer::checkConstraints
void checkConstraints(const Kernel::DblMatrix &equality, const Kernel::DblMatrix &inequality)
Sanity check for constraint inputs.
Definition: AugmentedLagrangianOptimizer.cpp:352

Mantid::CurveFitting::AugmentedLagrangianOptimizer::unconstrainedOptimization
void unconstrainedOptimization(const std::vector< double > &lambda, const std::vector< double > &mu, const double rho, std::vector< double > &xcur) const
Using gradient optimizer to perform limited optimization of current set.
Definition: AugmentedLagrangianOptimizer.cpp:290

Mantid::CurveFitting::AugmentedLagrangianOptimizer::m_maxIter
int m_maxIter
Maximum number of iterations.
Definition: AugmentedLagrangianOptimizer.h:141

Mantid::CurveFitting::AugmentedLagrangianOptimizer::numParameters
size_t numParameters() const
Definition: AugmentedLagrangianOptimizer.h:102

Mantid::CurveFitting::AugmentedLagrangianOptimizer::numEqualityConstraints
size_t numEqualityConstraints() const
Definition: AugmentedLagrangianOptimizer.h:104

Mantid::CurveFitting::AugmentedLagrangianOptimizer::ObjFunction
boost::function< double(const size_t, const double *)> ObjFunction
Function type.
Definition: AugmentedLagrangianOptimizer.h:57

Mantid::CurveFitting::AugmentedLagrangianOptimizer::minimize
void minimize(std::vector< double > &xv) const
Perform the minimization.
Definition: AugmentedLagrangianOptimizer.cpp:130

Mantid::CurveFitting::AugmentedLagrangianOptimizer::m_userfunc
ObjFunction m_userfunc
User-defined function.
Definition: AugmentedLagrangianOptimizer.h:129

Mantid::CurveFitting::AugmentedLagrangianOptimizer::m_ineq
Kernel::DblMatrix m_ineq
Defines the inequality constraints.
Definition: AugmentedLagrangianOptimizer.h:139

Mantid::CurveFitting::AugmentedLagrangianOptimizer::numInequalityConstraints
size_t numInequalityConstraints() const
Definition: AugmentedLagrangianOptimizer.h:106

Mantid::Kernel::Matrix< double >

Mantid::Kernel::Matrix::numCols
size_t numCols() const
Return the number of columns in the matrix.
Definition: Matrix.h:147

Mantid::CurveFitting
Definition: IFunction1D.h:19

Mantid::CurveFitting::OptimizerResult
OptimizerResult
The results of the optimization.
Definition: AugmentedLagrangianOptimizer.h:19

Mantid::CurveFitting::FTolReached
@ FTolReached
Definition: AugmentedLagrangianOptimizer.h:19

Mantid::CurveFitting::Success
@ Success
Definition: AugmentedLagrangianOptimizer.h:19

Mantid::CurveFitting::XTolReached
@ XTolReached
Definition: AugmentedLagrangianOptimizer.h:19

Mantid::Geometry::d
I a m d
Definition: SpaceGroupFactory.cpp:674

Mantid::Geometry::x
I a m x
Definition: SpaceGroupFactory.cpp:675

Mantid::Kernel::DblMatrix
Mantid::Kernel::Matrix< double > DblMatrix
Definition: Matrix.h:206

mu
Definition: ConvertAxisByFormula.h:14