dft-efe/BlasLapack_8h_source.html

/******************************************************************************

 * Copyright (c) 2021.                                                        *

 * The Regents of the University of Michigan and DFT-EFE developers.          *

 *                                                                            *

 * This file is part of the DFT-EFE code.                                     *

 *                                                                            *

 * DFT-EFE is free software: you can redistribute it and/or modify            *

 *   it under the terms of the Lesser GNU General Public License as           *

 *   published by the Free Software Foundation, either version 3 of           *

 *   the License, or (at your option) any later version.                      *

 *                                                                            *

 * DFT-EFE is distributed in the hope that it will be useful, but             *

 *   WITHOUT ANY WARRANTY; without even the implied warranty                  *

 *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.                     *

 *   See the Lesser GNU General Public License for more details.              *

 *                                                                            *

 * You should have received a copy of the GNU Lesser General Public           *

 *   License at the top level of DFT-EFE distribution.  If not, see           *

 *   <https://www.gnu.org/licenses/>.                                         *

 ******************************************************************************/


/*

 * @author Vishal Subramanian, Avirup Sircar

 */


#ifndef dftefeBlasWrappers_h

#define dftefeBlasWrappers_h


#include <linearAlgebra/LinearAlgebraTypes.h>

#include <linearAlgebra/BlasLapackTypedef.h>

#include <linearAlgebra/LinAlgOpContext.h>

#include <utils/TypeConfig.h>


namespace dftefe

{

  namespace linearAlgebra

  {

    namespace blasLapack

    {

      template <typename ValueType,

                typename dftefe::utils::MemorySpace memorySpace>

      real_type<ValueType>

      asum(size_type                     n,

           ValueType const *             x,

           size_type                     incx,

           LinAlgOpContext<memorySpace> &context);


      template <typename ValueType,

                typename dftefe::utils::MemorySpace memorySpace>

      real_type<ValueType>

      amax(size_type                     n,

           ValueType const *             x,

           size_type                     incx,

           LinAlgOpContext<memorySpace> &context);


      template <typename ValueType,

                typename dftefe::utils::MemorySpace memorySpace>

      std::vector<double>

      amaxsMultiVector(size_type                     vecSize,

                       size_type                     numVec,

                       ValueType const *             multiVecData,

                       LinAlgOpContext<memorySpace> &context);


      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      void

      axpy(size_type                           n,

           scalar_type<ValueType1, ValueType2> alpha,

           ValueType1 const *                  x,

           size_type                           incx,

           ValueType2 *                        y,

           size_type                           incy,

           LinAlgOpContext<memorySpace> &      context);


      // i have neglected incx & incy parameters

      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      void

      reciprocalX(size_type                            n,

                  const ValueType1                     alpha,

                  ValueType2 const *                   x,

                  scalar_type<ValueType1, ValueType2> *y,

                  LinAlgOpContext<memorySpace> &       context);


      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      void

      ascale(size_type                            n,

             ValueType1                           alpha,

             const ValueType2 *                   x,

             scalar_type<ValueType1, ValueType2> *z,

             LinAlgOpContext<memorySpace> &       context);


      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      void

      hadamardProduct(size_type                            n,

                      const ValueType1 *                   x,

                      const ValueType2 *                   y,

                      scalar_type<ValueType1, ValueType2> *z,

                      LinAlgOpContext<memorySpace> &       context);


      //    /*

      //     * @brief Template for performing \f$ blockedOutput_ij = blockedInput_ij * singleVectorInput_i$

      //     * @param[in] size size of the blocked Input array

      //     * @param[in] numComponets no of componets

      //     * @param[in] blockedInput blocked array

      //     * @param[in] singleVectorInput array

      //     * @param[out] blockedOutput blocked array

      //     */

      //  template <typename ValueType1,

      //            typename ValueType2,

      //            typename dftefe::utils::MemorySpace memorySpace>

      //    void

      //    blockedHadamardProduct(const size_type                     n,

      //                    const size_type                      blockSize,

      //                    const ValueType1 *                   blockedInput,

      //                    const ValueType2 * singleVectorInput,

      //                    scalar_type<ValueType1, ValueType2> *blockedOutput,

      //                    LinAlgOpContext<memorySpace> &       context);


      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      void

      hadamardProduct(size_type                            n,

                      const ValueType1 *                   x,

                      const ValueType2 *                   y,

                      const ScalarOp &                     opx,

                      const ScalarOp &                     opy,

                      scalar_type<ValueType1, ValueType2> *z,

                      LinAlgOpContext<memorySpace> &       context);


      template <typename ValueType1,

                typename ValueType2,

                dftefe::utils::MemorySpace memorySpace>

      void

      scaleStridedVarBatched(const size_type                      numMats,

                             const Layout                         layout,

                             const ScalarOp &                     scalarOpA,

                             const ScalarOp &                     scalarOpB,

                             const size_type *                    stridea,

                             const size_type *                    strideb,

                             const size_type *                    stridec,

                             const size_type *                    m,

                             const size_type *                    n,

                             const size_type *                    k,

                             const ValueType1 *                   dA,

                             const ValueType2 *                   dB,

                             scalar_type<ValueType1, ValueType2> *dC,

                             LinAlgOpContext<memorySpace> &       context);


      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      void

      khatriRaoProduct(const Layout                         layout,

                       size_type                            sizeI,

                       size_type                            sizeJ,

                       size_type                            sizeK,

                       const ValueType1 *                   A,

                       const ValueType2 *                   B,

                       scalar_type<ValueType1, ValueType2> *Z,

                       LinAlgOpContext<memorySpace> &       context);


      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      void

      transposedKhatriRaoProduct(const Layout                         layout,

                                 size_type                            sizeI,

                                 size_type                            sizeJ,

                                 size_type                            sizeK,

                                 const ValueType1 *                   A,

                                 const ValueType2 *                   B,

                                 scalar_type<ValueType1, ValueType2> *Z,

                                 LinAlgOpContext<memorySpace> &       context);


      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      void

      axpby(size_type                            n,

            scalar_type<ValueType1, ValueType2>  alpha,

            ValueType1 const *                   x,

            scalar_type<ValueType1, ValueType2>  beta,

            const ValueType2 *                   y,

            scalar_type<ValueType1, ValueType2> *z,

            LinAlgOpContext<memorySpace> &       context);


      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      void

      axpbyBlocked(const size_type                            n,

                   const size_type                            blockSize,

                   const scalar_type<ValueType1, ValueType2>  alpha1,

                   const scalar_type<ValueType1, ValueType2> *alpha,

                   const ValueType1 *                         x,

                   const scalar_type<ValueType1, ValueType2>  beta1,

                   const scalar_type<ValueType1, ValueType2> *beta,

                   const ValueType2 *                         y,

                   scalar_type<ValueType1, ValueType2> *      z,

                   LinAlgOpContext<memorySpace> &             context);


      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      scalar_type<ValueType1, ValueType2>

      dot(size_type                     n,

          ValueType1 const *            x,

          size_type                     incx,

          ValueType2 const *            y,

          size_type                     incy,

          LinAlgOpContext<memorySpace> &context);


      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      void

      dotMultiVector(size_type                            vecSize,

                     size_type                            numVec,

                     const ValueType1 *                   multiVecDataX,

                     const ValueType2 *                   multiVecDataY,

                     const ScalarOp &                     opX,

                     const ScalarOp &                     opY,

                     scalar_type<ValueType1, ValueType2> *multiVecDotProduct,

                     LinAlgOpContext<memorySpace> &       context);


      template <typename ValueType,

                typename dftefe::utils::MemorySpace memorySpace>

      real_type<ValueType>

      nrm2(size_type                     n,

           ValueType const *             x,

           size_type                     incx,

           LinAlgOpContext<memorySpace> &context);


      template <typename ValueType,

                typename dftefe::utils::MemorySpace memorySpace>

      std::vector<double>

      nrms2MultiVector(size_type                     vecSize,

                       size_type                     numVec,

                       ValueType const *             multiVecData,

                       LinAlgOpContext<memorySpace> &context);


      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      void

      gemm(Layout                               layout,

           Op                                   transA,

           Op                                   transB,

           size_type                            m,

           size_type                            n,

           size_type                            k,

           scalar_type<ValueType1, ValueType2>  alpha,

           ValueType1 const *                   dA,

           size_type                            ldda,

           ValueType2 const *                   dB,

           size_type                            lddb,

           scalar_type<ValueType1, ValueType2>  beta,

           scalar_type<ValueType1, ValueType2> *dC,

           size_type                            lddc,

           LinAlgOpContext<memorySpace> &       context);


      template <typename ValueType1,

                typename ValueType2,

                typename dftefe::utils::MemorySpace memorySpace>

      void

      gemmStridedVarBatched(Layout                               layout,

                            size_type                            numMats,

                            const Op *                           transA,

                            const Op *                           transB,

                            const size_type *                    stridea,

                            const size_type *                    strideb,

                            const size_type *                    stridec,

                            const size_type *                    m,

                            const size_type *                    n,

                            const size_type *                    k,

                            scalar_type<ValueType1, ValueType2>  alpha,

                            const ValueType1 *                   dA,

                            const size_type *                    ldda,

                            const ValueType2 *                   dB,

                            const size_type *                    lddb,

                            scalar_type<ValueType1, ValueType2>  beta,

                            scalar_type<ValueType1, ValueType2> *dC,

                            const size_type *                    lddc,

                            LinAlgOpContext<memorySpace> &       context);


      template <typename ValueType,

                typename dftefe::utils::MemorySpace memorySpace>

      LapackError

      inverse(size_type n, ValueType *A, LinAlgOpContext<memorySpace> &context);


      template <typename ValueType,

                typename dftefe::utils::MemorySpace memorySpace>

      LapackError

      trtri(Uplo                          uplo,

            Diag                          diag,

            size_type                     n,

            ValueType *                   A,

            size_type                     lda,

            LinAlgOpContext<memorySpace> &context);


      template <typename ValueType,

                typename dftefe::utils::MemorySpace memorySpace>

      LapackError

      potrf(Uplo                          uplo,

            size_type                     n,

            ValueType *                   A,

            size_type                     lda,

            LinAlgOpContext<memorySpace> &context);


      template <typename ValueType,

                typename dftefe::utils::MemorySpace memorySpace>

      LapackError

      steqr(Job                           jobz,

            size_type                     n,

            real_type<ValueType> *        D,

            real_type<ValueType> *        E,

            ValueType *                   Z,

            size_type                     ldz,

            LinAlgOpContext<memorySpace> &context);


      template <typename ValueType,

                typename dftefe::utils::MemorySpace memorySpace>

      LapackError

      heevd(Job                           jobz,

            Uplo                          uplo,

            size_type                     n,

            ValueType *                   A,

            size_type                     lda,

            real_type<ValueType> *        W,

            LinAlgOpContext<memorySpace> &context);


      template <typename ValueType,

                typename dftefe::utils::MemorySpace memorySpace>

      LapackError

      hegv(size_type                     itype,

           Job                           jobz,

           Uplo                          uplo,

           size_type                     n,

           ValueType *                   A,

           size_type                     lda,

           ValueType *                   B,

           size_type                     ldb,

           real_type<ValueType> *        W,

           LinAlgOpContext<memorySpace> &context);


      template <typename ValueType,

                typename dftefe::utils::MemorySpace memorySpace>

      LapackError

      gesv(size_type                     n,

           size_type                     nrhs,

           ValueType *                   A,

           size_type                     lda,

           LapackInt *                   ipiv,

           ValueType *                   B,

           size_type                     ldb,

           LinAlgOpContext<memorySpace> &context);


    } // namespace blasLapack

  }   // namespace linearAlgebra

} // namespace dftefe


#include "BlasLapack.t.cpp"

#endif // dftefeBlasWrappers_h

BlasLapackTypedef.h

BlasLapack.t.cpp

LinAlgOpContext.h

LinearAlgebraTypes.h

TypeConfig.h

dftefe::linearAlgebra::LinAlgOpContext
Definition: LinAlgOpContext.h:38

dftefe::linearAlgebra::blasLapack::transposedKhatriRaoProduct
void transposedKhatriRaoProduct(const Layout layout, const size_type sizeI, const size_type sizeJ, const size_type sizeK, const ValueType1 *A, const ValueType2 *B, scalar_type< ValueType1, ValueType2 > *Z, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:215

dftefe::linearAlgebra::blasLapack::amax
real_type< ValueType > amax(size_type n, ValueType const *x, size_type incx, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:31

dftefe::linearAlgebra::blasLapack::Diag
blas::Diag Diag
Definition: BlasLapackTypedef.h:44

dftefe::linearAlgebra::blasLapack::gemmStridedVarBatched
void gemmStridedVarBatched(const Layout layout, const size_type numMats, const Op *transA, const Op *transB, const size_type *stridea, const size_type *strideb, const size_type *stridec, const size_type *m, const size_type *n, const size_type *k, const scalar_type< ValueType1, ValueType2 > alpha, const ValueType1 *dA, const size_type *ldda, const ValueType2 *dB, const size_type *lddb, const scalar_type< ValueType1, ValueType2 > beta, scalar_type< ValueType1, ValueType2 > *dC, const size_type *lddc, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:415

dftefe::linearAlgebra::blasLapack::dotMultiVector
void dotMultiVector(const size_type vecSize, const size_type numVec, const ValueType1 *multiVecDataX, const ValueType2 *multiVecDataY, const ScalarOp &opX, const ScalarOp &opY, scalar_type< ValueType1, ValueType2 > *multiVecDotProduct, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:289

dftefe::linearAlgebra::blasLapack::gesv
LapackError gesv(size_type n, size_type nrhs, ValueType *A, size_type lda, LapackInt *ipiv, ValueType *B, size_type ldb, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:684

dftefe::linearAlgebra::blasLapack::hadamardProduct
void hadamardProduct(size_type n, const ValueType1 *x, const ValueType2 *y, scalar_type< ValueType1, ValueType2 > *z, LinAlgOpContext< memorySpace > &context)
Template for performing  alpha  z_i = x_i * y_i$.
Definition: BlasLapack.t.cpp:113

dftefe::linearAlgebra::blasLapack::axpy
void axpy(size_type n, scalar_type< ValueType1, ValueType2 > alpha, ValueType1 const *x, size_type incx, ValueType2 *y, size_type incy, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:65

dftefe::linearAlgebra::blasLapack::Uplo
blas::Uplo Uplo
Definition: BlasLapackTypedef.h:45

dftefe::linearAlgebra::blasLapack::Layout
blas::Layout Layout
Definition: BlasLapackTypedef.h:46

dftefe::linearAlgebra::blasLapack::amaxsMultiVector
std::vector< double > amaxsMultiVector(size_type vecSize, size_type numVec, ValueType const *multiVecData, LinAlgOpContext< memorySpace > &context)
Template for computing  norms of all the numVec vectors in a multi Vector.
Definition: BlasLapack.t.cpp:47

dftefe::linearAlgebra::blasLapack::khatriRaoProduct
void khatriRaoProduct(const Layout layout, const size_type sizeI, const size_type sizeJ, const size_type sizeK, const ValueType1 *A, const ValueType2 *B, scalar_type< ValueType1, ValueType2 > *Z, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:198

dftefe::linearAlgebra::blasLapack::Op
blas::Op Op
Definition: BlasLapackTypedef.h:43

dftefe::linearAlgebra::blasLapack::steqr
LapackError steqr(Job jobz, size_type n, real_type< ValueType > *D, real_type< ValueType > *E, ValueType *Z, size_type ldz, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:597

dftefe::linearAlgebra::blasLapack::LapackInt
int64_t LapackInt
Definition: BlasLapackTypedef.h:53

dftefe::linearAlgebra::blasLapack::nrm2
real_type< ValueType > nrm2(const size_type n, ValueType const *x, const size_type incx, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:312

dftefe::linearAlgebra::blasLapack::potrf
LapackError potrf(Uplo uplo, size_type n, ValueType *A, size_type lda, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:571

dftefe::linearAlgebra::blasLapack::scalar_type
blas::scalar_type< ValueType1, ValueType2 > scalar_type
Definition: BlasLapackTypedef.h:70

dftefe::linearAlgebra::blasLapack::nrms2MultiVector
std::vector< double > nrms2MultiVector(const size_type vecSize, const size_type numVec, const ValueType *multiVecData, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:328

dftefe::linearAlgebra::blasLapack::hegv
LapackError hegv(size_type itype, Job jobz, Uplo uplo, size_type n, ValueType *A, size_type lda, ValueType *B, size_type ldb, real_type< ValueType > *W, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:653

dftefe::linearAlgebra::blasLapack::asum
real_type< ValueType > asum(size_type n, ValueType const *x, size_type incx, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:15

dftefe::linearAlgebra::blasLapack::real_type
blas::real_type< ValueType > real_type
Definition: BlasLapackTypedef.h:64

dftefe::linearAlgebra::blasLapack::axpby
void axpby(const size_type n, const scalar_type< ValueType1, ValueType2 > alpha, const ValueType1 *x, const scalar_type< ValueType1, ValueType2 > beta, const ValueType2 *y, scalar_type< ValueType1, ValueType2 > *z, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:233

dftefe::linearAlgebra::blasLapack::gemm
void gemm(const Layout layout, const Op transA, const Op transB, const size_type m, const size_type n, const size_type k, const scalar_type< ValueType1, ValueType2 > alpha, ValueType1 const *dA, const size_type ldda, ValueType2 const *dB, const size_type lddb, const scalar_type< ValueType1, ValueType2 > beta, scalar_type< ValueType1, ValueType2 > *dC, const size_type lddc, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:342

dftefe::linearAlgebra::blasLapack::dot
scalar_type< ValueType1, ValueType2 > dot(const size_type n, ValueType1 const *x, const size_type incx, ValueType2 const *y, const size_type incy, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:269

dftefe::linearAlgebra::blasLapack::scaleStridedVarBatched
void scaleStridedVarBatched(const size_type numMats, const Layout layout, const ScalarOp &scalarOpA, const ScalarOp &scalarOpB, const size_type *stridea, const size_type *strideb, const size_type *stridec, const size_type *m, const size_type *n, const size_type *k, const ValueType1 *dA, const ValueType2 *dB, scalar_type< ValueType1, ValueType2 > *dC, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:162

dftefe::linearAlgebra::blasLapack::trtri
LapackError trtri(Uplo uplo, Diag diag, size_type n, ValueType *A, size_type lda, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:544

dftefe::linearAlgebra::blasLapack::reciprocalX
void reciprocalX(size_type n, const ValueType1 alpha, ValueType2 const *x, scalar_type< ValueType1, ValueType2 > *y, LinAlgOpContext< memorySpace > &context)
Template for computing the multiplicative inverse of all the elements of x, does not check if any ele...
Definition: BlasLapack.t.cpp:83

dftefe::linearAlgebra::blasLapack::ScalarOp
ScalarOp
Definition: BlasLapackTypedef.h:56

dftefe::linearAlgebra::blasLapack::heevd
LapackError heevd(Job jobz, Uplo uplo, size_type n, ValueType *A, size_type lda, real_type< ValueType > *W, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:625

dftefe::linearAlgebra::blasLapack::axpbyBlocked
void axpbyBlocked(const size_type n, const size_type blockSize, const scalar_type< ValueType1, ValueType2 > alpha1, const scalar_type< ValueType1, ValueType2 > *alpha, const ValueType1 *x, const scalar_type< ValueType1, ValueType2 > beta1, const scalar_type< ValueType1, ValueType2 > *beta, const ValueType2 *y, scalar_type< ValueType1, ValueType2 > *z, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:249

dftefe::linearAlgebra::blasLapack::Job
lapack::Job Job
Definition: BlasLapackTypedef.h:49

dftefe::linearAlgebra::blasLapack::inverse
LapackError inverse(size_type n, ValueType *A, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:518

dftefe::linearAlgebra::blasLapack::ascale
void ascale(const size_type n, const ValueType1 alpha, const ValueType2 *x, scalar_type< ValueType1, ValueType2 > *z, LinAlgOpContext< memorySpace > &context)
Definition: BlasLapack.t.cpp:97

dftefe::utils::MemorySpace
MemorySpace
Definition: MemorySpaceType.h:37

dftefe
dealii includes
Definition: AtomFieldDataSpherical.cpp:31

dftefe::size_type
unsigned int size_type
Definition: TypeConfig.h:8

dftefe::linearAlgebra::LapackError
Definition: LinearAlgebraTypes.h:113