nihu/a00671_source.html

#ifndef NIHU_FMM_X2X_PRECOMPUTE_HPP_INCLUDED

#define NIHU_FMM_X2X_PRECOMPUTE_HPP_INCLUDED


#include "cluster_tree.hpp"

#include "fmm_operator.hpp"

#include "lists.hpp"


#include "util/eigen_utils.hpp"


#ifdef NIHU_FMM_PARALLEL

#include <omp.h>

#endif


#include "Eigen/SparseCore"


#include <chrono>

#include <type_traits>

#include <vector>

#include <memory>


namespace NiHu

{

namespace fmm

{


template <class Result, class ClusterDerived, class FmmTag>

class x2x_precompute

    : public fmm_operator<FmmTag>

{

public:

    typedef ClusterDerived cluster_t;

    typedef cluster_tree<cluster_t> cluster_tree_t;

    typedef interaction_lists::list_t list_t;

    typedef Result result_t;


    typedef typename std::conditional<

        is_eigen<result_t>::value, typename eigen_std_vector<Result>::type, std::vector<result_t>

    >::type container_elem_t;


    typedef typename std::conditional<

        is_eigen<result_t>::value, typename eigen_std_vector<container_elem_t>::type, std::vector<container_elem_t>

    >::type container_t;


    typedef unsigned int index_t;

    typedef Eigen::SparseMatrix<index_t> indices_t;


    template <class Operator>

    x2x_precompute(Operator const &op, list_t const &list)

        : m_tree(op.get_tree())

        , m_pindices(new indices_t(m_tree.get_n_clusters(), m_tree.get_n_clusters()))

        , m_pcontainer(new container_t(m_tree.get_n_levels()))

    {

        typedef typename std::decay<Operator>::type operator_t;

        typedef Eigen::Triplet<index_t> triplet_t;

        std::vector<triplet_t> triplets, to_compute;


        std::vector<std::vector<bool> > ready(m_tree.get_n_levels() + 1);


        auto tstart = std::chrono::steady_clock::now();


        for (size_t to = 0; to < list.size(); ++to)

        {

            for (auto from : list[to])

            {

                cluster_t const &cto = m_tree[to];

                cluster_t const &cfrom = m_tree[from];

                size_t level = cto.get_level();

                size_t idx = operator_t::operator_t::unique_idx(cto, cfrom);

                if (idx >=  (*m_pcontainer)[level].size() )

                {

                    (*m_pcontainer)[level].resize(idx + 1);

                    ready[level].resize(idx + 1, false);

                }

                if (!ready[level][idx])

                {

                    to_compute.push_back(triplet_t(int(to), int(from), idx));

                    ready[level][idx] = true;

                }

                triplets.push_back(triplet_t(int(to), int(from), idx));

            }

        }


#ifdef NIHU_FMM_PARALLEL

#pragma omp parallel for schedule(dynamic)

#endif

        for (int i = 0; i < to_compute.size(); ++i)

        {

            size_t to = to_compute[i].row();

            size_t from = to_compute[i].col();

            size_t idx = to_compute[i].value();

            size_t level = m_tree[to].get_level();

            (*m_pcontainer)[level][idx] = op(to, from);

        }

#ifdef NIHU_FMM_PARALLEL

#pragma omp barrier

#endif


        m_pindices->setFromTriplets(triplets.begin(), triplets.end());

        auto tend = std::chrono::steady_clock::now();

        m_assembly_time = std::chrono::duration_cast<std::chrono::microseconds>(tend - tstart).count();

    }


    result_t const &operator()(size_t to, size_t from) const

    {

        size_t level = m_tree[to].get_level();

        size_t idx = m_pindices->coeff(to, from);

        return (*m_pcontainer)[level][idx];

    }


    size_t get_assembly_time() const

    {

        return m_assembly_time;

    }


private:

    cluster_tree_t const &m_tree;

    std::shared_ptr<indices_t> m_pindices;

    std::shared_ptr<container_t> m_pcontainer;

    size_t m_assembly_time;

};


template <class Operator>

auto

create_x2x_precompute(Operator const &op, typename interaction_lists::list_t const &list)

{

    typedef typename std::decay<Operator>::type operator_t;

    return x2x_precompute<

        typename operator_t::result_t,

        typename operator_t::cluster_t,

        typename operator_t::fmm_tag

    >(op, list);

}


} // namespace fmm

} // namespace NiHu


#endif /* NIHU_FMM_X2X_PRECOMPUTE_HPP_INCLUDED */