Tifa's CP Library

test/cpv/library-checker-convolution/convolution_mod_2_64.cpp

View this file on GitHub
Last update: 2026-05-21 12:41:07+08:00
Problem: https://judge.yosupo.jp/problem/convolution_mod_2_64

Depends on

Code

// competitive-verifier: PROBLEM https://judge.yosupo.jp/problem/convolution_mod_2_64
#include "../../../src/conv/add/u64/lib.hpp"
#include "../../../src/io/container/lib.hpp"
#include "../../../src/io/fastin/lib.hpp"
#include "../../../src/io/fastout/lib.hpp"

using namespace tifa_libs;
int main() {
  u32 n, m;
  fin_uint >> n >> m;
  vecuu a(n), b(m);
  fin_uint >> a >> b;
  fout << conv_u64(a, b) << '\n';
  return 0;
}

#line 1 "test/cpv/library-checker-convolution/convolution_mod_2_64.cpp"
// competitive-verifier: PROBLEM https://judge.yosupo.jp/problem/convolution_mod_2_64
#line 2 "src/conv/add/u64/lib.hpp"

#line 2 "src/conv/trans/fft_r3/lib.hpp"

#line 2 "src/math/ds/eint/lib.hpp"

#line 2 "src/util/traits/others/lib.hpp"
// clang-format off
#line 2 "src/util/alias/others/lib.hpp"

#line 2 "src/util/consts/lib.hpp"

#line 2 "src/util/alias/num/lib.hpp"

#line 2 "src/util/util/lib.hpp"
// https://github.com/Tiphereth-A/CP-lib
#include <bits/extc++.h>
// clang-format off
namespace tifa_libs {

#define CEXP constexpr
#define CEXPE constexpr explicit
#define CR const&
#define CP const*
#define PC *const
#define CPC const*const
#define TPN typename
#define NE noexcept
#define CNE const noexcept
#define ND [[nodiscard]]
#define cT_(...) std::conditional_t<sizeof(__VA_ARGS__) <= sizeof(size_t) * 2, __VA_ARGS__, __VA_ARGS__ CR>
// NOLINTNEXTLINE(misc-const-correctness)
#define flt_(T, i, l, r, ...) for (T i = (l), i##e = (r)__VA_OPT__(, ) __VA_ARGS__; i < i##e; ++i)
#define retif_(cond, if_true, ...) if cond return if_true __VA_OPT__(; else return __VA_ARGS__)
#ifdef ONLINE_JUDGE
#undef assert
#define assert(x) 42
#endif

using namespace std::ranges;
using namespace std::literals;

template <class T>
CEXP T abs(T x) NE { retif_((x < 0), -x, x); }

}  // namespace tifa_libs
// clang-format on
#line 4 "src/util/alias/num/lib.hpp"
// clang-format off
namespace tifa_libs {

#define mk0_(w, t) using w = t; using c##w = const t
#define mk_(w, t) mk0_(w, t); CEXP w operator""_##w(unsigned long long x) NE { return (w)x; }
mk_(i8, int8_t) mk_(u8, uint8_t) mk_(i16, int16_t) mk_(u16, uint16_t) mk_(i32, int32_t) mk_(u32, uint32_t) mk_(i64, int64_t) mk_(u64, uint64_t) mk_(isz, ssize_t) mk_(usz, size_t) mk_(chr, char) mk_(schr, signed char) mk_(uchr, unsigned char) mk_(sint, signed) mk_(uint, unsigned);
mk0_(i128, __int128_t); mk0_(u128, __uint128_t); mk0_(f32, float); mk0_(f64, double); mk0_(f128, long double);
#undef mk0_
#undef mk_

}  // namespace tifa_libs
// clang-format on
#line 4 "src/util/consts/lib.hpp"
// clang-format off
namespace tifa_libs {
using std::numbers::pi_v;
template <std::floating_point FP>
inline FP eps_v = std::sqrt(std::numeric_limits<FP>::epsilon());
template <std::floating_point FP>
CEXP void set_eps(FP v) NE { eps_v<FP> = v; }
CEXP u32 TIME = ((__TIME__[0] & 15) << 20) | ((__TIME__[1] & 15) << 16) | ((__TIME__[3] & 15) << 12) | ((__TIME__[4] & 15) << 8) | ((__TIME__[6] & 15) << 4) | (__TIME__[7] & 15);
CEXP auto STR2U16 = [] { std::array<u32, 65536> table{}; table.fill(-1_u32); flt_ (u32, i, 48, 58) flt_ (u32, j, 48, 58) table[i << 8 | j] = (j & 15) * 10 + (i & 15); return table; }();

inline const auto fn_0 = [](auto&&...) NE {};
inline const auto fn_is0 = [](auto x) NE { return x == 0; };
}  // namespace tifa_libs
// clang-format on
#line 4 "src/util/alias/others/lib.hpp"

namespace tifa_libs {

template <class T>
struct chash {
  CEXP static u64 C = u64(pi_v<f128> * 2e18) | 71;
  CEXP u64 operator()(T x) CNE { return __builtin_bswap64(((u64)x ^ TIME) * C); }
};
// clang-format off
#define mk_(w, t) using w = t; using c##w = const t;
mk_(strn, std::string) mk_(strnv, std::string_view)
#undef mk_
template <class T> struct edge_t { T w; u32 u, v; CEXP auto operator<=>(edge_t CR) const = default; }; template <class T> using cedge_t = const edge_t<T>;
template <class T> struct pt3 { T _0, _1, _2; CEXP auto operator<=>(pt3 CR) const = default; }; template <class T> using cpt3 = const pt3<T>;
template <class T> struct pt4 { T _0, _1, _2, _3; CEXP auto operator<=>(pt4 CR) const = default; }; template <class T> using cpt4 = const pt4<T>;
#define mkT_(w, t, ...) template <class T> using w = t __VA_OPT__(, ) __VA_ARGS__; template <class T> using c##w = const t __VA_OPT__(, ) __VA_ARGS__;
mkT_(ptt, std::pair<T, T>) mkT_(alc, std::pmr::polymorphic_allocator<T>) mkT_(vec, std::vector<T>) mkT_(vvec, vec<vec<T>>) mkT_(v3ec, vvec<vec<T>>) mkT_(vecpt, vec<ptt<T>>) mkT_(vvecpt, vvec<ptt<T>>) mkT_(ptvec, ptt<vec<T>>) mkT_(ptvvec, ptt<vvec<T>>)
#undef mkT_
template <class T> using itl = std ::initializer_list<T>;
template <class T, usz ext = std::dynamic_extent> using spn = std::span<T const, ext>;
template <class T, usz N> using arr = std::array<T, N>; template <class T, usz N> using carr = std::array<const T, N>;
template <class U, class T> using vecp = vec<std::pair<U, T>>; template <class U, class T> using vvecp = vvec<std::pair<U, T>>;
template <class U, class T> using vvecp = vvec<std::pair<U, T>>; template <class U, class T> using vvvecp = vvec<vvec<std::pair<U, T>>>;
#ifdef PB_DS_ASSOC_CNTNR_HPP
template <class T, class C = std::less<T>> using set = __gnu_pbds::tree<T, __gnu_pbds::null_type, C>;
template <class K, class V, class C = std::less<K>> using map = __gnu_pbds::tree<K, V, C>;
// hset<u64> s({}, {}, {}, {}, {1<<16});
template <class T, class HF = chash<T>> using hset = __gnu_pbds::gp_hash_table<T, __gnu_pbds::null_type, HF>;
// hmap<u64, int> s({}, {}, {}, {}, {1<<16});
template <class K, class V, class HF = chash<K>> using hmap = __gnu_pbds::gp_hash_table<K, V, HF>;
#else
using std::set, std::map;
template <class T, class HF = chash<T>> using hset = std::unordered_set<T, HF>;
template <class K, class V, class HF = chash<K>> using hmap = std::unordered_map<K, V, HF>;
#endif
#ifdef PB_DS_PRIORITY_QUEUE_HPP
template <class T, class C = std::less<T>> using pq = __gnu_pbds::priority_queue<T, C>;
#else
template <class T, class C = std::less<T>> using pq = std::priority_queue<T, vec<T>, C>;
#endif
template <class T> using pqg = pq<T, std::greater<T>>;
// clang-format on
#define mk1_(V, A, T) using V##A = V<T>;
#define mk_(V, A, T) mk1_(V, A, T) mk1_(c##V, A, T)
#define mk(A, T) mk_(edge_t, A, T) mk_(ptt, A, T) mk_(pt3, A, T) mk_(pt4, A, T) mk_(vec, A, T) mk_(vvec, A, T) mk_(v3ec, A, T) mk_(vecpt, A, T) mk_(vvecpt, A, T) mk_(ptvec, A, T) mk_(ptvvec, A, T) mk1_(spn, A, T) mk1_(itl, A, T)
mk(b, bool) mk(c, chr) mk(i, i32) mk(u, u32) mk(ii, i64) mk(uu, u64) mk(t, isz) mk(z, usz) mk(f, f32) mk(d, f64) mk(s, strn);
#undef mk
#undef mk_
#undef mk1_

}  // namespace tifa_libs
#line 4 "src/util/traits/others/lib.hpp"

namespace tifa_libs {

//! only for template without non-type argument
template <class, template <class...> class> CEXP bool specialized_from_v = false;
template <template <class...> class T, class... Args> CEXP bool specialized_from_v<T<Args...>, T> = true;
static_assert(specialized_from_v<vecu, std::vector>);
template <class T> concept container_c = common_range<T> && !std::is_array_v<std::remove_cvref_t<T>> && !std::same_as<std::remove_cvref_t<T>, strn> && !std::same_as<std::remove_cvref_t<T>, strnv>;
template <class T> concept istream_c = std::derived_from<T, std::istream> || std::derived_from<T, std::wistream> || requires(T is) { is.peek(); };
template <class T> concept ostream_c = std::derived_from<T, std::ostream> || std::derived_from<T, std::wostream> || requires(T os) { os.flush(); };

}  // namespace tifa_libs
// clang-format on
#line 4 "src/math/ds/eint/lib.hpp"

namespace tifa_libs {

template <class T>
class eint {
  T r_, i_;

 public:
  // $\omega$, $\omega^2$
  // $1+\omega+\omega^2=0$
  const static inline eint<T> w{0, 1}, w2{-T(1), -T(1)};

  CEXP eint(cT_(T) real = T{}, cT_(T) imag = T{}) NE : r_(real), i_(imag) {}

  CEXP T CR real() CNE { return r_; }
  CEXP T CR imag() CNE { return i_; }
  CEXP T norm() CNE { return r_ * (r_ - i_) + i_ * i_; }
  CEXP T& real() NE { return r_; }
  CEXP T& imag() NE { return i_; }
  CEXP void real(cT_(T) x) NE { r_ = x; }
  CEXP void imag(cT_(T) x) NE { i_ = x; }
  CEXP eint& operator+=(cT_(T) x) NE {
    r_ += x;
    return *this;
  }
  CEXP eint& operator-=(cT_(T) x) NE {
    r_ -= x;
    return *this;
  }
  CEXP eint& operator*=(cT_(T) x) NE {
    r_ *= x, i_ *= x;
    return *this;
  }
  CEXP eint& operator+=(eint CR x) NE {
    r_ += x.real(), i_ += x.imag();
    return *this;
  }
  CEXP eint& operator-=(eint CR x) NE {
    r_ -= x.real(), i_ -= x.imag();
    return *this;
  }
  CEXP eint& operator*=(eint CR x) NE {
    T _ = r_;
    r_ = r_ * x.real() - i_ * x.imag(), i_ = i_ * x.real() + _ * x.imag() - i_ * x.imag();
    return *this;
  }
  friend CEXP eint operator+(eint x, cT_(T) y) NE { return x += y; }
  friend CEXP eint operator-(eint x, cT_(T) y) NE { return x -= y; }
  friend CEXP eint operator*(eint x, cT_(T) y) NE { return x *= y; }
  friend CEXP eint operator+(eint x, eint CR y) NE { return x += y; }
  friend CEXP eint operator-(eint x, eint CR y) NE { return x -= y; }
  friend CEXP eint operator*(eint x, eint CR y) NE { return x *= y; }
  CEXP eint operator+() CNE { return *this; }
  CEXP eint operator-() CNE { return eint(-r_, -i_); }
  friend CEXP T norm(eint CR x) NE { return x.norm(); }
  friend CEXP eint conj(eint CR x) NE { return eint{x.r_ - x.i_, -x.i_}; }
  friend CEXP bool operator==(eint CR x, eint CR y) NE { return x.real() == y.real() && x.imag() == y.imag(); }
  friend auto& operator>>(istream_c auto& is, eint& x) NE { return is >> x.r_ >> x.i_; }
  friend auto& operator<<(ostream_c auto& os, eint CR x) NE { return os << x.real() << ' ' << x.imag(); }
};

}  // namespace tifa_libs
#line 4 "src/conv/trans/fft_r3/lib.hpp"

namespace tifa_libs {

template <class T>
class fft_r3 {
  using EI = eint<T>;
  u32 s = 1;
  vec<EI> tmp;

 public:
  using data_t = eint<T>;

  ND CEXP u32 size() CNE { return s; }
  CEXP void bzr(u32 len) NE {
    for (; 2 * s < len; s *= 3);
    tmp.resize(s * 3);
  }

  // Calculate the product of polynomial {@code f} and $x^t$ in $T[x]/(x^m - \omega)$
  // result is in {@code to}
  CEXP void twiddle(data_t* p, u32 m, u32 t, data_t* to) CNE {
    assert(t <= 3 * m);
    if (!t || t == 3 * m) {
      copy_n(p, m, to);
      return;
    }
    u32 n;
    data_t _0, _1;
    if (t < m) n = t, _0 = 1, _1 = EI::w;
    else if (t < 2 * m) n = t - m, _0 = EI::w, _1 = EI::w2;
    else n = t - 2 * m, _0 = EI::w2, _1 = 1;
    flt_ (u32, j, 0, n) to[j] = p[m - n + j] * _1;
    flt_ (u32, j, n, m) to[j] = p[j - n] * _0;
  }
  // @param p A polynomial from $(T[x]/(x^m - \omega))[y]/(y^r - 1)$
  // result: Fourier transform (w.r.t. y) in 3-reversed order, inplace.
  CEXP void dif(data_t* p, u32 m, u32 r) NE {
    for (u32 rr = r / 3; rr >= 1; rr /= 3)
      for (u32 k = 0; k < r; k += rr * 3)
        flt_ (u32, i, k, k + rr) {
          flt_ (u32, j, 0, m) {
            tmp[j] = p[i * m + j] + p[(i + rr) * m + j] + p[(i + 2 * rr) * m + j];
            tmp[m + j] = p[i * m + j] + EI::w * p[(i + rr) * m + j] + EI::w2 * p[(i + 2 * rr) * m + j];
            tmp[2 * m + j] = p[i * m + j] + EI::w2 * p[(i + rr) * m + j] + EI::w * p[(i + 2 * rr) * m + j];
            p[i * m + j] = tmp[j];
          }
          twiddle(tmp.data() + m, m, 3 * (i - k) * m / (rr * 3), p + m * rr + i * m);
          twiddle(tmp.data() + 2 * m, m, 6 * (i - k) * m / (rr * 3), p + 2 * m * rr + i * m);
        }
  }
  // @param p A polynomial in $(T[x]/(x^m - \omega))[y]/(y^r - 1)$ with coefficients in 3-reversed order.
  // result: inverse Fourier transform in normal order, inplace.
  CEXP void dit(data_t* p, u32 m, u32 r) NE {
    for (u32 rr = 1; rr < r; rr *= 3)
      for (u32 k = 0; k < r; k += rr * 3)
        flt_ (u32, i, k, k + rr) {
          twiddle(p + m * rr + i * m, m, 3 * m - 3 * (i - k) * m / (rr * 3), tmp.data() + m);
          twiddle(p + 2 * m * rr + i * m, m, 3 * m - 6 * (i - k) * m / (rr * 3), tmp.data() + 2 * m);
          flt_ (u32, j, 0, m) {
            tmp[j] = p[i * m + j];
            p[i * m + j] = tmp[j] + tmp[m + j] + tmp[2 * m + j];
            p[(i + rr) * m + j] = tmp[j] + EI::w2 * tmp[m + j] + EI::w * tmp[2 * m + j];
            p[(i + 2 * rr) * m + j] = tmp[j] + EI::w * tmp[m + j] + EI::w2 * tmp[2 * m + j];
          }
        }
  }
};

}  // namespace tifa_libs
#line 2 "src/conv/add/naive/lib.hpp"

#line 4 "src/conv/add/naive/lib.hpp"

namespace tifa_libs {

CEXP inline u32 CONV_NAIVE_THRESHOLD = 16;
template <class U, class T = U>
requires(sizeof(U) <= sizeof(T))
CEXP vec<T> conv_naive(vec<U> CR l, vec<U> CR r, u32 ans_size = 0) NE {
  retif_((l.empty() || r.empty()) [[unlikely]], {});
  if (!ans_size) ans_size = u32(l.size() + r.size() - 1);
  vec<T> ans(ans_size);
  u32 n = (u32)l.size(), m = (u32)r.size();
  auto &&l_ = n < m ? r : l, &&r_ = n < m ? l : r;
  if (n < m) swap(n, m);
  flt_ (u32, i, 0, n)
    flt_ (u32, j, 0, min(m, ans_size - i)) ans[i + j] += (T)l_[i] * (T)r_[j];
  return ans;
}

}  // namespace tifa_libs
#line 5 "src/conv/add/u64/lib.hpp"

namespace tifa_libs {

template <class T>
vecuu conv_u64(vec<T> CR a, vec<T> CR b, u32 ans_size = 0) NE {
  cu32 n = (u32)a.size(), m = (u32)b.size();
  if (!ans_size) ans_size = n + m - 1;
  retif_((a.empty() && b.empty()) [[unlikely]], {});
  if (min(n, m) < CONV_NAIVE_THRESHOLD) return conv_naive<T, u64>(a, b, ans_size);
  static fft_r3<T> fft;
  using EI = fft_r3<T>::data_t;
  CEXP static EI inv_3{-T(1) / 3 * 2 + 1, 0};
  fft.bzr(n + m - 1);
  u32 s = fft.size();
  vec<EI> pa(s), pb(s);
  for (u32 i = 0; i < min(s, n); ++i) pa[i].real(a[i]);
  for (u32 i = s; i < min(2 * s, n); ++i) pa[i - s].imag(a[i]);
  for (u32 i = 0; i < min(s, m); ++i) pb[i].real(b[i]);
  for (u32 i = s; i < min(2 * s, m); ++i) pb[i - s].imag(b[i]);
  vec<EI> pc(4 * s);
  auto mul = [](auto&& mul, EI* p, EI* q, EI* to, u32 n) {
    if (n <= 27) {
      fill_n(to, n, 0);
      flt_ (u32, i, 0, n) {
        flt_ (u32, j, 0, n - i) to[i + j] += p[i] * q[j];
        flt_ (u32, j, n - i, n) to[i + j - n] += p[i] * q[j] * EI::w;
      }
      return;
    }
    u32 m = 1;
    for (; m * m < n; m *= 3);
    u32 r = n / m;
    EI inv{1};
    for (u32 i = 1; i < r; i *= 3) inv *= inv_3;
    flt_ (u32, i, 0, r) {
      fft.twiddle(p + m * i, m, m / r * i, to + m * i);
      fft.twiddle(q + m * i, m, m / r * i, to + n + m * i);
    }
    fft.dif(to, m, r), fft.dif(to + n, m, r);
    flt_ (u32, i, 0, r) mul(mul, to + m * i, to + n + m * i, to + 2 * n + m * i, m);
    fft.dit(to + 2 * n, m, r);
    flt_ (u32, i, 0, n) to[2 * n + i] *= inv;
    flt_ (u32, i, 0, r) fft.twiddle(to + 2 * n + m * i, m, 3 * m - m / r * i, to + n + m * i);
    flt_ (u32, i, 0, r) {
      flt_ (u32, j, 0, m) p[m * i + j] = conj(p[m * i + j]), q[m * i + j] = conj(q[m * i + j]);
      fft.twiddle(p + m * i, m, 2 * m / r * i, to + m * i);
      fft.twiddle(q + m * i, m, 2 * m / r * i, p + m * i);
    }
    fft.dif(to, m, r), fft.dif(p, m, r);
    flt_ (u32, i, 0, r) mul(mul, to + m * i, p + m * i, to + 2 * n + m * i, m);
    fft.dit(to + 2 * n, m, r);
    flt_ (u32, i, 0, n) to[2 * n + i] *= inv;
    flt_ (u32, i, 0, r) fft.twiddle(to + 2 * n + m * i, m, 3 * m - 2 * m / r * i, q + m * i);
    fill_n(to, n, 0);
    flt_ (u32, i, 0, n) {
      to[i] += (1 - EI::w) * to[n + i] + (1 - EI::w2) * conj(q[i]);
      if (i + m < n) to[i + m] += (EI::w2 - EI::w) * (to[n + i] - conj(q[i]));
      else to[i + m - n] += (1 - EI::w2) * (to[n + i] - conj(q[i]));
    }
    flt_ (u32, i, 0, n) to[i] *= inv_3;
  };
  mul(mul, pa.data(), pb.data(), pc.data(), s);
  vec<T> ans(ans_size);
  flt_ (u32, i, 0, min(s, ans_size)) ans[i] = pc[i].real();
  flt_ (u32, i, s, min(2 * s, ans_size)) ans[i] = pc[i - s].imag();
  return ans;
}

}  // namespace tifa_libs
#line 2 "src/io/container/lib.hpp"

#line 4 "src/io/container/lib.hpp"

namespace tifa_libs {

auto& operator>>(tifa_libs::istream_c auto& is, tifa_libs::container_c auto& x) NE {
  for (auto& i : x) is >> i;
  return is;
}
auto& operator<<(tifa_libs::ostream_c auto& os, tifa_libs::container_c auto CR x) NE {
  if (begin(x) == end(x)) [[unlikely]]
    return os;
  auto it = begin(x);
  for (os << *it++; it != end(x); ++it) os << ' ' << *it;
  return os;
}

}  // namespace tifa_libs
#line 2 "src/io/fastin/lib.hpp"

#line 2 "src/util/traits/math/lib.hpp"
// clang-format off
#line 4 "src/util/traits/math/lib.hpp"

namespace tifa_libs {

template <class T> concept char_c = std::same_as<T, char> || std::same_as<T, signed char> || std::same_as<T, unsigned char>;
#pragma GCC diagnostic ignored "-Wpedantic"
template <class T> concept s128_c = std::same_as<T, __int128_t> || std::same_as<T, __int128>;
template <class T> concept u128_c = std::same_as<T, __uint128_t> || std::same_as<T, unsigned __int128>;
template <class T> concept i128_c = s128_c<T> || u128_c<T>;
#pragma GCC diagnostic warning "-Wpedantic"
template <class T> concept imost64_c = std::integral<T> && sizeof(T) * __CHAR_BIT__ <= 64;
template <class T> concept smost64_c = imost64_c<T> && std::signed_integral<T>;
template <class T> concept umost64_c = imost64_c<T> && std::unsigned_integral<T>;
template <class T> concept int_c = i128_c<T> || imost64_c<T>;
template <class T> concept sint_c = s128_c<T> || smost64_c<T>;
template <class T> concept uint_c = u128_c<T> || umost64_c<T>;
template <class T> concept arithm_c = std::is_arithmetic_v<T> || int_c<T>;
template <class T> concept mint_c = requires(T x) { {x.mod()} -> uint_c; {x.val()} -> uint_c; };
template <class T> concept dft_c = requires(T x, std::vector<TPN T::data_t> v, u32 n) { {x.size()} -> std::same_as<u32>; x.bzr(n); x.dif(v, n); x.dit(v, n); };
template <class T> concept ntt_c = dft_c<T> && requires(T x) { T::max_size; T::G; };

template <class T> struct to_sint : std::make_signed<T> {};
template <> struct to_sint<u128> { using type = i128; };
template <> struct to_sint<i128> { using type = i128; };
template <class T> using to_sint_t = TPN to_sint<T>::type;
template <class T> struct to_uint : std::make_unsigned<T> {};
template <> struct to_uint<u128> { using type = u128; };
template <> struct to_uint<i128> { using type = u128; };
template <class T> using to_uint_t = TPN to_uint<T>::type;
template <arithm_c T> struct to_bigger : std::make_unsigned<T> {};
#define _(w,ww) template <> struct to_bigger<w> { using type = ww; }
#define _2(w,ww) _(i##w,i##ww); _(u##w,u##ww);
_2(8, 16); _2(16, 32); _2(32, 64); _2(64, 128); _(f32, f64); _(f64, f128);
#undef _2
#undef _
template <class T> using to_bigger_t = TPN to_bigger<T>::type;

template <arithm_c T> CEXP T inf_v = [] {
    if CEXP(sint_c<T>) return T(to_uint_t<T>(-1) / 4 - 1);
    else if CEXP(uint_c<T>) return T(-1) / 2 - 1;
    else return std::numeric_limits<T>::max() / 2 - 1;
}();

}  // namespace tifa_libs
// clang-format on
#line 5 "src/io/fastin/lib.hpp"
#ifdef __linux__
#include <sys/mman.h>
#include <sys/stat.h>
#endif

namespace tifa_libs {

struct fastin_data {
  CEXP static u32 BUF = 0x200005;
  FILE* f_ = nullptr;
#ifdef __linux__
  chr *bg, *ed, *p;
  struct stat Fl;

  void rebind(FILE* f = nullptr) NE {
#pragma GCC diagnostic ignored "-Wmaybe-uninitialized"
    if (!f_) munmap(bg, Fl.st_size + 1);
#pragma GCC diagnostic warning "-Wmaybe-uninitialized"
    if (!f) return;
    auto fd = fileno(f_ = f);
    fstat(fd, &Fl);
    p = (bg = (chr*)mmap(nullptr, Fl.st_size + 4, PROT_READ, MAP_PRIVATE, fd, 0));
    ed = bg + Fl.st_size;
    madvise(bg, Fl.st_size + 4, MADV_SEQUENTIAL);
  }

  ND bool iseof() CNE { return p == ed; }
  ~fastin_data() NE { rebind(); }
#else
  // NOLINTNEXTLINE(modernize-avoid-c-arrays)
  chr buf[BUF], *ed, *p;

  void rebind(FILE* f) NE { f_ = f, p = ed = buf; }
  ND bool iseof() NE {
    if (p == ed) [[unlikely]]
      ed = (p = buf) + fread(buf, 1, BUF, f_);
    return p == ed;
  }
#endif

  fastin_data(FILE* f = stdin) NE { assert(f), rebind(f); }
  fastin_data(fastin_data CR) = delete;
  fastin_data& operator=(fastin_data CR) = delete;
};
// clang-format off
enum FIN_SET : u8 { FS_NEWLINE = 1, FS_SPACE = 2, FS_NEG = 4, FS_NUM = 8, FS_ALPHA = 16, FS_OTHERS = 32 };
// clang-format on
template <u32 charset>
class fastin {
  fastin_data& data;

  static CEXP bool is_cntrl(chr c) NE {
    if CEXP (charset & FS_OTHERS) return iscntrl(c);
    else if CEXP (charset & FS_NEWLINE) return c < 32;
    else return false;
  }
  static CEXP bool is_cntrls(chr c) NE {
    if CEXP (charset & FS_OTHERS) return !isgraph(c);
    else if CEXP (charset & (FS_NEWLINE | FS_SPACE)) return c <= 32;
    else return false;
  }
  static CEXP bool is_digit(chr c) NE {
    if CEXP (charset & (FS_ALPHA | FS_OTHERS)) return isdigit(c);
    else if CEXP (!(charset & FS_NUM)) return false;
    else if CEXP (!(charset & FS_NEG)) return c > 32;
    else return c >= 48;
  }
  static CEXP bool is_neg_digit(chr c) NE {
    if CEXP (!(charset & FS_NEG)) return is_digit(c);
    else if CEXP (charset & (FS_ALPHA | FS_OTHERS)) return c == '-' || isdigit(c);
    else return c > 32;
  }
#ifdef __linux__
  template <bool ignore_space = true>
  void read_str(strn& n) NE {
    chr* l;
    if CEXP (ignore_space) {
      skip_cntrls(), l = data.p;
      while (!is_cntrls(*data.p)) ++data.p;
    } else {
      skip_cntrl(), l = data.p;
      while (!is_cntrl(*data.p)) ++data.p;
    }
    n.assign(l, data.p);
  }
#else
  template <bool ignore_space>
  void read_str(strn& n) NE {
    if CEXP (n.clear(); ignore_space) {
      n.push_back(skip_cntrls().get());
      while (!is_cntrls(peek())) n.push_back(get());
    } else {
      n.push_back(skip_cntrl().get());
      while (!is_cntrl(peek())) n.push_back(get());
    }
  }
#endif
 public:
  fastin(fastin_data& data) NE : data(data) {}
  fastin(fastin CR) = delete;
  fastin& operator=(fastin CR) = delete;

  chr peek() NE {
    if (data.iseof()) [[unlikely]]
      return EOF;
    return *data.p;
  }
  chr get_unchk() NE { return *data.p++; }
  chr get() NE {
    if (data.iseof()) [[unlikely]]
      return EOF;
    return get_unchk();
  }
#define SKIP(name, pred)              \
  fastin& skip_##name() NE {          \
    while (pred(peek())) get_unchk(); \
    return *this;                     \
  }
  SKIP(cntrl, is_cntrl)
  SKIP(cntrls, is_cntrls)
  SKIP(ndigit, !is_digit)
  SKIP(nnegdigit, !is_neg_digit)
#undef SKIP
  template <class T>
  requires(imost64_c<T> && !char_c<T>)
  fastin& operator>>(T& n) NE {
    if CEXP (std::same_as<T, bool>) n = skip_ndigit().get() != '0';
    else {
      n = 0;
      bool is_neg = false;
      if CEXP ((charset & FS_NEG) && std::signed_integral<T>) is_neg = (skip_nnegdigit().peek() == '-' && get_unchk());
      else skip_ndigit();
      std::conditional_t<sizeof(T) < sizeof(u32), u32, to_uint_t<T>> n_ = 0;
#ifdef __linux__
      // clang-format off
#define _ {while (~STR2U16[*(u16*)data.p]) (n_ *= 100) += STR2U16[*(u16*)data.p], data.p += 2; if (is_digit(peek())) (n_ *= 10) += get_unchk() & 15;}
      if ((usz)data.p & 1) { if (is_digit(peek())) [[likely]] { (n_ *= 10) += get_unchk() & 15; _ } } else _;
#undef _
      // clang-format on
#else
      while (is_digit(peek())) (n_ *= 10) += get_unchk() & 15;
#endif
      if CEXP (sint_c<T>)
        if (is_neg) n_ = -n_;
      n = (T)n_;
    }
    return *this;
  }
  fastin& operator>>(std::floating_point auto& n) NE {
    static strn s;
    (*this >> s), std::from_chars(begin(s).base(), end(s).base(), n);
    return *this;
  }
  //! ignore cntrl and space
  fastin& operator>>(char_c auto& n) NE {
    n = skip_cntrls().get();
    return *this;
  }
  fastin& operator>>(strn& n) NE {
    read_str<true>(n);
    return *this;
  }
  fastin& getline(strn& n) NE {
    read_str<false>(n);
    return *this;
  }
  //! NOT ignore cntrl and space
  fastin& strict_read(char_c auto& n) NE {
    n = get();
    return *this;
  }
  fastin& operator>>(fastin& (*func)(fastin&)) NE { return func(*this); }
};
inline fastin_data fid_stdin;
inline fastin<FS_NEWLINE | FS_SPACE | FS_NEG | FS_NUM | FS_ALPHA | FS_OTHERS> fin(fid_stdin);
inline fastin<FS_NEWLINE | FS_SPACE | FS_NEG | FS_NUM> fin_int(fid_stdin);
inline fastin<FS_NEWLINE | FS_SPACE | FS_NUM> fin_uint(fid_stdin);
template <u32 w>
inline fastin<w>& ws(fastin<w>& f) NE { return f.skip_cntrls(); }

}  // namespace tifa_libs
#line 2 "src/io/fastout/lib.hpp"

#line 5 "src/io/fastout/lib.hpp"

namespace tifa_libs {

class fastout {
  CEXP static u32 BUF = 0x200005, INTBUF = 63;
  FILE* f_ = nullptr;
  // NOLINTNEXTLINE(modernize-avoid-c-arrays)
  chr int_buf[INTBUF];
  // NOLINTNEXTLINE(modernize-avoid-c-arrays)
  chr buf[BUF], *p;
  chr CPC ed = buf + BUF;
  std::chars_format fmt = std::chars_format::general;
  int precision = 6;

  fastout& write_str(chr CP n, usz len = 0) NE {
    if (!len) len = strlen(n);
    usz l_;
    chr CP n_ = n;
    while (p + len >= ed) memcpy(p, n_, l_ = usz(ed - p)), p += l_, n_ += l_, len -= l_, flush();
    return memcpy(p, n_, len), p += len, *this;
  }

 public:
  fastout(FILE* f = stdout) NE { rebind(f); }
  fastout(fastout CR) = delete;
  fastout& operator=(fastout CR) = delete;
  ~fastout() NE { flush(); }
  void rebind(FILE* f) NE { f_ = f, p = buf; }
  void flush() NE { fwrite(buf, 1, usz(p - buf), f_), p = buf; }
  fastout& operator<<(char_c auto n) NE {
    if (p == ed) [[unlikely]]
      flush();
    *(p++) = n;
    return *this;
  }
  fastout& operator<<(chr CP n) NE { return write_str(n); }
  fastout& operator<<(strn CR str) NE { return write_str(str.data(), str.size()); }
  fastout& operator<<(strnv str) NE { return write_str(str.data(), str.size()); }
  template <class T>
  requires(smost64_c<T> && !char_c<T>)
  fastout& operator<<(T n) NE {
    if CEXP (sizeof(T) < sizeof(i32)) return *this << (i32)n;
    else {
      if (n < 0) return *this << '-' << -to_uint_t<T>(n);
      return *this << to_uint_t<T>(n);
    }
  }
  template <class T>
  requires(umost64_c<T> && !char_c<T>)
  fastout& operator<<(T n) NE {
    if CEXP (std::same_as<T, bool>) return *this << (chr(n | '0'));
    else if CEXP (sizeof(T) < sizeof(u32)) return *this << (u32)n;
    else if (usz(p - buf) >= BUF - INTBUF) [[unlikely]] {
      auto res = std::to_chars(int_buf, int_buf + INTBUF, n);
      return write_str(int_buf, usz(res.ptr - int_buf));
    } else {
      auto res = std::to_chars(p, buf + BUF, n);
      p = res.ptr;
      return *this;
    }
  }
  fastout& operator<<(std::floating_point auto n) NE {
    if (usz(p - buf) >= BUF - INTBUF) [[unlikely]] {
      auto res = std::to_chars(int_buf, int_buf + INTBUF, n, fmt, precision);
      return write_str(int_buf, usz(res.ptr - int_buf));
    } else {
      auto res = std::to_chars(p, buf + BUF, n, fmt, precision);
      p = res.ptr;
      return *this;
    }
  }
  fastout& setf(std::chars_format f) NE {
    fmt = f;
    return *this;
  }
  //! only tested in libstdc++
  fastout& operator<<(decltype(std::setprecision(0)) p) NE {
    precision = *(int*)(&p);
    return *this;
  }
  fastout& operator<<(fastout& (*func)(fastout&)) NE { return func(*this); }
};
inline fastout fout;
inline fastout& scientific(fastout& f) NE { return f.setf(std::chars_format::scientific); }
inline fastout& fixed(fastout& f) NE { return f.setf(std::chars_format::fixed); }
inline fastout& hexfloat(fastout& f) NE { return f.setf(std::chars_format::hex); }
inline fastout& defaultfloat(fastout& f) NE { return f.setf(std::chars_format::general); }
inline fastout& endl(fastout& f) NE {
  (f << '\n').flush();
  return f;
}
using std::setprecision;

}  // namespace tifa_libs
#line 6 "test/cpv/library-checker-convolution/convolution_mod_2_64.cpp"

using namespace tifa_libs;
int main() {
  u32 n, m;
  fin_uint >> n >> m;
  vecuu a(n), b(m);
  fin_uint >> a >> b;
  fout << conv_u64(a, b) << '\n';
  return 0;
}

Test cases

Env	Name	Status	Elapsed	Memory
verify-g++	all_same_00	AC	2440 ms	130 MB
verify-g++	all_same_01	AC	2588 ms	149 MB
verify-g++	all_same_02	AC	2585 ms	148 MB
verify-g++	all_same_03	AC	2565 ms	149 MB
verify-g++	example_00	AC	9 ms	21 MB
verify-g++	example_01	AC	9 ms	21 MB
verify-g++	gen_131072_00	AC	813 ms	65 MB
verify-g++	gen_131073_00	AC	816 ms	65 MB
verify-g++	gen_177147_00	AC	835 ms	68 MB
verify-g++	gen_177148_00	AC	2422 ms	124 MB
verify-g++	gen_262144_00	AC	2521 ms	129 MB
verify-g++	gen_262145_00	AC	2454 ms	129 MB
verify-g++	gen_265721_00	AC	2462 ms	129 MB
verify-g++	gen_265722_00	AC	2460 ms	129 MB
verify-g++	gen_354294_00	AC	2501 ms	136 MB
verify-g++	gen_354295_00	AC	2506 ms	136 MB
verify-g++	gen_524288_00	AC	2574 ms	148 MB
verify-g++	gen_524288_01	AC	2571 ms	149 MB
verify-g++	medium_00	AC	31 ms	25 MB
verify-g++	medium_01	AC	30 ms	25 MB
verify-g++	medium_02	AC	31 ms	25 MB
verify-g++	random_00	AC	2518 ms	139 MB
verify-g++	random_01	AC	2533 ms	142 MB
verify-g++	random_02	AC	2431 ms	126 MB
verify-g++	small_00	AC	9 ms	20 MB
verify-g++	small_01	AC	9 ms	20 MB
verify-g++	small_02	AC	9 ms	20 MB
verify-g++	small_03	AC	9 ms	20 MB
verify-g++	small_04	AC	9 ms	20 MB
verify-g++	small_05	AC	9 ms	20 MB
verify-g++	small_06	AC	9 ms	21 MB
verify-g++	small_07	AC	9 ms	21 MB
verify-g++	small_08	AC	9 ms	20 MB
verify-g++	small_09	AC	8 ms	21 MB
verify-g++	small_10	AC	8 ms	20 MB
verify-g++	small_11	AC	8 ms	20 MB
verify-g++	small_12	AC	9 ms	20 MB
verify-g++	small_13	AC	9 ms	21 MB
verify-g++	small_14	AC	9 ms	20 MB
verify-g++	small_15	AC	9 ms	20 MB
verify-g++	small_and_large_00	AC	2452 ms	129 MB
verify-g++	small_and_large_01	AC	2449 ms	127 MB
verify-g++	small_and_large_02	AC	2454 ms	129 MB
verify-g++	small_and_large_03	AC	2456 ms	129 MB
coverage-g++	all_same_00	AC	4461 ms	96 MB
coverage-g++	all_same_01	AC	4592 ms	115 MB
coverage-g++	all_same_02	AC	4587 ms	115 MB
coverage-g++	all_same_03	AC	4590 ms	116 MB
coverage-g++	example_00	AC	2 ms	4 MB
coverage-g++	example_01	AC	2 ms	4 MB
coverage-g++	gen_131072_00	AC	1462 ms	37 MB
coverage-g++	gen_131073_00	AC	1451 ms	37 MB
coverage-g++	gen_177147_00	AC	1482 ms	41 MB
coverage-g++	gen_177148_00	AC	4375 ms	91 MB
coverage-g++	gen_262144_00	AC	4456 ms	97 MB
coverage-g++	gen_262145_00	AC	4433 ms	97 MB
coverage-g++	gen_265721_00	AC	4437 ms	97 MB
coverage-g++	gen_265722_00	AC	4431 ms	97 MB
coverage-g++	gen_354294_00	AC	4491 ms	103 MB
coverage-g++	gen_354295_00	AC	4644 ms	103 MB
coverage-g++	gen_524288_00	AC	4602 ms	115 MB
coverage-g++	gen_524288_01	AC	12581 ms	115 MB
coverage-g++	medium_00	AC	37 ms	5 MB
coverage-g++	medium_01	AC	35 ms	4 MB
coverage-g++	medium_02	AC	36 ms	5 MB
coverage-g++	random_00	AC	4529 ms	106 MB
coverage-g++	random_01	AC	4547 ms	109 MB
coverage-g++	random_02	AC	4402 ms	93 MB
coverage-g++	small_00	AC	2 ms	4 MB
coverage-g++	small_01	AC	2 ms	4 MB
coverage-g++	small_02	AC	2 ms	4 MB
coverage-g++	small_03	AC	2 ms	4 MB
coverage-g++	small_04	AC	2 ms	4 MB
coverage-g++	small_05	AC	2 ms	4 MB
coverage-g++	small_06	AC	2 ms	4 MB
coverage-g++	small_07	AC	2 ms	4 MB
coverage-g++	small_08	AC	2 ms	4 MB
coverage-g++	small_09	AC	2 ms	4 MB
coverage-g++	small_10	AC	2 ms	4 MB
coverage-g++	small_11	AC	2 ms	4 MB
coverage-g++	small_12	AC	2 ms	4 MB
coverage-g++	small_13	AC	2 ms	4 MB
coverage-g++	small_14	AC	2 ms	4 MB
coverage-g++	small_15	AC	2 ms	4 MB
coverage-g++	small_and_large_00	AC	4440 ms	97 MB
coverage-g++	small_and_large_01	AC	4456 ms	97 MB
coverage-g++	small_and_large_02	AC	4430 ms	97 MB
coverage-g++	small_and_large_03	AC	4432 ms	97 MB

This site is open source. Improve this page.