矩阵乘法。
这题关键在于矩阵的构造。
以 k = 4 为例:
类似地,对于任意 k 都可以构造出相应的矩阵。
代码如下:
矩阵乘法优化的动态规划。
考虑位数增长时答案的变化:
用数组 F[i][j] 记录长度为 i 且末尾三位的十进制表示为 j 的未感染 DNA 个数,那么每一个 j 可以向后转移到的状态如下:
j DNA possible subfix
0 000 + 0/1
1 001 + 0/1
2 010 + 0
3 011 + 0
4 100 + 0/1
5 101 + nothing
6 110 + 0
7 111 + nothing
上表还不太明显,用图表示:
那么转移就很明显了:
f[i+1][0] = f[i][0] + f[i][4]
f[i+1][1] = f[i][0] + f[4][0]
f[i+1][2] = f[i][1]
f[i+1][3] = f[i][1]
f[i+1][4] = f[i][2] + f[i][6]
f[i+1][6] = f[i][3]
但是,考虑到数据范围 ( L<=10^9 ),直接线性递推做会超时。
于是用矩阵乘法优化转移过程,具体实现见代码:
对于 Fibonacci 数列 {Fi} 存在这样一个定理:
那么题意可以转化为求 Fibonacci 数列的第 gcd(n, m) 项对 1000000007 取模的值。
注意这个数可能会达到 10^18,故使用矩阵乘法优化计算。
Reference:
代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113 #include<iostream>
#include<algorithm>
#include<cstdio>
#include<cstring>
using namespace std;
inline void set_file_IO(string);
inline void close_IO(void);
inline void work(void);
int main(void) {
#ifndef ONLINE_JUDGE
set_file_IO("sequence");
#endif
ios::sync_with_stdio(false);
work();
#ifndef ONLINE_JUDGE
close_IO();
#endif
return 0;
}
typedef long long ll;
const ll Mod = 1000000007;
template<int Size>
struct matrix {
ll data[Size][Size];
matrix() {
memset(data, 0, sizeof data);
}
matrix<Size> operator *(const matrix<Size> b) {
matrix<Size> res;
for (int i=0; i<Size; ++i) {
for (int j=0; j<Size; ++j) {
for (int k=0; k<Size; ++k) {
(res.data[i][j] += data[i][k] * b.data[k][j]) %= Mod;
}
}
}
return res;
}
void operator *= (const matrix<Size> b) {
*this = *this * b;
}
matrix<Size> operator ^(ll exp) {
matrix<Size> res;
for (int i=0; i<Size; ++i) {
res.data[i][i] = 1;
}
for (matrix<Size> base=*this; exp; base*=base, exp>>=1LL) {
if (exp & 1LL) {
res *= base;
}
}
return res;
}
matrix operator ^=(const ll exp) {
return *this = *this ^ exp;
}
};
inline void single(void) {
ll n, m;
cin >> n >> m;
while (m) {
const ll t = m;
m = n % m;
n = t;
}
matrix<2> ans, ast;
ans.data[0][1] = 1;
ast.data[0][0] = ast.data[0][1] = ast.data[1][0] = 1;
ans *= ast ^= n;
cout << ans.data[0][0] << endl;
}
/*
1 , 1
1 , 0
f[i], f[i-1] f[i]+f[i-1], f[i]
0 , 0 0 , 0
*/
inline void work(void) {
int T;
cin >> T;
while (T--) {
single();
}
}
inline void set_file_IO(string name) {
freopen((name + ".in" ).c_str(), "r", stdin );
freopen((name + ".out").c_str(), "w", stdout);
}
inline void close_IO(void) {
fclose(stdin);
fclose(stdout);
}
矩阵乘法优化的线性递推。
令 f[i] 为 Concatenate(1 .. N) Mod M 的值。则显然地,有这么一个关于 f[i] 的线性递推式:
f[i] = f[i-1] * (10 ^ log10(i)) + i
但是直接用这个式子做的话复杂度是 O(n) 的,会超时。考虑利用矩阵乘法来计算。
把刚才的式子稍加变换,得:
f[i+1] = f[i] * (10 ^ log10(i+1)) + i+1
可以发现,对于位数相同的一段,10 ^ log10(i+1)
的值是固定的。可以考虑分段矩乘。
可以构造出这么两个矩阵:
Matrix 1 Matrix 2
[ f[i], i, 1 ] [ k , 0, 0] [ f[i]*k+i+1, i+1, 1]
[ 0 , 0, 0 ] * [ 1 , 1, 0] = [ 0 , 0 , 0]
[ 0 , 0, 0 ] [ 1 , 1, 1] [ 0 , 0 , 0]
那么对于位数相同的一段,Matrix 2 都是不变的,可以快速幂做掉。
还有一些边界情况需要多加考虑。注意在题目运算过程中间量可能会超出 long long 范围,所以需要使用类似快速幂的慢速乘以及 unsigned long long。
代码如下: