详解3D Gaussian Splatting CUDA Kernel：反向传播（二）`BACKWARD::preprocess`

# 对预处理过程的反向传播`BACKWARD::preprocess`

分两步：

计算2D协方差矩阵的梯度：调用 computeCov2DCUDA 核函数，计算3D高斯球投影在成像平面上的2D协方差矩阵对3D高斯球均值和3D协方差的梯度。
处理剩余的反向传播步骤：调用 preprocessCUDA 核函数，完成对3D均值梯度的更新，以及将高斯球颜色梯度传播到球谐系数（SH），并将3D协方差矩阵的梯度传播到缩放和旋转参数。

void BACKWARD::preprocess(
	int P, int D, int M,
	const float3* means3D,
	const int* radii,
	const float* shs,
	const bool* clamped,
	const glm::vec3* scales,
	const glm::vec4* rotations,
	const float scale_modifier,
	const float* cov3Ds,
	const float* viewmatrix,
	const float* projmatrix,
	const float focal_x, float focal_y,
	const float tan_fovx, float tan_fovy,
	const glm::vec3* campos,
	const float3* dL_dmean2D, // 高斯球投影在像平面上的2D均值位置的梯度（BACKWARD::render的计算结果）
	const float* dL_dconic, // 高斯球投影在像平面上的2D协方差矩阵（不叠加透明度）的梯度（BACKWARD::render的计算结果）
	glm::vec3* dL_dmean3D, // 高斯球3D均值位置的梯度（待求解）
	float* dL_dcolor, // 高斯球颜色的梯度（BACKWARD::render的计算结果）
	float* dL_dcov3D, // 高斯球3D协方差矩阵的梯度（待求解）
	float* dL_dsh, // 高斯球球谐系数的梯度（待求解）
	glm::vec3* dL_dscale, // 高斯球scale参数的梯度（待求解）
	glm::vec4* dL_drot) // 高斯球rotation参数的梯度（待求解）
{
	// Propagate gradients for the path of 2D conic matrix computation. 
	// Somewhat long, thus it is its own kernel rather than being part of 
	// "preprocess". When done, loss gradient w.r.t. 3D means has been
	// modified and gradient w.r.t. 3D covariance matrix has been computed.	
	computeCov2DCUDA << <(P + 255) / 256, 256 >> > (
		P,
		means3D,
		radii,
		cov3Ds,
		focal_x,
		focal_y,
		tan_fovx,
		tan_fovy,
		viewmatrix,
		dL_dconic,
		(float3*)dL_dmean3D,
		dL_dcov3D);

	// Propagate gradients for remaining steps: finish 3D mean gradients,
	// propagate color gradients to SH (if desireD), propagate 3D covariance
	// matrix gradients to scale and rotation.
	preprocessCUDA<NUM_CHANNELS> << < (P + 255) / 256, 256 >> > (
		P, D, M,
		(float3*)means3D,
		radii,
		shs,
		clamped,
		(glm::vec3*)scales,
		(glm::vec4*)rotations,
		scale_modifier,
		projmatrix,
		campos,
		(float3*)dL_dmean2D,
		(glm::vec3*)dL_dmean3D,
		dL_dcolor,
		dL_dcov3D,
		dL_dsh,
		dL_dscale,
		dL_drot);
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64

# 进一步深入`computeCov2DCUDA`

// Backward version of INVERSE 2D covariance matrix computation
// (due to length launched as separate kernel before other 
// backward steps contained in preprocess)
__global__ void computeCov2DCUDA(int P,
	const float3* means,
	const int* radii,
	const float* cov3Ds,
	const float h_x, float h_y,
	const float tan_fovx, float tan_fovy,
	const float* view_matrix,
	const float* dL_dconics, // 高斯球投影在像平面上的2D协方差矩阵的梯度
	float3* dL_dmeans, // 高斯球投影在像平面上的2D均值位置的梯度
	float* dL_dcov) // 高斯球的3D协方差矩阵的梯度（待求解）
{
	auto idx = cg::this_grid().thread_rank(); // 当前thread要处理的高斯球编号
	if (idx >= P || !(radii[idx] > 0))
		return;

	// Reading location of 3D covariance for this Gaussian
	const float* cov3D = cov3Ds + 6 * idx; // 根据高斯球编号找到其3D协方差矩阵，因为是对称矩阵所以只有6个值

	// Fetch gradients, recompute 2D covariance and relevant 
	// intermediate forward results needed in the backward.
	float3 mean = means[idx]; // 根据高斯球编号找到其3D均值（高斯球中心点）
	float3 dL_dconic = { dL_dconics[4 * idx], dL_dconics[4 * idx + 1], dL_dconics[4 * idx + 3] }; // renderCUDA中计算好的锥体参数梯度
	float3 t = transformPoint4x3(mean, view_matrix); // 高斯球中心点坐标变换到相机坐标系

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

# 限制高斯球中心点坐标范围

和前向传播中一样保持数值稳定性避免精度溢出：

	const float limx = 1.3f * tan_fovx;
	const float limy = 1.3f * tan_fovy;
	const float txtz = t.x / t.z; // xy除了个z
	const float tytz = t.y / t.z;
	t.x = min(limx, max(-limx, txtz)) * t.z; // 限制大小后又把z给乘回去了
	t.y = min(limy, max(-limy, tytz)) * t.z;

1
2
3
4
5
6

和前向传播中不一样的是这里多了一步01标记了那些中心点超出范围的高斯球：

	const float x_grad_mul = txtz < -limx || txtz > limx ? 0 : 1; // 01标记了那些中心点超出范围的高斯球
	const float y_grad_mul = tytz < -limy || tytz > limy ? 0 : 1;

1
2

# 雅可比矩阵 $J$

复习前向传播中的雅可比矩阵 $J$ 计算公式，其表示2维空间坐标 $(u,v)$ 对3维空间中的坐标 $(x,y,z)$ 的导数：

$J=\frac{\partial (u,v)}{\partial (x,y,z)}=\left[ \begin{matrix} \frac{\partial u}{\partial x} & \frac{\partial u}{\partial y} & \frac{\partial u}{\partial z} \\ \frac{\partial v}{\partial x} & \frac{\partial v}{\partial y} & \frac{\partial v}{\partial z}\\ \end{matrix} \right]=\left[ \begin{matrix} f_x\frac{1}{z} & 0 & -f_x\frac{x}{z^2} \\ 0 & f_y\frac{1}{z} & -f_y\frac{y}{z^2} \\ \end{matrix} \right]$

	glm::mat3 J = glm::mat3(h_x / t.z, 0.0f, -(h_x * t.x) / (t.z * t.z),
		0.0f, h_y / t.z, -(h_y * t.y) / (t.z * t.z),
		0, 0, 0);

1
2
3

代码里的J为了方便glm库的加速所以加上了一行0。

和前向传播代码不一样的就是h_x和h_y表示 $f_x$ 和 $f_y$ ，其他均相同

# 2D协方差矩阵 $\Sigma'$

复习前向传播中的计算2D协方差矩阵 $\Sigma'$ 计算公式：

$\Sigma'=JW\Sigma W^\top J^\top$

其中 $W$ 为视角变换矩阵的前3x3部分，代码中的W对应 $W^\top$ ：

	glm::mat3 W = glm::mat3(
		view_matrix[0], view_matrix[4], view_matrix[8],
		view_matrix[1], view_matrix[5], view_matrix[9],
		view_matrix[2], view_matrix[6], view_matrix[10]);

1
2
3
4

Vrk就是 $\Sigma$ ：

	glm::mat3 Vrk = glm::mat3(
		cov3D[0], cov3D[1], cov3D[2],
		cov3D[1], cov3D[3], cov3D[4],
		cov3D[2], cov3D[4], cov3D[5]);

1
2
3
4

令 $T=JW$ ，则 $\Sigma'=T\Sigma T^\top$ ：

	glm::mat3 T = W * J;

	glm::mat3 cov2D = glm::transpose(T) * glm::transpose(Vrk) * T;

1
2
3

# 对3D协方差矩阵 $\Sigma$ 的梯度

在BACKWARD::render中已经计算了Loss值对高斯球 $i$ 投影在成像平面上的锥体参数（2D协方差逆矩阵）的梯度 $\frac{\partial L}{\partial \Sigma'^{-1}}$ （文中公式记为 $\frac{\partial L}{\partial (A,B,C)}$ ，此处对应dL_dconic2D）和中心位置梯度 $\frac{\partial L}{\partial\bm (u,v)}$ （文中公式记为 $\frac{\partial L}{\partial (x_i,y_i)}$ ，此处对应dL_dmeans）。接下来需要计算对高斯球3D中心位置 $(x,y,z)$ 和3D协方差矩阵 $\Sigma$ 的梯度。

已知 $\frac{\partial L}{\partial \Sigma'^{-1}}$ ，将2D协方差矩阵 $\Sigma'$ 和逆 $\Sigma'^{-1}$ 展开来进行计算：

$\begin{aligned} \Sigma'&=\left[\begin{matrix}a&b\\b&c\end{matrix}\right]\\ \Sigma'^{-1}&=\left[\begin{matrix}A&B\\B&C\end{matrix}\right]\\ \end{aligned}$

按照链式法则展开 $\frac{\partial L}{\partial \Sigma}$ 的计算过程，令 $\Sigma_{ij}$ 为矩阵 $\Sigma$ 中第 $i$ 行 $j$ 列的元素值，可得 $L$ 对 $\Sigma$ 中每个元素的导数的计算公式：

$\begin{aligned} \frac{\partial L}{\partial\Sigma_{ij}}&=\frac{\partial L}{\partial A}\frac{\partial A}{\partial\Sigma_{ij}}+2\frac{\partial L}{\partial B}\frac{\partial B}{\partial\Sigma_{ij}}+\frac{\partial L}{\partial C}\frac{\partial C}{\partial\Sigma_{ij}}\\ &= \frac{\partial L}{\partial A} \left(\frac{\partial A}{\partial a}\frac{\partial a}{\partial\Sigma_{ij}}+\frac{\partial A}{\partial b}\frac{\partial b}{\partial\Sigma_{ij}}+\frac{\partial A}{\partial c}\frac{\partial c}{\partial\Sigma_{ij}}\right) +\\&\qquad 2\frac{\partial L}{\partial B} \left(\frac{\partial B}{\partial a}\frac{\partial a}{\partial\Sigma_{ij}}+\frac{\partial B}{\partial b}\frac{\partial b}{\partial\Sigma_{ij}}+\frac{\partial B}{\partial c}\frac{\partial c}{\partial\Sigma_{ij}}\right) +\\&\qquad \frac{\partial L}{\partial C} \left(\frac{\partial C}{\partial a}\frac{\partial a}{\partial\Sigma_{ij}}+\frac{\partial C}{\partial b}\frac{\partial b}{\partial\Sigma_{ij}}+\frac{\partial C}{\partial c}\frac{\partial c}{\partial\Sigma_{ij}}\right) \\&= \left(\frac{\partial L}{\partial A}\frac{\partial A}{\partial a}+2\frac{\partial L}{\partial B}\frac{\partial B}{\partial a}+\frac{\partial L}{\partial C}\frac{\partial C}{\partial a}\right) \frac{\partial a}{\partial\Sigma_{ij}}+\\&\qquad \left(\frac{\partial L}{\partial A}\frac{\partial A}{\partial b}+2\frac{\partial L}{\partial B}\frac{\partial B}{\partial b}+\frac{\partial L}{\partial C}\frac{\partial C}{\partial b}\right) \frac{\partial b}{\partial\Sigma_{ij}}+\\&\qquad \left(\frac{\partial L}{\partial A}\frac{\partial A}{\partial c}+2\frac{\partial L}{\partial B}\frac{\partial B}{\partial c}+\frac{\partial L}{\partial C}\frac{\partial C}{\partial c}\right) \frac{\partial c}{\partial\Sigma_{ij}} \\&=\frac{\partial L}{\partial a}\frac{\partial a}{\partial \Sigma_{ij}}+\frac{\partial L}{\partial b}\frac{\partial b}{\partial \Sigma_{ij}}+\frac{\partial L}{\partial c}\frac{\partial c}{\partial \Sigma_{ij}} \end{aligned}$

所以先求2D协方差矩阵 $\Sigma'$ 中的几个标量的梯度 $\frac{\partial L}{\partial (a,b,c)}$ 再求 $\frac{\partial L}{\partial \Sigma_{ij}}$

# 先求 $\frac{\partial L}{\partial (a,b,c)}$

根据求逆公式写出逆矩阵 $\Sigma'^{-1}$ 的表达式，即 $A,B,C$ 和 $a,b,c$ 之间的关系：

$\Sigma'^{-1}=\left[\begin{matrix}A&B\\B&C\end{matrix}\right]=\frac{\left[\begin{matrix}c&-b\\-b&a\end{matrix}\right]}{ac-b^2}$

于是可以求得 $\frac{\partial L}{\partial a}$ 、 $\frac{\partial L}{\partial b}$ 和 $\frac{\partial L}{\partial c}$ ：

$\begin{aligned} \frac{\partial L}{\partial a}&= \frac{\partial L}{\partial A}\frac{\partial A}{\partial a}+ 2\frac{\partial L}{\partial B}\frac{\partial B}{\partial a}+ \frac{\partial L}{\partial C}\frac{\partial C}{\partial a}= \frac{\partial}{\partial a}\left(\frac{c\frac{\partial L}{\partial A}-2b\frac{\partial L}{\partial B}+a\frac{\partial L}{\partial C}}{ac-b^2}\right)=\frac{-c^2\frac{\partial L}{\partial A}+2bc\frac{\partial L}{\partial B}-b^2\frac{\partial L}{\partial C}}{\left(ac-b^2\right)^2}\\ \frac{\partial L}{\partial b}&= \frac{\partial L}{\partial A}\frac{\partial A}{\partial b}+ 2\frac{\partial L}{\partial B}\frac{\partial B}{\partial b}+ \frac{\partial L}{\partial C}\frac{\partial C}{\partial b}= \frac{\partial}{\partial b}\left(\frac{c\frac{\partial L}{\partial A}-2b\frac{\partial L}{\partial B}+a\frac{\partial L}{\partial C}}{ac-b^2}\right)=\frac{2bc\frac{\partial L}{\partial A}-2(ac+b^2)\frac{\partial L}{\partial B}+2ab\frac{\partial L}{\partial C}}{\left(ac-b^2\right)^2}\\ \frac{\partial L}{\partial c}&= \frac{\partial L}{\partial A}\frac{\partial A}{\partial c}+ 2\frac{\partial L}{\partial B}\frac{\partial B}{\partial c}+ \frac{\partial L}{\partial C}\frac{\partial C}{\partial c}= \frac{\partial}{\partial c}\left(\frac{c\frac{\partial L}{\partial A}-2b\frac{\partial L}{\partial B}+a\frac{\partial L}{\partial C}}{ac-b^2}\right)=\frac{-b^2\frac{\partial L}{\partial A}+2ab\frac{\partial L}{\partial B}-a^2\frac{\partial L}{\partial C}}{\left(ac-b^2\right)^2}\\ \end{aligned}$

	// Use helper variables for 2D covariance entries. More compact.
	float a = cov2D[0][0] += 0.3f;
	float b = cov2D[0][1];
	float c = cov2D[1][1] += 0.3f;

	float denom = a * c - b * b;
	float dL_da = 0, dL_db = 0, dL_dc = 0;
	float denom2inv = 1.0f / ((denom * denom) + 0.0000001f);

	if (denom2inv != 0)
	{
		// Gradients of loss w.r.t. entries of 2D covariance matrix,
		// given gradients of loss w.r.t. conic matrix (inverse covariance matrix).
		// e.g., dL / da = dL / d_conic_a * d_conic_a / d_a
		dL_da = denom2inv * (-c * c * dL_dconic.x + 2 * b * c * dL_dconic.y + (denom - a * c) * dL_dconic.z);
		dL_dc = denom2inv * (-a * a * dL_dconic.z + 2 * a * b * dL_dconic.y + (denom - a * c) * dL_dconic.x);
		dL_db = denom2inv * 2 * (b * c * dL_dconic.x - (denom + 2 * b * b) * dL_dconic.y + a * b * dL_dconic.z);

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

# 再求 $\frac{\partial L}{\partial \Sigma_{ij}}$

将2D协方差矩阵 $\Sigma'$ 和 $T$ 展开来进行计算：

$\Sigma'=\left[\begin{matrix}a&b\\b&c\end{matrix}\right]=T\Sigma T^\top=\left[\begin{matrix}T_1\\T_2\end{matrix}\right]\Sigma\left[\begin{matrix}T_1^\top&T_2^\top\end{matrix}\right]=\left[\begin{matrix}T_{1}\Sigma T_{1}^\top&T_{1}\Sigma T_{2}^\top\\T_{2}\Sigma T_{1}^\top&T_{2}\Sigma T_{2}^\top\end{matrix}\right]$

其中 $T_{1}$ 和 $T_{2}$ 表示 $T$ 矩阵的第1和第2行向量。令 $T_{ij}$ 为矩阵 $T$ 中第 $i$ 行 $j$ 列的元素值，于是可进一步展开，单独求得 $(a,b,c)$ 对 $\Sigma$ 中每个元素的导数：

$\begin{aligned} a&=T_{1}\Sigma T_{1}^\top&=\sum_{i,j\in\{1,2,3\}}T_{1i}\Sigma_{ij}T_{1j}&&\Rightarrow&&\frac{\partial a}{\partial\Sigma_{ij}}&=T_{1i}T_{1j}\\ c&=T_{2}\Sigma T_{2}^\top&=\sum_{i,j\in\{1,2,3\}}T_{2i}\Sigma_{ij}T_{2j}&&\Rightarrow&&\frac{\partial c}{\partial\Sigma_{ij}}&=T_{2i}T_{2j}\\ \end{aligned}$

对左下角和右上角的 $b$ 的求导是两条路：

$\begin{aligned} b&=T_{1}\Sigma T_{2}^\top&=\sum_{i,j\in\{1,2,3\}}T_{1i}\Sigma_{ij}T_{2j}&&\Rightarrow&&\frac{\partial b}{\partial\Sigma_{ij}}&=T_{1i}T_{2j}\\ b&=T_{2}\Sigma T_{1}^\top&=\sum_{i,j\in\{1,2,3\}}T_{2i}\Sigma_{ij}T_{1j}&&\Rightarrow&&\frac{\partial b}{\partial\Sigma_{ij}}&=T_{2i}T_{1j}\\ \end{aligned}$

于是 $b$ 的导数是两条路的均值：

$\begin{aligned} \frac{\partial b}{\partial\Sigma_{ij}}&=\frac{T_{1i}T_{2j}+T_{2i}T_{1j}}{2}\\ \end{aligned}$

于是 $L$ 对 $\Sigma$ 中每个元素的导数为：

$\begin{aligned} \frac{\partial L}{\partial\Sigma_{ij}}&=\frac{\partial L}{\partial a}\frac{\partial a}{\partial \Sigma_{ij}}+\frac{\partial L}{\partial b}\frac{\partial b}{\partial \Sigma_{ij}}+\frac{\partial L}{\partial c}\frac{\partial c}{\partial \Sigma_{ij}}\\ &=\frac{\partial L}{\partial a}T_{1i}T_{1j}+\frac{\partial L}{\partial b}\frac{T_{1i}T_{2j}+T_{2i}T_{1j}}{2}+\frac{\partial L}{\partial c}T_{2i}T_{2j} \end{aligned}$

		// Gradients of loss L w.r.t. each 3D covariance matrix (Vrk) entry, 
		// given gradients w.r.t. 2D covariance matrix (diagonal).
		// cov2D = transpose(T) * transpose(Vrk) * T;
		dL_dcov[6 * idx + 0] = (T[0][0] * T[0][0] * dL_da + T[0][0] * T[1][0] * dL_db + T[1][0] * T[1][0] * dL_dc);
		dL_dcov[6 * idx + 3] = (T[0][1] * T[0][1] * dL_da + T[0][1] * T[1][1] * dL_db + T[1][1] * T[1][1] * dL_dc);
		dL_dcov[6 * idx + 5] = (T[0][2] * T[0][2] * dL_da + T[0][2] * T[1][2] * dL_db + T[1][2] * T[1][2] * dL_dc);

		// Gradients of loss L w.r.t. each 3D covariance matrix (Vrk) entry, 
		// given gradients w.r.t. 2D covariance matrix (off-diagonal).
		// Off-diagonal elements appear twice --> double the gradient.
		// cov2D = transpose(T) * transpose(Vrk) * T;
		dL_dcov[6 * idx + 1] = 2 * T[0][0] * T[0][1] * dL_da + (T[0][0] * T[1][1] + T[0][1] * T[1][0]) * dL_db + 2 * T[1][0] * T[1][1] * dL_dc;
		dL_dcov[6 * idx + 2] = 2 * T[0][0] * T[0][2] * dL_da + (T[0][0] * T[1][2] + T[0][2] * T[1][0]) * dL_db + 2 * T[1][0] * T[1][2] * dL_dc;
		dL_dcov[6 * idx + 4] = 2 * T[0][2] * T[0][1] * dL_da + (T[0][1] * T[1][2] + T[0][2] * T[1][1]) * dL_db + 2 * T[1][1] * T[1][2] * dL_dc;
	}
	else
	{
		for (int i = 0; i < 6; i++)
			dL_dcov[6 * idx + i] = 0;
	}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

由 $\frac{\partial L}{\partial\Sigma_{ij}}$ 所构成的矩阵为对称矩阵，作者在代码中dL_dcov只存储矩阵的上半边还把非对角线元素求和了，在后面computeCov3D里用到dL_dcov的地方（computeCov3D里变量名为dL_dcov3D）可以看到dL_dcov又被展开为对称矩阵并且把dL_dcov非对角线元素乘了0.5。

# 对3D高斯球均值 $(x,y,z)$ 的梯度

对 $T$ 的梯度：

$\frac{\partial L}{\partial T}$

	// Gradients of loss w.r.t. upper 2x3 portion of intermediate matrix T
	// cov2D = transpose(T) * transpose(Vrk) * T;
	float dL_dT00 = 2 * (T[0][0] * Vrk[0][0] + T[0][1] * Vrk[0][1] + T[0][2] * Vrk[0][2]) * dL_da +
		(T[1][0] * Vrk[0][0] + T[1][1] * Vrk[0][1] + T[1][2] * Vrk[0][2]) * dL_db;
	float dL_dT01 = 2 * (T[0][0] * Vrk[1][0] + T[0][1] * Vrk[1][1] + T[0][2] * Vrk[1][2]) * dL_da +
		(T[1][0] * Vrk[1][0] + T[1][1] * Vrk[1][1] + T[1][2] * Vrk[1][2]) * dL_db;
	float dL_dT02 = 2 * (T[0][0] * Vrk[2][0] + T[0][1] * Vrk[2][1] + T[0][2] * Vrk[2][2]) * dL_da +
		(T[1][0] * Vrk[2][0] + T[1][1] * Vrk[2][1] + T[1][2] * Vrk[2][2]) * dL_db;
	float dL_dT10 = 2 * (T[1][0] * Vrk[0][0] + T[1][1] * Vrk[0][1] + T[1][2] * Vrk[0][2]) * dL_dc +
		(T[0][0] * Vrk[0][0] + T[0][1] * Vrk[0][1] + T[0][2] * Vrk[0][2]) * dL_db;
	float dL_dT11 = 2 * (T[1][0] * Vrk[1][0] + T[1][1] * Vrk[1][1] + T[1][2] * Vrk[1][2]) * dL_dc +
		(T[0][0] * Vrk[1][0] + T[0][1] * Vrk[1][1] + T[0][2] * Vrk[1][2]) * dL_db;
	float dL_dT12 = 2 * (T[1][0] * Vrk[2][0] + T[1][1] * Vrk[2][1] + T[1][2] * Vrk[2][2]) * dL_dc +
		(T[0][0] * Vrk[2][0] + T[0][1] * Vrk[2][1] + T[0][2] * Vrk[2][2]) * dL_db;

1
2
3
4
5
6
7
8
9
10
11
12
13
14

对 $J$ 的梯度：

$\frac{\partial L}{\partial J}$

	// Gradients of loss w.r.t. upper 3x2 non-zero entries of Jacobian matrix
	// T = W * J
	float dL_dJ00 = W[0][0] * dL_dT00 + W[0][1] * dL_dT01 + W[0][2] * dL_dT02;
	float dL_dJ02 = W[2][0] * dL_dT00 + W[2][1] * dL_dT01 + W[2][2] * dL_dT02;
	float dL_dJ11 = W[1][0] * dL_dT10 + W[1][1] * dL_dT11 + W[1][2] * dL_dT12;
	float dL_dJ12 = W[2][0] * dL_dT10 + W[2][1] * dL_dT11 + W[2][2] * dL_dT12;

1
2
3
4
5
6

对 $(x,y,z)$ 的梯度：

$\frac{\partial L}{\partial (x,y,z)}$

	float tz = 1.f / t.z;
	float tz2 = tz * tz;
	float tz3 = tz2 * tz;

	// Gradients of loss w.r.t. transformed Gaussian mean t
	float dL_dtx = x_grad_mul * -h_x * tz2 * dL_dJ02;
	float dL_dty = y_grad_mul * -h_y * tz2 * dL_dJ12;
	float dL_dtz = -h_x * tz2 * dL_dJ00 - h_y * tz2 * dL_dJ11 + (2 * h_x * t.x) * tz3 * dL_dJ02 + (2 * h_y * t.y) * tz3 * dL_dJ12;

	// Account for transformation of mean to t
	// t = transformPoint4x3(mean, view_matrix);
	float3 dL_dmean = transformVec4x3Transpose({ dL_dtx, dL_dty, dL_dtz }, view_matrix);

	// Gradients of loss w.r.t. Gaussian means, but only the portion 
	// that is caused because the mean affects the covariance matrix.
	// Additional mean gradient is accumulated in BACKWARD::preprocess.
	dL_dmeans[idx] = dL_dmean;
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

# 进一步深入`preprocessCUDA`

// Backward pass of the preprocessing steps, except
// for the covariance computation and inversion
// (those are handled by a previous kernel call)
template<int C>
__global__ void preprocessCUDA(
	int P, int D, int M,
	const float3* means,
	const int* radii,
	const float* shs,
	const bool* clamped,
	const glm::vec3* scales,
	const glm::vec4* rotations,
	const float scale_modifier,
	const float* proj,
	const glm::vec3* campos,
	const float3* dL_dmean2D,
	glm::vec3* dL_dmeans,
	float* dL_dcolor,
	float* dL_dcov3D,
	float* dL_dsh,
	glm::vec3* dL_dscale,
	glm::vec4* dL_drot)
{
	auto idx = cg::this_grid().thread_rank();
	if (idx >= P || !(radii[idx] > 0))
		return;

	float3 m = means[idx];

	// Taking care of gradients from the screenspace points
	float4 m_hom = transformPoint4x4(m, proj);
	float m_w = 1.0f / (m_hom.w + 0.0000001f);

	// Compute loss gradient w.r.t. 3D means due to gradients of 2D means
	// from rendering procedure
	glm::vec3 dL_dmean;
	float mul1 = (proj[0] * m.x + proj[4] * m.y + proj[8] * m.z + proj[12]) * m_w * m_w;
	float mul2 = (proj[1] * m.x + proj[5] * m.y + proj[9] * m.z + proj[13]) * m_w * m_w;
	dL_dmean.x = (proj[0] * m_w - proj[3] * mul1) * dL_dmean2D[idx].x + (proj[1] * m_w - proj[3] * mul2) * dL_dmean2D[idx].y;
	dL_dmean.y = (proj[4] * m_w - proj[7] * mul1) * dL_dmean2D[idx].x + (proj[5] * m_w - proj[7] * mul2) * dL_dmean2D[idx].y;
	dL_dmean.z = (proj[8] * m_w - proj[11] * mul1) * dL_dmean2D[idx].x + (proj[9] * m_w - proj[11] * mul2) * dL_dmean2D[idx].y;

	// That's the second part of the mean gradient. Previous computation
	// of cov2D and following SH conversion also affects it.
	dL_dmeans[idx] += dL_dmean;

	// Compute gradient updates due to computing colors from SHs
	if (shs)
		computeColorFromSH(idx, D, M, (glm::vec3*)means, *campos, shs, clamped, (glm::vec3*)dL_dcolor, (glm::vec3*)dL_dmeans, (glm::vec3*)dL_dsh);

	// Compute gradient updates due to computing covariance from scale/rotation
	if (scales)
		computeCov3D(idx, scales[idx], scale_modifier, rotations[idx], dL_dcov3D, dL_dscale, dL_drot);
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54

# 进一步深入`computeCov3D`

// Backward pass for the conversion of scale and rotation to a 
// 3D covariance matrix for each Gaussian. 
__device__ void computeCov3D(int idx, const glm::vec3 scale, float mod, const glm::vec4 rot, const float* dL_dcov3Ds, glm::vec3* dL_dscales, glm::vec4* dL_drots)
{
	// Recompute (intermediate) results for the 3D covariance computation.
	glm::vec4 q = rot;// / glm::length(rot);
	float r = q.x;
	float x = q.y;
	float y = q.z;
	float z = q.w;

	glm::mat3 R = glm::mat3(
		1.f - 2.f * (y * y + z * z), 2.f * (x * y - r * z), 2.f * (x * z + r * y),
		2.f * (x * y + r * z), 1.f - 2.f * (x * x + z * z), 2.f * (y * z - r * x),
		2.f * (x * z - r * y), 2.f * (y * z + r * x), 1.f - 2.f * (x * x + y * y)
	);

	glm::mat3 S = glm::mat3(1.0f);

	glm::vec3 s = mod * scale;
	S[0][0] = s.x;
	S[1][1] = s.y;
	S[2][2] = s.z;

	glm::mat3 M = S * R;

	const float* dL_dcov3D = dL_dcov3Ds + 6 * idx;

	glm::vec3 dunc(dL_dcov3D[0], dL_dcov3D[3], dL_dcov3D[5]);
	glm::vec3 ounc = 0.5f * glm::vec3(dL_dcov3D[1], dL_dcov3D[2], dL_dcov3D[4]);

	// Convert per-element covariance loss gradients to matrix form
	glm::mat3 dL_dSigma = glm::mat3(
		dL_dcov3D[0], 0.5f * dL_dcov3D[1], 0.5f * dL_dcov3D[2],
		0.5f * dL_dcov3D[1], dL_dcov3D[3], 0.5f * dL_dcov3D[4],
		0.5f * dL_dcov3D[2], 0.5f * dL_dcov3D[4], dL_dcov3D[5]
	);

	// Compute loss gradient w.r.t. matrix M
	// dSigma_dM = 2 * M
	glm::mat3 dL_dM = 2.0f * M * dL_dSigma;

	glm::mat3 Rt = glm::transpose(R);
	glm::mat3 dL_dMt = glm::transpose(dL_dM);

	// Gradients of loss w.r.t. scale
	glm::vec3* dL_dscale = dL_dscales + idx;
	dL_dscale->x = glm::dot(Rt[0], dL_dMt[0]);
	dL_dscale->y = glm::dot(Rt[1], dL_dMt[1]);
	dL_dscale->z = glm::dot(Rt[2], dL_dMt[2]);

	dL_dMt[0] *= s.x;
	dL_dMt[1] *= s.y;
	dL_dMt[2] *= s.z;

	// Gradients of loss w.r.t. normalized quaternion
	glm::vec4 dL_dq;
	dL_dq.x = 2 * z * (dL_dMt[0][1] - dL_dMt[1][0]) + 2 * y * (dL_dMt[2][0] - dL_dMt[0][2]) + 2 * x * (dL_dMt[1][2] - dL_dMt[2][1]);
	dL_dq.y = 2 * y * (dL_dMt[1][0] + dL_dMt[0][1]) + 2 * z * (dL_dMt[2][0] + dL_dMt[0][2]) + 2 * r * (dL_dMt[1][2] - dL_dMt[2][1]) - 4 * x * (dL_dMt[2][2] + dL_dMt[1][1]);
	dL_dq.z = 2 * x * (dL_dMt[1][0] + dL_dMt[0][1]) + 2 * r * (dL_dMt[2][0] - dL_dMt[0][2]) + 2 * z * (dL_dMt[1][2] + dL_dMt[2][1]) - 4 * y * (dL_dMt[2][2] + dL_dMt[0][0]);
	dL_dq.w = 2 * r * (dL_dMt[0][1] - dL_dMt[1][0]) + 2 * x * (dL_dMt[2][0] + dL_dMt[0][2]) + 2 * y * (dL_dMt[1][2] + dL_dMt[2][1]) - 4 * z * (dL_dMt[1][1] + dL_dMt[0][0]);

	// Gradients of loss w.r.t. unnormalized quaternion
	float4* dL_drot = (float4*)(dL_drots + idx);
	*dL_drot = float4{ dL_dq.x, dL_dq.y, dL_dq.z, dL_dq.w };//dnormvdv(float4{ rot.x, rot.y, rot.z, rot.w }, float4{ dL_dq.x, dL_dq.y, dL_dq.z, dL_dq.w });
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66

Yin的笔记本

Choose mode