导数

标量求导和向量求导是矩阵求导的特殊情况。向量求导使用的频率较高。对向量求导时运用乘法和除法公式时会出现标量求导,这里记录一下各种求导的结果。

阅读更多

光线投射(raycast)公式中的far-clip

光线投射公式

从相机发出一条光线,穿过与相机距离为1的屏幕上的某点,已知相机参数和点在屏幕空间上的位置(sx,sy),计算世界空间中投影到该点的对应点的坐标的公式为: \[ P = ViewMat^{-1} * ProjMat^{-1} * ((sx, sy, 1, 1) * farClip). \]

阅读更多

浮点数

浮点数的表示方法为 \[ v=(-l)^s M 2^E \] 对于规范化编码(Normalized Encoding),M是frac的部分加1得到的,所以能表示的最小的正数是\(2^{E_{min}}\)。因此需要引入非规范化编码(Denormalized Encoding),它的M不需要加1,E=1-Bias。最小的数是0。

跨页表格的题注

使用latex写文章,尤其是和图像相关的文章时,常常会遇到需要用图片表格的情况。为了能够跨页,我们可以使用longtable。因为图片较大,如果没有刻意缩小,那么表格就会跨页。有的文章接收方会要求跨页表格在第二页顶部增加额外的题注来接上上一页的表格,以及第一个题注在表格顶部。

跨页题注

https://tex.stackexchange.com/questions/115195/table-captions-continued 给出了一个解决方法。

阅读更多

在latex项目里用plotneuralnet

plotneuralnet是一个绘制神经网络的工具,使用该工具可以将python脚本转换为latex脚本,编译得到pdf。需要以下几个步骤:

  1. 下载plotneuralnet的github源码,https://github.com/HarisIqbal88/PlotNeuralNet
  2. 找一个latex环境,可以是win/linux/overleaf,前两种需要安装latex的环境,比如texlive,可以参考https://github.com/luanshiyinyang/PlotNeuralNet,texlive在这里可以找到https://mirrors.tuna.tsinghua.edu.cn/CTAN/systems/texlive/Images/。
  3. 写好脚本my_arch.py(名字可以随便起)放在源码的pyexamples文件夹下,编写的教程可以在其他地方搜到。
  4. 直接用python运行python my_arch.py,可以看到目录下的my_arch.tex
阅读更多

JOKR笔记

JOKR: Joint Keypoint Representation for Unsupervised Cross-Domain Motion Retargeting

摘要

原视频和目标视频形状不同时,之前专注于特定对象先验的方法就会失败,作者提出联合关键点表达可以捕捉原视频和目标视频都有的动作,而且不需要物体先验或者数据采集。使用domain confusion项有利于对于两个domain的动作的一致的部分的解耦,可区分的外观和动作使得捕捉其中一个视频动作同时描绘另一个视频的风格的视频得以生成。

为处理物体有不同比例缩放或者不同方向的情形,作者应用了JOKR之间的仿射变换。这使得表达具有仿射不变性。

阅读更多