三维视觉是计算机视觉的一个重要分支,在无人驾驶、安防、交通等领域都有重要的作用。《计算机视觉中的多视图几何》(MVG)是该领域的经典入门书籍。
今年来随着深度学习(DL)技术的兴起, DL在三维领域进行了大量的尝试和应用,诸如位姿估计,特征点提取和匹配等任务,都能见到DL的身影。不过,学习基于传统几何的立体视觉方法仍然是有必要的。一方面,短时间内基于严密数学推导的解法鲁棒性肯定是更高的;另一方面,DL也能在传统方法中汲取和挖掘创新点。
MVG的入门还是相对来说比较困难的,里面的一些概念,诸如无穷远点、无穷远线,对于初学者来说会非常抽象。记得当年选修MVG课程,时间在周五晚上的三连堂,连续三个小时的密集教学,加之其本身又抽象无比,基本所有学生都难以跟上节奏。同时,不像目前的大火的深度学习,MVG这本书籍缺少一些系统讲解和配套的代码,让理解其内容变得更加困难。
基于这个目的,写了一个这样MVG的jupyter教程帮助初学者入门,这也是对自己这几年学习和工作中的一些总结。教程里面只选取了书中在实际中应用最广泛的一些章节,并提供大量实际应用的例子,帮助理解和学习。
相关文章更新在知乎专栏 https://www.zhihu.com/column/c_1348590328891576320