Skip to content

Latest commit

 

History

History
99 lines (48 loc) · 4.23 KB

README.md

File metadata and controls

99 lines (48 loc) · 4.23 KB

Grab_cut

Grab的python代码复现

用到的库

import numpy as np

import cv2

import maxflow

代码略述

一共写了两个版本的迭代

Gbv1是只迭代一轮的代码

Gbv2的迭代是每次都用kmeans重新聚类

Gbv2.5 的迭代是严格按照原论文和opencv源码的迭代,运行速度较慢

Gbv3是打算加快运行速度的,但并没有实现,目前运行速度可提升的方向是constructGCGraph函数

具体而言,构建图速度较慢,可以考虑numpy的向量化或多线程,但多线程效果好像并不理想(一次迭代需要610s,一般情况迭代12次效果就比较理想了)

代码使用说明:

运行代码首先人为给定框,按下enter或space键确认

运行效果图:

调试过程

首先是无符号整型数溢出不会报错

calcBeta,在这个函数中遇到了越界的情况,要将uint8转成astype(np.float32)

其次,因为参数gamma 设置地不好,源码中设置为50,我10~50地测试效果都不理想,心态破防,后来设为2,code奇迹般的work了。

换了几个最大流的库,发现pymaxflow最快

聚类直接用opencv的接口最快

能用numpy向量操作的尽量用numpy向量操作,for循环运行速度慢

ML课设

实现了基于自注意力机制的自动抠图算法

基于自注意力机制的自动抠图可以通过以下四个简单步骤完成:

  1. 加载预训练的图像分类模型:首先,需要加载一个预训练的图像分类模型,例如使用深度学习模型如ResNet、VGG等。这些模型已经在大规模图像数据上进行了训练,可以用于图像分类任务。

  2. 进行预测并计算损失:使用加载的图像分类模型对目标图像进行预测。根据预测结果和真实标签,计算损失函数。

  3. 在图像空间上进行反向传播以生成显著图:通过将损失函数反向传播到输入图像,可以计算每个像素对于预测结果的贡献程度。这样可以生成一个显著图,指示图像中每个像素的重要程度。

  4. 利用形态学操作,对显著图先膨胀再腐蚀,以在将来获取更为精确的图像方框。

  5. 执行Grabcut算法进行图像分割:利用生成的显著图,可以将其作为先验知识,结合Grabcut算法来进行图像分割。Grabcut算法通过对图像中的前景和背景进行迭代优化,根据显著性信息进行分割,得到最终的分割结果。

复现体悟

第一次将数学知识运用起来,觉得还是挺神奇的。经典算法。

kmeans+GMM+最小割

概率论+图论

其实也可以不用kmeans,但kmeans算法比em快很多,权衡之下用的kmeans。

以后不用pycharm全面投入vsc了。vsc真的界面很清爽。

从论文理解到复现一共花了三天,本来要用c++的,但配环境花了很久最后虽然配好了,但兴趣索然全失,毕竟opencv就是C++写的,再把code重敲一遍意义不大。

但C++还是挺重要的,它运行速度很快,有空再重拾一下C++,尽管用C++刷力扣,但用C++做项目的经历还是很少,第一次下载Clion这个ide,第一次用msys2配环境,第一次了解Cmake。怀疑以前学了个假C++课。

做这个的时候面临两个期中考试,一次非限课ppt汇报,扁桃体发炎+咳嗽+角膜炎,xs人有时很脆弱有时又很强大。

不管结果如何,就当一次切磋吧,我也是有收获的。人生也只是一场没有终点的修行罢了。

最后感谢chatgpt的帮助!

推荐博客

opencv源码

csdn

如果你觉得本仓库帮助到了你,欢迎star!