五千年(敝帚自珍)

主题:【图像处理求助】后续 -- 一双草鞋

共:💬5 🌺39
全看分页树展 · 主题
家园 【图像处理求助】后续

不好意思占用一个新主题的资源,因为无法回复那个【图像处理求助】出国的就别管了,先救救国内群众的急老帖了。

问题可以点击上面链接查看,我这里说说解决办法。

1. 按照 @假设 的建议,以FFmpeg软件提取关键帧,这个对于正确标记的或许有用,但是恰好我得到的这些视频大多标记并不对,常常搞错。

2. 基于 @小科 的建议,略有发展,即以每一帧前后若干帧(根据数据测试,我的这些视频前后各取2帧是个好的折中)作比较,若如果差别很小,则判断这帧为一个稳定的帧。在稳定的帧这个子集里,按照主贴办法去除重复,得到需要的单一帧。

3. 基于chatgpt的建议的算法。读取全部数据后,用kmeans做聚类分析。这需要自己给于一个聚类个数的假设。先取一个比较大的值,然后聚类完成后,再去看他们之间的距离,足够近就合并。但是后者效果不好。即我能得到几乎全部的希望得到的图片,但是会有部分重复,或不需要的转换帧。

另外我向chatgpt抱怨电脑性能不够,它建议我subsample还有把彩色改黑白,确实效果几乎不变的情况下,大大提升速度。

如果是能挣钱的话,我估计会在kmeans之前,加一个图像分割的步骤,比简单的像素做输入应该更好。当然整个任务弄个多层的神经网络更好,只是我缺乏足够精力去学习、细化这个东西了。

最后的处理是:先用主帖办法,失败后退到方法2,再失败退到方法3。这三个办法依次更消耗资源,需要手动参数越多,但是也越普适。

感谢前面提到的两位网友和 @盲人泪 , @小科 , @hamigua 的参与和关心。

全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河