恭喜 @李家銘 @周依璇 在CVPR NTIRE2024 Image super-resolution上斬獲全球第6! (6/199 = Top3%)。NTIRE是每年都會在CVPR上舉辦的知名workshop,其促進了研究人員對影像復原、增強和操作等關鍵電腦視覺任務的廣泛理解及討論。具體來說,是關於如何恢復退化的影像內容並填充缺失的信息,或實現所需目標(增強關於感知品質、內容、或處理此類影像的應用程式的性能)。
現今大家都透過swin-transformer為基礎模型去嘗試增大模型receptive field或設計複雜的模塊來增強模型萃取特徵的能力。然而,我們觀察出了一個普遍的現象,就是特徵圖的強度分布往往會隨著網路深度增加而變大,但在最末端的時候被抑制到一個較小的區間,這可能隱式地限制了模型的效能上界,因為空間訊息會因為遭逢資訊瓶頸而丟失,而導致大家需要設計非常複雜的網路或模塊才能推進SR模型的上界。因此,我們提出了Dense-residual-connected Transformer (DRCT) 旨在透過結合dense-connection來穩定前向過程,讓SR模型能夠”遠離”資訊瓶頸,相比於現今SOTA模型省了33%的參數量就能在效能上有所突破!