セマンティックセグメンテーションとは、画像内の各ピクセルをクラスとして分類する作業です。理想的には、すべてのピクセルに正確なアノテーションが必要ですが、これが困難な場合、粗いアノテーションのみを行うことが可能です。この記事では、エンコーダ・デコーダアーキテクチャを用いたモデルに対する正則化手法が提案されています。特に、ピクセルの色や位置に基づいたSLICスーパー・ピクセルの形成を促し、境界間の整合性を改善します。この手法はFCN-16フルコンボリューショナルネットワークに適用され、SUIM、Cityscapes、PanNukeデータセットで評価されています。その結果、粗いアノテーションで訓練された際の境界再現率が最先端のモデルと比較して大幅に改善されることが示されました。