前回、前々回からUbuntu環境で Nerfstudioのセットアップして、どのようなワークステーションで処理するべきかをダラダラと考えました。そしてNerfstudioが扱うデータセットについてやCOLMAPやReartycaputerとの連携を紹介しました。

前回記事:その3
https://techietechnology.co.jp/2025/03/11/nerfstudio-data-setup/

今回は同一写真データセット(73枚)を用いて、Gaussian SplattingとPhotogrammetryによる3Dモデル再構築の特性差異を検証しました。両手法は複数写真から3Dモデルを生成する点で共通していますが、技術的アプローチが本質的に異なります。

Gaussian Splattingは3D空間内の楕円体(位置・向き・色・透明度)を直接最適化する点ベース手法です。一方、Photogrammetryは三角形ポリゴン集合とテクスチャから構成されるメッシュベース手法です。

全体比較においては、Gaussian Splattingはフローターと呼ばれるアーティファクトが散見されましたが、発色に優れていました。Photogrammetryは連続的表面構造により空間ノイズが少なく安定した印象を与えています。

細部比較(木箱の取っ手部分)では、Gaussian Splattingは細長いガウス関数が曲線に沿って連続的に配置されるため、滑らかな曲線表現を実現しています。対照的にPhotogrammetryでは三角形ポリゴンによる離散的近似のため、特に金属などの光沢部分でエッジのジグザグが顕著でした。両技術はそれぞれ特性が異なり、用途に応じた選択が重要です。

以下のような同一写真データセット(73枚)を使用しました。それぞれ比較した結果を見てみます。

全体の引きから比較します。Gaussian Splattingは、フローターと呼ばれるアーティファクトが目出します。フォトグラメトリは連続した表面として認識されるメッシュベースなので空間のゴミが少なく見えます。ガウシアンの方が発色が良い印象です。1枚目ガウシアン、2枚目フォトグラメトリです。

木の箱の取っ手部分に注目します。ガウシアンは各ガウス関数は楕円体状の特性を持ち形状や向きを調整できるため、細い曲線に沿って細長いガウス関数が自然に並びます。これらのガウス関数は空間的に連続的に配置され、レンダリング時には互いに滑らかに重なり合うため、取っ手の曲線が自然で滑らかに表現されます。

対照的に、フォトグラメトリによるメッシュ表現では、三角形ポリゴンという離散的な単位で形状を近似するため、特に細い曲線部分ではポリゴンのエッジがジグザグに見えてしまいます。光沢のある金属部分は写真からの分析が難しくメッシュがよりジグザクになります。

箱の紐を詳細に観察すると、ガウシアンは木箱と紐の境界線を正確に描写しています。対照的にフォトグラメトリでは箱のテクスチャーが紐の下部に若干混ざり込んでいます。

色彩表現においては、ガウシアンの方が全体的に発色が良好ですが、紐の網目構造の細部が失われています。フォトグラメトリでは網目構造がはっきりと確認できます。この違いはコントラスト処理の方法に起因している可能性があります。


撮影された角度からの描写を比較すると、ガウシアンは高い再現性を示しています。左側のガウシアン画像は右側のフォトグラメトリと比べて自然です。フォトグラメトリの品質自体も悪くはありません。撮影角度に沿った視点からの描写において、ガウシアンは写真のような質感と自然さを維持しながら3D空間を再構築できています。

写真のカバレッジが低い角度からの視点では、両手法の性能差が顕著になります。ガウシアンは撮影データが少ない角度からの描写において品質が著しく低下します。フォトグラメトリはそこまでの劣化が見られません。※フォトグラメトリでも写真がない部分に関しては情報が無いためメッシュ化が困難ですがガウシアンよりは良好です。

この差異は両技術の根本的な構造の違いに起因しています。ガウシアンは点ベースの手法であり、直接観測された情報に強く依存するため、データの薄い領域では適切なガウス関数の配置や特性の推定が困難になります。フォトグラメトリではメッシュ構造が全体として連続的な表面を形成するため、データの少ない部分でも周囲の情報から補完され、極端な品質低下を防いでいます。左ガウシアン、右フォトグラメトリ。

細部の文字の解像を見てみます。フォトグラメトリはテクスチャーを活用する手法であるため、細部の描写に強いです。メッシュ上に高解像度のテクスチャーを用意できるため細かなディテールの表現に優位性があります。

ガウシアンも撮影方法を最適化することで細部の再現性を向上させることが可能ですが、同一の写真から分析をした結果として、細部の質感や模様が重要な対象では、フォトグラメトリが適しているといえます。以下ガウス、フォトグラの写真です。

後処理についても軽く比較します。ガウシアンは2025年現在、不要部分の削除などの基本的な編集は可能です。将来的には微調整や追加機能も期待されますが、楕円体状のガウス関数はメッシュデータのような詳細な編集には本質的な制約があります。このため大規模な変更は難しいものの、今後専用ツールの開発が進むことで改善が見込まれるでしょう。

一方でフォトグラメトリから生成されるメッシュ&テクスチャーデータは従来型の3Dデータ形式であるため、既存の豊富なツールセットで編集が可能です。メッシュの修正、テクスチャーの調整、不足部分(底面など)の追加など柔軟な後編集ができます。例えば品質の低い紐部分を完全に作り直してCGモデルに置き換えるといった高度な処理も実現できます。この後処理の自由度と安定性は、フォトグラメトリが特に商用利用において優位性を持つ重要な要因となっています。以下、左がガウス、右がフォトグラデータです。

ガウシアンスプラッティングとフォトグラメトリは、どちらも複数写真から3Dシーンを再構築できる技術ですが、それぞれ異なる特性を持っています。ガウシアンスプラッティングは従来から、透明素材、反射面、単色表面、連続模様、細かい形状などの再現に優れていることが知られています。特にガラスや光沢のある物体、植物の葉のような薄い構造物の表現に強みがあります。これらは知られていることなので検証はしませんでした。

必要写真データ量については、ガウシアンはより少ないデータで済むという意見もありますが、高品質な結果を求める場合は多くの写真が必要になります。一概に少なくて済むとは言えません。表示効率においては、ガウシアンがWebブラウザでの軽量表示に適している一方、フォトグラメトリもリトポロジー処理によって軽量化が可能です。これらは使用目的や表示方法によって優劣が変わるため、単純比較は適切ではないとも言えます。

総合的には、対象物の特性と利用目的に応じて最適な技術を選択することが重要です。それぞれが得意とする領域で活用することで、最良の結果が得られます。今回の検証は木の箱を使い、これらの特性をより明確に可視化することを目的としました。

分析結果から、実写に基づく簡易3Dデータ作成にはガウシアンスプラッティングが優れていることがわかりました。特に迅速な視覚化と写真に忠実な見た目の再現に強みがあります。一方、フォトグラメトリは後処理を前提としたより自由度の高い高品質3Dデータ制作に最適です。既存の3Dツールとの互換性が高く、商用利用に適した柔軟性を備えています。

興味深い点として、ガウシアンスプラッティングは形状を厳密に保証しないデータ形式であり、3D構造としては必ずしも正確ではありませんが、視覚的な印象としてはより正確に感じられることがあります。これは写真からの見た目に強く依存する特性によるものです。

つづく