DreamEdit3D: Personalization of Multi-View Diffusion Models for 3D Editing

Abstract

This project presents DreamEdit3D, a novel framework for personalized 3D scene editing by leveraging multi-view diffusion models. The approach enables users to edit 3D scenes with fine-grained control through personalized text-driven modifications while maintaining multi-view consistency. By personalizing multi-view diffusion models, DreamEdit3D ensures coherent edits across all viewpoints, avoiding the inconsistencies common in single-view editing approaches. The framework enables subject-driven 3D editing by fine-tuning diffusion models on user-provided reference images, allowing precise insertion and modification of objects in 3D scenes. Edited multi-view outputs are combined with 3D Gaussian Splatting for high-quality, real-time renderable 3D scene reconstruction.

Method

Our pipeline consists of three key stages: (1) personalizing a multi-view diffusion model on reference images, (2) generating consistent edited multi-view images via text-driven editing, and (3) reconstructing the final 3D scene using 3D Gaussian Splatting.

Results

Qualitative editing results demonstrating multi-view consistent 3D scene modifications.

cake → cake in plate

cheetah → cheetah lying on the floor

dog → cat

van → sport car

person → person wearing sunglasses

sofa → sofa redesigned to single seat

shoe → two shoes as a pair

eagle → two eagles together

Qualitative Comparisons

Visual comparison with MVEdit, PrEditor3D, and Vox-E.

cake → cake in plate

Original

MVEdit

PrEditor3D

Vox-E

Ours

sofa → redesigned to single seat

Original

MVEdit

PrEditor3D

Vox-E

Ours

van → convertible sport car

Original

MVEdit

PrEditor3D

Vox-E

Ours

dog → smiling dog

Original

MVEdit

PrEditor3D

Vox-E

Ours

cheetah → cheetah lying on floor

Original

MVEdit

PrEditor3D

Vox-E

Ours

basket → basket of apples

Original

MVEdit

PrEditor3D

Vox-E

Ours

plant → sunflower

Original

MVEdit

PrEditor3D

Vox-E

Ours

eagle → two eagles

Original

MVEdit

PrEditor3D

Vox-E

Ours

van → change color

Original

MVEdit

PrEditor3D

Vox-E

Ours

van → car

Original

MVEdit

PrEditor3D

Vox-E

Ours

dog → cat

Original

MVEdit

PrEditor3D

Vox-E

Ours

dog → pig

Original

MVEdit

PrEditor3D

Vox-E

Ours

shoes → shoes in red

Original

MVEdit

PrEditor3D

Vox-E

Ours

shoes → shoes as a pair

Original

MVEdit

PrEditor3D

Vox-E

Ours

human → smile with teeth

Original

MVEdit

PrEditor3D

Vox-E

Ours

human → wearing sunglasses

Original

MVEdit

PrEditor3D

Vox-E

Ours

boat → house boat

Original

MVEdit

PrEditor3D

Vox-E

Ours

boat → sailboat

Original

MVEdit

PrEditor3D

Vox-E

Ours

koala → lego koala

Original

MVEdit

PrEditor3D

Vox-E

Ours

robot → robot sitting

Original

MVEdit

PrEditor3D

Vox-E

Ours

lady → riding horse

Original

MVEdit

PrEditor3D

Vox-E

Ours

lady → sitting

Original

MVEdit

PrEditor3D

Vox-E

Ours

lady → lady with child

Original

MVEdit

PrEditor3D

Vox-E

Ours

lady → wearing blue T-shirt

Original

MVEdit

PrEditor3D

Vox-E

Ours

house → house with snow

Original

MVEdit

PrEditor3D

Vox-E

Ours

Diverse Editing Results

Demonstrating the diversity and flexibility of our editing framework across various object categories and prompts.

Input

Sunglasses (Seed 1)

Sunglasses (Seed 2)

Sunglasses (Seed 3)

Sunglasses (Seed 4)

Wearing Glasses

Input

Aged & Wrinkles

Close Eyes

Smile with Teeth

Spiky Hair

White Hair

Ablation Results

Analyzing the contribution of each component in our pipeline.

Loss Function Ablation

Original

w/o Attn Loss

w/o Masked Loss

w/o All Masks

Ours (Full)

Single-View vs Multi-View

Original

Single View 1

Single View 2

Single View 3

Ours (Multi-View)

Textual Inversion vs DreamBooth

Original

TI Only

w/o TI

Ours (TI + DB)

DreamEdit3D: Personalization of Multi-View Diffusion Models for 3D Editing

Abstract

Method

Results

Video

Qualitative Comparisons

Diverse Editing Results

Ablation Results

Loss Function Ablation

Single-View vs Multi-View

Textual Inversion vs DreamBooth

BibTeX