StartseiteArtikel

Die weltweit größte Skala! Realsee, ein Open-Source-Innen-3D-Datensatz von Realsee

未来城不落2025-12-16 16:47
Als das erste Large Model für räumliche Tiefenschätzung, das die Eingabe von Panoramabildern unterstützt, wurde Argus 1.0 anhand der von Rushi angesammelten Datenbank mit tens von Millionen dreidimensionaler Räume trainiert.

Am 16. Dezember 2025 gab Realsee bekannt, dass es 10.000 Sätze von Innen-3D-Datensätzen namens Realsee3D für akademische Forschung und nicht-kommerzielle Zwecke offiziell freigibt. Dies könnte der weltweit derzeit größte 3D-Raumdatensatz sein. Das Ziel ist es, Forschern und Entwicklern im Bereich der Raumintelligenz eine hochwertige Datenbasis bereitzustellen und die technologische Iteration und die Umsetzung von Anwendungen in der gesamten Branche zu beschleunigen.

Realsee3D

Zuvor hat Realsee das Large Model für die Raumtiefenschätzung Argus1.0 veröffentlicht. Als erstes Large Model für die Raumtiefenschätzung, das Panoramabilder als Eingabe unterstützt, wurde Argus1.0 anhand der von Realsee angesammelten Datenbank mit tens von Millionen 3D-Räumen trainiert. Der jetzt freigegebene 3D-Datensatz Realsee3D besteht aus hochwertigen Stichproben, die aus dieser riesigen Datenbank ausgewählt wurden.

Vorteile des Datensatzes

Realsee3D ist ein umfangreicher, mehrperspektivischer RGB-D-Datensatz, der die Forschung auf dem Gebiet der Innen-3D-Wahrnehmung, -Rekonstruktion und -Szenerieverständnis vorantreiben soll. Der Datensatz weist die folgenden vorteilhaften Merkmale auf:

Extrem umfangreich

- 10.000 einzigartige Innen-3D-Szenen

- 95.962 unterteilte Zimmer-Einheiten

- 299.073 Paare von Blickpunkten/RGB-D-Bildern

Vollständige Annotationen

Um das Multi-Task-Learning zu ermöglichen, bieten wir detaillierte Ground-Truth-Annotationen, die nicht nur auf das Visuelle beschränkt sind, sondern auch auf die Geometrie und die Semantik erstrecken:

- Geometrieschicht: Es werden hochpräzise CAD-Zeichnungen und Grundrisse bereitgestellt.

- Semantische Schicht: Enthält 2D-Semantische-Segmentierungs- und 3D-Erkennungs-Labels.

Vielfältige Szenen

Um die Robustheit des Modells in komplexen realen Umgebungen sicherzustellen, haben wir eine Zwei-Motor-Strategie mit "echten Daten + programmgesteuert generierten Daten" gewählt:

- Gesammelte Daten: 1.000 reale Szenen (die komplexe Beleuchtung, Layouts und Spuren des Lebens in der realen physischen Welt erfassen)

- Synthetische Daten: 9.000 synthetische Szenen (basierend auf Stilvorlagen, die von über 100 professionellen Designern sorgfältig zusammengestellt wurden und eine Vielzahl von Möbelmodellen und Einrichtungsstilen umfassen)

Datentypen

  • Farbpanoramabilder
  • Tiefenbilder
  • Positionen
  • CAD-Zeichnungen
  • Wohnungsgrundrisse
  • Semantische Segmentierungs-Labels
  • 3D-Objekterkennungs-Labels

Farbpanoramabild

Tiefenbild

Oberflächennormalen

Semantische Segmentierungsbild

Einsatzgebiete

Seit langem steht der Forschung und der Anwendung im Bereich der Raumintelligenz ein kniffliges Problem entgegen: Es besteht ein großer Mangel an hochwertigen Raumdaten. Realsee füllt diesen Mangel dank seiner technologischen Akkumulation und Ressourcen im Bereich der 3D-Raumdaten.

Dieser Datensatz eignet sich für Kernforschungsthemen in der Raumintelligenz wie geometrische Rekonstruktion, Multi-Modality-Learning und Embodied Intelligence. Wir laden Forscher und Entwickler aus der ganzen Welt ein, den 3D-Datensatz Realsee3D herunterzuladen und zu nutzen, um gemeinsam die zukünftigen Grenzen der Raumintelligenzforschung zu erkunden.

Abrufmethode: Derzeit ist der Datensatz Realsee3D über die offizielle Plattform beantragbar. Man kann ihn über das Realsee-GitHub-Repository abrufen.