Dateifreigabe
Verwenden Sie Datensätze aus Netzwerkfreigabe-Dateien als Eingabe in ArcGIS Data Pipelines.
Verwendungshinweise
Beachten Sie beim Arbeiten mit Dateifreigaben Folgendes:
Mit der Eingabe "Dateifreigabe" können Sie Datendateien oder Dateisammlungen laden, die in Dateisystemen oder Netzwerkfreigaben gespeichert sind, auf die ArcGIS Data Pipelines Server zugreifen kann.
Um ein Dataset aus einer Dateifreigabe zu verwenden, müssen Sie zuerst ein Data-Store-Element vom Typ "Ordner" erstellen. In Data-Store-Elementen werden Verbindungsinformationen, einschließlich des Pfads der Dateifreigabe, sicher gespeichert, sodass die Daten von Data Pipelines ausgelesen werden können. Weitere Informationen finden Sie unter Hinzufügen von Data-Store-Elementen des Typs "Ordner".
- Um das von Ihnen konfigurierte Data-Store-Element zu ändern, verwenden Sie den Parameter Data-Store-Element, um das aktuell ausgewählte Element zu entfernen, und verwenden Sie die Schaltfläche Element auswählen, um den Inhalt zu durchsuchen und ein vorhandenes Data-Store-Element auszuwählen.
Geben Sie mit dem Parameter Dataset-Pfad den Namen des Datasets oder den Namen des Ordners mit dem Dataset an. Sie können beispielsweise Dataset-Pfade auf folgende Weise angeben:
Referenzieren Sie eine einzelne Datei, indem Sie den Pfad zu dieser Datei angeben, z. B.
Hurricanes.shpoderCustomerInfo.csv.Referenzieren Sie einen Ordner mit mehreren Datasets, indem Sie einen Pfad angeben, z. B.
MyFolder/. Alle Dateien im Ordner müssen das gleiche Schema und den gleichen Dateityp aufweisen.Referenzieren Sie bestimmte Dateitypen aus einem Ordner mit mehreren Dateien und Formaten, indem Sie einen Pfad wie
MyFolder/*.parquetangeben. In diesem Beispiel werden nur Parquet-Dateien gelesen. Alle Parquet-Dateien im Ordner müssen das gleiche Schema aufweisen.Referenzieren Sie mehrere Dateien und verschachtelte Ordner mit Glob-Mustern, indem Sie einen Pfad wie
MyFolder/**/*.geojsonangeben. In diesem Beispiel werden alle Unterordner unter "MyFolder" und alle GeoJSON-Dateien in diesen Unterordnern geladen.
Der Dataset-Pfad muss außerdem relativ zum Ordnerpfad sein, der beim Erstellen des Data-Store-Elements angegeben wurden. Beispiel: Wenn der vollständige Dataset-Pfad
\\mynetworkshare\data\hurricanes\hurricanes_2025.csvlautet und vom Data-Store-Element\\mynetworkshare\datafür den Pfad angegeben wird, sollte der Dataset-Pfadhurricanes\hurricanes_2025.csvlauten.
Das Dateiformat des Datasets, das Sie im Parameter Dataset-Pfad angegeben haben, geben Sie im Parameter Dateiformat an. Die folgenden Formatoptionen sind verfügbar:
CSV oder durch Trennzeichen getrennt (z. B.
.csv,.tsvund.txt)Parquet (
.parquet)GeoParquet (
.parquet)JSON (z. B. eine
.json- oder.txt-Datei mit Daten im JSON-Format)GeoJSON (z. B.
.jsonund.geojsonoder eine.txt-Datei mit Daten im GeoJSON-Format)Shapefile (
.shp)File-Geodatabase (
.gdb)ORC (
.orc)
Wenn die Formatoption CSV oder durch Trennzeichen getrennt angegeben ist, sind die folgenden Parameter für die Dataset-Definition verfügbar:
Trennzeichen: Das Trennzeichen, mit dem Feld- und Datensatzwerte (bzw. Spalten- und Zeilenwerte) getrennt werden. Sie können die folgenden Optionen auswählen oder einen eigenen Wert eingeben:
Komma (,): Feld- und Datensatzwerte werden durch Kommas (
,) getrennt. Dies ist die Standardeinstellung.Tabstopp (\t): Feld- und Datensatzwerte werden durch Tabstopps (
\t) getrennt.Senkrechter Strich (|): Feld- und Datensatzwerte werden durch senkrechte Striche (
|) getrennt.Semikolon (;): Feld- und Datensatzwerte werden durch Semikolons (
;) getrennt.Leerzeichen ( ): Feld- und Datensatzwerte werden durch Leerzeichen ( ) getrennt.
Wenn Sie einen eigenen Wert eingeben, muss dieser einschließlich Leerzeichen ein oder zwei Zeichen lang sein. Trennzeichen mit mehr als zwei Zeichen werden nicht unterstützt.
Hat Kopfzeile: Gibt an, ob das Dataset eine Kopfzeile enthält. Der Standardwert ist "true". Bei der Festlegung auf "False" wird die erste Zeile als Datensatz verarbeitet.
Hat mehrzeilige Daten: Gibt an, ob das Dataset Datensätze umfasst, die Zeilenumbruchzeichen enthalten. Der Standardwert ist "false". Wenn "true" festgelegt ist, werden Daten, die mehrzeilige Daten umfassen, richtig gelesen und formatiert.
Zeichencodierung: Gibt den zum Lesen des angegebenen Datasets verwendeten Codierungstyp an. Die Standardeinstellung ist UTF-8. Sie können aus den verfügbaren Codierungsoptionen auswählen oder einen Codierungstyp angeben. Leerzeichen werden in Codierungswerten nicht unterstützt. So ist beispielsweise der Wert "ISO 8859-8" ungültig. Stattdessen muss "ISO-8859-8" angegeben werden.
Felder: Optional können Feldnamen und -typen konfiguriert werden. Mit der Schaltfläche Schema konfigurieren wird ein Dialogfeld geöffnet, das Dataset-Felder mit den folgenden Optionen enthält:
Felder einbeziehen oder löschen: Sie können Felder entfernen, indem Sie das Kontrollkästchen neben dem entsprechenden Feld aktivieren. Standardmäßig werden alle Felder eingeschlossen.
Feldname: Der in Data Pipelines verwendete Name des Feldes. Dieser Wert kann bearbeitet werden. Standardmäßig ist dieser Wert mit dem des Feldes im Quellen-Dataset identisch, es sei denn, der Quellenname enthält ungültige Zeichen oder stellt ein reserviertes Wort dar. Ungültige Zeichen werden durch einen Unterstrich (_) ersetzt, und reservierten Wörtern wird ein Unterstrich (_) vorangestellt.
Feldtyp: Der Feldtyp, wie er in Data Pipelines verwendet wird.
Das Entfernen oder Ändern von Feldern in Data Pipelines hat keine Auswirkungen auf die Quelldaten.
In der folgenden Tabelle werden die verfügbaren Feldtypen beschrieben:
Feldtyp Beschreibung Zeichenfolge Felder des Typs "Zeichenfolge" unterstützen eine Zeichenfolge aus Textzeichen. Small Integer Felder des Typs "Small Integer" unterstützen ganze Zahlen zwischen -32768 und 32767. Integer Felder des Typs "Integer" unterstützen ganze Zahlen zwischen -2147483648 und 2147483647. Big Integer Felder des Typs "Big Integer" unterstützen ganze Zahlen zwischen -9223372036854776000 und 9223372036854776000. Float Felder des Typs "Float" unterstützen Bruchzahlen zwischen ca. -3,4E38 und 3,4E38. Double Felder des Typs "Double" unterstützen Bruchzahlen zwischen ca. -2,2E308 und 1,8E308. Datum Felder des Typs "Datum" unterstützen Werte im Format yyyy-MM-dd HH:mm:ss, ein gültiger Wert ist z. B.2025-12-31 13:30:30. Wenn die Datumswerte in einem anderen Format gespeichert sind, berechnen Sie mit dem Werkzeug Datums-/Uhrzeitfeld erstellen ein Datumsfeld.Nur Datum Felder des Typs "Datum" unterstützen Werte im Format yyyy-MM-dd, ein gültiger Wert ist z. B.2025-12-31. Wenn die Werte des Typs "Nur Datum" in einem anderen Format gespeichert sind, verwenden Sie die Werte als Eingabe für das Werkzeug Feld berechnen, um ein Feld vom Typ "Nur Datum" zu berechnen.Boolesch Felder des Typs "Boolesch" unterstützen die Werte TrueundFalse. Wenn ein Feld Integer-Darstellungen boolescher Werte (0 und 1) enthält, wandeln Sie mit dem Werkzeug Felder aktualisieren die ganzen Zahlen in boolesche Werte um.
- Wenn die Formatoption JSON angegeben ist, ist der Parameter Stammeigenschaft verfügbar. Mit diesem Parameter können Sie eine Eigenschaft in der JSON-Struktur angeben, aus der Daten gelesen werden sollen. Sie können verschachtelte Eigenschaften referenzieren, indem Sie ein Dezimaltrennzeichen zwischen den einzelnen Eigenschaften verwenden, z. B.
property.subProperty. Standardmäßig wird die vollständige JSON-Datei gelesen.
- Wenn die Formatoption GeoJSON angegeben ist, ist der Parameter Geometrietyp verfügbar. Dieser Parameter ist optional. Standardmäßig wird der Geometrietyp in der GeoJSON-Datei verwendet. Wenn die GeoJSON-Datei mehrere Geometrietypen enthält, müssen Sie einen Wert für diesen Parameter angeben. Gemischte Geometrietypen werden nicht unterstützt. Es wird nur der angegebene Typ verwendet. Die Optionen lauten Punkt, Multipoint, Polylinie und Polygon. Ein Geometriefeld mit den Positionen der GeoJSON-Daten wird automatisch berechnet und dem Eingabe-Dataset hinzugefügt. Das Geometriefeld kann als Eingabe für räumliche Operationen oder zum Aktivieren der Geometrie im Ausgabeergebnis verwendet werden.
- Bei Angabe der Formatoption File-Geodatabase ist der Parameter Feature-Class- oder Tabellenname verfügbar. Geben Sie mit diesem Parameter den Namen der Feature-Class oder Tabelle an, die Sie als Eingabe verwenden möchten. Es werden nur Point-, Multipoint-, Polyline- und Polygon-Feature-Classes und -Tabellen unterstützt. Datasets vom Typ Raster, Mosaik, Trajektorie usw. werden nicht unterstützt. Erweiterte Feature-Typen wie Features in geometrischen Netzwerken werden nicht unterstützt.
Mit den folgenden Optionen können Sie die Performance beim Lesen von Eingabe-Datasets verbessern:
Verwenden Sie den Parameter Caching verwenden, um eine Kopie des Dataset zu speichern. Die gecachte Kopie wird nur beibehalten, solange mindestens eine im Editor geöffnete Browser-Registerkarte verbunden ist. Dadurch wird der Zugriff auf die Daten bei der Verarbeitung möglicherweise beschleunigt. Wenn die Quelldaten aktualisiert wurden, nachdem sie gecacht wurden, deaktivieren Sie diesen Parameter, und zeigen Sie eine Vorschau an, oder führen Sie das Werkzeug erneut aus.
Konfigurieren Sie nach dem Konfigurieren eines Eingabe-Dataset die folgenden Werkzeuge, mit denen die Menge der verarbeiteten Daten begrenzt wird:
Nach Attribut filtern: Es wird eine Teilmenge der Datensätze beibehalten, die bestimmte Attributwerte enthalten.
Nach Ausdehnung filtern: Es wird eine Teilmenge der Datensätze innerhalb einer bestimmten räumlichen Ausdehnung beibehalten.
Felder auswählen: Es werden nur die Felder von Interesse beibehalten.
Ausschneiden: Es wird eine Teilmenge der Datensätze beibehalten, die sich mit bestimmten Geometrien überschneiden.
Einschränkungen
Die folgenden Einschränkungen sind bekannt:
Der Data Store vom Typ "Ordner" muss bei ArcGIS Data Pipelines Server registriert sein.
Der im Data Store vom Typ "Ordner" angegebene Pfad muss absolut sein. Relative Pfade werden nicht unterstützt.
Bei dem im Data Store vom Typ "Ordner" angegebenen Pfad sollte es sich um eine Netzwerkfreigabe und kein lokales Laufwerk handeln. Die Verwendung lokaler Laufwerke, wie z. B.
c:\, wird für Data Pipelines Server-Sites mit mehreren Computern nicht unterstützt.
Lizenzanforderungen
Die folgenden Lizenzen und Konfigurationen werden benötigt:
Benutzertyp "Creator" oder "Professional"
Publisher-, Vermittler- oder Administratorrolle oder eine entsprechende benutzerdefinierte Rolle
Weitere Informationen zu den Anforderungen für Data Pipelines finden Sie unter Anforderungen.
Darüber hinaus ist Data Pipelines nur verfügbar, wenn Sie einen ArcGIS Data Pipelines-Server mit ArcGIS Enterprise konfiguriert haben.
Verwandte Themen
Weitere Informationen zum Hinzufügen von Data-Store-Elementen zu Ihren Inhalten finden Sie unter Hinzufügen von Data-Store-Elementen.