Fichier

Utilisez des enregistrements de fichiers en tant qu’entrée dans ArcGIS Data Pipelines.

Remarques sur l’utilisation

Voici quelques points à garder à l’esprit lorsque vous utilisez des fichiers :

Si vous utilisez des fichiers en entrée, vous pouvez charger des données à partir des fichiers disponibles dans le contenu ArcGIS.
Lorsque vous ajoutez un fichier en entrée à la zone d’affichage, la boîte de dialogue Select a file (Sélectionner un fichier) apparaît avec les options suivantes :
- Browse to existing files (Accéder aux fichiers existants) – Accédez au contenu d’un élément chargé précédemment. Vous pouvez parcourir votre contenu, le contenu qui est partagé avec vous et le contenu disponible pour votre organisation.
- Upload a new file (Charger un nouveau fichier) - Chargez un fichier à partir d’un disque ou d’un partage réseau. Pour plus d’informations, reportez-vous à la rubrique Ajouter des fichiers en tant qu’éléments.
Data Pipelines ne prend pas en charge tous les types de fichier qu’il est possible de charger directement dans votre contenu. Pour connaître les formats pris en charge, reportez-vous aux informations ci-après concernant les formats de fichier.
Le paramètre File format (Format de fichier) indique automatiquement le format du fichier que vous sélectionnez. Les options de format suivantes sont pris en charge :
- CSV or delimited (CSV ou délimité) - Fichier contenant des valeurs délimitées (.csv)
- Shapefile - Dossier compressé contenant un jeu de fichiers associés constituant le shapefile (.shp)
- GeoJSON - Format ouvert standard d’échange de données géospatiales représentant des entités géographiques simples et leurs attributs non spatiaux (.geojson ou .json)
- Parquet - Format de stockage non spatial hautement compressé, tabulaire orienté colonne et de partage (.parquet)
- File Geodatabase (Géodatabase fichier) - Géodatabase fichier compressée (.gdb)

Si l’option de format CSV or delimited (CSV ou délimité) est spécifiée, les paramètres de définition de jeu de données suivants sont disponibles :

Delimiter (Délimiteur) - délimiteur utilisé pour fractionner les valeurs de champ (ou de colonne) et d’enregistrement (ou de ligne). Vous pouvez sélectionner l’une des options suivantes ou saisir votre propre valeur :
- Comma (,) (Virgule [,]) : les valeurs des champs et des enregistrements sont séparées par des virgules (,). Il s’agit de l’option par défaut.
- Tab (\t) (Tabulation [\t]) : les valeurs des champs et des enregistrements sont séparées par des tabulations (\t).
- Pipe (|) (Barre verticale [|]) : les valeurs des champs et des enregistrements sont séparées par des barres verticales (|).
- Semicolon (;) (Point-virgule [;]) : les valeurs des champs et des enregistrements sont séparées par des points-virgules (;).
- Space ( ) (Espace ) : les valeurs des champs et des enregistrements sont séparées par des espaces ( ).

Si vous saisissez votre propre valeur, elle doit comporter un ou deux caractères, espaces compris. Les délimiteurs de plus de deux caractères ne sont pas pris en charge.

Has header row (Comporte une ligne d’en-tête) - Indique si le jeu de données contient une ligne d’en-tête. Par défaut, la valeur est définie sur true (vrai). Si la valeur est définie que false (faux), la première ligne du jeu de données est considérée comme un enregistrement.
Has multiline data (Comporte des données multilignes) - Indique si le jeu de données a des enregistrements contenant des caractères de nouvelle ligne. Par défaut, cette propriété est définie sur faux. Si la valeur est définie sur true (vrai), les données contiennent des données multilignes lues et mises en forme comme il convient.
Character encoding (Encodage des caractères) – Type d’encodage utilisé pour lire le jeu de données spécifié. La valeur par défaut est UTF-8. Vous pouvez sélectionner l’une des options d’encodage disponibles ou indiquez un type d’encodage. Les espaces ne sont pas pris en charge dans les valeurs d’encodage. Par exemple, la spécification d’une valeur ISO 8859-8 est incorrecte ; la valeur doit plutôt être spécifiée comme ISO-8859-8.
Fields (Champs) : configure éventuellement les noms et les types de champ. Le bouton Configure schema (Configurer la structure) ouvre une boîte de dialogue qui contient les champs de jeu de données avec les options suivantes :
- Include or drop fields (Inclure ou supprimer des champs) – Vous pouvez supprimer des champs en cochant la case en regard du champ concerné. Par défaut, tous les champs sont inclus.
- Field name (Nom de champ) : nom du champ tel qu’il est utilisé dans Data Pipelines. Cette valeur peut être modifiée. Par défaut, cette valeur sera identique à celle du champ dans le jeu de données source sauf si le nom source contient des caractères non valides ou est un mot réservé. Les caractères non valides seront remplacés par un trait de soulignement (_) et les mots réservés se verront ajouter un trait de soulignement (_) en préfixe.
- Field type (Type de champ) : type de champ tel qu’il est utilisé dans Data Pipelines.

La suppression ou la modification des champs dans Data Pipelines ne modifie pas les données sources.

Le tableau suivant décrit les types de champ disponibles :

Type de champ	Description
Chaîne	Les champs de type chaîne prennent en charge une chaîne de caractères de texte.
Entier petit	Les champs de type entier petit prennent en charge les nombres entiers compris entre -32768 et 32767.
Entier	Les champs de type entier prennent en charge les nombres entiers compris entre -2147483648 et 2147483647.
Entier très grand	Les champs de type entier très grand prennent en charge les nombres entiers compris entre -9223372036854776000 et 9223372036854776000.
Flottant	Les champs de type flottant prennent en charge les nombres fractionnels compris approximativement entre -3,4E38 et 3,4E38.
Double	Les champs de type double prennent en charge les nombres fractionnels compris approximativement entre -2,2E308 et 1,8E308.
Date	Les champs de type date prennent en charge les valeurs au format `yyyy-MM-dd HH:mm:ss`, par exemple, la valeur `2025-12-31 13:30:30`. Si les valeurs de date sont stockées dans un format différent, utilisez l’outil Créer un champ de date/heure pour calculer un champ de date.
Date uniquement	Les champs de type date prennent en charge les valeurs au format `yyyy-MM-dd`, par exemple, la valeur `2025-12-31`. Si les valeurs de date uniquement sont stockées dans un autre format, utilisez-les comme entrées de l’outil Calculate field (Calculer un champ) pour calculer un champ de date uniquement.
Booléen	Les champs de type booléen prennent en charge les valeurs `True` et `False`. Si un champ contient des représentations entières de valeurs booléennes (0 et 1), utilisez l’outil Mettre à jour des champs pour redéfinir les entiers en valeurs booléennes à la place.

Si l’option de format GeoJSON est spécifiée, le paramètre Geometry type (Type de géométrie) est disponible. Ce paramètre est facultatif. Par défaut, le type de géométrie dans le fichier GeoJSON est utilisé. Si le fichier GeoJSON contient plusieurs types de géométrie, vous devez indiquer la valeur de ce paramètre. Les types de géométrie mixtes ne sont pas pris en charge et seul le type spécifié est utilisé. Les options sont Point, Multipoint, Polyline (Polyligne) et Polygon (Polygone). Un champ de géométrie contenant les localisations des données GeoJSON est automatiquement calculé et ajouté au jeu de données en entrée. Le champ de géométrie peut être utilisé en entrée pour les opérations spatiales ou permet d’activer la géométrie sur le résultat en sortie.

Si l’option de format File Geodatabase (Géodatabase fichier) est spécifiée, le paramètre Feature class or table name (Nom de la table ou classe d’entités) est disponible. Utilisez ce paramètre pour spécifier le nom de la classe d’entités ou de la table à utiliser comme entrée. Seules les tables et les classes d’entités ponctuelles, multi-points, polylignes et surfaciques sont prises en charge. Les jeux de données de type raster, mosaïque, trajectoire, etc. ne sont pas pris en charge. Les types d’entité avancés tels que les entités de réseau géométrique ne sont pas pris en charge.

Pour améliorer les performances de lecture des jeux de données en entrée, vous pouvez utiliser les options suivantes :
- Utilisez le paramètre Use caching (Utiliser la mise en cache) pour stocker une copie du jeu de données. La copie en cache est conservée uniquement si au moins un onglet de navigateur ouvert sur l’éditeur est connecté. Cela peut accélérer l’accès aux données lors du traitement. Si les données sources ont été mises à jour depuis leur mise en cache, désélectionnez ce paramètre et prévisualisez ou exécutez à nouveau l’outil.
- Après avoir configuré un jeu de données en entrée, configurez l’un des outils suivants pour limiter la quantité de données traitées :
  - Filtrer par attribut : conservez un sous-ensemble d’enregistrements contenant certaines valeurs attributaires.
  - Filtrer selon l’étendue - conserve un sous-ensemble d’enregistrements dans une certaine étendue spatiale.
  - Sélectionner des champs - Conserve uniquement les champs d’intérêt.
  - Clip (Découper) : conservez un sous-ensemble d’enregistrements qui intersectent des géométries spécifiques.

Limitations

Les limitations connues sont les suivantes :

Les fichiers Excel (.xlsx) ne sont pas pris en charge dans Data Pipelines.
Le chargement des fichiers texte (.txt), des fichiers ORC (.orc), des fichiers JSON (.json), des fichiers GeoParquet (.parquet) et des fichiers EsriJSON (.esrijson) n’est pas pris en charge. Pour plus d’informations, reportez-vous à la rubrique Contenu que vous pouvez ajouter dans le portail ArcGIS Enterprise.
Si vous possédez un fichier .txt qui comporte des valeurs délimitées, enregistrez-le au format .csv et chargez-le dans ce format.
Si le jeu de données inclut des noms de champ comportant des espaces ou des caractères non valides, les noms sont automatiquement mis à jour pour utiliser des traits de soulignement à la place. Ainsi, un champ nommé Population 2022 est renommé en Population_2022 et un champ nommé %Employed est renommé en _Employed.

Licences requises

Les licences et configurations suivantes sont requises :

Type d’utilisateur Creator ou Professional
Rôle d’éditeur, de facilitateur ou d’administrateur, ou rôle personnalisé équivalent

Afin d’en savoir plus sur la configuration requise pour Data Pipelines, reportez-vous à la rubrique Configuration requise.

De plus, Data Pipelines n’est disponible que si vous disposez d’une instance ArcGIS Data Pipelines Server configurée avec ArcGIS Enterprise.

Pour plus d’informations, reportez-vous à la rubrique Ajouter des fichiers en tant qu’éléments.

Fichier

Remarques sur l’utilisation

Limitations

Licences requises

Rubriques connexes