Файл
Используйте записи в файлах в качестве входных данных для ArcGIS Data Pipelines.
Примечания по использованию
При работе с файлами помните следующее:
Использование входных файлов позволяет загружать данные из файлов, доступных в ресурсах ArcGIS.
При добавлении файла входных данных на канву появится диалоговое окно Выбрать файл со следующими опциями:
Перейти к существующим файлам — просмотреть ресурсы в поисках ранее загруженного элемента. Вы можете просматривать свои ресурсы, ресурсы, которые опубликованы для вас, а также ресурсы, доступные вашей организации.
Загрузить новый файл – загрузить файл с диска или из общей сетевой папки. Более подробно см. Добавление файлов в качестве элементов.
Data Pipelines не поддерживает все типы файлов, которые можно загружать непосредственно в ваши ресурсы. См. информацию о поддерживаемых форматах ниже.
Параметр Формат файла автоматически заполняется форматом выбранного файла. Поддерживаются следующие опции формата:
CSV или с разделителями — файл, содержащий значения, разделенные символом-разделителем (
.csv)Шейп-файл — архивированная папка, содержащая набор связанных файлов, составляющих шейп-файл (
.shp)GeoJSON — открытый стандартный формат обмена геопространственными данными, который содержит простые географические объекты и их непространственные атрибуты (
.geojsonили.json)Parquet — сильно сжатый ориентированный на столбцы табличный формат непространственного хранения и совместного использования (
.parquet)Файловая база геоданных — архивированная файловая база геоданных (
.gdb)
Если указана опция формата CSV или с разделителями, доступны следующие параметры определения набора данных:
Разделитель — Разделитель, используемый для разделения значений поля (или столбца) и записи (или строки). Вы можете выбрать из следующих вариантов или ввести свое собственное значение:
Запятая (,) — Значения полей и записей разделяются запятыми (
,). Используется по умолчанию.Табуляция (\t) — Значения полей и записей разделяются табуляцией (
\t).Вертикальная линия (|) — Значения полей и записей разделяются вертикальными линиями (
|).Точка с запятой (;) — Значения полей и записей разделяются точкой с запятой (
;).Пробел ( ) — Значения полей и записей разделяются пробелами ( ).
Если вы вводите свое собственное значение, его длина должна составлять один или два символа, включая пробелы. Разделители длиной более двух символов не поддерживаются.
Содержит строку заголовка — Указывает, содержит ли набор данных строку заголовка. Значением по умолчанию является true. Если установлено значение false, первая строка набора данных будет считаться записью.
Содержит мультилинейные данные — Указывает, содержит ли набор данных записи, содержащие символы новой строки. Значением по умолчанию является false. Если установлено значение true, данные, содержащие мультилинейные данные, будут прочитаны и отформатированы корректно.
Кодировка символов — Указывает тип кодировки, используемый для чтения указанного набора данных. По умолчанию это будет UTF-8. Вы можете выбрать один из доступных опций кодировки или указать тип кодировки. Пробелы не поддерживаются в значениях кодировки. Например формат значения ISO 8859-8 недопустим, должно быть ISO-8859-8.
Поля – дополнительно настраивает имена и типы полей. Кнопка Настроить схему открывает диалоговое окно, содержащее поля набора данных со следующими параметрами:
Включить или удалить поля — Вы можете удалить поля, поставив отметку рядом с полем. По умолчанию включаются все поля.
Имя поля — Имя поля, которое будет использоваться в Data Pipelines. Это значение можно изменить. По умолчанию это значение будет соответствовать полю исходного набора данных, если имя источника не содержит недопустимых символов и не является зарезервированным словом. Недопустимые символы будут заменены подчеркиванием (_), а зарезервированные слова будут содержать префикс - подчеркивание (_).
Тип поля – тип поля, который будет использоваться в Data Pipelines.
Удаление или изменение полей в Data Pipelines не меняет исходные данные.
В следующей таблице приводится описание доступных типов полей:
Тип поля Описание Строка Текстовые поля поддерживают строку текстовых символов. Small integer Поля типа Small integer поддерживают целые числа в диапазоне от -32768 до 32767. Integer Поля типа Integer поддерживают целые числа в диапазоне от -2147483648 до 2147483647. Big integer Поля типа Big integer поддерживают целые числа в диапазоне от -9223372036854776000 до 9223372036854776000. Float Поля типа с плавающей точкой поддерживают дробные числа приблизительно от -3.4E38 до 3.4E38. Double Поля типа двойной точности поддерживают дробные числа приблизительно от -2.2E308 до 1.8E308. Дата Поля типа дата поддерживают значения в формате yyyy-MM-dd HH:mm:ss, например допустимо значение2025-12-31 13:30:30. Если значения даты хранятся в другом формате, используйте инструмент Создать дату и время, чтобы вычислить поле дата.Только дата Поля типа дата поддерживают значения в формате yyyy-MM-dd, например допустимо значение2025-12-31. Если значения, содержащие только дату, хранятся в другом формате, используйте эти значения в качестве входных данных для инструмента Вычислить поле, чтобы вычислить поле, содержащее только дату.Boolean Булевы поля поддерживают значения TrueиFalse. Если есть поле, содержащее целочисленные представления Булевых значений (0 и 1), используйте инструмент Обновить поля, чтобы вместо этого привести целые числа к логическим Булевым значениям.
- Если указана опция формата GeoJSON, доступен параметр Тип геометрии. Это дополнительный параметр. По умолчанию используется тип геометрии в файле GeoJSON. Если файл GeoJSON содержит несколько типов геометрии, необходимо указать значение этого параметра. Смешанные типы геометрии не поддерживаются, и будет использован только указанный тип. Возможны опции Точечный, Мультиточечный, Полилинейный и Полигональный. Поле геометрии, содержащее местоположения данных GeoJSON, будет автоматически рассчитано и добавлено во входной набор данных. Поле геометрии можно использовать в качестве входных данных для пространственных операций или для включения геометрии в выходной результат.
- Если указана опция формат Файловой базы геоданных, то доступен параметр Класс объектов или имя таблицы. Используйте этот параметр, чтобы указать имя класса объектов или таблицы, которую вы хотите использовать в качестве входных данных. Поддерживаются только классы точечных, мультиточечных, полилинейных и полигональных объектов и таблицы. Не поддерживаются такие наборы данных, как растровые, наборы данных мозаики и траектории. Не поддерживаются продвинутые типы объектов, например, объекты геометрической сети.
Чтобы повысить производительность чтения входных наборов данных, рассмотрите следующие варианты:
Используйте параметр Использовать кэширование для сохранения копии набора данных. Кэшированная копия сохраняется только пока в браузере открыта хотя бы одна вкладка редактора. Это может ускорить доступ к данным во время их обработки. Если исходные данные были обновлены с момента их кэширования, отключите этот параметр и выполните предварительный просмотр или запустите инструмент еще раз.
После настройки входного набора данных настройте любой из следующих инструментов, которые ограничивают объем обрабатываемых данных:
Фильтр по атрибуту — Сохраняет поднабор записей, содержащих определенные значения атрибутов.
Фильтр по экстенту — Сохраняет поднабор записей в пределах определенного пространственного экстента.
Выбрать поля — Сохраняет только поля интереса.
Вырезание — Сохраняет поднабор записей, которые пересекаются с определенными геометриями.
Ограничения
Известны следующие ограничения:
Файлы Excel (
.xlsx) не поддерживаются в Data Pipelines.Текстовые файлы (
.txt), файлы ORC (.orc), файлы JSON (.json), GeoParquet (.parquet) и файлы EsriJSON (.esrijson) не поддерживаются для загрузки. Для получения дополнительной информации см. раздел Ресурсы, которые можно добавить на портал ArcGIS Enterprise.Если у вас есть файл
.txt, содержащий значения с разделителями, сохраните его как файл.csvи загрузите в этом формате.Если набор данных содержит имена полей с пробелами или недопустимыми символами, имена автоматически обновляются для использования подчеркивания. Например, поле с именем
Population 2022переименовывается вPopulation_2022, а поле%Employedв_Employed.
Лицензионные требования
Требуется следующее лицензии и конфигурации:
Тип пользователя Creator или GIS Professional
Роль Издатель, Посредник или Администратор, или эквивалентная пользовательская роль
Подробнее о системных требованиях Data Pipelines см. в разделе Требования.
Кроме того, Data Pipelines доступен только в том случае, если у вас есть ArcGIS Data Pipelines Server, настроенный с ArcGIS Enterprise.
Связанные разделы
Более подробно см. Добавление файлов в качестве элементов.