文件
使用文件中的记录作为 ArcGIS Data Pipelines 的输入。
用法说明
使用文件时,请牢记以下内容:
使用文件输入允许您从 ArcGIS 内容中的可用文件加载数据。
将文件输入添加至画布时,将出现选择文件对话框并显示以下选项:
浏览至现有文件 - 浏览内容以查找先前上传的项目。 您可以浏览您拥有的内容、与您共享的内容以及您的组织的可用内容。
上传新文件 - 从磁盘或网络共享上传文件。 有关详细信息,请参阅将文件添加为项目。
Data Pipelines 不支持所有可以直接上传到您的内容的文件类型。 请参阅以下支持的文件格式信息。
文件格式参数会自动填充您选择的文件格式。 支持以下格式选项:
CSV 或分隔 - 包含分隔值的文件 (
.csv)Shapefile - 压缩文件夹包含一组构成 shapefile (
.shp) 的相关文件GeoJSON - 一种开放标准的地理空间数据交换格式,可表示简单的地理要素及其非空间属性(
.geojson或.json)Parquet - 一种高度压缩的非空间存储的列定向表格共享格式 (
.parquet)文件地理数据库 - 压缩文件地理数据库 (
.gdb)
如果指定了 CSV 或分隔格式选项,则可以使用以下数据集定义参数:
分隔符 - 用于分割字段(或列)和记录(或行)值的分隔符。 可从以下选项中进行选择或者输入您自己的值:
逗号 (,) - 字段和记录值以逗号 (
,) 分隔。 这是默认设置。制表符 (\t) - 字段和记录值以制表符 (
\t) 分隔。管道 (|) - 字段和记录以管道 (
|) 分隔。分号 (;) - 字段和记录值以分号 (
;) 分隔。空格 ( ) - 字段和记录值以空格 ( ) 分隔。
如果您输入自己的值,其长度必须为一个或两个字符(包括空格)。 不支持长度超过两个字符的分隔符。
具有标题行 - 指定数据集是否包含标题行。 默认为 true。 如果设置为 false,则将数据集的第一行视为一条记录。
包含多行数据 - 指定数据集是否具有包含换行符的记录。 默认为 false。 如果设置为 true,将正确读取和格式化包含多行数据的数据。
字符编码 - 指定用于读取指定数据集的编码类型。 默认值为 UTF-8。 您可以从可用的编码选项中进行选择,或指定一种编码类型。 编码值不支持空格。 例如,指定 ISO 8859-8 值是无效的,必须指定为 ISO-8859-8。
字段 -(可选)配置字段名称和类型。 配置方案按钮可打开一个对话框,其中包含数据集字段,并提供以下选项:
包括或删除字段 - 可以通过选中字段旁边的复选框来移除字段。 默认情况下,包含所有字段。
字段名称 - 将在 Data Pipelines 中使用的字段名称。 可以编辑此值。 默认情况下,此值将与源数据集中的字段相同,除非源名称包含无效字符或为保留字。 无效字符将替换为下划线 (_),保留字将以下划线 (_) 为前缀。
字段类型 - 将在 Data Pipelines 中使用的字段类型。
在 Data Pipelines 中移除或修改字段将不会修改源数据。
下表介绍了可用字段类型:
字段类型 描述 字符串 字符串字段支持文本字符串。 短整型 小整型字段支持介于 -32768 和 32767 之间的整数。 整型 整型字段支持介于 -2147483648 和 2147483647 之间的整数。 大整数 大整型字段支持介于 -9223372036854776000 和 9223372036854776000 之间的整数。 浮点型 浮点型字段支持介于大约 -3.4E38 和 3.4E38 之间的小数。 双精度 双精度型字段支持介于大约 -2.2E308 和 1.8E308 之间的小数。 日期 日期字段支持格式为 yyyy-MM-dd HH:mm:ss的值,例如2025-12-31 13:30:30为有效值。 如果日期值以其他格式存储,则使用创建日期时间工具计算日期字段。仅日期 日期字段支持格式为 yyyy-MM-dd的值,例如2025-12-31为有效值。 如果仅日期值以其他格式存储,请使用这些值作为计算字段工具的输入以计算仅日期字段。布尔 布尔字段支持 True和False值。 如果字段包含布尔值的整数表示(0 和 1),请使用更新字段工具将整数转换为布尔值。
- 如果指定了 GeoJSON 格式选项,则可以使用 Geometry 类型参数。 设置此参数属于可选操作。 默认情况下,将使用 GeoJSON 文件中的几何类型。 如果 GeoJSON 文件包含多个几何类型,则必须指定此参数值。 不支持混合几何类型,仅可使用指定的类型。 选项包含点、多点、折线和面。 包含 GeoJSON 数据位置的几何字段将自动计算并添加到输入数据集中。 几何字段可用作空间操作的输入或在输出结果上启用几何。
- 如果指定文件地理数据库格式选项,则要素类或表名称参数可用。 使用此参数可指定您希望用作输入的要素类或表的名称。 仅支持点、多点、折线以及面要素类和表。 诸如栅格、镶嵌、轨迹等数据集不受支持。 诸如几何网络要素等高级要素类型不受支持。
为了提高读取输入数据集的性能,请考虑以下选项:
限制
以下为已知局限性:
Data Pipelines 不支持 Excel (
.xlsx) 文件。文件上传不支持文本文件 (
.txt)、ORC 文件 (.orc)、JSON 文件 (.json)、GeoParquet (.parquet) 和 EsriJSON 文件 (.esrijson)。 有关详细信息,请参阅可在 ArcGIS Enterprise 门户中添加的内容。如果您有包含分隔值的
.txt文件,请将其另存为.csv文件并以该格式上传。如果数据集包含带空格或无效字符的字段名称,名称会自动更新为使用下划线。 例如,名为
Population 2022的字段将重命名为Population_2022,名为%Employed的字段将重命名为_Employed。
许可要求
需要以下许可和配置:
Creator 或 Professional 用户类型
发布者、服务商或管理员角色,或等效的自定义角色
有关 Data Pipelines 要求的详细信息,请参阅要求。
此外,仅当您在 ArcGIS Enterprise 中配置了 ArcGIS Data Pipelines Server 时,Data Pipelines 才可用。
相关主题
有关详细信息,请参阅将文件添加为项目。