Skip to main content

Procesamiento de datos

Nota:

En ArcGIS Enterprise 12.0, ArcGIS Data Pipelines es una función beta. Mientras estén en beta, es posible que esta capacidad no esté completa y presente problemas de rendimiento o calidad conocidos y el Soporte técnico de Esri no ofrecerá soporte.

Se pueden enviar comentarios sobre esta función en la comunidad Early Adopter de las funciones de ArcGIS Enterprise 12.0 Beta.

ArcGIS Data Pipelines realiza el procesamiento por lotes de datos vectoriales y tabulares almacenados, como los datos de una capa de entidades o un almacén de objetos o en la nube, como Amazon S3 y Google BigQuery. Data Pipelines proporciona capacidades de preparación e ingeniería de datos para que pueda combinar y crear datos e integrarlos en ArcGIS. El procesamiento que se puede realizar utiliza herramientas agrupadas en las siguientes categorías como conjuntos de herramientas:

  • Limpiar: limpiar los datos. Por ejemplo, puede eliminar campos innecesarios. También puede modificar los campos o rellenar los valores que falten.

  • Construir: crear campos derivados de campos o propiedades existentes en la capa. Por ejemplo, puede agregar y calcular un nuevo campo; estandarizar, transformar o reclasificar un campo existente; y agregar un campo basado en la geometría de la capa de entrada.

  • Formato: cambiar el formato de los campos o reorganizar los campos en la tabla o clase de entidad. Por ejemplo, puede convertir campos de tiempo, codificar campos de categorías o reducir las dimensiones de los campos existentes.

  • Integrar: integrar o agregar datos de otra fuente de datos a la tabla de entrada o clase de entidad. Por ejemplo, puede unir campos o agregar campos enriqueciendo los datos.

  • Dataset de salida: elija el tipo de salida para escribir y almacenar el resultado.

Ejemplos

Los siguientes son escenarios de ejemplo en los que se puede utilizar Data Pipelines:

  • Como científico de datos, puede combinar datasets dispares y calcular variables como campos utilizando funciones de ArcGIS Arcade.

  • Como analista SIG, puede crear y compartir flujos de trabajo de preparación de datos reproducibles.

  • Como científico medioambiental, puede combinar y estandarizar la información de campo que se almacena como una colección de archivos .csv.

Herramientas

Las tablas de las secciones siguientes describen las herramientas en las distintas categorías del editor de Data Pipelines.

Limpiar

Las siguientes herramientas están en la categoría Limpiar:

Herramienta Descripción
Recortar La herramienta Recortar extrae los registros de entrada que se superponen en los registros de recorte.
Filtrar por atributo La herramienta Filtrar por atributo devuelve un subconjunto de un dataset basado en una consulta. El resultado es un nuevo dataset que contiene solo los registros que cumplen la condición especificada en la consulta.
Filtrar por extensión La herramienta Filtrar por extensión devuelve un subconjunto de un dataset basado en una extensión espacial especificada. El resultado es un nuevo dataset que contiene solo los registros que se encuentran geográficamente dentro de la extensión especificada.
Eliminar duplicados La herramienta Eliminar duplicados elimina los registros duplicados en función de uno o varios campos clave. El resultado es un nuevo dataset sin registros duplicados.
Seleccionar campos La herramienta Seleccionar campos mantiene uno o más campos especificados en el dataset de salida. El resultado es un nuevo dataset que solo contiene los campos especificados.
Simplificar geometría La herramienta Simplificar geometría simplifica la complejidad de polilíneas o polígonos eliminando vértices innecesarios y conservando solamente los vértices más críticos.

Construir

Las siguientes herramientas están en la categoría Construir:

Herramienta Descripción
Calcular campo La herramienta Calcular campo calcula valores de campo para un campo nuevo o uno existente. Puede utilizar funciones de Arcade para definir la expresión de cálculo.
Crear fecha hora La herramienta Crear fecha hora crea un campo de fecha utilizando valores de campo existentes.
Crear geometría La herramienta Crear geometría crea un campo de geometría utilizando uno o varios campos.

Formato

Las siguientes herramientas están en la categoría Formato:

Herramienta Descripción
Asignar campos La herramienta Asignar campos transforma el esquema de un dataset al compararlo con un esquema objetivo.
Pivote La herramienta Pivote convierte un dataset largo en un dataset amplio utilizando valores diferentes de un campo existente para crear campos nuevos.
Geometría de proyecto La herramienta Proyectar geometría proyecta un campo geométrico a una nueva referencia espacial.
Desanidar campo La herramienta Desanidar campo devuelve valores almacenados en campos de matriz, mapa o struct como nuevos campos o filas.
Actualizar campos La herramienta Actualizar campos actualiza un nombre o tipo de campo.

Integrar

Las siguientes herramientas están en la categoría Integrar:

Herramienta Descripción
Disolver La herramienta Disolver busca polígonos o polilíneas que se superponen o que comparten un límite común, o atributos comunes, y los fusiona para formar un polígono o una polilínea únicos.
Unir La herramienta Unir une datasets basándose en las relaciones especificadas. Los datasets pueden unirse utilizando atributos coincidentes, relaciones espaciales, relaciones temporales o cualquier combinación de las tres.
Fusionar La herramienta Fusionar combina uno o más datasets en un único dataset nuevo. Puede combinar datasets de puntos, líneas, polígonos o tablas.
Resumir atributos La herramienta Resumir atributos agrega registros y calcula estadísticas. Puede agregar todos los registros o agregar en función de los valores coincidentes de uno o varios campos.

Salidas

Se admite el siguiente tipo de salida:

Herramienta Descripción
Capa de entidades La Salida de capas de entidades escribe datasets de canalización de datos en una capa de entidades alojada o una tabla alojada. Puede crear una tabla o capa de entidades, sustituir los datos de una tabla o capa de entidades existente o agregar y actualizar registros a una tabla o capa de entidades existente.
Volver al principio