Skip to main content

データの処理

注意:

ArcGIS Enterprise 12.0 において、ArcGIS Data Pipelines はベータ版機能です。 ベータ版では、この機能は完全ではない可能性があるため、場合によってはパフォーマンスまたは品質に関する既知の問題があり、Esri テクニカル サポートによるサポートはありません。

この機能に関するフィードバックは、「ArcGIS Enterprise 12.0 Beta Features Early Adopter Community」でお送りいただけます。

ArcGIS Data Pipelines は、フィーチャ レイヤー内のデータや、クラウドまたはオブジェクト ストア (Amazon S3 や Google BigQuery など) 内のデータなど、保存されたベクター データおよび表形式のデータに対してバッチ処理を実行します。 Data Pipelines は、データ準備およびエンジニアリング機能を提供するため、データをブレンドおよび構築して、ArcGIS に統合できます。 実行できる処理では、ツールセットとして次のカテゴリーに分類されたツールが使用されます。

  • [クリーン] - データをクリーニングします。 たとえば、不要なフィールドを削除することができます。 また、フィールドを変更したり、欠損値を補完したりすることもできます。

  • [構築] - レイヤーの既存のフィールドまたはプロパティから派生したフィールドを作成します。 たとえば、新しいフィールドを追加して計算したり、既存のフィールドを標準化、変換、または再分類したり、入力レイヤーのジオメトリーに基づいてフィールドを追加したりすることができます。

  • [形式] - テーブルまたはフィーチャクラスのフィールドの形式を変更したり、フィールドを再編成したりします。 たとえば、時間フィールドを変換したり、カテゴリー フィールドをエンコードしたり、既存のフィールドの次元を減らしたりすることができます。

  • [統合] - 別のデータ ソースから入力テーブルまたはフィーチャクラスにデータを統合または追加します。 たとえば、データに情報付加することで、フィールドを結合または追加できます。

  • 出力データセット - 出力タイプを選択し、結果を書き込んで格納します。

Data Pipelines は次のようなシナリオで使用できます:

  • データ サイエンティストが、異なるデータセットを組み合わせ、ArcGIS Arcade 関数を使用してフィールドとして変数を計算する場合。

  • GIS アナリストが、再現可能なデータ準備ワークフローを構築および共有する場合。

  • 環境科学者が .csv ファイルのコレクションとして格納されているフィールド情報を組み合わせて標準化する場合。

ツール

下記のセクションの表には、Data Pipelines エディターのさまざまなカテゴリーのツールが示されています。

クリーン

[クリーン] カテゴリーに含まれるツールを次に示します。

ツール 説明
Clip クリップ (Clip) クリップ ツールは、クリップ レコードと重なり合う入力レコードを抽出します。
属性によるフィルター [属性によるフィルター] ツールは、クエリーに基づいてデータセットのサブセットを返します。 クエリーで指定した条件を満たすレコードのみを含む新しいデータセットが出力されます。
範囲によるフィルター 範囲によるフィルター ツールは、指定した空間範囲に基づき、データセットのサブセットを返します。 指定した範囲に地理的に含まれるレコードのみを含む新しいデータセットが出力されます。
重複の削除 重複の削除ツールは、1 つまたは複数のキー フィールドに基づき、重複レコードを削除します。 重複レコードが含まれない新しいデータセットが出力されます。
フィールドの選択 フィールドの選択ツールは、指定した 1 つ以上のフィールドを出力データセットに保持します。 指定したフィールドのみを含む新しいデータセットが出力されます。
ジオメトリーの単純化 ジオメトリーの単純化ツールは、不要な頂点を取り除き、最も重要な頂点のみを維持することによって、ポリラインやポリゴンの複雑さを単純化します。

構築

[構築] カテゴリーに含まれるツールを次に示します。

ツール 説明
フィールド演算 フィールド演算ツールは、新規または既存のフィールドのフィールド値を計算します。 Arcade 関数を使用して、計算式を定義できます。
日付/時間の作成 日付/時間の作成ツールは、既存のフィールド値を使用して、日付フィールドを作成します。
ジオメトリーの作成 ジオメトリーの作成ツールは、1 つ以上のフィールドを使用してジオメトリー フィールドを作成します。

形式

[形式] カテゴリーに含まれるツールを次に示します。

ツール 説明
フィールドのマップ [フィールドのマップ] ツールでは、データセットのスキーマをターゲット スキーマと一致させて、そのスキーマを変換します。
ピボット ピボット ツールは、既存のフィールドの個別値を使用してロング データセットをワイド データセットに変換し、新しいフィールドを作成します。
ジオメトリーの投影変換 ジオメトリーの投影変換ツールは、新しい空間参照にジオメトリー フィールドを投影変換します。
フィールドのネスト解除 [フィールドのネスト解除] ツールを実行すると、array、map、struct フィールドに格納されている値が新しいフィールドまたは行として返されます。
フィールドの更新 フィールドの更新ツールは、フィールド名またはフィールド タイプを更新します。

統合

[統合] カテゴリーに含まれるツールを次に示します。

ツール 説明
ディゾルブ (Dissolve) ディゾルブ ツールは、オーバーラップまたは共通の境界線を共有するポリゴンやポリライン、あるいは共通の属性を共有するポリゴンやポリラインを検出し、それらを結合し、1 つのポリゴンまたはポリラインを形成します。
結合 結合ツールは、指定したリレーションシップに基づいてデータセットを結合します。 データセットは、一致する属性、空間リレーションシップ、時系列リレーションシップ、またはその 3 つの任意の組み合わせを使用して結合することができます。
マージ (Merge) 統合ツールは、1 つ以上のデータセットを単一の新しいデータセットに結合します。 ポイント、ライン、ポリゴン、表形式のデータセットを結合できます。
属性の集計 [属性の集計] ツールは、レコードを集約し、統計を計算します。 すべてのレコードを集計することも、1 つ以上のフィールドの一致する値に基づいて集計することもできます。

出力

次の出力タイプがサポートされています:

ツール 説明
フィーチャ レイヤー フィーチャ レイヤー出力では、データ パイプライン データセットをホスト フィーチャ レイヤーまたはホスト テーブルに書き込みます。 フィーチャ レイヤーまたはテーブルを作成したり、既存のフィーチャ レイヤーまたはテーブル内のデータを置き換えたり、既存のフィーチャ レイヤーまたはテーブルにレコードを追加したり、既存のフィーチャ レイヤーまたはテーブル内のレコードを更新したりできます。
トップへ戻る