AWS Glueって何？基本・料金・使いどころをざっくり解説する

データ関連のAWS案件に関わる際、まず耳にするのが「AWS Glue」という名前。

Glue（グルー）って、日本語で「のり」や「接着剤」ですよね。
なんでデータサービスに接着剤？とわたしと同じように思った方、いらっしゃいませんか？

AWSのサービス名って、なんとなく想像がつく名前で、かつ「名付けセンス神かよ！！！」ってものが多いじゃないですか。

でも、中にはどうしても頭の中で変換ができず、資格試験で苦戦させられる子たちがいます。

今回はその筆頭の謎多き「AWS Glue」について

など、AWS Glueをわかりやすく解説したいと思います。

データ分析やETL処理に興味がある方も、「Glueって聞いたことあるけどよくわからない」という方も、参考んしていただけたら幸いです。

なんでGlue（のり）なの？

AWS公式がGlueという名前の由来を明言しているわけではないのですが、サービスの役割を見ると「え、もしやそういうこと？」と勝手に思うことがあります。

データ分析の現場では、データが1か所にまとまっていることはほとんどありませんよね。

このようなデータがバラバラに存在していることがほとんどです。

AWS Glueはそんなバラバラなデータソースをつなぎ合わせ、分析できる形に整える役割を担います。

データを「くっつける接着剤」のような働きをするから、Glueと呼ばれているのではないかと想像しています。

AWS Glueは、フルマネージドのETLサービスです。

ETLとは

の略で、データを取り出して、整形して、別の場所に格納する一連の処理のことです。

主な機能は大きく3つに分けられます。

機能	内容
ETLジョブ	データの抽出・変換・ロードを自動化する。Apache Spark/Pythonで処理を記述できる
Data Catalog	どこにどんなデータがあるかを管理するメタデータのカタログ
Crawler（クローラー）	S3やデータベースを自動スキャンしてData Catalogに登録する

ETLジョブはGlueの中核機能です。

「S3にあるCSVを読み込んで、不要な列を削除して、RedshiftにロードするPythonスクリプト」のような処理を、サーバー管理なしで実行できます。

AWS Glue Studioというビジュアルエディタを使えば、コードを書かずにドラッグ＆ドロップで処理フローを組み立てることもできます。

Data Catalogは、データの「目次」のようなものです。

「このS3バケットにはこういうカラム構成のデータがある」という情報をカタログとして管理しておくことで、AthenaやRedshift Spectrumから直接クエリを投げられるようになります。

Crawlerは、Data Catalogの登録を自動化してくれる機能です。

S3のバケットを指定してCrawlerを実行すると、ファイルの構造を自動で解析してカタログに登録してくれます。

スキーマが変わったときも自動で更新できるので、手動メンテナンスの手間が省けます。

AWS Glueが活躍するシーンをいくつかご紹介します。

逆に向いていない場面もあります。

リアルタイムのストリーミング処理にはKinesisやMSKの方が適していますし、シンプルなファイルコピーにはS3のレプリケーション機能で十分です。

「バッチ処理でデータを変換・統合したい」というニーズにもっとも合うサービスではないでしょうか。

AWS Glueの料金は DPU（Data Processing Unit）という単位で課金されます。

1 DPUは 4 vCPU・16GBメモリの処理能力に相当します。

※ 2026/4現在