SageMakerの使い方まとめ

概要

弥生R&D室のsiidaです。R&D室ではSageMakerを使用して機械学習 (ML) のプロジェクトを進めています。SageMakerはMLのための様々な機能が搭載されたサービスであり、データ分析からモデル訓練、ひいてはワークフローの構築まで、SageMakerの中で完結させることができます。

今回はこれまでに投稿してきたSageMakerの使い方記事をまとめました。いわゆるAI/MLを活用したPoCの範囲で扱うSageMakerの基本的な機能を一通り網羅しています。

sagemaker

記事一覧

ユースケース毎のガイド

はじめてSageMakerを立ち上げる場合

SageMakerのはじめかた を参照します。

もし、VSCode上のUIを使用したい場合は SageMaker Code Editorの紹介 もオプションで参照してください。

クイックにデータ分析を実施する場合

SageMakerのはじめかた で作成した仮想マシンを使用すればNotebookから分析可能です。

データが大規模で仮想マシン上に配置できない場合には SageMaker Studioの仮想マシンの容量を変更する方法 を参照します。

より大規模なデータや前処理を実施する場合や、再現性のある分析プロセスを構築する必要がある場合は、後述のProcessingJobを使う記事をご覧ください。

モデル作成・パイプライン構築など大規模な処理を実施する場合

SageMakerでProcessingJobを使用するPythonラッパーの紹介 を参照してProcessingJobから処理を実行します。

またその際に SageMaker ProcessingJobのCLIからのジョブ管理方法ProcessingJobで使用可能なジョブ数を上げる方法 を参照することでジョブの管理に役立てることができます。

まとめ

  • SageMakerの基本的な機能について、ユースケース毎にまとめてみました
  • AI/MLを使うPoCで必要となる、データ分析からモデル開発までのプロセスに対応しています
  • より特定のケースに向けた機能については今後紹介する予定です

本記事は下記の記事と同じ内容です。 アクセス解析を目的としてマルチポストしています。

qiita.com

弥生では一緒に働く仲間を募集しています。 ぜひエントリーお待ちしております。

herp.careers