updated_at: 2026/4/2
SRE・インフラエンジニア採用の完全ガイド|要件定義からスカウトまで
SRE・インフラエンジニアの採用が難しい理由と、要件定義・求人設計・選考の実践手法を解説
TL;DR(この記事の要約)
SRE・インフラエンジニアは求人倍率が高く、そもそも市場に人材が少ないため採用難度が極めて高い
「何でもできるインフラ人材」ではなく、自社のフェーズに合った要件定義が採用成功の第一歩
年収レンジはミドルクラスで600〜900万円、シニアクラスで900〜1,300万円が目安。相場を外すとスカウトすら読まれない
求人票では技術スタック・SLO運用体制・オンコール頻度を具体的に開示するのが返信率向上のカギ
正社員だけに固執せず、副業・業務委託からの段階的採用も有力な選択肢
SRE・インフラエンジニア採用はなぜこれほど難しいのか
「SREを採用したいが、半年経っても1人も内定に至らない」——こんな声をスタートアップの採用担当者から頻繁に聞きます。SRE(Site Reliability Engineering)やインフラエンジニアの採用が困難な背景には、構造的な理由がいくつもあります。
このページでわかること
SRE・インフラエンジニアの採用が難しい構造的な理由
自社のフェーズに合った要件定義の作り方
候補者に刺さる求人票・スカウト文面の設計手法
選考プロセスで技術力と適性を見極めるポイント
副業・業務委託を活用した段階的採用のアプローチ
人材供給の絶対量が少ない
経済産業省の「IT人材需給に関する調査」によれば、2030年にはIT人材が最大約79万人不足すると予測されています。なかでもインフラ・SRE領域はアプリケーション開発者と比べて母数が圧倒的に少なく、「そもそも候補者がいない」状態に陥りやすいのが実情です。
SREという職種自体がGoogleで生まれた比較的新しい概念であり、日本では2018年前後から求人が増え始めました。歴史が浅い分、経験者の絶対数が限られています。
求められるスキルセットが幅広い
SREに求められるスキルは、従来のインフラエンジニアの範囲を大きく超えています。
スキル領域 | 具体例 |
クラウド設計・運用 | AWS / GCP / Azure のマルチクラウド構成 |
IaC(Infrastructure as Code) | Terraform / Pulumi / CloudFormation |
コンテナ・オーケストレーション | Docker / Kubernetes / ECS |
監視・可観測性 | Datadog / Prometheus / Grafana / OpenTelemetry |
CI/CD | GitHub Actions / ArgoCD / CircleCI |
プログラミング | Go / Python / Shell scripting |
SRE プラクティス | SLI/SLO設計 / エラーバジェット / ポストモーテム |
Googleが提唱するSREの原則では「SREの業務時間の50%以上はソフトウェアエンジニアリングに充てるべき」とされています。つまり、インフラの知識だけでなくコードを書ける力が必須です。この「インフラ × 開発」の交差領域に立てる人材は、市場でも希少です。
大手企業との報酬競争
SREの年収相場は一般的なWebエンジニアより高い水準にあります。メガベンチャーや外資系IT企業がシニアSREに年収1,000万円超を提示するケースは珍しくなく、スタートアップが同じ土俵で戦うのは容易ではありません。
だからこそ、報酬だけでない魅力——技術的チャレンジの面白さ、裁量の大きさ、成長機会——を明確に打ち出す必要があります。
「SRE」の定義が企業によって異なる問題
SRE採用をさらに難しくしている要因が、「SRE」という肩書きの使われ方が企業によってバラバラであることです。
ある企業では「Kubernetes基盤の設計と運用」がSREの仕事であり、別の企業では「社内ツールの開発と監視ダッシュボードの構築」が主務、さらに別の企業では「従来のインフラ運用をSREと呼び替えただけ」というケースもあります。
この曖昧さが候補者の混乱を招きます。求人票に「SRE募集」と書いてあっても、蓋を開けたら手動のサーバー運用ばかりだった——そんな経験をしたSREは少なくありません。だからこそ、自社の「SRE」が何を意味するのかを求人票やスカウト文面で明確に定義することが、候補者からの信頼を得る第一歩です。
転職市場に出てこない「潜在層」が多い
SRE・インフラエンジニアのもう一つの特徴として、転職市場に能動的に出てくる人が少ないことが挙げられます。現職のインフラを熟知し、チームの信頼を得ているSREは、簡単に職場を離れる動機がありません。
つまり、転職サイトでの求人掲載だけでは十分な母集団を形成できず、ダイレクトリクルーティング(スカウト)やリファラル、技術コミュニティ経由のアプローチといった能動的な手法が不可欠です。
自社に必要なSRE・インフラ人材の要件を定義する
採用活動で最もありがちな失敗は、「SREを採りたい」という漠然としたオーダーのまま求人を出してしまうことです。SREと一口に言っても、企業のフェーズやインフラの成熟度によって求める人物像はまったく異なります。
フェーズ別:SRE・インフラ人材に求める役割
シード〜シリーズA(社員10〜30名規模)
この段階ではSRE専任を置く余裕がないことも多く、「インフラも見られるバックエンドエンジニア」が現実的です。
クラウドインフラの初期構築と基本的な監視設定
CI/CDパイプラインの整備
デプロイの自動化
障害対応のファーストレスポンダー
必須スキル:AWS or GCPの実務経験、Docker、基本的なLinux運用
シリーズA〜B(社員30〜100名規模)
サービスの成長に伴い、信頼性やスケーラビリティの問題が顕在化するフェーズです。SRE専任のポジションを設ける企業が増えます。
SLI/SLO の策定と運用
Kubernetes環境の構築・運用
監視・アラート体系の整備
IaCによるインフラ管理の標準化
オンコール体制の構築
必須スキル:Kubernetes実務経験、Terraform、監視ツールの設計経験
シリーズC以降(社員100名超)
プラットフォームエンジニアリングチームとしてSRE組織を拡大し、開発チームのセルフサービス化を推進するフェーズです。
内部開発者プラットフォーム(IDP)の構築
マルチクラウド・マルチリージョン対応
コスト最適化とFinOps
セキュリティ・コンプライアンス基盤
SREチームのマネジメント
必須スキル:大規模インフラ運用経験、組織設計の経験、コスト管理
「Must / Want / Nice to have」で要件を整理する
要件定義では、全てを「必須」にしないことが重要です。条件を広げすぎると該当者がゼロになります。
具体例:シリーズBのスタートアップの場合
区分 | 要件 |
Must(必須) | AWS or GCPでの本番運用経験3年以上、IaCツールの実務経験、プログラミング言語1つ以上での開発経験 |
Want(歓迎) | Kubernetes運用経験、SLI/SLO設計経験、オンコール運用経験 |
Nice to have | 大規模トラフィック対応経験、マルチクラウド経験、テックリード経験 |
Mustの項目を3つ以内に絞ることで、候補者プールを最大化しつつ、最低限のスキルラインは確保できます。
ポジション名の設計も重要
求人のポジション名は候補者の第一印象を決めます。同じ役割でもポジション名の付け方で応募数が変わります。
ポジション名 | 向いているケース |
SRE(Site Reliability Engineer) | SLI/SLO運用、トイル削減など、Googleが定義するSREプラクティスを実践する場合 |
インフラエンジニア | クラウドインフラの設計・構築が主務で、運用自動化にも取り組む場合 |
プラットフォームエンジニア | 開発者向けの内部プラットフォーム構築が主務の場合 |
DevOpsエンジニア | CI/CDパイプライン整備やデプロイ自動化が中心の場合 |
クラウドエンジニア | 特定のクラウドサービス(AWS / GCP)の設計・最適化が主務の場合 |
候補者は自分の経験と合致するポジション名で求人を検索します。実態と合わない名前をつけると、ミスマッチの原因になります。自社の業務内容と市場で一般的に使われている定義を照らし合わせて、最も適切な名前を選んでください。
SRE・インフラエンジニアの年収相場と報酬設計
採用を成功させるうえで、市場の年収相場を正確に把握することは避けて通れません。相場から大きく外れた年収レンジを求人に載せると、スカウトメールすら開封されないことがあります。
2026年時点の年収相場(目安)
レベル | 経験年数目安 | 年収レンジ(万円) | 補足 |
ジュニア | 1〜3年 | 400〜600 | インフラ運用からキャリアチェンジ組も含む |
ミドル | 3〜7年 | 600〜900 | Kubernetes・IaC実務経験あり |
シニア | 7年以上 | 900〜1,300 | 設計・組織づくり・障害対応のリード経験 |
リード / マネージャー | 10年以上 | 1,100〜1,500+ | SREチームの立ち上げ・マネジメント経験 |
上記はWeb系・スタートアップ・メガベンチャーの一般的な水準です。外資系IT企業はこれよりさらに高い提示をすることが多いため、外資と直接競合する場合はRSU(譲渡制限付き株式)やストックオプションなどの株式報酬で差を埋める戦略が必要になります。
スタートアップが報酬で戦うためのポイント
年収の絶対額で大手に勝てない場合でも、以下の要素を組み合わせた「トータルリワード」で勝負できます。
ストックオプション(SO): 上場前のスタートアップならではの魅力。付与条件と行使価額を具体的に開示する
技術投資の自由度: 「新しいツール・技術の導入裁量がある」ことはSREにとって大きな魅力
リモートワーク・柔軟な働き方: フルリモートや居住地自由の制度は年収差を埋める効果がある
学習支援制度: カンファレンス参加費・書籍購入費・資格取得支援の充実
オンコール手当: SRE特有のオンコール負担に対して適切な手当を設計する
特にオンコール手当は見落とされがちですが、SREにとって業務負荷の大きな部分を占めるオンコール対応に対して、きちんと報酬で報いる姿勢を見せることは信頼獲得につながります。
候補者に響く求人票の書き方
SRE・インフラエンジニアは情報感度が高く、求人票の記載内容を細部まで読み込む傾向があります。曖昧な表現や情報不足はそれだけで候補者を遠ざけます。
NG例とOK例で学ぶ求人票の改善ポイント
技術スタックの記載
NG: 「クラウド環境の構築・運用」
OK: 「AWS(ECS Fargate / Aurora / CloudFront / S3)を中心としたインフラ基盤の設計・運用。IaCはTerraformで管理し、CI/CDはGitHub Actionsで自動化」
候補者は「自分のスキルがフィットするか」を技術スタックの一覧で判断します。サービス名・ツール名を具体的に列挙してください。求人票の書き方全般についてはエンジニアが応募したくなる求人票の書き方完全ガイドも参考にしてください。
業務内容の記載
NG: 「インフラの設計・構築・運用全般」
OK: 「SLI/SLOの策定・運用改善(現在の可用性99.9%を99.95%に引き上げるプロジェクトを推進中)。Kubernetes上のマイクロサービス基盤の運用と改善。月次でのポストモーテム実施とトイル削減」
数字や具体的なプロジェクト内容を含めることで、入社後のイメージが明確になります。
オンコール体制の記載
NG: (記載なし)
OK: 「オンコールは現在4名でローテーション(月1〜2回担当)。PagerDuty導入済み。深夜対応は月平均1〜2回。オンコール手当あり(1回あたりX万円)」
SREにとってオンコール体制は入社判断に直結する最重要情報の一つです。書かないと「ブラックなのでは」と疑われます。正直に書くのが最善策です。
求人票に必ず含めるべき7つの要素
技術スタック一覧(クラウド・IaC・コンテナ・監視・CI/CD・言語)
チーム構成(SREチームの人数、開発チームとの関係性)
担当サービスの規模感(リクエスト数/日、DAU、インフラ規模)
SRE プラクティスの導入状況(SLO運用の有無、ポストモーテム実施頻度)
オンコール体制の詳細(ローテーション人数、頻度、手当)
キャリアパス(IC(Individual Contributor)ルート / マネジメントルートの選択肢)
年収レンジ(幅を持たせつつも具体的に。「応相談」はNG)
スカウトメールで返信率を上げる実践テクニック
SRE・インフラエンジニアは転職市場では引く手あまたの存在です。毎日のようにスカウトメールが届くため、テンプレ感のあるメッセージは即スルーされます。
スカウト前のリサーチが9割
候補者のプロフィールやSNS・技術ブログから以下を事前にリサーチします。
現在使っている技術スタック: 自社の環境との共通点や発展性を具体的に言及
登壇歴・発表資料: 特定の発表内容に言及すると「ちゃんと見てくれた」という印象を与えられる
GitHubのパブリックリポジトリ: OSSへのコントリビュートやツール開発への言及
転職意欲シグナル: プロフィール更新日、「話を聞きたい」ステータスの有無
スカウト文面の構成テンプレート
件名:「[候補者の専門領域] × [自社の技術的チャレンジ]」のフォーマット
例: 「Kubernetes運用の知見を活かせるSREポジション|月間X億リクエストのプラットフォーム基盤」
本文の構成:
なぜあなたに送ったか(1〜2文で具体的に)
自社の技術課題(候補者が興味を持ちそうなチャレンジ)
ポジションの魅力(裁量・技術選定の自由度・チーム体制)
年収レンジの明示
次のアクション(カジュアル面談の提案)
重要なのは「この人にしか送れない文面」であることが伝わることです。技術スタック名を羅列するだけではなく、候補者の経験と自社の課題がどう結びつくかを言語化してください。
返信率を上げる細かいテクニック
送信タイミング: 平日の午前10時〜12時、または火曜〜木曜の夕方が開封率が高い傾向
文面の長さ: スマートフォンでスクロールなしで読める300〜400字が理想
CTO / テックリードからの送信: 人事ではなく技術に詳しい人からのメッセージは返信率が上がる
フォローアップ: 未返信の場合、1週間後に1回だけフォローする。しつこい追撃は逆効果
スカウト文面の具体例
以下は、候補者のGitHub活動を踏まえたスカウト文面の例です。
件名:Prometheus Exporterの開発経験を活かせるSREポジション|DAU XX万のサービス基盤
〇〇様
株式会社△△でCTOを務めている□□です。GitHubで公開されているPrometheus用のカスタムExporterを拝見し、可観測性に対する深い理解と実装力に感銘を受けてご連絡しました。
弊社は現在、DAU XX万人のサービスを支えるインフラ基盤の信頼性向上に取り組んでいます。具体的には、Kubernetes上のマイクロサービス20個の SLO運用を本格化するフェーズで、〇〇様の経験がダイレクトに活かせる環境です。
技術スタック:AWS EKS / Terraform / Datadog / ArgoCD / Go 年収レンジ:800〜1,100万円(経験・スキルに応じて)
30分のカジュアル面談で、技術課題や開発体制について詳しくお話しできればと思います。ご都合のよいタイミングはありますか?
ポイントは「なぜあなたなのか」を冒頭で具体的に述べていること、そして技術スタックと年収を明示している点です。この2点だけでテンプレメールとの差別化ができます。
SRE採用でよくある失敗パターンと回避策
SRE・インフラエンジニアの採用活動でスタートアップが陥りがちな失敗パターンを整理します。自社の採用プロセスに当てはまる項目がないか、チェックリストとして活用してください。
失敗1:要件を盛りすぎて候補者ゼロ
「AWS / GCP両方の経験必須」「Kubernetes3年以上」「Go / Pythonの実務経験」「SREチーム立ち上げ経験」——こうした条件を全てMust要件にすると、日本市場で該当する候補者はごく少数に限られます。
回避策: Must要件を最大3つに絞り、それ以外はWant・Nice to haveに分類する。「この3つがあれば入社後にキャッチアップできる」という最低ラインを見極めてください。
失敗2:年収レンジが市場と乖離している
「インフラエンジニアだから500〜700万円」という感覚のまま求人を出しているケースです。SREの市場相場はこの水準を大きく上回っており、候補者にスカウトを送っても返信が来ません。
回避策: 本記事の年収相場テーブルを参考に、競合他社の求人も確認したうえでレンジを設定する。予算の上限がある場合は、ストックオプションやリモートワークなどの非金銭報酬で補完する戦略を立てる。
失敗3:選考プロセスが長すぎる
書類選考→1次面接→コーディング試験→2次面接→最終面接→オファー……と6ステップ以上の選考を組んでしまうケースです。SRE人材は引き合いが強く、長い選考中に他社からオファーが出て辞退されるリスクが高まります。
回避策: 選考ステップは4つ以内、全体のリードタイムは2〜3週間以内を死守する。各ステップで何を評価するかを明確にし、重複する評価は排除する。
失敗4:人事だけで選考を完結させようとする
SREの技術面接をエンジニアリングの知見がない人事担当者だけで行うと、候補者の技術力を正確に評価できません。候補者側も「技術のわかる人と話がしたい」という期待を持っているため、満足度が低下します。
回避策: 技術面接には必ずエンジニア(できればSRE経験者)を同席させる。社内にSRE経験者がいない場合は、外部のSREアドバイザーに面接官を依頼するか、副業SREに面接設計と同席を依頼する方法もあります。
失敗5:入社後のキャリアパスを提示できない
「SREとして入社した後、どのようなキャリアを歩めるのか」が不明確だと、優秀な候補者ほど不安を感じます。特に、IC(Individual Contributor)として専門性を深める道とマネジメントに進む道の両方が用意されているかは、SRE候補者が重視するポイントです。
回避策: SREのキャリアラダー(等級制度)を事前に設計しておく。完璧でなくてもよいので、「シニアSRE→スタッフSRE→プリンシパルSRE」のようなICトラックと「SREリード→SREマネージャー→VPインフラ」のようなマネジメントトラックの概要を面接時に提示できる状態にしておくことが大切です。
SRE・インフラエンジニアの選考で見極めるべきポイント
SREの選考では、一般的なソフトウェアエンジニアとは異なる観点での評価が必要です。コーディング力だけでなく、障害対応力・設計思想・運用への当事者意識を多角的に見極めます。
選考プロセスの設計例
ステップ | 内容 | 評価ポイント | 所要時間 |
1. カジュアル面談 | 技術課題の共有、双方の期待値すり合わせ | カルチャーフィット、技術的関心 | 30〜45分 |
2. 技術面接(1回目) | 過去の障害対応経験、インフラ設計の考え方 | 問題解決力、設計思想 | 60分 |
3. 技術課題 or ペアワーク | Terraform設計レビュー、障害シナリオ対応 | 実務スキル、コミュニケーション | 60〜90分 |
4. 技術面接(2回目) | システム設計ディスカッション | スケーラビリティ思考、トレードオフ判断 | 60分 |
5. オファー面談 | 条件提示、質疑応答 | — | 30分 |
全体のリードタイムは2〜3週間以内を目標にしてください。SRE人材は複数社から同時にオファーを受けていることが多く、選考が長引くと他社に先を越されます。
技術面接で使える質問例
障害対応力を見る質問
「これまで経験した中で最も印象的な本番障害について教えてください。どのように検知し、どう対応しましたか?」
「ポストモーテムを書いたことはありますか?どのような改善アクションにつなげましたか?」
「障害発生時、最初の5分間で何をしますか?」
この質問で見るべきは、障害の技術的詳細だけでなく、冷静な状況判断力と再発防止への意識です。
設計思想を見る質問
「SLOを設定する際、どのような基準で数値を決めますか?」
「可用性99.9%と99.99%の違いは何ですか?そのコスト差をどう経営層に説明しますか?」
「トイル(繰り返しの手作業)を削減した経験を教えてください。どのように優先順位をつけましたか?」
SREの本質は「信頼性をエンジニアリングで解決する」ことです。理想論ではなく、ビジネス要件とのバランスを取れる思考を持っているかを確認します。
コラボレーション力を見る質問
「開発チームに対して運用面での改善を提案した経験はありますか?どのように合意形成しましたか?」
「オンコール中に開発チームの協力が必要な障害が発生しました。どのようにエスカレーションしますか?」
SREは開発チームとの連携が不可欠です。技術力だけでなく、異なるチームとの建設的なコミュニケーション能力も重要な評価軸です。面接での技術力評価の全般的なポイントについてはエンジニア面接の技術力評価ガイドもあわせてご覧ください。
技術課題の設計パターン
実技試験は候補者の負担が大きいため、所要時間2時間以内で完結する設計にしましょう。
パターン1:Terraformコードレビュー
事前に用意したTerraformコードに意図的な問題点(セキュリティリスク、冗長性、コスト非効率など)を仕込み、レビューしてもらう。改善提案の質と、指摘の優先順位付けを評価します。
パターン2:障害シナリオシミュレーション
「あるサービスのレスポンスタイムが急激に悪化した」というシナリオを提示し、どのダッシュボードを見るか、どのログを確認するか、仮説をどう立てるかをホワイトボードで議論します。
パターン3:システム設計ディスカッション
「月間1億リクエストを処理するAPIの基盤をAWS上で設計してください」というお題で、アーキテクチャ設計のディスカッションを行います。正解を求めるのではなく、トレードオフの考え方と意思決定プロセスを評価します。
副業・業務委託からの段階的採用アプローチ
正社員採用だけにこだわると、SRE・インフラ人材の確保はさらに難しくなります。副業・業務委託を入口とした段階的な採用は、特にスタートアップにおいて非常に有効な戦略です。
副業・業務委託が有効な理由
候補者プールが広がる: 現職を辞めずに参画できるため、転職意欲が低い優秀層にもリーチできる
ミスマッチリスクの低減: 実際に一緒に働いてから正社員化を判断できる
即戦力の確保: 正社員採用の長い選考プロセスを待たずに、すぐにチームに技術力を補充できる
コスト効率: 週2〜3日の稼働であれば、フルタイム採用よりもコストを抑えられる
副業・業務委託SREの活用パターン
パターン | 稼働量 | 主な業務 | 月額報酬目安 |
スポット相談 | 月8〜16時間 | アーキテクチャレビュー、障害分析 | 15〜30万円 |
週2日稼働 | 月64時間 | IaC整備、監視設計、CI/CD改善 | 50〜80万円 |
週3日稼働 | 月96時間 | SRE業務全般、オンコール対応含む | 70〜110万円 |
副業→正社員化を成功させるポイント
最初から「正社員化の可能性がある」ことを伝える: 隠して後出しすると信頼を損ねる
明確なゴール設定: 「3ヶ月でSLO運用の基盤を構築する」など具体的な目標を設定
チームに溶け込める環境づくり: Slackチャンネルへの招待、定例ミーティングへの参加
正社員化のタイミング: 3〜6ヶ月の協業期間を経て、双方の合意のもとで判断
報酬の移行設計: 業務委託時の報酬と正社員時の年収が大きく乖離しないよう配慮
SREを採りたい企業が今すぐやるべき5つのアクション
ここまでの内容を踏まえ、SRE・インフラエンジニアの採用を始める企業が最初に取り組むべきアクションをまとめます。
アクション1:自社インフラの現状を棚卸しする
技術スタック、運用体制、課題を一覧化します。これが要件定義と求人票の土台になります。
使用しているクラウドサービスとその構成
デプロイ頻度とデプロイ方法
監視・アラートの設定状況
直近6ヶ月間の障害発生回数と対応時間
現在のオンコール体制(あれば)
アクション2:年収レンジを市場相場に合わせる
本記事で示した年収レンジを参考に、自社の提示レンジが市場から乖離していないか確認してください。レンジが低すぎる場合、スカウトメールの返信率は著しく低下します。
アクション3:SRE経験者に求人票をレビューしてもらう
社内にSRE経験者がいなければ、外部の副業SREやアドバイザーに求人票の内容をレビューしてもらいましょう。「この求人を見て応募したいと思うか?」という率直なフィードバックが得られます。
アクション4:スカウト対象のリストを作成する
転職媒体のデータベースだけでなく、以下のチャネルからも候補者をリストアップします。
技術カンファレンスの登壇者リスト(SRE NEXT、CloudNative Days Tokyoなど)
SRE関連の技術ブログ執筆者
OSSプロジェクトのコントリビューター
LinkedIn・Xで情報発信しているSRE
アクション5:副業・業務委託の受け入れ体制を整備する
正社員採用と並行して、副業・業務委託でSRE人材を確保する準備を進めます。契約テンプレートの整備、セキュリティポリシーの確認、リモートアクセス環境の構築などを事前に済ませておくと、候補者が見つかったときにスムーズに参画してもらえます。
FAQ(よくある質問)
Q1. SREとインフラエンジニアの違いは何ですか?
インフラエンジニアは主にサーバー・ネットワーク・ミドルウェアの構築・運用を担います。一方、SREはソフトウェアエンジニアリングの手法を使って信頼性を向上させることに重点を置きます。SLI/SLOの設計、トイルの自動化、エラーバジェットの運用など、定量的な指標に基づいてシステムの信頼性を管理するのがSREの特徴です。採用時には、自社が求めるのは「守りのインフラ運用」なのか「攻めの信頼性エンジニアリング」なのかを明確にしたうえで、ポジション名と要件を設定してください。
Q2. SRE未経験者を育成するのは現実的ですか?
現実的です。バックエンドエンジニアやインフラエンジニアからSREへキャリアチェンジするパスは確立されています。ただし、育成には6ヶ月〜1年程度の投資が必要です。外部の副業SREをメンターとして招き、OJT形式で育成するアプローチが効率的です。「SRE経験は不問、インフラ運用経験+プログラミング力があればOK」という求人にすることで候補者プールを広げつつ、入社後にSREプラクティスを学んでもらう戦略も有効です。
Q3. 1人目のSREはどんな人を採るべきですか?
技術力はもちろん重要ですが、1人目のSREには「仕組みをゼロから作れる人」が適しています。大規模環境の運用経験があっても、既存の仕組みのうえで作業していただけの人は、何もない状態からの立ち上げには向きません。面接では「何もないところから監視基盤を構築した経験」「SREプラクティスをチームに導入した経験」を重点的に確認してください。
Q4. オンコール体制がまだない状態で求人を出しても大丈夫ですか?
大丈夫です。むしろ「オンコール体制をこれから設計する」という点を正直に伝えたうえで、「あなたにその設計を任せたい」とポジショニングすると、裁量の大きさを魅力に感じるSRE経験者は少なくありません。ただし、「24時間365日一人で対応してほしい」というニュアンスにならないよう、体制構築のロードマップを示すことが大切です。
Q5. SREの採用で特に有効な転職媒体はどこですか?
SRE・インフラ人材はLinkedInやForkwell、Findy、転職ドラフトなどの技術者特化型プラットフォームに多い傾向があります。また、LAPRASのようにGitHubやQiitaの活動データをもとに候補者をサーチできるサービスも有効です。ただし、最も効果的なチャネルは技術カンファレンスやコミュニティ経由のリファラルです。SRE NEXTやCloudNative Days Tokyoなどのイベントにスポンサーとして参加し、自社の技術課題を発信することで、直接的な出会いを作れます。
Q6. フルリモートでSREを採用するのはリスクがありますか?
SRE業務はリモートとの親和性が高い職種です。クラウドインフラの操作、監視ダッシュボードの確認、障害対応のコミュニケーション(Slack・PagerDuty)はすべてリモートで完結します。むしろフルリモートを条件にすることで、地方在住の優秀な人材にもリーチでき、候補者プールが大幅に広がります。リスクを軽減するには、オンボーディング期間中だけ出社日を設けるハイブリッド型にする、定期的にオフサイトミーティングを実施するなどの工夫が有効です。
Q7. SREチームの適正規模はどのくらいですか?
Googleが推奨する目安として「開発エンジニア10名に対してSRE 1名」という比率があります。ただし、これはGoogleの規模と成熟度を前提とした数字であり、スタートアップには必ずしも当てはまりません。まずは1〜2名の専任SREからスタートし、サービスの成長と障害頻度に応じてチームを拡大していくのが現実的です。重要なのは、SREチームの負荷を定期的にモニタリングし、トイルの割合が50%を超えたら増員を検討するという基準を持つことです。
Q8. SREとプラットフォームエンジニアの違いは何ですか?
SREは「サービスの信頼性」に焦点を当て、SLO運用・障害対応・トイル削減を主務とします。一方、プラットフォームエンジニアは「開発者の生産性向上」に焦点を当て、CI/CDパイプライン・内部開発者ポータル・セルフサービスインフラなどを構築します。実際には両者の業務範囲は重なることが多く、特にスタートアップでは一人が両方の役割を兼務するケースが一般的です。採用時には、自社の課題が「信頼性」寄りなのか「開発者体験」寄りなのかを見極めたうえでポジションを設計すると、より適切な候補者にリーチできます。
まとめ:SRE・インフラエンジニア採用は「準備」で決まる
SRE・インフラエンジニアの採用は確かに難易度が高い領域です。しかし、その難しさの多くは「準備不足」に起因しています。
自社のフェーズに合った要件定義を行う
市場相場に見合った報酬レンジを設定する
候補者目線で具体的な求人票を作成する
テンプレではないスカウトメッセージを送る
正社員だけでなく副業・業務委託も視野に入れる
これらの準備を丁寧に行うだけで、採用の成功確率は大きく変わります。
SRE採用は一朝一夕に結果が出る領域ではありません。しかし、本記事で紹介した手法を一つずつ実行に移していけば、「半年経っても1人も採れない」状態を打破する糸口は必ず見つかります。まずは自社のインフラ現状の棚卸しから始めてみてください。
関連記事として、スカウトメールの書き方や報酬設計のガイド、副業・業務委託エンジニアの活用ガイドもあわせてご覧ください。
techcellarでは、SRE・インフラエンジニアの採用支援も行っています。スカウト文面の添削から要件定義の壁打ち、技術面接の設計まで、エンジニア採用のプロが伴走します。まずはお気軽にご相談ください。