================================================================ 20120308-forschooner-seminor ================================================================ ---------------------------------------------------------------- 運用ドキュメント ことはじめ (大久保さん) ---------------------------------------------------------------- - 同じ事をよく聞かれる - いつの間にか保守切れている なぜそうなる ------------- - きいたほうが楽 - どうすれば良いかわからない メリット -------------------------------- - その人が仕様 からの脱却 - 可視化 状態 - 可視化 業務 整備例 -------------------------------- - 設計書 - 構成図 - 仕様書 - バックアップ - 監視 - 体制図 - 手順書 - 定型手順 - 障害対応手順 - 作業/障害管理票 - 環境定義 (構成情報の一種) - 管理台帳 意識すべきポイント ---------------------------------------------------------------- - レイヤー - ソフト/ハード - 管理 モデルケース -------------------------------- - 前任者がいない - ドキュメントがない - 社内向けシステム - 社外向けシステム - 必須 - 運用手順 - 資産管理 - できれば - 理想 運用資料 ----------------------------------------------------------------- - システムリスト - 関係者リスト - 物理資産 - アクセス手段(アカウント) 調査/ヒアリング - 利害関係者のあらいだし - 窓口、連絡先 - 外部ベンダーのサービス条件調査 管理対象の把握 - 保守情報 - 棚卸/現地 - 保守ベンダーの窓口 運用手順書 - 手順書 - 完了条件を意識する - 異常時の切り戻しの方法も考慮 環境の定義、運用仕様書 - 調査目的 - 調査計画 - リスト - 環境定義 - 調査方法 - 調査計画と手順は使い回せるように残しておく。 できれば -------------------------------- 自分を楽にする - 過去の作業をあらいだす - チケットの定型化 理想 -------------------------------- - 運用設計 - システム構成図 ---------------------------------------------------------------- 24/365運用の技術 ---------------------------------------------------------------- 止まることは機会損失 人がやるのは負担が高い、システムで補完しよう。 - 監視 (障害監視) - 通知が主目的 - 項目の定め方 - 内と外 - レイヤー - モニタリング (データ測定) - スケーリング計画のベース - Munin - 自動化 - IaaSをつかった障害自動回復の実例はあるか? - アメリカでもあまり実例がない? - 状況把握に一番時間かかる - そこを自動化できないか? - DevOps について - 発展途上 - スタートアップだと自然にDevOpsになっている。 - はやいデプロイ、はやいリリース - 5分でIaaSはたちあがる。 - 人はついていけてない。 - ネットゲームには "運営者" というサービス判断をする人がいる。そこは人でしかできない。 - 障害時は、すぐあやまりに来るよりも - 再発防止策/情報共有などのコミットの方が大事 ---------------------------------------------------------------- 橋本さん ---------------------------------------------------------------- ECO Easy Cloud Operation Easy: 楽な Nifty/AWS クラウド上に OS/ミドルウェア - CMS - EC - CRM