opsの人気記事 64件 - はてなブックマーク

1 - 40 件 / 64件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

opsの検索結果1 - 40 件 / 64件

opsに関するエントリは64件あります。運用、開発、 aws などが関連タグです。人気エントリには『みずほ銀行システム障害に学ぶ』などがあります。

みずほ銀行システム障害に学ぶ
- 997 users
- ja.kohsuke.org
- テクノロジー
- 2021/06/17
みずほ銀行システム障害の調査報告書が公開されたのがニュースになって、Twitterなどで色々な人がコメントをしているのを見た。140文字しか書けない空間で他人の失敗談の揚げ足取りをするのは簡単だが、そこからは一時の爽快感以外に何も得るものがないので、僕はそういうのはカッコ悪いと思っている。そこで、ちゃんと読んでみたら全く他人事でない部分も沢山あるし、非常に面白く勉強になったので、ブログにまとめてみる。技術的な話銀行のシステムがどのようになっているのか、全然イメージが湧いていなかったので、それがまず勉強になった(p.29)。トラフィックのソースに応じて用意された色々なシステムから基幹システム「MINORI」の取引メインバスにトラフィックが流れ、そこから各種システムへとリクエストが送られていく。この辺はService Oriented Architectureらしい。開発当時としては（
- 障害
- あとで読む
- システム
- 開発
- IT
- development
- 運用
- 銀行
- セキュリティ
- 仕事
障害報告書を書こう！ - Qiita
- 844 users
- qiita.com/Ping
- テクノロジー
- 2022/07/04
担当しているITサービスなどに何かしらのインシデントや障害が発生した時に、対処後のアクションとして報告書を提出して事象の内容を報告（レポート）する場合がある。提出先は会社の偉い人だったりクライアントだったり。場合によってはユーザー向けに発表したり。事の顛末を報告して「今後同様のことを起こさないように努力します、ごめんなさい」をするのだ。どのように再発防止の努力するのかを書くものでもある。主にクライアント向けのビジネス内容ではあるが、自分が使っているテンプレパターンを共有するので参考にしてもらえればと思う。1 全般的なポイント心得のようなもの。次の点は留意してて欲しい。淡々と冷静な説明をこころがける当然のことながら事実は脚色しない。無駄な修飾も要らない。客観的な事実を簡潔に述べる。例： ❌「一生懸命頑張って対応したが…」 ❌「寝ないで対応したが…」 ❌「本当の原因は…」できるだ
- ドキュメント
- あとで読む
- 障害
- 運用
- 仕事
- qiita
- 技術
- 資料
- IT
- マネジメント
数時間かかる週一リリースを毎日何度も爆速でできるようにするまで / CI/CD Conference 2021
- 513 users
- speakerdeck.com/k0kubun
- テクノロジー
- 2021/09/03
CI/CD Conference 2021
- ci
- あとで読む
- devops
- デプロイ
- 開発
- terraform
- development
- CD
- サーバ
- cicd
Postgres と MySQL における id, created_at, updated_at に関するベストプラクティス
- 499 users
- zenn.dev/mpyw
- テクノロジー
- 2022/06/16
読者対象ある程度データベースに関する知識を持っている，経験年数 1 年以上のバックエンドエンジニア特定のプログラミング言語に依存する部分は含めないため，すべての SQL 使用者を対象とするまた，ゼロからの丁寧な説明というよりは，リファレンス感覚で使える記事という形にまとめる。 RDBMS の対象バージョン PostgreSQL: 9.4 以降 MySQL: 8.0.28 以降 id （データ型と INSERT 時のデフォルト埋め）導入一般的に採用されやすいプライマリキー用の値として，以下を考える。連番整数 MySQL では AUTO_INCREMENT， Postgres では IDENTITY や SERIAL と呼ばれるもの UUID v1: ハードウェアごとにユニークな単調増加値 UUID v4: ランダム値 UUID v7（ドラフト）: 単調増加であるタイムスタンプとラ
- postgresql
- mysql
- db
- あとで読む
- SQL
- database
- データベース
- UUID
- 設計
- id

あんどぅ on Twitter: "本番運用するといずれ誰もがたどり着く、公式ドキュメントには書かれてないログ管理の現実解が資料化されていてすばらしいそう、CloudWatch LogsにはDev環境 or ERRORの場合のみ飛ばすFluentdの設定をすることで利便性と料金のバランスをとるのであるこれは公式ドキュメントにすべき https://t.co/RE4FmPCpJX"
- 488 users
- twitter.com/integrated1453
- テクノロジー
- 2022/11/10
- aws
- ログ
- あとで読む
- 運用
- fluentd
- ドキュメント
- 環境
- インフラ
- サーバ
- monitoring
アプリケーション開発者は Amazon ECS あるいは Kubernetes をどこまで知るべきか #AWSDevDay / You build it, you run it
- 411 users
- speakerdeck.com/toricls
- テクノロジー
- 2021/09/29
Talked at AWS Dev Day Online Japan 2021. - 動画: https://youtu.be/I7mMQshlpcs - イベントページ: https://aws.amazon.com/jp/about-aws/events/2021/devday - Pro…
- kubernetes
- aws
- ecs
- あとで読む
- コンテナ
- k8s
- 開発
- 運用
- docker
- devops
コンテナ運用におけるログ基盤設計のベストプラクティス - Qiita
- 408 users
- qiita.com/naomichi-y
- テクノロジー
- 2020/12/24
課題数年前と比較すると、GKEやECSを始めとするコンテナ実行環境でのアプリケーション運用を行うサービスはかなり増えてきた印象があります。コンテナを運用する上では、アプリケーションのイベントを追跡する上でログをどう扱うかが課題になります。今までのように古いログを定期的にローテートして別のストレージに転送するといった手法はクラウドネイティブなアーキテクチャには最適とは言えません。アプリケーション開発の方法論として、Twelve Factor App ではログをイベントストリームとして扱うためのガイドラインが示されていますが、近年のWebアプリケーションではシステムを疎結合に連携するマイクロサービスという考え方が主流になりつつあります。アプリケーションログはサービスごとにフォーマットを整形した上で、ログ収集サービスに配送。必要に応じてリアルタイム分析や異常データの通知、そしてデータの可
- コンテナ
- あとで読む
- ログ
- 運用
- 設計
- docker
- ecs
- qiita
- kubernetes
- log
「コード書きました、あとはよろしく」では優れたソフトウェアは生まれない　コンテナのスペシャリストが語る、運用性を損なう8つの実装例 | ログミーBusiness
- 369 users
- logmi.jp
- テクノロジー
- 2022/02/03
今押さえておくべき知識をアップデートし、ノウハウを共有し、さらなるスキルアップを実現する場として開催されている、AWS で最も Developer に特化したカンファレンス「AWS Dev Day Online Japan」。ここでSr. Product Developer Advocate, Elastic Containersの原氏が登壇。続いて、運用性に優れたソフトウェアが重要な理由と、運用性を損なう8つの実装例について紹介します。前回はこちらから。 You build it, you run it原トリ氏：（スライドの「You build it, you run it」を指して）この言葉、聞いたこと、見たことがある方がいるかもしれません。これは、2006年にACM（Association for Computing Machinery）という団体が、Amazon AWSのCTOであ
- 開発
- あとで読む
- 運用
- コンテナ
- aws
- ソフトウェア
- docker
- devops
- コード
- 仕事
「運用組織」の考え方と設計〜運用組織論 2021 / 20210310-ssmjp-operation-organization
- 364 users
- speakerdeck.com/opelab
- テクノロジー
- 2021/03/11
ssmjp ssmonline #8 "第三回はたのさん祭オンライン"( https://ssmjp.connpass.com/event/206074/ )での発表資料です。 (運用設計ラボ合同会社波田野裕一)
- 運用
- 組織
- 設計
- あとで読む
- 考え方
- devops
- management
- ssmjp
- マネジメント
- 仕事
Cloudflare outage on June 21, 2022
- 364 users
- blog.cloudflare.com
- テクノロジー
- 2022/06/21
Today, June 21, 2022, Cloudflare suffered an outage that affected traffic in 19 of our data centers. Unfortunately, these 19 locations handle a significant proportion of our global traffic. This outage was caused by a change that was part of a long-running project to increase resilience in our busiest locations. A change to the network configuration in those locations caused an outage which starte
- cloudflare
- CDN
- あとで読む
- 障害
- network
- incident
- ネットワーク
- BGP
- トラブル
- セキュリティ
サーバ作業を安全に行うための工夫
- 271 users
- heartbeats.jp
- テクノロジー
- 2022/09/27
こんにちは。 2021年7月にハートビーツに入社後、エンジニアリンググループに所属している北岡です。以前は同じMSP企業で10年以上勤務しておりましたが、自身のスキル向上などを目的としてハートビーツへ入社しました。私の転職の経緯やハートビーツへ入社して感じたことなどは今後お話するとして、今回はお客様のLinuxサーバ上で作業する際、私がオペレーション中に意識していることやミスを防ぐために行っていることについて紹介します。コピー、ペーストのショートカットキーを変更するコピー「Ctrl + c」とペースト「Ctrl + v」はキーが隣り合っており、タイピングミスによってコピーしようとしたつもりがペーストしてしまったということが起こりえます。メモ帳などで起きた場合は特に問題にはなりませんが、サーバ上で起きると不要なコマンド実行に繋がります。小さなことではありますが防止策をとるべきです。
- サーバ
- あとで読む
- コマンド
- 運用
- linux
- tmux
ローカルマシンでDocker を動かさないためにBlimp を採用する - y-ohgi's blog
- 264 users
- y-ohgi.blog
- テクノロジー
- 2020/12/15
https://blimpup.io TL;DR docker-compose をリモートで実行するための開発フェーズ向けのサービスローカルマシンへ負荷をかけずに開発できる URL を発行してくれるため第三者への公開も可能概要 blimpup はざっくりいうと「docker-compose をリモートで実行する」ためのサービスです。用途としては本番環境としてではなく開発フェーズでの利用を想定されており、docker-compose を使用した開発の効率化を行ってくれます（k8s のtelepresence に近いイメージです）。従来開発フェーズで使用していたdocker-compose をローカルで直接コンテナを動かすのではなく、blimp の提供するインフラ上で動かし、ローカルマシンに負荷をかけることなく開発が可能になります。ローカルのファイルと同期を行ってくれるためファイルの更
- docker
- 開発
- あとで読む
- コンテナ
- サービス
- docker-compose
- コマンド
- development
- dev
- 仮想化
運用設計における設計項目の体系化 / 20240207-ssmjp-operation-design-items
- 258 users
- speakerdeck.com/opelab
- テクノロジー
- 2024/02/08
ssmjp ssmonline #38 "第四回はたのさん祭オンライン"( https://ssmjp.connpass.com/event/307397/ )での発表資料です。 (運用設計ラボ合同会社波田野裕一)
- 運用
- あとで読む
- 設計
- 開発
- 資料
- システム
AWSのCLI作業はどこで行う？安全に管理するパターンとメリデメ集 | DevelopersIO
- 234 users
- dev.classmethod.jp
- テクノロジー
- 2021/05/28
AWSアクセスキーセキュリティ意識向上委員会って何？昨今、AWSのアクセスキーを漏洩させてしまうことが原因でアカウントへの侵入を受け、多額の利用費発生・情報漏洩疑いなど重大なセキュリティ事案が発生するケースが実際に多々起きています。そこで、アクセスキー運用に関する安全向上の取組みをブログでご紹介する企画をはじめました。アクセスキーを利用する場合は利用する上でのリスクを正しく理解し、セキュリティ対策を事前に適用した上で適切にご利用ください。 AWS CLI、どこから使っていますか？ざっくり、以下4種類のどれかを使っている方が多数派ではないでしょうか。ローカル端末 AWS内に構築した管理用EC2にSSHを利用して接続 AWS内に構築した管理用EC2にSSM(セッションマネージャ)を利用して接続 AWS CloudShell 一体どう違うのでしょうか。状況によって良し悪しは異なる
- aws
- あとで読む
- CLI
- iam
- セキュリティ
- 運用
- security
- 管理
- Amazon
「知的単純作業」を自動化する、地に足の着いた大規模言語モデル (LLM) の活用
- 233 users
- speakerdeck.com/nrryuya
- テクノロジー
- 2024/05/08
LayerX 部門執行役員・AI・LLM事業部長中村龍矢 2024/5/8 生成AI Conf
- AI
- あとで読む
- LLM
- GPT
- business
- ビジネス
個人でもAWS Organizationsを使ったほうが良い理由 - 本日も乙
- 229 users
- blog.jicoman.info
- テクノロジー
- 2021/07/23
技術書典11で「Amazon Web Servicesコスト最適化入門マルチアカウント編」を頒布中です。 techbookfest.org BOOTHでも購入できますが、送料（370円）がかかってしまうので、7/25までであれば技術書典のオンラインマーケットだと送料がかからずお得かと思います。オンラインマーケットだと物理本の発送が8月になってしまいますが、BOOTHは私が発送するので注文後数日で届きます。すぐに物理本が欲しい人はBOOTHまで。 booth.pm マルチアカウントに対する障壁の高さ個人用途におけるマルチアカウントのメリット使い捨てのAWSアカウントを作ることができる検証用環境として活用する GCPのプロジェクトと同じような感覚マルチアカウントのデメリットアカウントの削除（解約）が面倒セキュリティコスト管理まとめマルチアカウントに対する障壁の高さ 6/19
最強のツール「LangSmith」が登場した話【Python / LangChain】
- 216 users
- zenn.dev/umi_mori
- テクノロジー
- 2023/07/23
【📩 仕事の相談はこちら 📩】お仕事の相談のある方は、下記のフォームよりお気軽にご相談ください。 https://forms.gle/G5g1SJ7BBZw7oXYA7 もしもメールでの問い合わせの方がよろしければ、下記のメールアドレスへご連絡ください。 info*galirage.com（*を@に変えてご送付ください） 🎁 「生成AIの社内ガイドライン」PDFを『公式LINE』で配布中 🎁 「LINEで相談したい方」や「お問い合わせを検討中の方」は、公式LINEでご連絡いただけますと幸いです。（期間限定で配信中なため、ご興味ある方は、今のうちに受け取りいただけたらと思います^^） https://lin.ee/3zRuqKe おまけ①：生成AIアカデミーより専門的な「生成AIエンジニア人材」を目指しませんか？そんな方々に向けて、「生成AIアカデミー（旧：生成AIエンジニア
- LLM
- あとで読む
- LangChain
- ChatGPT
- python
- AI
- 機械学習
- データ
Fastlyが大規模障害の経緯を公開、原因はソフトウェアのバグ。障害を1分以内に検知し、49分でおおむね復旧させたと報告
- 208 users
- www.publickey1.jp
- テクノロジー
- 2021/06/09
Fastlyが大規模障害の経緯を公開、原因はソフトウェアのバグ。障害を1分以内に検知し、49分でおおむね復旧させたと報告 CDNベンダ大手のFastlyが日本時間6月8日夕方に障害を発生、その影響は国内にもおよび、メルカリや楽天市場、Amazon.co.jp、Twitter、ABEMAなど多くのサービスに接続できないなどの障害が発生しました。 We identified a service configuration that triggered disruptions across our POPs globally and have disabled that configuration. Our global network is coming back online. Continued status is available at https://t.co/RIQWX0LWwl
リクルートのAWS基盤におけるTerraform運用_実践的な取り組みと組織づくり / HashiCorpVirtualStrategyDay_sudo
- 206 users
- speakerdeck.com/recruitengineers
- テクノロジー
- 2022/04/23
2022/04/21_HashiCorp Virtual Strategy Day Japan Vol.2での、須藤の講演資料になります
生産性を可視化したい！ / SUZURI's four keys
- 167 users
- speakerdeck.com/udzura
- テクノロジー
- 2021/06/17
@Pepabo Tech Conference #15 - ECプラットフォームSUZURIの開発の裏側 https://pepabo.connpass.com/event/215058/
Terraformerとしてコードを書いて思うこと | フューチャー技術ブログ
- 166 users
- future-architect.github.io
- テクノロジー
- 2021/10/29
こんにちは。TIGの伊藤です。この記事は秋のブログ週間2021の3日目です。はじめに私は普段会社でクラウドをまたいでTerraformを日々書いたり、メンバーに教えたりしています。もはや俗に言うプログラミング言語を書かずにここまで全振りしてきたくらいなので、比較的自信を持ってコードを書いて仕事をしています。特にここ最近はほぼ1からコード設計をして運用まで持っていくこともあり、「より腐りにくい、より息の長いコード」というものを考えるようになりました。Terraformだからこその「定期メンテを簡易にするためには」「より簡単に変更するためには」をひたすら突き詰めていった結果、アツい気持ちが生まれ、今回は筆を取っています。そんな私のアツい気持ちをしたためた今回の記事ですが、可能な限り例も添えつつ、いくつか解説できればと思います。公式にも実は載っているような内容もあったりしますが、日本語の記
- Terraform
- IaC
- あとで読む
- aws
- コード
- 運用
- 技術
- ブログ
- web
WebAssemblyでの機械学習モデルデプロイの動向
- 143 users
- www.tkat0.dev
- テクノロジー
- 2020/12/02
本記事はMLOps Advent Calendar 2020の 2 日目の記事です。 WebAssembly（Wasm）は機械学習モデルをデプロイする新たな手段になりうるでしょうか。この記事では、機械学習モデル（特に Deep Learning）を Wasm でデプロイする周辺技術の動向や内部の仕組みをざっくりと説明します。 Table of Contents tkat0 です。WebAssembly(Wasm)面白いですね。私も最近はyewでフロントエンドを書いて遊んでいます。Rust で React っぽいことできるのは新鮮で面白いです。 Wasm は、なんとなく速い JavaScript？とか機械学習で何に役立つの？とか思ってる方も多いと思います。しかし、Wasm はブラウザでの推論時に使えるだけでなく、機械学習モデルのサービングやエッジデバイスでの推論にも使えると知ったら驚き
- WebAssembly
- 機械学習
- wasm
- あとで読む
- machinelearning
- TensorFlow
- MLOps
- continuousDelivery
- deploy
- tvm
エラー監視とテスト体制への改善作戦 / PHPerKaigi2022
- 131 users
- speakerdeck.com/kazatohiei
- テクノロジー
- 2022/04/09
What's in a price? How to price your products and services
- テスト
- あとで読む
- 監視
- エンジニア
- 考察
- php
Summary of June 8 outage
- 122 users
- www.fastly.com
- テクノロジー
- 2021/06/09
Summary of June 8 outageWe experienced a global outage due to an undiscovered software bug that surfaced on June 8 when it was triggered by a valid customer configuration change. We detected the disruption within one minute, then identified and isolated the cause, and disabled the configuration. Within 49 minutes, 95% of our network was operating as normal. This outage was broad and severe, and we
- fastly
- incident
- 障害
- あとで読む
- cloud
- trouble
- network
DevOpsトポロジー
- 102 users
- www.ryuzee.com
- テクノロジー
- 2022/04/11
チームトポロジー価値あるソフトウェアをすばやく届ける適応型組織設計著者／訳者：マシュー・スケルトン、マニュエル・パイス、原田騎郎、永瀬美穂、吉羽龍太郎出版社：日本能率協会マネジメントセンター発売日：2021-12-01単行本：280ページISBN-13：9784820729631ASIN：4820729632 今日はこの「チームトポロジー」の元となったDevOpsトポロジーについて紹介します。このアイデアは2013年に著者の1人であるマシュー・スケルトンが自身のブログに書いた記事をまとめたものです。 2013年頃といえばDevOpsが流行しはじめた時期だと思いますが、このような時期から組織構造やチーム間のコミュニケーションモデルをロジカルに定義しようとしていたのは驚きです。チームトポロジーでは、このDevOpsトポロジーやその他の考え方を元にして、4つのチームタイプと3
- devops
- あとで読む
- SRE
- チーム
- 組織
- 開発
- Blog
AWS アクセス管理を一歩先へ！カミナシのセキュアな AWS アクセス管理を実現するシステムの紹介 - カミナシエンジニアブログ
- 100 users
- kaminashi-developer.hatenablog.jp
- テクノロジー
- 2024/12/04
カミナシのエンジニアリング組織では、チームメンバーの AWS アカウント環境への定常的なアクセス権限として「センシティブな情報を除いた全リソースへの ReadOnly Access」を付与しており、一方で書き込み権限については必要に応じてメンバーが一時的に権限を獲得できる仕組みとシステムを開発し、運用を行っています。本記事では、そういった仕組みを開発するに至った経緯や仕様、そしてこれを数ヶ月ほど運用した結果と今後の展望について紹介します。このシステムは『ハマヤン』という名前で呼ばれていますが、あまねくユーザーに愛される素敵な名称であり、Sec Eng チーム内でも大人気です。開発者が濱野さんだからハマヤンにしたのでは？と社内で言われることがありますが、真相は不明です。ハマヤンを開発した理由ハマヤン開発前の2022年頃、カミナシではソフトウェアエンジニア全員が Administrat
75億ドキュメント以上のデータを保持するMongoDBを、Amazon EC2からMongoDB Atlasへ約3ヶ月で移設した方法 | CyberAgent Developers Blog
- 87 users
- developers.cyberagent.co.jp
- テクノロジー
- 2021/06/17
75億ドキュメント以上のデータを保持するMongoDBを、Amazon EC2からMongoDB Atlasへ約3ヶ月で移設した方法はじめにタップル SREの赤野、CAM SREの庭木です。タップルは2021年3月頃にMongoDB on Amazon EC2(以下EC2 MongoDB)からMongoDB Atlas(以下Atlas)への移設を行いました。今回はこの移設での取り組みについて紹介します。 Atlasへ移設することになった経緯・目的タップルでは定期的にキャパシティプランニングを目的とした負荷試験を実施しており、今後のDAU増加のシミュレーションに対してシステムのキャパシティが確保できるかを定期的に確認しています。タップルSREのキャパシティプランニングの取り組みについては、以前発表させていただいた資料があるのでこちらにも目を通していただけると幸いです。 2020年
- MongoDB
- db
- aws
- あとで読む
- database
- Developers
- データ
- SRE
- amazon
- ドキュメント
マイクロサービスにおけるAZ間通信のコスト大幅削減した話 with Istio Locality Load Balancing - Gunosy Tech Blog
- 85 users
- tech.gunosy.io
- テクノロジー
- 2022/08/24
広告技術部のUT@mocyutoです。大幅コスト削減シリーズ第二弾です。前回はこちら tech.gunosy.io 今回はアベイラビリティゾーン（AZ）間通信のコストをIstioのlocality load balancingを使って削減した話になります。概要 Istioとはどのようにコスト削減したかまとめ概要みなさんはマイクロサービスを導入しているでしょうか？最近はモジュラモノリスが流行り始めている雰囲気を感じてきていますが、弊社の広告配信サーバは以下のようなマイクロサービス化された設計（と言っても2つのサービスしかないのですが）になっています。構成図一般的にクラウドプロバイダ上で構築している場合、耐障害性を高めるために複数AZ、複数リージョンに分散させることが基本になるかと思います。弊社では、単一リージョン複数AZに分散させて稼働しています。リージョン間の通信に
- Istio
- envoy
- あとで読む
- 設計
- 設定
- Cloud
- サービス
- development
なぜセキュリティを言い訳にアジリティが犠牲になるのか - 流沙河鎮
- 78 users
- bering.hatenadiary.com
- テクノロジー
- 2023/04/04
ここ数年、アジリティとセキュリティ(あるいはガバナンス)の両立について考える機会が多い。伝統的で規模の大きい企業にありがちな傾向として、セキュリティやガバナンスを確保するためにはシステムの開発/運用が鈍重、高コスト、不自由になったとしても已む無しとする思想がしばしば見受けられる。結果として例えば簡単な仮想サーバ１つを用意するだけでも数ヶ月の納期と膨大な工数を要するとか、世の中で当たり前に活用されている技術やプロセスが許可されない/導入に非現実的な手続きを要求されるといった状況が生まれる。確かにシステムの安全性を適切にコントロールすることは重要である一方で、論理的に考えれば「セキュリティのためのビジネス」ではなく「ビジネスのためのセキュリティ」なのだから、セキュリティを確保するためにビジネスの成功が妨げられてしまっては本末転倒に思える。しかし実際には「セキュリティのためなので仕方がない」と
GitHub - openstatusHQ/openstatus: 🏓 The open-source synthetic monitoring platform 🏓
- 72 users
- github.com/openstatusHQ
- テクノロジー
- 2023/10/07
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- monitoring
- あとで読む
- 監視
- OSS
- github
- library
- *あとで読む
運用の考え方は「システム管理」から「サービス管理」へ　ITIL4で変わってきた、運用者に求められること | ログミーBusiness
- 67 users
- logmi.jp
- テクノロジー
- 2021/11/10
2019年頃に起きた運用の変化近藤誠司氏（以下、近藤）：みなさん運用をやっている方が多いということで、ご存知のITIL（Information Technology Infrastructure Library）のv3、シラバス2011をベースにしたものを貼っています。いろいろとプロセスや機能などがあって、分類がありました。シラバス2011、ITIL v3の時点では、基本的にはサービスストラテジが戦略を練る、サービスデザインは設計するというところです。トランジションは、設計したものを作って移行する。オペレーションが運用していく。最終的には継続的なサービス改善していくというところで、基本、分類が時系列に並んでいたと思います。 2011年から2019年、8年ぐらいはITILはこの形態でよしとしていました。 2019年になると、これがITIL4に変わりました。久しぶりに大幅なアップデートが起こ
モバイルゲームの運営を譲り受け「長命化」させるマイネット。彼らはどのようにサービスを移管しているのか？インフラ担当会社ビヨンドと共に内情を明かす - AUTOMATON
- 65 users
- automaton-media.com
- アニメとゲーム
- 2020/11/30
- インフラ
- ゲーム
- game
- あとで読む
- cloud
- サービス
- ネット
クラウドのシステム運用技術に機械学習を応用する研究 / CLOUD AI
- 63 users
- speakerdeck.com/yuukit
- テクノロジー
- 2020/12/09
第6回さくらインターネット研究会
- 機械学習
- 運用
- cloud
- あとで読む
- DevOps
- machinelearning
- AI
- システム
- 学習
- 研究
Gitで継続的デリバリーを実現する「GitOps」とは？概要とGitOpsソリューションの紹介
- 63 users
- codezine.jp
- テクノロジー
- 2021/06/22
GitOpsとは、分散バージョン管理システムであるGitを使用して、全てのアプリケーションとインフラストラクチャの望ましい状態を宣言的に記述し、管理する手法で、継続的デリバリーを実現する一つのモデルです。本連載では、GitOpsを活用した継続的デリバリーやプログレッシブデリバリーについて紹介します。第1回では、GitOpsの概要やメリット、GitOpsを実現するソリューションを紹介します。はじめに本連載はソフトウェアデリバリーにおける継続的デリバリー・プログレッシブデリバリーについての連載で、以下の3つの記事で構成されています。第1回となる本記事では、継続デリバリーについての概要、話題となっているGitOpsは何か、どんなメリットがあるのか、現在のGitOpsソリューションについて紹介します。第2回では、プログレッシブデリバリーの解説と各ソリューションの紹介・比較について説明します
- gitops
- git
- DevOps
- ci
- あとで読む
- デプロイ
- techfeed
- GitHub
State of DevOps Report 2021を日本語で解説ーTeam Topologies Model、プラットフォームが重要な要素ー - TC3株式会社｜GIG INNOVATED.
- 58 users
- www.tc3.co.jp
- テクノロジー
- 2021/07/29
State of DevOps Report 2021を日本語で解説ーTeam Topologies Model、プラットフォームが重要な要素ーはじめに State of DevOps ReportはDevOpsの成熟度についてアンケート形式で調査しているレポート資料です。毎年アップデートされているので、直近の動向などを理解し、かつ課題解決の活路を見出すのに良いレポートです。2021版が先日リリースされていました(もとのレポートはこちら)。デジタルトランスフォーメーションの文脈の中で、ソフトウェア開発がますます増えてきていますが、単に一発作っておしまいではなく、継続的に進化させることが求められます。継続的にサービスを進化させていくことがビジネス力の根源となるということをアンケート調査から証明したのが、このレポートで、調査内容については、『LeanとDevOpsの科学』をご一読いただく
KaggleOpsを考える ~ MLflow + Colaboratory + Kaggle Notebook ~ - GMOインターネットグループグループ研究開発本部
- 56 users
- recruit.gmo.jp
- テクノロジー
- 2021/01/15
2020.10.05 KaggleOpsを考える ~ MLflow + Colaboratory + Kaggle Notebook ~ こんにちは。次世代システム研究室のY. O.です。筆者はデータ分析のスキルアップのためにkaggleというデータ分析プラットフォームを活用しています。kaggleを始めてから約2年間を経て、スキルアップの枠を超え、趣味・生活の一部・etc.になってきてしまっているのも認めざるを得ません。。。今回は、先日kaggleの自然言語処理コンペ（Tweet Sentiment Extraction）で2位になった結果を題材に、振り返りの意味を込めて”こうしておけば良かった”という点をMLOpsの観点でまとめていきたいと思います。ここで、kaggleを取り巻くMLOpsの構成をKaggleOpsと勝手に呼ぶこととし、少なくとも筆者は今後のコンペでも以下にまとめ
- kaggle
- MLOps
- colaboratory
- GPU
- あとで読む
[レポート] オペレーション、監視(Monitoring)、可観測性(Observability)… AmazonのCTOはAWS re:Invent 2020のキーノートでどう語ったか？キーワードを拾ってみた #reinvent | DevelopersIO
- 54 users
- dev.classmethod.jp
- テクノロジー
- 2021/01/05
- aws
- 運用
- あとで読む
- 開発
Python で緊急対応時の Slack 操作を自動化してみた | DevelopersIO
- 54 users
- dev.classmethod.jp
- テクノロジー
- 2021/06/14
このブログはこんな方におすすめ緊急対応の初動を早めたいリモートワーク中心になり、緊急対応中の作業分担や進捗確認が難しい Google Apps Script で緊急対応時の Slack 操作を自動化してみたの Python 版がほしい 2021年6月11日に以下のセッションに登壇しました。本ブログでは登壇中に紹介するとお伝えした関数をご紹介します。また背景についても改めて少し記載しています。業界特化事例紹介セッション SIer編 | Slack はじめにクラスメソッドでは Slack API を活用することで、いくつかある緊急対応の初動が約30分早くなりました。では、どのように活用して初動対応を迅速化したのでしょうか。本ブログでは、クラスメソッドの緊急対応の一つである、AWS 不正利用対応を例に紹介します。 AWS 不正利用とは、AWS アクセスキーの漏洩などが原因で発生しま
- slack
- aws
- python
- 運用
- あとで読む
「システム運用アンチパターン」という書籍を翻訳しました｜yuichielectric
- 48 users
- note.com/yuichielectric
- 暮らし
- 2022/04/11
こんにちは、田中裕一です。今回Jeffery Smithさんが書かれた「Operations Anti-Patterns」という書籍の日本語訳を「システム運用アンチパターン」として出版します。発売日は4/12ですが、一部の書店では既に店頭に並んでいるようですし、オンラインでも買えるようになっています。是非一読いただけると嬉しいです。どういった本か本書を一言で言うならDevOpsによる変革を実践する人のための一冊です。ただ、そういった書籍は「Effective DevOps」や「The DevOpsハンドブック」など、これまでもありました。そういった書籍との違いは本書についての紹介に表れています。本書は、技術チームの運用担当や開発担当のチームリーダーや一般のエンジニアを対象としています。より上位のマネージャーやシニアリーダーも本書から多くの有用なヒントを得ることができるでしょう。しかし
- devops
- book
- 本
- あとで読む
- server
- tech
- 考え方
軽量feature flag導入の手引き - Qiita
- 47 users
- qiita.com/behiron
- テクノロジー
- 2022/06/15
何か Kyashでサーバサイドのエンジニアをしているhirobeです。業務でサーバサイドのアプリケーションへのfeature flag導入を提案および設計をしました。どのような設計や実装にするか、なぜそうしたかを整理します。なお、アプリケーションの特性としては以下を念頭に入れていただければと思います。新規プロダクトではなく、5年以上動いている既存プロダクトに導入するサーバサイドアプリケーションのみをスコープとする 20~30のマイクロサービスから構成されているマイクロサービス間はREST/gRPC/SQSで通信されているそもそもなぜ導入するのか？目的を整理しておきます！ featureブランチからmainブランチにmergeされるまでの期間が長いために、以下のような問題がありました。複数の機能開発の修正がconflictする可能性があり、またそれに気づくのが遅れる可能性が