Job title: Senior SRE Engineer - EH
Job type: Permanent
Emp type: Full-time
Industry: Information Technology < IT >
Salary: Negotiable
Location: Tokyo
Job published: 2024-05-02
Job ID: 50590

Job Description

Senior SRE Engineer 

(Japan Based Candidates only)

 

■ Your Role and Responsibilities 

  •  Lead the design, implementation, and management of scalable and reliable infrastructure solutions in public cloud environments (e.g., AWS).
  • Lead the development and maintenance of Kubernetes clusters, ensuring optimal performance, availability, and security.
  • Collaborate with development teams to provide expertise in designing architecture, act as a trusted advisor for development teams, provide consultations on infrastructure-related matters and guide them toward effective and scalable solutions.
  • Monitor system performance, troubleshoot complex issues, and implement proactive measures to ensure high availability and reliability.
  • Lead incident response and resolution, conducting post-mortem analyses to identify areas for improvement.
  • Lead the professional development initiatives within the team by mentoring junior members, conducting comprehensive code reviews to uphold quality and best practices, and orchestrating training and workshops to enhance overall skill set

 

  • AWSなどのパブリッククラウド環境でスケーラブルで信頼性のあるインフラソリューションの設 計、実装、および管理をリードします。
  • Kubernetesクラスターの開発とメンテナンスをリードし、最適なパフォーマンス、可用性、およ びセキュリティを確保します。
  • 開発チームと協力してアーキテクチャの設計に専門知識を提供し、開発チームに対して信頼できる アドバイザーとして機能し、インフラに関連する問題に対するコンサルテーションを行い、効果的 かつスケーラブルなソリューションに導きます。
  • システムのパフォーマンスを監視し、複雑な問題のトラブルシューティングを行い、高い可用性と 信頼性を確保するための積極的な対策を実施します。
  • インシデントの対応と解決をリードし、事後分析を実施して改善の余地を特定します。
  • チーム内のプロフェッショナルな成長イニシアチブをリードし、ジュニアメンバーへのメンタリン グ、コードの総合的なレビューによる品質とベストプラクティスの維持、全体的なスキルセットの 向上を図るためのトレーニングとワークショップを主催します。

 

■ Work Location

・Tokyo, Japan 

 

 

■ Experience and Qualifications 

  • Extensive expertise in at least one cloud platform (i.e. AWS, Azure, GCP, etc...) and experience in designing and leading the management of scalable cloud-based infrastructure
  • Strong expertise in infrastructure-as-code solutions such as Terraform
  • Strong operational expertise in containerization technologies, especially Kubernetes
  • In-depth knowledge of source control, CI/CD, infrastructure automation, orchestration, deployment automation and configuration management
  • Solid understanding of networking and security best practices • Excellent problem-solving skills and the ability to lead collaboratively in a team-oriented environment.
  • While our team is mostly english speaking, you should be comfortable enough talking in Japanese with other internal stakeholders

 

  • 少なくとも1つのクラウドプラットフォーム(例:AWS、Azure、GCPなど)における幅広い専 門知識と、スケーラブルなクラウドベースのインフラストラクチャの設計および管理のリーダーシ ップ経験
  • Terraformなどのインフラストラクチャのコード化ソリューションにおける強力な専門知識
  • 特にKubernetesにおける強力な運用の専門知識 • ソースコントロール、CI/CD、インフラストラクチャの自動化、オーケストレーション、デプロイ メントの自動化、および構成管理に関する深い知識
  • ネットワーキングおよびセキュリティのベストプラクティスに対する確かな理解
  • 優れた問題解決能力およびチーム指向の環境で協力的にリーダーシップを発揮できる能力
  • チーム内言語は主に英語となりますが、社内関係部門と日本語でコミュニケーションをとることが 求められます。

■ Additional Preferred Qualifications

  • AWS Solutions Architect certifications or knowledge on par with those
  • Certified Kubernetes Administrator or knowledge on par with those
  • Familiar with scripting languages (Shell, Python, Golang)
  • Familiar with extended infrastructure-related tooling such as Ansible or Chef
  • Experience in working with large software systems developed on Unix/Linux
  • Experience of working with monitoring and metrics systems (e.g Grafana, Datadog, etc.)
  • Experience in leading teams through incident response and post-mortem analysis
  • Experience in working closely together with development, product and business teams
  • Bi-lingual (business English & Japanese daily conversation or English daily conversation & Japanese native)

 

  • AWS Solutions Architect の認定資格 または同等の知識
  • Certified Kubernetes Administrator の認定資格 また同等の知識
  • Shell, Python, Golang などのプログラミング言語の経験
  • Ansible, Chefなどの拡張インフラ関連ツールの経験 • Unix/Linux上で開発された大規模なソフトウェアシステムの運用経験
  • モニタリングおよびメトリクスシステム(例:Grafana、Datadogなど)の管理運用経験
  • インシデント対応と事後分析を通じてチームをリードした経験
  • Engineering, Product, Business チームなどと連携しながら業務を進めた経験
  • バイリンガル(ビジネス英語&日本語の日常会話 または 英語の日常会話&日本語のネイティブ)