OpenShift on NVIDIA GPU(概要編)

16 Dec 2020, 19:21 By mosuke5

こんにちは、もーすけです。
本日はOpenShiftにNVIDIA GPUのノードを追加して利用する方法2つのブログ(概要編と導入編)に分けて紹介したいと思います。 あまりまだ日本語での情報がないので、挑戦したいと考えている人の参考になればと思います。 また、非常に進化が速く、情報が古くなる可能性もあります。なるべく更新していきたいと思っていますが、最新情報は公式情報をみてください。。 導入編では、OpenShiftを取り扱いますが、他のKubernetesディストリビューションをお使いの方も参考になるところはあると思います。

続きを読む

P2Pでコンテナイメージを配信できるDragonflyとAlibaba Cloudのなぞ

02 Dec 2020, 00:00 By mosuke5

こんにちは、もーすけです。
ここ最近、ワケアッて少しAlibaba Cloud関連のKubernetesについて調べています。 ちなみにこちらの記事はAlibaba Cloud Adovent Calender 2020の2日目の投稿です。

Alibaba Cloudの中の人をやめて、もう1年半以上たちますが、まだこうやって調べるとは思わなかったです。いまになっていろいろAlibaba Cloudが取り組んでいるコンテナ関連のことがよく理解できるようになってきました(笑) 本日はアリババ/Alibaba Cloudが開発するP2Pのファイル配信ソフトウェアのDragonflyについて少し書いてみたいと思います。(まだ調べ中のところもあるので許してください)

Dragonflyとは

Dragonflyは、アリババおよびAlibaba Cloudがメインとなって開発している、オープンソースのP2Pファイル配信の仕組みです。
よくコンテナイメージの配信のためのソフトウェアといわれることもありますが、実態はコンテナイメージだけでなく、どんなファイルにも活用できるものです。 コンテナ時代より前からアリババが研究していた効率的なアプリケーションの配布、キャッシュの配布、ログの配布、画像の配布がもとになっています。 現代のクラウドネイティブの環境になってコンテナイメージの配布にも活用されてきているということです。 その目標は、クラウドネイティブのシナリオにおけるすべての配布問題に取り組むことです。現在、Dragonflyは以下の点に焦点を当てています。

続きを読む

[Alibaba Cloud] KubernetesのProfessional managed clustersは何が違うのか?

29 Nov 2020, 20:46 By mosuke5

こんにちは、もーすけです。
Container Service for Kubernetes (ACK) では、新しくマネージドクラスタの中でサービスレベルを選べるようになりました。 Professional managed clustersというものです。 このクラスターは通常のマネージドクラスタと比べて何が違うのでしょうか? 調べてみたのでまとめました。

続きを読む

Docker Hubのダウンロード回数制限の対策を考える

18 Nov 2020, 17:32 By mosuke5

こんにちは。もーすけです。
今日は最近開始されたDocker Hubのイメージダウンロードの回数制限について書きたいと思います。 動向だけはなんとなく追っていたのですが、先日に自分がこの問題に向き合わなければいけないケースに遭遇したため、残しておこうと思い立ちました。

きっかけ

本ブログの記事のビルドやデプロイにはWeckerというサービスを利用しています。 ある日、記事を投稿しようとしたところCIのビルドがコケて記事を投稿できませんでした。 エラーは以下のとおりで、調べるとDocker Hubのイメージダウンロードの回数制限に引っかかっていることがわかりました。

fetch failed to pull image debian: API error (500): {"message":"toomanyrequests: You have reached your pull rate limit. You may increase the limit by authenticating and upgrading: https://www.docker.com/increase-rate-limit"}

docker-rate-limit-error

続きを読む

【翻訳】Kubernetes as a serviceの謎を解く。Alibaba Cloudが1万個のKubernetesクラスタを管理する方法

17 Nov 2020, 17:24 By mosuke5

※本記事は、著者であるZhimin Tangの許可をとって翻訳した記事となります。(原文)
また本記事の内容は、2020/12/11のAliEaters Tokyo #16にて発表しており、スライドは以下です。

概要

2015年以来、Alibaba Cloud Container Service for Kubernetes(ACK)は、Alibaba Cloud上でもっとも急速に成長しているクラウドサービスの1つです。今日では、ACKは多数のAlibaba Cloudの顧客にサービスを提供しているだけでなく、Alibabaの社内インフラストラクチャやその他多くのAlibaba Cloudサービスをサポートしています。

世界的なクラウドベンダーが提供する他の多くのコンテナサービスと同様に、ACKでは信頼性と可用性が最優先事項となっています。これらの目標を達成するために、セルベースでグローバルに利用可能なプラットフォームを構築し、数万個のKubernetesクラスタを稼働させています。

今回のブログ記事では、クラウドインフラ上で大量のKubernetesクラスタを管理した経験と、その基盤となるプラットフォームの設計についてご紹介します。

続きを読む

Googleアドセンス合格に必要なサイトのレイアウトについて

17 Oct 2020, 16:52 By mosuke5

こんにちは、もーすけです。
ふだんはあまりブログ運用のことは書きませんが、Googleアドセンスの合格について非常に重要な知見を得たのでまとめます。 ずばり、Googleアドセンスの合格には実は「サイトのレイアウトが重要である」ということです。

続きを読む

Kubernetesを学ぶ

16 Oct 2020, 00:00 By mosuke5
本ページは、Kubernetesを学びたい人向けにコンテンツを整備していくことを目的にしたものです。 随時更新しますので、ぜひご活用ください。 続きを読む

OperatorSDK for Ansible の開発。チュートリアルの次の一歩

10 Oct 2020, 14:06 By mosuke5

こんにちは、もーすけです。
本日は、Kubernetes Operatorの開発に関する情報提供をしたいと思います。 Operatorってなに?ってかたやより内部実装を学びたい方はぜひこちらの書籍(実践入門 Kubernetesカスタムコントローラーへの道)を参考にしてください。

Operator開発にはOperatorSDKを利用するのが非常に便利です。Go, Ansible, Helmなどを用いて開発できるのですが、今回はAnsibleを使ったOperatorについて書きます。 OperatorSDKは便利ですが、まだまだ情報が少なく、ドキュメントのチュートリアルを実施したあとに何をすればいいのか?とっつきにくいさもあります。 というわけで、このブログでは、チュートリアル後に何をすればいいか?どんなことを確認していけばいいのか?という観点でまとめてみましたので、ぜひ参考にしてOperator開発を楽しんでください。

まだチュートリアルをやっていないよ、というかたはこちらから済ましてみましょう。

続きを読む

KubernetesのPod内からの名前解決を検証する

09 Sep 2020, 17:45 By mosuke5

もーすけです。本日は最近おこなったトラブルシューティングの中で、自分がKubernetesのDNSまわりについて理解が乏しく手こずっていたのでその内容について簡単に書いていきたいと思います。

前提

これからcurlをhttpサーバに打ったり、digを行ったりしますが、Kubernetes内の下記のような環境で行ってます。

overview

続きを読む

ZabbixでKubernetesの監視を検討する(Prometheus exporter, Kubernetes API)

13 Aug 2020, 18:40 By mosuke5

こんにちは、mosuke5 です。 本日は、ZabbixでKubernetesの監視をどこまで頑張れるか考えてみたいと思います。 クラウドネイティブな環境ならPrometheusとそう単純に思うところですが、使い慣れたツールに統合したいことも当然ありますし、選択肢はいろいろあるべきですね。 どんな方法で実現できるのかみていきましょう。

続きを読む