Data Science and AI

オープンソースが切り拓いた「どこからでもコンピューティング」への道

2023年10月02日

カテゴリー Data Science and AI | IBM Data and AI

記事をシェアする:

IBMのPriya Nagpurkarが、オープンソース・コミュニティーがどのように機能するのか、なぜイノベーションを促進するのか、そしてオープン・テクノロジーがAIの未来を支えるのかについて説明します。

Credit: Ryan Lavine

IBMは、LinuxやKubernetesのようなオープンソースの技術でハイブリッド・クラウド・ビジネスを構築しました。今日、これらの技術により、企業はどこからでもワークロードを処理することができ、クラウド上のパブリック・サーバーとプライベート・サーバーの間で簡単に移行することができます。これらのテクノロジーに加え、RayやPyTorchのような新たなテクノロジーは、今やAIの未来に重要な役割を担っています。

IBMは、ハイブリッド・クラウドで動作して今のビジネス・ニーズを満たすように、watsonxを設計しました。IBMのハイブリッド・クラウド・プラットフォームのイノベーションを推進する研究をリードしているPriya Nagpurkarに、オープンソース技術の過去、現在、そして未来について話を聞きました。

なぜオープンソースに魅了されたのか？

私は2000年代にプログラミング言語のランタイムで博士号を取得しました。当時はJavaがホットで、ジャスト・イン・タイム・コンパイルは新しい概念でした。当時IBMは、仮想マシンをテストするためのJikes RVMを公開したばかりでした。新しいコンパイル手法やジャスト・イン・タイムの最適化を試すのにこのJikes RVMが適していました。Jikes RVMはIBMの支援を受けていたので、それを利用すれば自分の研究を商業的に応用してもらい、実際のユーザーに役立てることができました。大学院生だったので、ゼロから何かを作り、その上に新しいものを作る時間はなかったのです。それが私にとってオープンソースの価値でした。

オープンソースはどのようにイノベーションを加速させるのか？

オープンソースを利用することで、1つの会社内の才能だけでない、膨大な先行研究を利用し、その上に自分の仕事を積み重ねることが可能になります。そうすることで、イノベーションはより速く進みます。他の人がやっていることの上に構築し、そこから利益を得ることができるのです。

なぜオープンソースにとってガバナンスが重要なのか？

たとえば、ある特定のテクノロジーの価値を信じて、IBMの誰かがGoogleの誰かとチームを組むかもしれません。しかし、GoogleとIBMは異なる目標を持っています。ガバナンス、つまり協力者が一緒に働ける仕組みがあれば、共通の土台を見つけることができます。デメリットは、時間がかかることです。オープンなコミュニティーで合意点を見つけるには、会社の製品チームを説得するよりも時間がかかります。あなたが解決しようとしている問題が正しいものであり、ソリューションが幅広い価値を持つものであることを、より多くの人にわかってもらう必要があります。ガバナンスにはもうひとつ良い側面があります。これは特にAIについて言えることです。すなわち、より多くの人が問題点を見つける機会を持つということです。誰もがAIは良いものだと話していますが、一方でAIは悪いものにもなり得てしまいます。コミュニティー全体がテクノロジーを監視していれば、問題を抑制することができます。

オープンソースの課題にはどのようなものがあるか？

前述したように、共通の土台を見つけるには時間とエネルギーがかかります。もうひとつは、どうやって差別化を図るかです。企業としては、テクノロジーをどのように収益化するか、です。しかし、私たちの経験では、少なくとも大規模なシステムやプラットフォームでは、オープンソースのテクノロジーを組み合わせてシームレスなユーザー体験を生み出し、継続的なサポートを提供する機会がたくさんあることがわかっています。そしてIBMとして存在感を示すことができれば、IBMのお客様とそのユースケースの利益のためにオープンソースのテクノロジーに影響を与え、形作ることもできます。お客様の利益のために、集合的なイノベーションを活用することができるのです。

IBMのオープンソースの成功例は？

ほとんどの人は、1990年代にオープンソース・ソフトウェアのムーブメントを起こしたオペレーティング・システムであるLinuxのことをご存知でしょう。IBMは初期からその支援者であり、貢献者でもあります。先にJavaとJikes RVMについて述べました。私は、サーバーレス・コンピューティングのための OpenWhiskと、サービス・メッシュのIstioという2つの関連技術に取り組みました。どちらもRed Hat OpenShiftを通じてクラウド・ネイティブなエコシステムを支えており、現在IBMの高成長分野となっています。今やAIソフトウェアのエコシステム全体がOpenShift上に構築されています。watsonxは、企業が生産性を向上させられるように、これらのテクノロジーをシームレスに統合します。オペレーティング・システムや分散システムからRayやPyTorchのようなAIフレームワークまで、ソフトウェアはますますオープンになってきています。

IBMはどのようにオープンソースのパートナーを選んでいるのか？

私たちは、解決しようとしている問題が私たちとオープンソース・コミュニティーでうまくマッチしているところを探します。「問題と解決策」が合っているかです。時には、既存のコミュニティーに参加することもあります。あるいはそうでなく、ある技術をインキュベートし、他の人たちに参加を呼びかけることもあります。基盤モデルはその好例です。何千ものオープンソースのAIモデルを提供するHugging FaceとIBM、学習や推論をより効率的にしようとするRayやPyTorchのコミュニティーにとって、基盤モデルは大きな機会です。健全でオープンなガバナンスも重要です。単一の団体が主導権を握っているのか、それとも他の人たちも参加し、結果に影響を与えることが許されているのかがポイントです。私たちは、IBMの希望が反映されるようにコミュニティーに影響を与えたいのです。

オープンソース・コミュニティーは民主的なものか？

オープンソース・コミュニティーは、むしろ実力主義のようなものと言えます。というのは、あなたはまず、あなたがコミュニティーに技術的価値をもたらすということを示さなければなりません。貢献者としてコミュニティーの信頼を得れば、「メンテナー」に昇格し、変更を加えることができるようになります。主要な決定を下すのは、技術統括委員会（Technical Oversight Committee）であることが多いです。IBMのような企業が参加する場合、資金を提供し、重要な決定に対して発言権を持つ理事会の席を確保することがしばしばあります。プロジェクトを支援し、公式に参加するということは、通常、何らかの商業的利益を得ることを期待していることを意味しています。

異質なオープンソース・プロジェクト同士をどのように協力させるのか？

差別化する方法を見つけるということに話は戻ります。OpenShiftプラットフォームが良い例です。OpenShiftは、Kubernetesの上にあるRayや、AIジョブを実行するためのPyTorchと統合されています。IBMは、これらのコミュニティーを統合し、IBMが必要と考える方向にテクノロジーを振り向ける手助けをしました。私たちは、優れたユーザー体験を提供するために、テクノロジーのパッケージ化とシームレスな統合を支援しました。

オープン・コミュニティーはフリーローダーにどう対処するか？

誰かが貢献せずに技術を手にするのを止めることはできませんが、そのような人たちは限定的な影響力しか持てません。そのような人たちが新機能を必要としても、その開発は優先されないかもしれません。オープン・ガバナンス、すなわち先に述べた実力主義の仕組みには、チェックとバランスがあります。オープンソースのソフトウェアは誰でも利用できますが、サポートが必要な場合はどうなるのでしょうか？Red Hatは、オープンソースのコンテナ・オーケストレーション・システムであるKubernetesをベースにしたOpenShiftの商用版を提供しています。Red Hatは顧客のためにバグを修正し、その変更をKubernetesにマージすることで、Kubernetesのコミュニティーにも利益をもたらしています。

なぜAIにおいてオープンソースへの大きな流れが生じているのか？

標準化には価値があります。特に、新しい技術分野の動きが速いときにはなおさらです。特にオープンソース・プロジェクトへの関心が高まっている場合、プロジェクトを内部だけに留めておくことが常に有益とは限りません。コンテナが良い例です。Kubernetesがオープンにされたとき、それは業界全体に利益をもたらす標準化につながりました。

クローズド・イノベーションの方がうまくいく場合もあるのか？

プラットフォームの世界では、オープンとクローズは共存できます。典型的な例がKubernetesです。ワークロードを処理する場所は一箇所だけではなく、プラグインを追加することでジョブの配置を最適化できます。もし、より優れたアルゴリズムを持っていれば、それをプラグインすることができます。自分のアルゴリズムが人のプラットフォームに有用かもしれないということで、多くの人が興味を持ちます。より良いユーザー体験や、プラットフォームとその使われ方を最適化するアルゴリズムを提供することは、まったく正当なことです。これは、両者が共存できる一つの具体例です。つまり、共通の標準に基づいたプラットフォームがあるのは良いことである一方で、自分用のインフラをカスタマイズしフルスタックを最適化することだってできるのです。

IBMのAIプラットフォーム「watsonx」も一例と言えるか？

そうです。秘密のレシピは、モデルをカスタマイズしたりチューニングしたりするためのより良い方法を提供できることです。watsonxはAIモデルの出力があなたのニーズに合うように、より良いガードレールを提供します。ガードレールは厳密にオープンな機能である必要はなく、むしろ付加的に価値を与えるものです。

AIはどこへ向かうのか？

今、大きな議論になっているのは、AIが少数の大手プレーヤーとその巨大なモデルによって支配されるのか、それともより大きなコミュニティーが影響力を持つのかということです。価値創造は、大きなモデルや大きなモデルの学習者から、よりコミュニティー主導のものへとシフトするのでしょうか？それとも、コミュニティーがチームを組み、より大きなモデルを構築する方法を見つけ出すのでしょうか？これらは大きな疑問です。より多くの人々の力が活かされるので、コミュニティー・アプローチが勝つだろうと、多くの人が予測しています。しかし、ハードウェアへの投資は莫大です。私は、大きなベースモデルを作る以上の価値を引き出す新しく革新的な方法を人々が考え出すだろうと考えています。PyTorchやRayのようなコミュニティーは、すでにオープンな場でプラットフォームの改良を行っています。

あなたは良いオープン・ガバナンスについて話したが、悪いガバナンスとはどんなものなのか？

悪いガバナンスは通常、プロジェクトが一人のプレーヤーに支配されているときに起こります。ひとつの良い指標は、他のプレーヤーが貢献し意思決定できるかどうかです。私がコミュニティーに貢献したら、私の意見は聞いてもらえるでしょうか。健全なコミュニティーでは、多くの場合、複数の人が貢献し、影響力を持っています。

ウィキペディアのように？

それはいい例えかもしれません。ウィキペディアは自主運営されていますからね。私はそのプロセスを詳しく知っているわけではありませんが、編集を受け入れる仕組みはあると理解しています。

コミュニティーが消滅することはあるか？

はい、それは複数の理由で起こりえます。その理由のひとつは、そのコミュニティーに投資するのが危険であると人に躊躇わせる、貧弱なガバナンス・モデルです。ガバナンスが不十分なコミュニティーや、単一の支配的なプレーヤーが規約やライセンスの変更を決定したり、重要な修正を提出させなかったりした場合、私たちはその上に構築するリスクを冒すことはできません。人々が参加を止めると、他の参加者も他の場所を探し始めます。IBM Researchでは、オープンソースへの投資を戦略的に行うようにしています。なぜならば投資にはコストがかかるからです。いったん何かをコミュニティーに出したら、コミュニティーに投資しなければなりません。

だから、放棄されたプロジェクトにはリスクがある。それがTensorFlowに起きたことなのか？

人々はまだTensorFlowを完全には見限ったわけではありません。Googleの立場から見て、このまま続ける価値があるのでしょうか？これから危機を脱することはあるでしょうか。それともすでにPyTorchの勝利が決定的なのでしょうか？例えるなら、クラウド・ネイティブ・プラットフォームではKubernetesが勝者として浮上しましたが、Mesosはほとんど姿を消したと言えると思います。

現在、数社の大企業が最大規模のAIモデルを支配している。それはAIの安全性にとって何を意味するのか？

これらのAIモデルは公開されていないため、より広範なコミュニティーからの精査が不足しており、他の人が結果を再現したり、安全性を向上させる可能性のある追加実験を行ったりすることが難しくなっています。

この記事は英語版IBM Researchブログ「How open source paved the way for computing from anywhere」（2023年9月20日公開）を翻訳し一部更新したものです。