次世代オペレーティングシステムSSSPCを開発

―― オフィスのPCを束ねて高性能高信頼システムを構築する新OS ――

 

 文部科学省 国立情報学研究所 松本尚 助教授らの研究グループは、職場にあるPCやワークステーションを束ねて高性能高信頼システムを構築する次世代オペレーティングシステムSSSPC(スリーエスピーシー)を開発し、この度16台のPCから成るプロトタイプシステムの稼動に成功した。SSSPCの下では、多数のPC等を一台の高性能並列計算機として統合的に使用可能であり、実行中のアプリケーションプログラムを停止することなくシステム・メンテナンス(PCの交換や点検の作業)を行うことや、無停止でシステム構成を動的に拡張や縮小することが可能である。また、LinuxUNIX用に開発されたアプリケーションをソースコードの修正なしに移植可能なアプリケーション開発環境を提供する。SSSPCは情報処理振興事業協会の平成13年度IPA情報技術開発支援事業等によって支援されて開発された。SSSPCの主な特徴は以下のとおりである。

 なお、国立情報学研究所は、産学連携推進の一環として、SSSPCの技術移転ならびに開発普及促進を支援している。具体的には、ベンチャー企業(株式会社情報科学研究所)の設立(平成147月)及び松本助教授の代表取締役副社長としての兼業などである。

 

特徴1高性能通信プロトコルの採用

TCP/IP等の標準通信プロトコルのみではなく、研究チームが開発したメモリベース通信ファシリティ(MBCF)と呼ばれる高性能通信プロトコルが使用可能である。MBCFを使用することにより、TCP/IP等の標準プロトコルを用いた場合に比べて通信にかかるオーバヘッドコストを約30分の1に抑えることができ、束ねられたマシン間(クラスタ内)において効率良く並列プログラムの実行が行える。

 

特徴2 アプリケーションの実行マシンを動的に変更可能

 実行中のプログラムを途中で他のマシンに移送して実行を継続させるマイグレーション機能(移送機能)を実装した。協調しながら動く並列プログラムもマシン間を移送することが可能である。完全な分散制御を行っているので、本機能により、アプリケーションを停止させずに、任意のマシンを停止させてシステム・メンテナンス作業を行うことや、マシン追加によりシステムの能力を動的に増強することが可能である。

 

特徴3 自由市場原理に基づくスケジューリング方式の採用

 マシン間の負荷分散方式には自律分散方式の一つである自由市場原理に基づくスケジューリング方式を考案し実装している。開示されたシステムの資源使用状況を基に各アプリケーションは自己申告自己責任で自分の都合がよいノードで実行を進める。ただし、システムの資源を浪費するプログラムにはペナルティを課す機構を導入し無法状態になることを防止している。

 

特徴4 高いスケーラビリティ

 OS内の各種機構のスケーラビリティ(拡張性)が高く、10万台程度のPCやサーバーまでを一台の並列計算機環境として統合することが可能である。特徴2のマイグレーション機能と組み合わせて運用時の負荷に応じた台数拡張をシステム停止なしに実現できる。

 

特徴5 Linuxとソースコードレベルでアプリケーションの互換性

 既存アプリケーション等のソフトウェア資産を活用するために、互換C言語ライブラリを開発し、ソースコードレベルで既存UNIXOSとの互換性を保っている。

 

特徴6 新規機能とキラーアプリケーションによる普及戦略

SSSPCは、他の汎用OSにはない特徴2のマイグレーション機能を活かして、高可用性およびアプリケーションの無停止が不可欠なサーバ用途から普及を目指す。そのために、webサーバプログラムとデータベースサーバプログラムの並列版を開発中である。

 

将来的にはSSSPCをディペンダブル・コンピューティング(高信頼性コンピュータシステム)の基盤技術として発展させられるように、今後は高信頼性機能の開発増強に注力して行く。特に、複数マシンの存在を活用することにより既存アプリケーションを重複して実行させて、多数決の結果を最終的な動作とする冗長多数決実行機能をOSに追加する予定である。この冗長多数決実行機能により、一部マシンが突然停止してもアプリケーションは停止せずに稼動し続けることが可能なシステムの開発が実現される。なお、冗長多数決実行を採用した高信頼ファイルシステムとしてLinuxNRFSを開発し公開している。詳しくはhttp://www.ssspc.org/nrfs/をご覧下さい。

 

SSSPCに関する詳しい説明はhttp://www.ssspc.org/ (平成15120日開設予定)をご覧下さい。