エッジ・オンデバイスAI時代に求められる「ハイブリッド・インフラ設計」

FOR BUSINESS

課題解決のためのノウハウ

これまでAIは、すべてのデータをクラウドへ送って処理する形が主流でした。しかし現在は、反応の速さやプライバシーの保護を重視し、現場(エッジ)や端末(デバイス)側で直接処理を行う「エッジ・オンデバイスAI時代」が到来しています。

この「クラウド」と「現場」それぞれの強みを組み合わせ、処理を適材適所に分散させる運用方法が「ハイブリッド・インフラ設計」です。現場や端末が進化するほど、それらを束ね、常に最新の状態へアップデートし続ける「中核」には、これまで以上の高い性能と安全性が求められるようになります。

本記事では、分散化するAI時代において、なぜ強固な拠点としてのデータセンターが必要なのか、その選定基準を解説します。

AI処理の分散化と「3つのインフラ階層」の定義

AIの活用シーンが広がるにつれ、「もっと反応を速くしたい」「通信コストを抑えたい」「個人情報を守りたい」というニーズがこれまで以上に高まってきました。その結果、すべての処理を遠くのサーバーに任せるのではなく、現場や手元の端末でも処理を行う「分散化」の動きが進んでいます。

現在は、この分散化された「現場(エッジ)」や「端末(デバイス)」での処理と、「クラウド」での処理を組み合わせた「ハイブリッド・インフラ設計」が求められています。この設計を理解する上で重要なのが、役割ごとに整理された「3つのインフラ階層」です。

1. オンデバイスAI(端末完結型)

「オンデバイスAI」は、処理をスマートフォンや監視カメラ、センサーなどの端末(デバイス)内で完結させる技術で、ネットワークを介さないため通信によるタイムラグがなく、瞬時に反応が得られる点が強みです。また、データを外に送信しないため、情報の秘匿性が極めて高く、強固な「プライバシー保護」が実現できます。

一方で、端末自体のリソースやバッテリーには限界があります。そのため、大規模なデータを利用するAIモデルの学習や、高度で複雑な処理には向いていません。

2. エッジAI(ゲートウェイ/ローカルサーバー型)

「エッジAI」は、工場や店舗などの現場に設置されたゲートウェイやローカルサーバーで処理を行う技術で、複数の端末から情報を集約し、総合的な判断を下せるのが強みです。そのため、製造ラインの検品や交通システムのように、現場全体を見渡してリアルタイムに対応する必要がある場面で活躍するでしょう。

ただし、オンデバイスAIのように端末内で処理をする場合に比べ、機材自体が大きくなります。また、設置には十分なスペースや電源、空調設備が必要になるため、システムを拡張する際に「置き場所がない」「電気が足りない」といった物理的な制約に直面する場合があります。

3. クラウドAI(データセンター型)

「クラウドAI」は、ネットワークの先にある、大規模な計算リソースを備えた基盤で処理を行う技術です。分散されたAI全体を統括し、オンデバイスAIやエッジAIでは難しい高度な処理を一手に引き受けます。

たとえば、全国の工場や店舗から集まった膨大なログを分析し「数ヶ月先の需要を予測する」といった高度な判断モデルを作り上げるのは、強大なパワーを持つクラウドAIならではの役割です。さらに、そこで進化した最新のAIを各地の現場へ一斉に送り届ける「配信拠点」としての機能も備えています。

現場での分散化が進み、システム全体が高度化すればするほど、それらを統括し進化させ続ける「中核(コア拠点)」であるクラウドAIの重要性と負荷は大きくなります。

分散型AIを支えるバックエンドの物理的限界

AI処理の分散化が進むほど、全体を統括する「中核(コア拠点)」が重要になります。各地から吸い上げられた膨大な情報を集約し、活用するには強固なバックエンドが欠かせません。

しかし、従来のWebシステムを前提としたインフラ環境では、AI特有の「情報の重さ」や「進化の速さ」による物理的な限界に対応できないという、大きな課題があります。

データ集約の限界:処理能力とネットワーク帯域

分散化が進むほど、その「中核」には絶え間なく大量の情報が集中します。その結果、従来のインフラではデータの集約に限界が生じてしまいます。この限界を突破できないと、システム全体のパフォーマンスとリアルタイム性が大きく低下してしまうのです。

そのためにまず必要なのは、情報を瞬時に捌くための「処理能力」です。次々に流れ込む大量のデータを遅延なく処理し続けるには、従来の一般的なサーバーを上回る、極めて高い集約能力が求められます。

次に、その処理能力を最大限に活かすための「広帯域ネットワーク」も必要です。どれほど情報の処理能力が高くても、データをやり取りする回線の容量が小さければ、通信が滞って本来の性能を発揮できません。そのため、インターネットの基幹網(バックボーン)に直結し、膨大な情報を淀みなく高速で通信できるような広帯域のネットワークインフラも不可欠となります。

これらの一部でも不足すると、そこが通信や処理の「ボトルネック(流れの滞留)」となり、AIモデルの再学習やアップデートに著しい遅延を招いてしまいます。

セキュリティの限界:機密データの物理的な保護

エッジやデバイスから「中核」に集約されるデータには、個人の行動履歴や工場の製造ノウハウなど、企業の競争力を左右する極めて機密性の高い情報が含まれています。その際に、従来のパブリッククラウドのような共有型インフラでは情報を守りきれない、という限界に直面してしまいます。

一般的なパブリッククラウドは、他社とインフラを共有して利用します。そのため、利便性が高い反面、多くの機密情報を扱うにはセキュリティ上の不安が残ります。どれだけデジタル上の対策を重ねても、他社との共有環境にデータを置くこと自体がセキュリティの限界点となるのです。

そこで注目されているのが、指紋や顔認証を備えた厳重な施設内に専用ラックやケージを設け、サーバーを物理的に隔離して管理する「ハウジング(サーバーの預かりサービス)」という手法です。これにより、自社でデータセンターを建てるコストを抑えつつ、共有環境の不安を物理的に解消することができます。

拡張性の限界:高密度サーバーへの対応

エッジやデバイスの増加に伴い、集まったデータを処理するサーバーの増設が必要になります。しかし、ここで直面するのが、従来のインフラでは対応しきれない電力供給の限界です。

最新のハイエンドなGPUサーバーは、極めて高い処理能力を持つ反面、消費電力が非常に高くなります。一般的なオフィスビルやデータセンターが想定している1ラックあたりの電力容量(4kVA〜8kVA程度)では、最新のマシンを数台設置しただけで上限に達し、いわば「ブレーカーが落ちる」ような状態に陥ってしまいます。

その結果、物理的なスペースが空いているのに機器を増設できず、AI基盤の拡張を断念せざるを得なかったり、電力を求めてサーバーを複数のラックに分散せざるを得なくなり、管理の手間とコストだけが膨れ上がったりするなど、ビジネスの成長機会を奪ってしまう可能性があるのです。

現場を支える「中核」となるデータセンターの条件

現場で動くAIが広まるほど、それらすべてを束ね、常に最新の状態へとアップデートし続ける「司令塔」である中核の役割が重要になります。しかし、前述したように、大量のデータや機密情報、最新マシンが求める電力や耐荷重は、これまでの一般的な施設の限界を超えています。

この課題を解決するには、これまでとは異なる設備を備えた環境が必要です。

大規模な再学習を支える高電力・高集積な環境

AIは一度作れば終わりではなく、世界中の現場から日々集まる膨大な情報を処理し、AIモデルを最新の状態にアップデート(再学習)し続ける必要があります。この再学習の効率を最大化するには、中核となるGPUサーバーを1箇所に集めて動かす「高密度な実装」が理想的です。しかし、ここで先ほど述べた電力の限界が問題になります。

一般的なデータセンターの電力供給は、1ラックあたり4kVA〜8kVA程度です。高密度に実装されたGPUサーバーを動かすには電力が不足してしまうため、複数のラックに分散して配置せざるを得ません。再学習を支えるためには、一般的な環境の3〜5倍以上に相当する「1ラックあたり20kVA超」の大容量電源を備えた、専用の拠点が不可欠です。

高発熱・重量級の機材に耐えうる堅牢なファシリティ

AIを支えるGPUサーバーは、電力を大量に消費するだけでなく、高い熱を放出するほか、機材そのものも非常に重たいという特徴があります。このため、以下の2つの問題が発生し、一般的なビルでは建物そのものが耐えられなくなります。

まず、「熱」の処理です。24時間フル稼働するGPUサーバーは、一般的なエアコンでは太刀打ちできないほどの膨大な熱を発し続けます。しかし、熱がこもると、サーバーの故障や性能の低下を招いてしまいます。そこで、床下から効率的に冷気を送り込んで熱を逃がす「カスケード空調」のような、データセンター専用の高度な冷却システムが求められるのです。

次に、「床の強度(床荷重)」です。最新のGPUサーバーは巨大な冷却用のパーツを搭載しているため非常に重く、標準的な施設の床(500kg/㎡程度)では床が抜けてしまう恐れがあります。将来的なAI基盤の拡張(GPUサーバーの増設・大型化)を見据えるなら、一般的なビルの3倍以上の強度に相当する「1,500kg/㎡以上」の耐荷重性能が必須条件となります。

災害時も司令塔を止めない究極の立地と安全性

現場のエッジやデバイスがどれだけ正常に稼働していても、それらを制御・統括する司令塔である中核がダウンすれば、システム全体は一瞬で機能不全に陥ります。この中核を止めないためにも、立地と安全性が重要になります。

まずは、自然災害に強い立地です。地震大国である日本において、地震リスクが極めて低く、津波や活火山の降灰といった影響を受けにくい立地に拠点を構えることは、中核を動かし続けるためにも必要な条件です。

次に、不測の事態でも稼働を続ける安全性です。止まることが許されない中核には、データセンターの格付けで最高レベルを指す国際基準「ティア4」準拠の高い信頼性が必須条件でしょう。これは電源や空調などあらゆる設備が二重・三重に備わっていることを意味し、高い稼働率を誇るため、何があっても中核を止めない強固なバックアップ体制につながります。

災害リスクに強い「西日本・香川県」に位置するPowerico

エッジやデバイスがどこにあろうとも、それらを統括する管理基盤は安全な場所に置くべきでしょう。そこで注目されているのが、西日本の香川県に位置するSTNetのデータセンター「Powerico(パワリコ)」です。ここでは、2つの地理的な要因からPowericoの利点について解説します。

災害に強い「安全な避難場所」としての立地

日本でAIの司令塔を構える際、避けては通れないのが自然災害のリスクです。どんなに優れた設備も、建物自体が被災しては意味がありません。その点、Powericoのある香川県は、日本特有の「3大災害リスク」を極めて高いレベルでクリアしています。

まずは、地震リスクの低さです。香川県は、過去100年間で震度6以上の地震が一度も発生していないエリアです。また、地盤の液状化の可能性を示すPL値が「0」であり、建物の土台そのものが極めて健全です。

次に、津波リスクへの備えです。施設は海抜14.5mの高台に位置しています。南海トラフ地震で想定される津波の高さは最大3mとされていますが、その4倍以上の高さがあります。

さらに、半径100km圏内に活火山がないため、降灰によるサーバーの故障や空調設備の停止リスクもなく、企業の大切なデータとシステムを守り抜く安全な避難場所として理想的な環境です。

首都圏と異なる「大陸プレート」

どれほど設備が強固でも、広域災害によって地域一帯がダウンすると機能が失われてしまいます。そこで重要になるのが、首都圏のリスクに巻き込まれない「独立性」です。

香川県は地学的にも首都圏と完全に切り離されています。首都圏が「北アメリカプレート」上に位置するのに対し、香川県は「ユーラシアプレート」上に位置しています。つまり、首都圏で地震が発生しても、その直接的な影響を極めて受けにくい構造になっています。

さらに、ライフラインである電力網も完全に独立しています。香川県は四国電力の供給エリアであり、首都圏の電力網とは繋がっていません。そのため、万が一首都圏で大規模な広域停電が発生したとしても、電力が供給され続けます。

この地理的・インフラ的な独立性を活かし、首都圏をメイン、香川県をサブ(マザー拠点)として構成することで、強固なリスク分散が可能になります。こうした「同時被災を回避できる安心感」が、首都圏をはじめとする多くの企業から高く評価されている理由です。

まとめ:分散型AIの成功を左右する「戦略的な拠点選び」

今後のAI活用において重要になるのは、現場での素早い処理と、中核での高度な集約をバランスよく組み合わせた分散型の「ハイブリッド・インフラ設計」です。この設計を成功させるためには、中核の拠点にこれまでの環境とは異なった「電力・空調・床荷重」の設備が必要となります。

さらに、機密データを守り抜き、いかなる災害時にもシステムを止めない安全性と、インフラの独立性も、拠点選びの決定的な条件となるでしょう。

自社、そして顧客のAI基盤を揺るぎないものにするために、最高水準のスペックと、災害リスクの低い香川県の立地を兼ね備えたPowericoのようなデータセンターを、ハイブリッドなAI戦略を支える戦略的な拠点として検討してみてはいかがでしょうか。

この記事で紹介しているサービス

Powerico(パワリコ)

自然災害リスクの低い安全な立地と高信頼のファシリティ、多様な運用サービスで、お客さまのサーバーを安全に保管・運用します。