NXPのNPUを搭載したi.MX ⁄ MCXによる
エッジAIソリューションをご紹介

ここ数年、人工知能(AI)の利用は急速に拡大し、私達の生活や仕事のあらゆる面でその存在感が増しています。自動運転や文章/画像生成などの分野でAIの利用が進み、大規模なサーバー上でのAI処理だけでなくデバイスそのものにAIを組み込むエッジAIの利用も急増しています。本ページでは、そのエッジAIについて、実際の機器を踏まえて解説いたします。

関連サイト
  • NXP
  • 車載
  • i.MX
  • MCX
  • AI
  • マイクロコントローラー
  • マイクロプロセッサー
  • エッジAI
  • NPU

エッジAIとは

エッジAI(Edge AI)とは、データ処理をクラウドではなくデバイス自体で行う技術です。
これにより、リアルタイム性と効率性が大幅に向上し、迅速な処理が可能になります。
従来のクラウドベースのAIシステムではデータの送受信に時間がかかるため、特にリアルタイム性が求められるアプリケーションには限界がありました。
しかし、エッジAIを導入することで、データの遅延を最小限に抑え、リアルタイム性の高い応答を実現できます。

クラウドベースAIとエッジAIの送受信イメージ説明図

クラウドベースAIとエッジAI

エッジAIのもう一つの利点は、ネットワークに処理を依存しない点です。
大量のデータをクラウドに送信せずにローカルで処理を行うため、通信コストを削減できます。
また、データのプライバシー保護にも寄与します。センシティブな情報をクラウドに送信せずにデバイス上で処理することで、セキュリティリスクを低減します。
さらに、エッジAIは、リモートエリアやインターネット接続が不安定な場所でも有効です。
クラウドへのアクセスが難しい環境でも、ローカルでのデータ処理が可能なため、信頼性の高いシステム運用が実現できます。

クラウドベースAIと比較したエッジAIの利点の説明イメージ

クラウドベースAIと比較したエッジAIの利点

エッジAIは、多くの分野での応用が期待されています。
例えば、自動運転車、スマートホーム、産業用IoT(Industrial IoT)、医療機器など、リアルタイム性の高いデータ処理と応答が求められる場面で活躍します。
特に、自動運転車では道路状況や障害物の検知を瞬時に行う必要があるため、エッジAIの導入は欠かせません。
このように、エッジAIはデータ処理の新たなパラダイムを提供し、多くの産業において革新的な変化をもたらしています。

NXPのエッジAIソリューション

NXPは、このエッジAIの分野で高速に処理を行うため、ニューラルプロセッシングユニット(NPU)を搭載したプロセッサー、マイコンをリリースしています。
NPUはAI推論に特化したコプロセッサーで、膨大な計算を高速に処理し効率性とパフォーマンスを大幅に向上させます。ここからは、NPUを搭載したNXPのi.MX93プロセッサーとMCX N94x ⁄ 54xマイクロコントローラーについてご紹介します。

i.MX 93アプリケーションプロセッサー

i.MX 93アプリケーションプロセッサーは最大1.7GHzで駆動するCortex®-A55プロセッサーとEthos™-U65 NPUを搭載し、優れたエッジAIソリューションを実現します。

NXPセミコンダクターズのMCIMX93-EVKイメージ

MCIMX93-EVK

i.MX 93アプリケーション・プロセッサー・ファミリー

i.MX 93アプリケーション・プロセッサー・ファミリー(NXP公式サイト)

NXPセミコンダクターズのi.MX 93 ブロック図イメージ

i.MX 93 ブロック図

  • マルチコア・プロセッシング
    • Arm® Cortex®-A55 × 1 ⁄ × 2 @ 1.7 GHz
    • Arm® Cortex®-M33 @ 250Mhz
    • Arm® Ethos™ U-65 microNPU
    • EdgeLock®セキュア・エンクレーブ
  • コネクティビティ
    • USB 2.0 Type C × 2(PHY搭載)
    • Gbイーサネット × 2:同期用のAVBおよびIEEE 1588、および低消費電力用のEEE(1つはTSN対応)
    • CAN-FD × 2
    • UART × 8、I2C × 8、SPI × 8、I3C × 2
    • 4ch、12ビットADC × 1
    • 32ピンFlexIOインターフェース(カメラ、バス、またはシリアルI ⁄ O)x 2
  • 外部メモリ
    • 最大3.7 GT ⁄ s x16 LPDDR4 ⁄ LPDDR4X(インラインECC対応)
    • SD 3.0 ⁄ SDIO3.0 ⁄ eMMC5.1 × 3
    • Octal SPI × 1、SPI NORメモリおよびSPI NANDメモリをサポート
  • ディスプレイ・インターフェース
    • 1080p60 MIPI-DSI(4レーン、1.5 Gbps ⁄ レーン)× 1、PHY搭載
    • 720p60 LVDS(4レーン)× 1
    • 24ビット・パラレルRGB
  • オーディオ
    • I2S TDM × 7(32ビット @ 768 KHz)、SPDIF Tx ⁄ Rx
    • 8チャネルPDMマイク入力
    • MQS:中品質サウンド出力(シグマ–デルタ変調器)
  • オペレーティング・システム
    • Linux® OS
    • FreeRTOS
    • INTEGRITY
    • QNX
    • VxWorks
  • 温度範囲
    • 0℃~+95℃ (Commercial)
    • -40℃~+105℃ (Industrial)
    • -40℃~+125℃ (Automotive ⁄ Extended Industrial)
  • MCX N94x ⁄ 54xマイクロコントローラー

    MCX N94xおよびN54xマイコンは最大150MHzで動作するArm® Cortex®-M33プロセッサーとeIQ® Neutron NPUを搭載し、省電力で高効率なエッジAIソリューションを実現します。

    NXPセミコンダクターズのFRDM-MCXN947イメージ

    FRDM-MCXN947

    MCX N94x ⁄ 54x マルチコア MCU(NXP公式サイト)

    MCX N94xブロック図イメージ

    MCX N94xブロック図

  • コア・プラットフォーム
    • Arm® Cortex®-M33 @ 150 MHz(デュアルコア)
    • DSPアクセラレータ(PowerQUAD、コプロセッサ・インターフェース搭載)
    • SmartDMA(パラレル・カメラ・インターフェースやキーパッド・スキャンなどのアプリケーション用のコプロセッサ)
    • eIQ® Neutron N1-16ニューラル・プロセッシング・ユニット
    • 電力線通信 (PLC) コントローラ
  • メモリ
    • 最大2 MB(1 MBバンク × 2)オンチップ・フラッシュ
    • フラッシュのスワップとRWW(Read-while-write)をサポート
    • 16 KB RAMを使用するキャッシュ・エンジン
    • 最大512 KB RAM、ECC付きで416 KBまで構成可能(1ビット補正2ビット検出をサポート)
    • 最大4個の8 KB ECC RAMをVBATモードまで保持可能
    • XIP、Octal ⁄ Quad SPIフラッシュ、HyperFlash、HyperRAM、Xccelaメモリ・タイプをサポートする16 KBキャッシュ付きFlexSPI
  • ペリフェラル(アナログ)
    • 16ビットADC × 4(シングル・エンド)または16ビットADC × 2(差動)
    • ADCごとの内蔵温度センサ
    • 内部リファレンスとして17本の入力ピンと8ビットDACを備えた3つの高速コンパレータ
    • 12ビットDAC × 2(最大サンプル・レート1.0 Mサンプル ⁄ 秒)
    • 14ビットDAC × 1(最大サンプル・レート10 Mサンプル ⁄ 秒)
    • プログラマブル・ゲイン・アンプ
    • 差動アンプ
    • 計装アンプ
    • トランスコンダクタンス・アンプ
    • 高精度VREF ±0.15%、15 ppm ⁄ deg Cのドリフト
  • ペリフェラル(タイマ)
    • 5個の32ビット標準汎用非同期タイマ ⁄ カウンタを搭載し、最大4個のキャプチャ入力と4個のコンペア出力、PWMモード、外部カウント入力をサポートします。特定のタイマ・イベントを選択してDMA要求を生成できます。
    • SCTimer ⁄ PWM
    • LPTimer
    • 周波数測定タイマ
    • マルチレート・タイマ
    • ウィンドウ・ウォッチドッグ・タイマ
    • カレンダ機能付きRTC
    • マイクロ・タイマ
    • OSイベント・タイマ
  • ペリフェラル
    (通信インターフェース)
    • USB高速(ホスト ⁄ デバイス)、オンチップHS PHY搭載
    • USBフルスピード(ホスト ⁄ デバイス)、オンチップFS PHY搭載、USBデバイス
    • uSDHC(MicroSD高速カード・インターフェース)
    • LP Flexcomm × 10(それぞれSPI、I2C、UARTをサポート)
    • FlexCAN × 2(FD、I3C × 2、SAI × 2)
    • QoS対応イーサネット × 1
    • FlexIO × 1(ディスプレイ・ドライバやカメラ・インターフェースなど、各種シリアル・インターフェースおよびパラレル・インターフェースとしてプログラム可能)
    • EVMスマートカード・インターフェース × 2
    • プログラマブル・ロジック・ユニット (PLU)
  • ペリフェラル
    (モータ制御サブシステム)
    • eFlexPWM × 2(それぞれ4個のサブモジュールを備え、12 PWM出力を提供)
    • 直交エンコーダ ⁄ デコーダ (ENC) × 2
    • イベント・ジェネレータ (AND ⁄ OR ⁄ INVERT) モジュール × 1、最大8個の出力トリガをサポート
    • SINCフィルタ・モジュール(3次、5ch、PWMへのブレーク信号接続)
  • セキュリティ
    • EdgeLock®セキュア・エンクレーブ、コア・プロファイル
      • 暗号化サービス(AES-256、SHA-2、ECC NIST P-256、TRNG、鍵の生成 ⁄ 派生を含む)
      • 鍵使用ポリシーを備えたセキュアな鍵ストア(プラットフォームの整合性、製造、およびアプリケーションの各鍵の保護)
      • 物理複製困難関数(PUF)に基づくデバイス固有のID
      • Device Identifier Composition Engine (DICE) をサポートするデバイス認証
      • セキュアな接続とTLSのサポート
      • NXP EdgeLock® 2GOの事前統合による無線での鍵管理
    • EdgeLock®アクセラレータ(公開鍵暗号)

    • ROM内の不変セキュア・ブート・コード
    • デュアル・セキュア・ブート・モード(非対称モードおよび高速、ポスト量子セキュア対称モード)
    • セキュアなファームウェア更新のサポート
    • セキュアな認証済みデバッグを含むデバイスのライフサイクル管理
    • 外部フラッシュ用の追加認証を使用した高性能のオンザフライ・メモリ暗号化
    • 保護フラッシュ領域(PFR)
      • コード・ウォッチドッグ × 2
      • 侵入および改ざん応答コントローラ (ITRC)
      • 8つのアクティブおよびパッシブ改ざんピン検知
      • 電圧、温度、光、クロックの改ざん検知
      • 電圧グリッチ検出
    • 信頼されていない工場での安全な製造とIP盗難防止
    • Cortex®-M用Arm® TrustZone®
  • AI処理速度をNPUと通常のCPUで比較

    NXPのNPUを搭載したプロセッサーは、通常のCPUに比べてAI処理を高速に行うことができます。例として、MCX N94xボードで顔認識のAI処理速度の速さをNPUと通常のCPUとで測定してみました。

    顔認識AI処理速度をNPUとCPUとで比較した結果のイメージ

    顔認識AI処理速度をNPUとCPUとで比較した結果

    この実験では、NPUでの推論時間24msに対して、CPUでの推論時間869msとなり、NPUはCPUに比べておよそ30倍もAI処理速度が速いという結果になりました。もちろんどの程度の速度差が出るかは、使用するモデルやソフトウェアの仕様にもよるため、一概に述べるのは難しいですが、AIの処理をNPUに任せることで大幅な処理速度向上を見込むことができます。

    まとめ

    このように、AIはクラウドだけでなくエッジでも利用が増えており、デバイスにNPUが搭載されることで、さらに高性能化が進んでいます。今回はその背景とデバイス、実際の性能について紹介しました。NXPのNPUを搭載したデバイスによるソリューションは、高速かつ効率的なAI処理を実現しています。詳細については、ぜひ関連サイトに記載したNXP公式サイトをご確認ください。