6月9日未明に、WWDCの基調講演が開催され、秋に導入が予定されているアップル製品の次期OSが発表された。昨年はユーザーインターフェイスに「Liquid Glass」を採用するなど、外観の大きなアップデートがあったそれぞれのOSだが、今年はどちらかと言えばそのブラッシュアップを中心にしていた印象だ。
着実な進化の一方、OSそのものに大きなアップデートはなし
冒頭で挙げられたのは、OSの高速化やLiquid Glassの改善。アップルによると、アプリの起動が最大30%、写真の表示が最大70%、AirDropに至っては最大80%もの高速化を実現しているという。これは、CPUがリソースを割り当てるスケジューラーの改善によって実現している。直近のモデルだけでなく、iPhoneであれば、7年前の19年に発売されたiPhone 11まで対象になるのがうれしいポイントだ。
また、半透明で背景が透けて見えるLiquid Glassは、透明度をユーザーが自由に調整できるようになる。これによって、ユーザーインターフェイス上の可読性を上げるなど、ユーザーの好みを反映させやすくなる。アプリのアイコンにもLiqud Glassのデザインランゲージが取り入れられることで、統一感もさらに高まる格好だ。
もっとも、上記のようなアップデートは特に新機能が豊富な年のWWDCでは、サラッと流されてしまったり、“まとめ”の中で軽く言及されたりすることも多い話だ。その意味では、OSそのものに大きなアップデートがないという事前の見立ては当たっていたと言えるだろう。どちらかと言えば、今回のアップデートでは、その上で動作するAIに焦点が当てられている。
「Siri AI」がついに登場、よりエージェント的な振る舞いが可能に
AI対応の遅れを指摘されていたアップルだが、実際、24年のWWDCで発表されていた進化したSiriの導入は2年間見送られてきた。ユーザーがiPhoneやiPadに蓄積した情報を元に、文脈を踏まえたうえで、アプリを連携させながら使うことができるというのが当初の構想だった。いわばSiriをエージェント的に使うという発表だったが、アップルが想定していた品質に達することができず、2年間お蔵入りになっていた格好だ。
次期OSでは、この進化したSiriがついに登場する。その名も、「Siri AI」。2年前に予告していたのと同様、画面の中身やこれまでのメッセージからユーザーの周辺情報を理解し、それに基づいた提案やアプリの操作をしてくれるようになる。WWDCの基調講演では、以下のようなデモが披露された。
まず、「Suki Waterhouseのサンフランシスコ公演はいつ?」という質問に対し、Siriがネットの公開情報を元に回答。その結果に対して、チケットの取り方を聞き、「抽選の受付開始日にリマインドして」というと、リマインダーアプリに予定が登録された。そのまま、「Sukiの新しい曲を聴かせて」と言うと、Apple Musicアプリで該当する新曲が再生される。
一連の操作を手動でやるのは、なかなか骨が折れる。まずSafariを起動し、「Suki Waterhouse」などのキーワードで検索したあと、自ら公演のサイトを探して予定や予約方法を熟読し、リマインダーアプリを立ち上げて登録を済ませたあと、Apple Musicを起動して検索をかけて曲を探し、再生するといった操作が必要になる。画面を何タップもしなければできない操作を、Siriとの会話だけで完結させることができるというわけだ。
アーティストの公演情報や予約方法を調べ、その開始日をリマインダーに登録し、さらに楽曲をApple Musicで再生するという一連の流れをSiriだけで完結できるようになった
別の事例では、ワールドカップの予定を聞き、ブラジル対モロッコの試合が行われる日に観戦パーティを開きたいということで、そのままSiriにプランの提案を依頼。その途中に「Mariaが最近言っていたデザートは何だっけ?」という質問を挟むと、メッセージアプリから該当するデザートを探し出してくれたうえで、それを先ほど作った観戦パーティのメニューに追加してくれた。そのまま、観戦パーティの案内をグループメッセージで送信することまでできる。
ワールドカップの対戦情報を調べ、その国に基づいたメニューを考え、さらにメッセージの履歴からメニューを追加したものを友人に送るといったこともこなせる
自社のAIモデル「Apple Foundation Models」を、グーグルのGeminiを使って再構築
こうした機能を実現するため、アップルは自社のAIモデルである「Apple Foundation Models」を、グーグルのGeminiを使って再構築している。端末上で動作するオンデバイスモデルと、プライバシーを担保したクラウド上のモデルの両方を、次世代版にアップデートした格好だ。そのうえで、画面上の情報や過去のメッセージや個人のコンテクスト、さらにはネットなどの外部情報を統合し、Siriが文脈を踏まえたうえで回答やアプリの操作をできるようにした。
この新しいAIモデルは、Siri AI以外にも使用されており、Apple Intelligence全体が大きく進化している。例えば、アップル版消しゴムマジックとも言える「クリーンアップ」は、消したあとに描画する精度が大きく上がっている。写真編集では、空間的に、カメラを動かしたかのような編集が可能になる「空間フレーミング」も新たに対応する。
Geminiを使ってアップル自身のAIモデルであるApple Foudation Modelsを進化させた。それをシステム全体に適用。コンテキスト情報を活用しながら、アプリとの連携も行う
また、Geminiを活用してApple Foundation Modelsをブラッシュアップしたことで、画像生成の「Image Playground」は、より多彩なイラストを生成できるようになる。これまでは、数パターンで決まった画風のイラストしか作れず、使いどころがほとんどなかった機能だが、このアップデートによって、今どきの生成AIと同じように、さまざまなイラストを作れるようになる。
さらに、Safariでは、開いているタブをAIが分析し、テーマごとに自動でグループ化する機能が搭載されている。冒頭で述べたように、OSそのものに目立ったアップデートが少ないように見えた一方で、OSだけでなく、それぞれのアプリもApple Intelligenceを強化することで大きく使い勝手を上げているというわけだ。
個人的にぜひ活用したいと思ったのは、「ショートカット」を自然言語で作れる機能だ。ショートカットとは、複数の操作をまとめて実行する自動化機能のこと。アイコンをタップしたら現在地を取得してメッセージを送ったり、現在地に基づいて天気と交通情報をまとめて読み上げさせたりなどの組み合わせを作成できる。また、時間やあるWi-Fiに接続した時だけ設定を変えるといったオートメーションも利用可能だ。
ただ、条件分岐を設定したり、変数を決めたりと、複雑なショートカットは簡易的なプログラムのようになってくる。知識がないと、なかなか手を出すのが難しいのが実情だ。ここにApple Intelligenceを使い、ショートカットを自然言語で作成できるようにする。プログラミングの分野では、生成AIに指示を出すだけでコードを書くことを「バイブコーディング」と呼ぶが、そのショートカット版だ。
作成したいショートカットを言葉で説明するだけで、AIが作成してくれる。あたかもバイブコーディングのようだ
この秋、iPhoneは最強AIエージェントスマホとなるか?
Geminiを使ってAIモデルを刷新したことで、OSにより深く統合されただけでなく、Apple Intelligenceのクオリティそのものが上がったことも分かる。OSそのものへの言及は少なかったものの、Apple Intelligenceの進化は、それ以上に大きなアップデートと言える。iPhoneやiPadの操作体系はもちろん、アプリの役割すら変えてしまう可能性があるからだ。
例年よりあっさり終わってしまったかのように見えたWWDCの基調講演だが、むしろ、そのぶんApple Intelligenceへのフォーカスぶりが伝わってきた。現時点で、ここまで深くエージェント的なAIを組み込めているスマホやタブレットはほぼ存在しない。2年という長い時間はかかってしまったものの、その時間を費やしただけの進化はしていると言えそうだ。
取材・文/石野純也







DIME MAGAZINE


























