小学館IDをお持ちの方はこちらから
ログイン
初めてご利用の方
小学館IDにご登録いただくと限定イベントへの参加や読者プレゼントにお申し込み頂くことができます。また、定期にメールマガジンでお気に入りジャンルの最新情報をお届け致します。
新規登録
人気のタグ
おすすめのサイト
企業ニュース

文字起こし、生成AIによる写真編集、ライブ翻訳、国内発売が待ち遠しい最新スマホ「Galaxy S24」の実力検証

2024.02.12

■連載/石野純也のガチレビュー

 サムスン電子は、Galaxyシリーズの最新モデル「Galaxy S24」「Galaxy S24+」「Galaxy S24 Ultra」を海外で発売した。3機種は、同社のフラッグシップモデルと位置づけられている製品で、歴代の端末は日本でも発売され、ドコモやKDDIが取り扱っている。例年通りだとすれば、Galaxy S24やGalaxy S24 Ultraが販売される可能性は高いと言えるだろう。同機は「Galaxy Harajuku」や「Galaxy Osaka」に展示されており、ユーザーが実機を試すこともできた。

 カメラやパフォーマンスの高さに磨きをかけてきたフラッグシップモデルのGalaxy Sシリーズだが、Galaxy S24が売りにしたのはAIだ。音声通話の翻訳機能や、ボイスレコーダーの文字起こし、メモアプリの要約機能など、AIを活用することでスマホのベースとなる機能を大きくブラッシュアップした格好だ。これらのAIはその多くが日本語にも対応しており、グローバル版でも利用できる。

 筆者はGalaxy S24や、新シリーズの特徴となるGalaxy AIをいち早く試すことができた。ここでは、その模様を届けする。なお、グローバル版は日本のモバイルネットワークで使うための認証が取れていなかったため、香港で契約したeSIMを入れ、国際ローミング経由で電話やモバイル通信を活用している点はあらかじめお断りしておきたい。

グローバル版のGalaxy S24で、Galaxy AIをチェックした

録音した声をサッとテキストに、まとめや翻訳も便利

 まず試したのが、ボイスレコーダーの文字起こし機能だ。話した内容をテキスト化する機能自体は代々Galaxyに搭載されてきたが、クラウドを介した処理になるうえに、時間も10分までに制限されていた。Galaxy AIでは、こうした制約がなくなり、デバイス上の処理だけで音声をテキスト化することが可能だ。以下のスクリーンショットを見ればわかるように、フライトモードでネットワーク接続を遮断した状態でも、しっかり文字起こしが機能している。

デバイス上で文字起こしをするため、フライトモードでも利用できる

 また、40分を超える発表会で録音機能を試してみたが、こちらも無事、文字起こしができた。画面には、「概要」というタブも表示される。ここをタップすると、文字起こしから要点だけを抜き出し、箇条書きに整理してくれる。何が話されていたかを手っ取り早くつかみたい時に便利な機能で、文字起こし対応のボイスレコーダーで先行するグーグルのPixelシリーズにはなかったものだ。

録音後にファイルを選び、言語を選択してから文字起こしを始める流れ。文字起こし後に「概要」をタップすると、まとめが表示される

 さらに、文字起こししたテキストをワンタッチで外国語に翻訳することまでできる。Pixelでも、テキストをコピーして翻訳アプリにペーストすれば同様のことは可能だった一方で、翻訳アプリ側に文字数制限などがあると、そこに合わせて文字数を削る必要があった。こうした手間がかからず、ワンタッチで外国語に変換できるのは非常に便利。ボイスレコーダーに必要とされる機能がしっかり統合されている点は高く評価できる。

外国語で録音したファイルは、文字起こし後に翻訳ボタンを押すだけですぐに母国語に翻訳される。これは便利だ

 一方で、文字起こしは〝リアルタイム〟ではない、ここは、Pixelシリーズとの大きな違いと言っていいだろう。Galaxyのボイスレコーダーは、あくまで録音した音声を後からテキスト化する機能。録音時にかかる端末への負荷は軽くなるため、バッテリーを激しく消費したり、本体が熱くなったりする心配がない反面、相手が話したことをすぐに文字で確認できないのはやや不便だ。変換はデバイス上で行っているため、時間もかかる。20分程度の音声を文字にするのに、約3分を要した。メリット、デメリットの両面はあるが、Pixelとの違いとして認識しておきたい。

デバイス上での処理になるため、録音時間が長いと文字起こしにも時間がかかる印象

 文字認識の精度という観点では、日本語はまだまだといった印象。正確さは、「Pixel 8」で使ったボイスレコーダーに軍配が上がる。ただし、Pixelのそれは、聞き取れなかった箇所をズバッと省略してしまう傾向があり、思ったよりも文字になっていないことがある。これに対し、Galaxy S24のAIは、無理に当てはめてでも文字にしようとしている感が強い。こちらも一長一短だが、何かがしゃべられていることだけはわかる。

 ちなみに、認識精度はどのような環境で録音されていたかにも左右される。PCからダイレクトに出力した発表会の動画は比較的正確だったのに対し、室内の発表会をそのまま録音したようなケースでは少々テキストの難が多かった。より正確性を求めるなら、外部マイクを使うなどの工夫は必要だろう。また、日本語よりも英語の方が認識精度は高い印象。これは他のサービスでも同じだが、AIが開発された経緯を踏まえると、どうしても英語ファーストになっているようだ。

足りない部分をAIで補う編集機能に対応、生成AIをフル活用

 次に試したのが、写真編集。ここにもAIの機能が存分に活用されている。できることはPixelの「編集マジック」に近く、写真の中の一部被写体を移動させたり消去したりした際に、足りない部分が生成AIで描き足される。本来であれば空白になってしまうところを生成AIで補うことで、あたかも本当に移動もしくは削除したように見せているというわけだ。この機能は被写体の選択まではデバイス側でやっているが、生成AIはクラウド経由の機能になり、ネットワーク接続が必須になる。

 まずやってみたのが、風景写真に写り込んでしまう車を取り除くという編集。手順は簡単で、選択したい被写体を指で囲むと自動的にそれが認識される。それを長押しすると、移動することができる。移動が終わると消しゴムボタンが表示されるため、消したい時にはそれをタップする。作業が終わったら、「生成」ボタンを押すと、AIが背景を描き始める。10数秒待つと、完成後の写真が表示される。

消したい被写体を適当に囲むと、物体が検知される。長押しで移動したあと、消しゴムボタンをタップするとその対象が消える。ここで「生成」ボタンをタップすると……

 結果はご覧のとおり。車のあった部分に、道路や人物などが描かれており、あたかも最初からそれが写っていなかったかのような写真に仕上がる。ここで消した車は、全体から見ればごく一部だったこともあり、編集の痕跡がわかりづらい。逆に、ちょっと大きな手前に写った街灯を消した時には、後ろに写るビルの形が不自然になってしまった。光も残っているため、月が輝いているようにも見え、あまり上手な処理とは言えない。生成AIにも、限界はあるようだ。

手前に写っていた車が、キレイに消えた。本来は写っていなかった信号待ちの人物も描き足されている

手前の街灯を消そうとしたところ、背景のビルが不自然に〝伸びて〟しまった。これは、失敗例と言えそうだ

 こうした編集機能は、先に述べたようにPixel 8シリーズにも実装されているが、Galaxy S24のそれは、傾き補正にも活用できる。長方形の写真に角度をつけると、その隅に空白ができてしまうが、それを生成AIで補うことが可能。これによって、被写体が平行になるような写真を作り出せる。本来であれば、一部をトリミングしなければならず、画像のサイズが小さくなってしまっていたが、それをせずに角度補正ができるというわけだ。

傾きを補正したあと、足りなくなった背景を継ぎ足すことが可能だ

 以下で掲載した仕上がりは、完璧に近い。背後に写ったドリンクのカップや、ハンバーガーの下にあるトレイまで、完全にAIが足りない部分を補っている。最初に編集後の写真を見せても、AIが何かをしたとは気づかれないレベルだ。ただし、これも、あまりに背景が複雑だと、生成AIが音を上げてしまうことがある。AIといっても完ぺきではなく、失敗するケースもあるという点は念頭に置いておきたい。

カップやトレイなどの本来写っていなかった部分が生成され、あたかも最初から傾いていないような写真に仕上がった

 Galaxyシリーズのハイエンドモデルには、元々、ガラスの反射や影の映り込みなどを消す編集機能が搭載されていたが、Galaxy S24にもそれは踏襲されている。これに加えて、生成AIによる写真の編集が可能になった結果、できることの幅が広がった。写真の編集が難しいと思っていた人にも、ぜひ試してもらいたい機能だ。こうした機能を手軽に利用できるのは、Galaxy S24の魅力と言っていい。

@DIMEのSNSアカウントをフォローしよう!

DIME最新号

最新号
2024年11月15日(金) 発売

DIME最新号は「2024年ヒットの新法則!」、永尾柚乃、小田凱人、こっちのけんと他豪華インタビュー満載!

人気のタグ

おすすめのサイト

ページトップへ

ABJマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標(登録番号 第6091713号)です。詳しくは[ABJマーク]または[電子出版制作・流通協議会]で検索してください。