iPhoneにライブ翻訳機能と控えめなAI強化機能が登場

iPhoneにライブ翻訳機能と控えめなAI強化機能が登場

  • Oligur
  • 0
  • vyzf
iPhoneにライブ翻訳機能と控えめなAI強化機能が登場
  • ニュース
iOS 26のiPhone向けライブ翻訳
iOS 26の電話アプリにはライブ翻訳機能が搭載されています。
画像:Apple

Appleの最近のAIへの取り組みのハイライトはライブ翻訳ですが、月曜日のWWDCで発表されたApple Intelligenceの新機能はそれだけではありません。ビジュアルインテリジェンスとImage Playgroundにも改良が加えられています。さらに、サードパーティのアプリ開発者はAppleのAIモデルを無料で利用できます。

しかし、Macメーカーの開発者会議の基調講演では、OpenAIやGoogleの発表に比べると、AI関連の大きな発表は少なかった。それでも、同社はできる限りのことをした。

「昨年、私たちは、ユーザーのプライバシーを保護しながら、役立ち、関連性が高く、使いやすく、ユーザーが必要とする場所に適切なインテリジェンスを提供するための取り組みの第一歩を踏み出しました。現在、Apple Intelligenceを支えるモデルはより高性能かつ効率的になっており、各オペレーティングシステムのさらに多くの場所に機能を統合しています」と、Appleのソフトウェアエンジニアリング担当シニアバイスプレジデント、クレイグ・フェデリギは述べています。

WWDCでのApple AI

AppleはWWDCで人工知能(AI)への取り組みをアピールする際に、微妙なバランスを取らざるを得なかった。WWDC24でAI強化版Siriを発表したが、まだ発売されておらず、ユーザーへの提供は2026年になる可能性もあるため、批判を浴びた。

しかし、同社は人工知能を無視することもできなかった。あらゆる種類のコンピューターにとって極めて重要だと考えられているからだ。そこでAppleは、限られた発表数の中で、AIの進歩を最大限アピールしようと躍起になった。

WWDCにおけるApple Intelligenceの目玉は、ライブ翻訳です。これは、使用しているアプリケーションに応じて、話し言葉や書き言葉の言語を変換できます。

メッセージアプリでは、この機能を使ってテキストを翻訳できます。FaceTime通話中は、話者の音声を聞きながら、翻訳されたライブキャプションを読むことができます。通常の通話では、会話中ずっと翻訳された音声が読み上げられます。現在、電話アプリとFaceTimeアプリのライブ翻訳は、英語(米国、英国)、フランス語(フランス)、ドイツ語、ポルトガル語(ブラジル)、スペイン語(スペイン)の1対1通話で利用可能です。

もちろん、これにはiOS 26またはiPadOS 26が必要ですが、現時点では開発者のみがアクセスできます。完全版のリリースは秋に予定されています。

GenmojiとImage Playgroundのアップデート

Apple Intelligenceには、ユーザーが独自の絵文字を作成できるGenmojiが含まれています。この無料サービスはアップデートされ、ユーザーは絵文字を組み合わせたり、説明文と組み合わせたりして、新しい絵文字を作成できるようになります。

Image Playgroundは、iPhone、iPad、Macユーザーがテキストの説明から画像を作成できるツールです。Appleは現在、この分野で競合他社に大きく遅れをとっています。この解決策として、アプリケーションからOpenAIのChatGPTにリクエストを送信できるようにしました。Appleは「ユーザーは常に制御権を持ち、ユーザーの許可なくChatGPTと共有されることはありません」と約束しています。

繰り返しになりますが、Genmoji と Image Playground の改良は、秋までリリースされないベータ版の一部です。

新しいビジュアルインテリジェンス機能

Appleのビジュアルインテリジェンスの現在のバージョンは、iPhoneのカメラを使って現実世界の物体の情報を取得します。WWDC基調講演では、この機能がiPhoneの画面全体に拡張され、ユーザーがアプリケーション内で画像に基づいて検索したり操作したりできるようになると約束されました。

さらに、ビジュアルインテリジェンスは、ユーザーがイベントを見ていることを認識し、カレンダーに追加することを提案することもできます。

開発者はAppleのLLMに無料でアクセスできる

WWDC は開発者向けのカンファレンスで、Apple は月曜日に AI 関連のニュースを発表しました。

「開発者は、Apple Intelligenceの中核であるデバイス上の大規模言語モデルにアクセスできるようになり、強力で高速、プライバシーを考慮して構築され、ユーザーがオフラインの場合でも利用できるインテリジェンスに直接アクセスできるようになります」と同社は述べた。

開発者は無料でアクセスできます。このフレームワークはSwiftプログラミング言語をネイティブサポートしています。