Perplexity AIは2026年6月30日(米国時間)、法人向け「Sonar Pro API」の価格を入力・出力トークン双方で約75%引き下げると発表した。入力1Mトークンあたり$8→$2、出力は$8→$2となり、リアルタイムWeb検索を内包した推論エンドポイントとしては現時点で最安水準に入る。単なる値下げではなく、RAG(検索拡張生成)構築コストの構造が変わる分岐点とみられる。
Perplexityは現地時間6月30日21時にX公式アカウントで価格改定を告知した。
「Sonar Pro の新料金が本日深夜(UTC)より反映される。入力・出力ともに $2/1M トークン。オンライン検索コールは1回 $0.005 のまま変わらない」
改定後の料金体系を他社主要APIと並べると、GPT-4o(入力$2.50/出力$10)やClaude Sonnet 4.6(入力$3/出力$15)に対して、Sonar Proは「Web検索つき」でほぼ同価格帯に入る。検索コールを内包しながら推論も完結するオールインワン構造は、自前でRetrieverを実装するコストを丸ごと省ける点が他社との差別化軸だ。
同社のMAU(月間アクティブユーザー)は2026年Q1時点で1億5,000万人を突破しており、API利用量の急拡大による規模の経済が値下げを可能にしたと同社CPOは説明している。
Perplexityは2024年後半から法人APIの普及に力を入れてきた。2025年初頭には「Enterprise Pro」プランを投入し、SSO・監査ログ・データリテンション設定を整備。同年Q4にはSalesforce・Zendeskとのコネクター連携を発表し、CRMデータとWeb情報を横断するQ&Aエージェントの実装事例が積み上がった。
一方、RAG型AIの最大の導入障壁は「ベクターDB + エンベディング + LLM推論 + 検索クロール」の多段コストだった。Sonar APIはこの工程を単一エンドポイントで吸収する設計だが、これまでの料金水準では大量リクエストが想定される本番環境でのコストが重荷だった。今回の75%削減はその障壁を一気に取り除く。
Sonar Pro APIを1日1,000リクエスト×30日で試算すると、月間コストは検索コール込みで約$210(約3万円)。中小企業のカスタマーサポートBot用途では、人件費換算で十分に引き合う水準に入った。
従来「ベクターDB構築+エンベディングモデル選定+検索チューニング」に数週間かけていたエンジニアリング工数が、Sonar APIへのシフトで削減できるケースが増える。ただし、プライベートドキュメント(社内wiki・契約書等)の検索精度はSonarの公開Web索引に依存できず、ハイブリッド構成が依然必要になる点は注意が要る。
OpenAIが2025年に投入したResponses API(Web検索ツール内蔵)と機能軸が重なる。現時点でResponses APIの検索コールは$0.03/回と6倍の開きがあり、価格優位はPerplexityに傾いている。ただしOpenAIはFunction Callingの柔軟性と既存エコシステムを武器に反撃を仕掛けてくると見られる。
Sonarのリアルタイム検索は英語圏コンテンツで強みを発揮する一方、日本語固有の情報源(企業IR、官庁発表、地方紙)のカバレッジは未検証の部分が残る。国内導入を検討する開発者は、日本語クエリでのGrounding精度を先に評価することが実装前の必須ステップになる。
価格改定と同時に、思考連鎖(CoT)を内蔵した「Sonar Reasoning Pro」βが限定公開された。入力$3/出力$15と従来比では割高だが、複数ステップの調査・比較タスクに特化している。価格とユースケースの棲み分けを明確にする戦略と読める。
今回の値下げで最も影響を受けるのは、RAGシステムの内製化に踏み切れていなかった中小・中堅企業の開発チームだろう。エンベディングモデルの選定・ベクターDBの運用・検索パイプラインのメンテという三重苦から解放される選択肢が、現実的なコスト感で手に入るようになった。
ただし「Perplexityに乗り換えれば即完成」とはならない。プライベートデータとのハイブリッド検索、出力の引用精度検証、API可用性のSLA確認——この3点は自前実装であっても外部API依存であっても変わらず問われる設計課題だ。
競合各社の反応も見えてきた。GoogleはVertex AI Search(旧Enterprise Search)を値下げ改定する動きが内部で検討されているとの情報が複数の開発者コミュニティで流れており、今後90日でRAG-as-a-Service市場全体の料金水準が再編される可能性が高い。
2026年後半に向け、「検索統合型推論」の主戦場は料金競争から精度・プライバシー保証・ファインチューニング柔軟性へと移っていくと見られる。Perplexityが次のカードを切るとすれば、オンプレ or VPC内デプロイオプションの提供が本命と思われる。
Sonar Pro APIの75%値下げは、RAG型LLM採用の「コスト障壁」を取り除く一手だった。これにより、検索とLLM推論を一体運用するアーキテクチャが中小規模の本番環境でも現実解となる。自前パイプラインを構築すべきか、外部APIに委ねるか——その判断軸は今後「コスト」ではなく「データ主権」と「精度」に絞られていく。あなたのチームの設計判断は、どちらの軸で揺れているだろうか。
※本記事は ミライ・ニュース編集部の AI ライター(AIニュース)が執筆しています。